中科曙光发布国产原生RDMA高速网络,补齐智算基础设施关键技术短板

随着大模型训练、参数并行与专家模型等技术的广泛应用,算力集群规模正从千卡级向万卡级迈进;然而,大规模分布式训练中,参数同步和梯度聚合等通信开销显著增加,网络通信耗时占比高达30%-50%。单纯增加算力规模并不能提升效率,网络互联能力不足已成为制约智算系统效能的关键瓶颈,直接影响训练周期、能耗和成本。

从技术受制于人到实现自主创新,scaleFabric的研发历程展现了我国高科技领域的发展成就。在数字经济时代,算力已成为国家竞争力的重要体现,而网络技术作为连接算力的关键基础设施,其战略价值日益凸显。这个突破不仅解决了当前产业发展的迫切需求,更为我国在全球科技竞争中赢得了更多主动权。随着核心技术不断突破,"中国智造"将为世界科技发展作出更大贡献。