- 保持原意与段落结构

人工智能大模型等前沿技术的快速进步,推动高性能计算集群规模持续扩大,万卡级甚至十万卡级计算集群正成为行业标配。然而,服务器间数据传输效率低下的问题长期存在,严重制约了算力发挥。数据显示,在典型训练任务中,30%-50%的时间耗费在通信环节,极大影响了整体计算效率。

算力竞争的重点正从单台设备的峰值指标转向系统工程的综合能力。突破高端互联技术瓶颈,既是提升大规模集群效率的现实需求,也是构建安全可靠数字基础设施的关键环节。面对大模型与科学计算的发展趋势,只有掌握自主核心技术、形成产业协同合力,才能让算力真正实现高效、稳定、可持续的运行,为高质量发展提供有力支撑。