我国在算力网络高可靠承载方面有了关键突破,中国电信这次在北京搞了个大动作。他们刚在真实网络环境里搞了个业内头一回的50毫秒波长交换光网络(WSON)算力互联现网验证。这一验证搞定了超过1200公里跨区域分布式AI大模型训练的可靠性问题,标志着咱们在这领域取得了很大进展。这是在2025年要先实现千卡规模、千亿参数大模型500公里联合训练试商用之后,中国电信又给咱贡献了一个新成果。为了满足未来工业和信息化部提出的“毫秒用算”专项行动,还有全国一体化算力调度的要求,这个验证提供了强有力的技术支持。 随着人工智能飞速发展,像AI大模型训练这种事儿,对底层网络的要求简直苛刻到了极点。稍微出点网络丢包或者短暂中断,这几天辛苦训练出来的成果可能就全白费了。传统的保护恢复技术通常只能做到秒级甚至分钟级别的恢复,根本跟不上智算业务要零感知中断的需求。所以,中国电信北京公司把这事儿扛了下来。他们和中国电信研究院还有华为公司一块琢磨了下,把创新的WSON保护机制直接用到了算力互联场景里。 这次验证的最大亮点在于把深度学习、智能决策这些前沿AI算法深度融入了WSON控制平面里,弄出了个“实时感知-最优决策-瞬时执行”的智能闭环系统。一旦网络出了岔子,系统能在50毫秒内自动算出最优光通路并建立新链路,让业务整体上感觉不到变化。为了测试这套系统的威力,验证还特意模拟了北京和远处数据中心协同训练AI大模型的情景。测试结果显示,哪怕在长达1200公里的超远距离传输下,网络吞吐率依然维持在高水准上。最让人意外的是,分布式AI大模型训练性能竟然达到了单一智算中心内集中训练的97%以上。这就意味着不管地理距离多远,这些异质算力也能像在一个房间里那样稳定高效地干活了。 这次现网验证成功不仅大幅提升了网络的生存性和可靠性,对医疗、金融这些对时延和中断非常敏感的行业来说意义也很重大。毕竟这东西能给它们提供那种又快又稳的确定性算力保障嘛。“面对这AI时代蓬勃发展的势头,我们正忙着搞全光网3.0战略转型呢。”负责这事的中国电信北京公司负责人沈鸿这样说道。“我们要弄一个像‘一环一纵’的高可靠、低时延网络底座出来。”这个底座不光能支撑国家“AI+”行动计划落地,还能让京津冀乃至更广大区域的智算中心连起来用。“最终目标嘛,”沈鸿补充道,“就是让高品质的算力变成水电煤气那样的社会级基础服务。” 这就是这次WSON验证成功的故事了。大伙儿以后用起AI来应该会更方便更稳当啦!