国产千卡智算集群成功训练具身智能大模型 我国算力自主能力获得突破

当前全球AI竞争中,算力基础设施已成为战略制高点。国产算力长期面临自主可控程度不足、系统协同能力有限等挑战。此次MTTS5000千卡集群成功训练具身大脑模型,正是对此瓶颈的直接突破。 从硬件架构看,MTTS5000集群采用异构计算设计,通过自研互联协议实现90%以上的线性扩展效率。这意味着从64卡扩展至1024卡的过程中,算力损耗被控制在10%以内,远优于业界平均水平。同时,水冷散热系统将PUE值降至1.15,每消耗1度电就有0.87度用于纯计算,在能耗敏感的具身智能领域形成显著优势。 软件层面的创新同样关键。摩尔线程自主研发的FlagOS-Robo框架通过多芯片自动调优功能,使训练曲线与国际主流GPU的Loss误差控制在0.62%以内,真正实现了"代码不改、精度不降"的跨平台迁移。这一突破打破了国产芯片与国际产品之间的性能鸿沟,为国内AI生态的自主发展奠定基础。 具身智能训练对系统稳定性提出极致要求。RoboBrain2.5需要同时处理视觉、语言、动作时序的跨模态关联,任何计算中断都会影响训练效果。实测数据显示,在连续72小时的高强度训练中,MTTS5000的故障中断时间仅0.37小时,远低于行业1.5小时的基准线。这种稳定性源自独创的"双环容错"机制:内环实时监测单卡状态,外环动态调整任务分配,即使10%的计算单元宕机也能保证训练连续进行。 在训练策略上,FlagOS-Robo框架采用"大脑-小脑"协同训练模式,让负责认知推理的视觉语言模型与专精动作控制的视觉动作模型并行迭代。这一设计使RoboBrain2.5在开门、抓取等具身任务中的成功率提升23%,三维重建误差相比前代缩小41%。所有训练数据均经过"物理场景增强"处理,通过模拟真实世界的摩擦力、材质反光等参数,有效降低从数字训练到实体应用的"现实差距"。 在三维空间推理等关键任务上,RoboBrain2.5的表现已反超国际同类产品,这充分证明了国产算力体系的竞争力。更值得关注的是,MTTS5000集群采用开放架构设计,支持国内外12种主流AI芯片的即插即用,这种包容性既是应对技术封锁的战略选择,也为国产AI生态的健康发展创造了条件。 从产业应用前景看,RoboBrain2.5已体现出在家庭服务、工业巡检等场景的应用潜力。其创新的"价值评估模块"能让机器人自主判断动作的时序合理性,比如在端茶时自动调整先迈步还是先转身,这种智能化程度的提升将直接提高服务机器人的实用价值。随着FlagOS-Robo框架将训练成本压缩至国际水平的68%,国产具身智能产品的商业竞争力正在明显提高。

国产算力在具身智能领域的突破,展现了我国科技创新的实力和自主发展的决心;在全球AI竞赛日益激烈的背景下,这种以效率和创新为核心的发展模式,将为我国在新一轮科技革命中赢得优势。随着技术成果的转化应用,中国智造有望在人工智能领域实现更大突破。