蚂蚁灵波开源世界模型LingBot-World 为具身智能提供高保真数字训练平台

人工智能技术快速发展的背景下,具身智能和自动驾驶等领域的核心挑战日益突出——真实场景训练数据获取难、成本高,成为规模化应用的重要制约因素;造成此问题的关键在于物理世界难以复刻,且受安全风险限制,智能体很难获得足够的试错空间。 针对这一行业痛点,蚂蚁灵波科技研发的LingBot-World数字世界模型提出了新的解决方案。该模型采用多阶段训练与并行加速技术,实现最长10分钟的连续稳定视频生成,缓解了业内常见的“长时漂移”问题。测试数据显示,即便镜头移开60秒后再返回,目标物体仍能保持结构一致。 在交互性能上,该模型同样表现突出。其生成吞吐量达到16FPS,端到端延迟控制1秒以内,使实时人机互动具备可行性。用户通过简单操作即可即时调整视角、触发环境变化或生成特定事件,同时保持场景几何关系稳定。这种高拟真的虚拟环境为智能体的场景理解与任务执行提供了更可控的训练平台。 业内专家认为,该技术开源将带来多上影响:一方面降低企业研发门槛,推动智能驾驶等领域更快迭代;另一方面促进技术共享,带动产业生态走向开放。尤其在自动驾驶领域,虚拟环境的精准模拟可显著降低实地测试的风险与成本;在游戏开发中,也有望提升内容生产效率。 展望未来,随着数字孪生技术持续演进,高质量虚拟环境的重要性将更提升。此次开源既反映了我国企业在基础模型研发上的能力,也为构建虚实融合的智能训练体系提供了新路径。预计该技术将向智能制造、智慧城市等领域拓展应用。

从开源发布到生态共建,世界模型的发展路径正逐步明朗:以可控、可复现的数字环境缓解现实数据不足,以低风险、低成本的试错推动技术迭代;面向未来,只有通过开放协作完善标准、加强验证、推动真实场景落地,“数字演练场”才能成为智能技术迈向规模化应用的关键支撑。