最近智元机器人推出了一个新的比赛,名字叫AGIBOTWORLDCHALLENGE,放在2026年的ICRA上举行。这个比赛有两个主要的赛道:一个是Reasoning to Action,主要看机器人怎么理解任务然后去做;另一个是World Model,就是看机器人怎么建模周围的环境。沈咏剑解释说,这两个东西不是你死我活的关系,是可以一起用的。他说现在单纯靠摄像头和语音指令让机器人干活的时代已经过去了,现在机器人得懂更多东西,比如任务目标、步骤拆分、环境变化什么的。 在World Model这个赛道里,参赛者要根据真实机器人的数据训练视频生成模型,弄出不同场景下的交互视频。这就说明世界模型在具身智能里有多重要了。而Reasoning to Action那个赛道则更关注机器人怎么拆解任务、理解环境还有优先级。 沈咏剑还提到2024年底智元搞了个AgiBotWorld的数据集,里面有超过100万条轨迹、217个任务和五大场景。2025年3月他们发布了首个通用基座模型GenieOperator-1。今年1月又出了GenieSim3.0平台,基于NVIDIA IsaacSim做的,能实现高保真环境。还有他们在2026年1月搞出了GenieReasoner这个系统。 沈咏剑说现在搞具身智能的人太少了,特别是厉害的算法人才,所以他们想通过这次比赛吸引更多人进来。他还指出世界模型就是看当前的信息来预测未来变化的东西。他觉得世界模型跟VLA这种纯视觉语言行动的路线不一样。 智元机器人在这两条路上都很重视。比如去年他们推了AgiBotWorld数据集,今年3月有了基座模型GenieOperator-1,1月又有了仿真平台GenieSim3.0。还有2026年1月他们弄了个GenieReasoner系统。 总之VLA和世界模型不是互相代替的关系,而是可以一起发展来推动具身智能。未来的机器人不能只会听命令做事了,还得能理解环境和推理适应变化。这次比赛就是个好机会让大家一起探索这条充满潜力的路。