沈咏剑：机器人干活的时代已经过去了，现在机器人得懂更多东西，比如任务目标、步骤拆分、环境变化什么。

最近智元机器人推出了一个新的比赛，名字叫AGIBOTWORLDCHALLENGE，放在2026年的ICRA上举行。这个比赛有两个主要的赛道：一个是Reasoning to Action，主要看机器人怎么理解任务然后去做；另一个是World Model，就是看机器人怎么建模周围的环境。沈咏剑解释说，这两个东西不是你死我活的关系，是可以一起用的。他说现在单纯靠摄像头和语音指令让机器人干活的时代已经过去了，现在机器人得懂更多东西，比如任务目标、步骤拆分、环境变化什么的。在World Model这个赛道里，参赛者要根据真实机器人的数据训练视频生成模型，弄出不同场景下的交互视频。这就说明世界模型在具身智能里有多重要了。而Reasoning to Action那个赛道则更关注机器人怎么拆解任务、理解环境还有优先级。沈咏剑还提到2024年底智元搞了个AgiBotWorld的数据集，里面有超过100万条轨迹、217个任务和五大场景。2025年3月他们发布了首个通用基座模型GenieOperator-1。今年1月又出了GenieSim3.0平台，基于NVIDIA IsaacSim做的，能实现高保真环境。还有他们在2026年1月搞出了GenieReasoner这个系统。沈咏剑说现在搞具身智能的人太少了，特别是厉害的算法人才，所以他们想通过这次比赛吸引更多人进来。他还指出世界模型就是看当前的信息来预测未来变化的东西。他觉得世界模型跟VLA这种纯视觉语言行动的路线不一样。智元机器人在这两条路上都很重视。比如去年他们推了AgiBotWorld数据集，今年3月有了基座模型GenieOperator-1，1月又有了仿真平台GenieSim3.0。还有2026年1月他们弄了个GenieReasoner系统。总之VLA和世界模型不是互相代替的关系，而是可以一起发展来推动具身智能。未来的机器人不能只会听命令做事了，还得能理解环境和推理适应变化。这次比赛就是个好机会让大家一起探索这条充满潜力的路。