智元联合清华大学还有麦吉尔大学,搞出了个叫MANSION的东西,这次直接把它给推到了CVPR2026去展示。上证报记者孙小程拿到了最新消息,这个框架主要是用来给机器人建造数字试验场的。 为啥要弄这个?其实现在的机器人感知、操作这些本事提升很快,但它们练的环境太差。真实的场景太难搞,要么太贵要么改不动;现有的虚拟环境大多只有一层楼,根本没有楼梯、电梯这些必须的东西,没法让机器人跨楼层长时间干活。 为了打破这个僵局,MANSION把多模态大模型和几何求解器拼在一起,只要给它一个自然语言指令,就能直接变出一整栋多层3D的大楼。它不像以前那样胡乱拼接房间,而是从整栋楼的逻辑出发:先把功能分区、上下通行和整体风格规划好,然后再一层层地去布局房间和结构。最后通过数学计算生成符合物理规则的平面图,再输出一个能在模拟器里跑的交互式3D场景。 这样做的好处是保证了楼梯、电梯这些跨层结构衔接得很合理,整个建筑也更连贯好用。测试结果也很明显,一旦任务变得复杂或者跨楼层了,之前最厉害的机器人表现就明显下滑了,直接暴露出它们在空间推理、长期规划这些方面的短板。 MANSION的厉害之处在于它给全球的研究人员提供了一个标准化的楼宇级测试平台。以后大家就能让机器人在更真实的复杂环境里练本领了。 实验也证明,MANSION生成的场景不管是布局还是真实性、可用性方面都很厉害。 智元联合清华大学还有麦吉尔大学的这项成果入选CVPR2026真是太让人惊喜了!