中关村论坛聚焦具身智能新范式:无训练式“具身大脑”推动机器人迈向自主作业

(问题)当前机器人智能化快速发展,但复杂场景中的自主作业能力仍是行业痛点;论坛现场,多位与会者聚焦“机器人为何仍难以像人一样理解空间并完成劳动”的核心问题。吴易明在演讲中指出,主流具身智能研究多采用“语言模型与视觉模型融合”的技术路线,虽然在知识问答、图像理解各上取得进展,但本质仍偏向对数据统计规律的拟合。真实物理世界中,机器人往往难以稳定完成“识别—理解—规划—执行”的闭环任务,表现为对空间关系理解不足、对物体功能与可操作性把握不准,进而影响自主作业可靠性。 (原因)他将症结概括为两上约束:一是“数据瓶颈”。工业现场多为小样本、非标件、强反光或遮挡环境,难以获得覆盖充分、标注一致的训练数据;二是“算力与泛化瓶颈”。依赖大规模训练的方案在特定任务上可达成高指标,但一旦环境变化、目标换型或工艺调整,模型容易出现不稳定输出,甚至产生与物理规律不一致的判断。吴易明继续指出,若不能解决机器对现实物体与符号之间的对应关系问题,即“看到杯子就能理解其三维结构、可抓取方式及用途”,机器人就难以真正走向可验证、可复用的自主劳动能力。 (影响)此讨论折射出智能制造升级的迫切需求。我国制造业正加快推进高端化、智能化、绿色化转型,在航空航天、核电、船舶、重型装备等领域,作业环境往往具有高风险、高精度、强约束等特点,传统机器人依赖人工示教与重复编程,部署周期长、改造成本高、对技能人员依赖强。若机器人能够在复杂现场实现更强的空间理解与自主规划,将有望提升产线柔性与一致性,降低高危岗位暴露风险,并推动离散制造向无人化、少人化迈进。 (对策)针对上述难题,吴易明介绍,其团队在科技部重大专项支持下,提出以数学方法重构机器认知的思路:不以“记住大量数据”为主要路径,而是通过微分几何、群论等工具建立对物理世界更精准的映射关系,形成“无需数据训练”的具身“大脑”操作系统。据介绍,在感知层面,该系统将视觉信息直接映射到可度量的环境坐标,实现对任意立体对象的精细结构表征与识别,面向小样本与非标场景提升稳定性;在规划层面,通过可逆拓扑变换、逆向可达地图等方法,将运动规划中的复杂逆解转化为可求解的正向问题,构建从感知到决策再到执行的自主闭环,减少对人工示教与重复编程的依赖。吴易明强调,机器智能应以实践验证为准绳,通过可落地、可复现的作业结果检验其“理解”是否真实有效。 (前景)产业化进展成为外界关注的另一焦点。论坛信息显示,仝人智能近期完成近4亿元人民币A轮融资,投资方包括产业资本及多家国资背景机构。公司称,搭载“具身大脑”的智能焊接机器人已在重型装备、船舶制造等行业实现批量交付,形成以双目立体视觉终端及焊接、测量机器人为代表的产品矩阵,覆盖“看得见、想得明白、干得出来”的关键链条。下一阶段,团队将围绕域控制器、双目视觉模块、类脑芯片等核心部件持续攻关,并将目标指向更高自主等级的通用化人形机器人,力求在无需遥操作条件下实现更接近拟人化的自主决策与作业能力。业内人士认为,具身智能的发展仍需在标准体系、可靠性验证、工程成本与生态协同上持续突破,但其在高端制造与重大工程中的示范效应,有望带动涉及的核心部件与系统集成能力加速成熟。

该突破性研究标志着我国在智能科技领域实现了从跟随到引领的关键跨越。其意义不仅在于技术创新,更在于通过基础科学解决工程难题的新范式。在科技自立自强的背景下,这样的原创突破将为制造强国建设提供重要支撑,也预示着智能技术正从数据驱动向认知驱动转型。