问题——机器人“会表演”不等于“会干活” 近年来,具身智能热度不断上升,但产业端的普遍反馈是:不少机器人固定场景里能完成抓取、整理等任务,可一旦进入真实的工厂、仓储或服务现场,遇到光照变化、物体形变、工装差异和随机干扰,稳定性与成功率就会明显下滑;“实验室样品”和“产线熟练工”之间的差距,已成为规模化应用的重要瓶颈。 原因——仅靠视觉与语言难以覆盖物理世界复杂性 丁文超在接受采访时表示,一些主流技术路线更强调从视觉和语言信息中学习动作映射,擅长处理外观、轮廓等“表层信息”,但对时间、空间、接触力、摩擦、材料弹性等物理量的表达仍不充分。对工厂来说,很多任务难点不在“看见”,而在“摸到”“控住”。例如线束装配涉及柔性物体的弯折、回弹与插接配合:用力稍大容易损伤,用力稍小则无法到位;又如在狭小空间的插拔、对位,需要持续微调和稳定力控。缺少对物理规律的有效建模与反馈闭环,机器人就容易在复杂工况下“卡住”。 影响——从新质生产力到制造升级,期待“可持续交付”的机器人能力 今年政府工作报告提出“因地制宜发展新质生产力”。具身智能被认为是推动数字技术与实体经济融合的重要方向之一。业内人士分析,如果机器人只能在展会“秀”能力,就很难形成可复制、可运维、可评估的产业价值;而一旦具备跨场景泛化和长时间稳定执行能力,就有望在装配、质检、搬运、分拣、运维等环节提升效率,并在部分危险、重复或对健康不友好的岗位实现替代或协作,推动制造业向更高水平的自动化与柔性化发展。 对策——以“全栈闭环”打通从数据到执行的最后一厘米 据介绍,它石智航在AWE2026发布通用具身大模型AWE3.0,并强调从数据采集、训练到机器人本体执行的全链路能力建设。其思路是:让机器人不只依赖单一视角的识别结果,而是形成对环境的综合理解与规划,并在任务过程中持续感知、预测与纠错。 一是强化对物理世界的建模与推理。公司提出“智能世界引擎”架构,重点提升机器人在复杂环境中的操作流畅性与稳定性,减少对固定布景和单一视角的依赖,增强跨场景迁移能力。 二是用“隐空间”动作表达提升长程任务执行效率。丁文超表示,通过对人类动作规律进行压缩表达,机器人不必机械记住每条轨迹,而是学习动作生成的内在逻辑,从而在装配、整理等连续操作中实现更平滑的衔接与更稳健的执行。 三是以高密度触觉感知补齐“手感”。在精细装配场景中,触觉反馈是闭环控制的关键。相比传统主要依赖关节电流等间接信号进行力控、遇阻即停的方式,高密度触觉感知能捕捉更细微的接触变化,使机器人在接触过程中同步调整、在受力过程中及时修正,更好适应柔性材料和装配公差带来的不确定性。 前景——从“刷新纪录”到“走进产线”,规模化仍需时间与标准 展会现场,一台机器人在一小时内完成超百次亚毫米级线束装配,并获得对应的世界纪录认证。受访人士认为,纪录表明了技术上限,但产业化更关注在多班次、多工位、多批次条件下的稳定表现,以及成本、维护、训练周期和安全合规等综合指标。 下一阶段,具身智能要真正形成对新质生产力的支撑,仍需在三个上持续推进:其一,建立更贴近工业现场的数据体系与评测标准,用可量化指标衡量可靠性与泛化能力;其二,完善软硬件协同与工程化交付体系,降低部署门槛;其三,推动与制造、物流、服务等行业深度共创,在真实工艺和真实节拍中迭代升级。随着感知、控制与推理能力持续融合,具身智能有望从单点突破走向系统化落地。
具身智能的价值不在于让机器人“看起来更聪明”,而在于让它在真实世界里“做得稳、做得久、做得好”。从展会展示到工厂落地,决定成败的不是一次惊艳的动作,而是可复制的系统能力和可核验的产业收益。面向未来,只有以场景牵引技术、以标准沉淀能力、以产业协同放大规模,“能干活”的机器人才能真正走进千行百业,持续释放新质生产力动能。