问题——具身智能“会展示”与“能干活”之间仍有差距。近年来,具身智能在特定场景中已能完成开瓶、整理等动作,但一旦环境变化、视角改变或任务链条拉长,稳定性与可复用性就明显下降。尤其在制造业、物流和公共服务等场景,任务常涉及柔性物体、复杂接触和连续工序,任何一次偏差都可能带来停线、返工甚至安全风险。如何让机器人从“看起来聪明”走向“可靠上岗”,已成为行业共同关注的核心问题。 原因——物理建模不足与数据供给不匹配是主要瓶颈。业内主流路径多依赖视觉、语言与动作耦合的模型框架,优势在于迁移快、理解指令强——但在真实世界中——决定任务成败的往往不是“看见什么”,而是“接触时发生了什么”。以线束装配为例,线材形变、插接阻力、角度偏差、摩擦与回弹等因素相互耦合,仅靠视觉难以稳定判断“该加力还是该微调”。同时,工业现场数据分布更复杂、噪声更高,如果训练数据覆盖不到真实工况,模型就容易在更换场景时失效。 影响——从“概念热”走向“生产力”,将改变机器人产业的竞争方式。政府工作报告提出“因地制宜发展新质生产力”,具身智能被视为推动数字技术与实体经济深度融合的重要方向。业内人士认为,一旦具备可规模复制的稳定作业能力,机器人有望在重复、危险、对精度要求高的岗位上形成替代与增量价值:一上缓解部分行业用工的结构性矛盾,另一方面推动产线柔性化改造,提升质量一致性与安全水平。对企业而言,竞争焦点也将从单一硬件性能,转向“数据—模型—本体—控制—应用交付”的系统能力。 对策——以“全栈闭环”提升可靠性,以“物理理解”增强泛化能力。展会期间,它石智航发布通用具身大模型AWE3.0,并针对“能干活”目标展示技术路线:一是强化对时间、空间、力与交互等物理量的表达与推理,提高对真实作业约束的理解;二是通过自研架构增强对视角变化的适应性,提升长程任务执行的稳定性;三是通过“隐空间”等方法压缩动作规律,让机器人不必机械记忆轨迹,而是学习动作生成的内在逻辑,从而获得更平滑、更可控的操作表现。现场还设置“大脑演示区”,以多场景任务选择与学习数据同步呈现的方式,展示系统如何利用真实数据进行学习、规划与执行,帮助公众更直观理解“机器如何认识世界”。 值得关注的是,精细操作的关键仍在触觉与力控闭环。企业提出高密度触觉感知等思路,尝试让机器人在接触过程中获得更细粒度的反馈,从“遇阻即停”转向“边接触边调整”,以适配柔性物体装配、精密插接等高难度任务。业内普遍认为,未来一段时间,触觉传感、端到端控制、实时规划与安全冗余将成为具身智能工程化落地的主要竞争点。 前景——产业落地将从“单点试验”走向“成组部署”,但仍需跨过标准化与成本门槛。随着算法与本体协同迭代,具身智能有望率先在装配、分拣、质检、清洁与危险工序等场景实现规模化应用。同时,行业仍需在数据合规与安全、软硬件接口标准、评测体系、质量责任边界等加快完善,推动从“能跑通”迈向“可交付、可维护、可复制”。在成本层面,传感器、执行器、算力与运维体系的综合优化,将决定机器人“上岗”的投入产出能否成立。多位受访者表示,未来竞争不只看模型参数与演示效果,更取决于面向产业需求的工程体系与交付能力。
从“看上去很聪明”到“真正能上岗”,具身智能的价值不在展台上的一次成功,而在生产现场的长期稳定。面向制造业转型升级的现实需求,谁能把物理世界的复杂性纳入可计算、可控制、可交付的体系,谁就更可能在新一轮产业变革中占得先机。具身智能能否成为新质生产力的重要支撑,关键仍在以真实场景为牵引,用工程化能力把技术优势转化为可持续的产业效益。