博鳌论坛聚焦人形机器人“泛化短板”:数据与模型两端协同决定智能上限

当前,人形机器人展示、试点和特定场景应用中取得了一定进展,但在真实、开放、多变的环境中执行任务时,仍普遍存在“能演示、难通用”的问题。业内认为,能否从“单点可用”迈向“规模可用”,关键在于提升其适应不同场景、物体和任务的泛化能力。王晓刚在博鳌亚洲论坛2026年年会上表示,人形机器人看似“不够聪明”,核心问题正是泛化能力不足。 王晓刚将原因归结为两点:数据与模型。 一是数据不足且获取方式不匹配。过去行业主要依赖人工操控真机采集数据,但这些数据多来自试验环境或专门采集流程,难以覆盖真实生产生活中的大量细节,效率也较低。他举例称,过去几年积累的约10万小时数据,与通用能力所需的千万小时级目标仍有数量级差距。 二是模型通用性受限。早期模型与机器人本体强绑定,导致更换平台或传感器时能力迁移困难;而一些现有模型虽能完成分拣等标准化动作,但在连续、多步骤的复杂任务中表现不足,缺乏对环境和物理交互的深层理解。 数据与模型的限制,使人形机器人在产业落地中面临三上挑战:训练成本高、迭代周期长;跨场景复用能力弱,导致项目定制化倾向;面对真实环境的不确定性(如物体位置变化、人机干扰等)时策略失配,影响可靠性和安全性。这些问题若不解决,人形机器人将难以从“试点示范”进入“长期稳定运行”。 针对数据问题,王晓刚介绍,大晓机器人2025年提出“环境式数据采集”方案:通过第一视角眼镜、穿戴设备和第三方传感器,在真实场景中记录人类行为。这个方法将数据采集融入日常工作流,使数据更贴近实际任务分布,提升效率和多样性。例如,1000名作业人员配备采集设备,每天可生成约1万小时数据。更重要的是,该方案从“依赖单机采集”转向“以环境和行为为中心”,使数据更具可迁移性,支持“一脑多形”,降低跨平台门槛。 在模型上,王晓刚提出引入“世界模型”:让机器人不仅能执行动作,还能理解物理规律和人类行为逻辑,从而提升复杂任务的规划与纠错能力。他强调,世界模型并非取代现有技术,而是与执行模型协同工作——前者负责生成多步骤计划和风险预判,后者专注动作执行,偏差时再介入调整,以提高稳定性。 从产业趋势看,随着传感器成本下降、算力提升和应用需求增长,人形机器人正从“展示技术”转向“工程化产品”。但能否实现跨场景泛化,仍取决于数据规模化和模型的环境理解能力。未来竞争将聚焦真实数据采集与标注、模型架构创新及软硬件协同优化。同时,数据安全、隐私保护和场景合规也需建立规则,为规模化应用提供保障。

人形机器人从实验室走向大众的过程中,泛化能力是一道必须跨越的技术鸿沟。当数据采集从机械复制转向生态记录,当认知模型从单一指令升级为全局推演,这场智能变革正在重塑人机协作的边界。未来,谁能率先突破这些瓶颈,谁就能在人机共生时代占据先机。