博鳌论坛聚焦人形机器人“泛化短板”：数据与模型两端协同决定智能上限

当前，人形机器人展示、试点和特定场景应用中取得了一定进展，但在真实、开放、多变的环境中执行任务时，仍普遍存在“能演示、难通用”的问题。业内认为，能否从“单点可用”迈向“规模可用”，关键在于提升其适应不同场景、物体和任务的泛化能力。王晓刚在博鳌亚洲论坛2026年年会上表示，人形机器人看似“不够聪明”，核心问题正是泛化能力不足。王晓刚将原因归结为两点：数据与模型。一是数据不足且获取方式不匹配。过去行业主要依赖人工操控真机采集数据，但这些数据多来自试验环境或专门采集流程，难以覆盖真实生产生活中的大量细节，效率也较低。他举例称，过去几年积累的约10万小时数据，与通用能力所需的千万小时级目标仍有数量级差距。二是模型通用性受限。早期模型与机器人本体强绑定，导致更换平台或传感器时能力迁移困难；而一些现有模型虽能完成分拣等标准化动作，但在连续、多步骤的复杂任务中表现不足，缺乏对环境和物理交互的深层理解。数据与模型的限制，使人形机器人在产业落地中面临三上挑战：训练成本高、迭代周期长；跨场景复用能力弱，导致项目定制化倾向；面对真实环境的不确定性（如物体位置变化、人机干扰等）时策略失配，影响可靠性和安全性。这些问题若不解决，人形机器人将难以从“试点示范”进入“长期稳定运行”。针对数据问题，王晓刚介绍，大晓机器人2025年提出“环境式数据采集”方案：通过第一视角眼镜、穿戴设备和第三方传感器，在真实场景中记录人类行为。这个方法将数据采集融入日常工作流，使数据更贴近实际任务分布，提升效率和多样性。例如，1000名作业人员配备采集设备，每天可生成约1万小时数据。更重要的是，该方案从“依赖单机采集”转向“以环境和行为为中心”，使数据更具可迁移性，支持“一脑多形”，降低跨平台门槛。在模型上，王晓刚提出引入“世界模型”：让机器人不仅能执行动作，还能理解物理规律和人类行为逻辑，从而提升复杂任务的规划与纠错能力。他强调，世界模型并非取代现有技术，而是与执行模型协同工作——前者负责生成多步骤计划和风险预判，后者专注动作执行，偏差时再介入调整，以提高稳定性。从产业趋势看，随着传感器成本下降、算力提升和应用需求增长，人形机器人正从“展示技术”转向“工程化产品”。但能否实现跨场景泛化，仍取决于数据规模化和模型的环境理解能力。未来竞争将聚焦真实数据采集与标注、模型架构创新及软硬件协同优化。同时，数据安全、隐私保护和场景合规也需建立规则，为规模化应用提供保障。

人形机器人从实验室走向大众的过程中，泛化能力是一道必须跨越的技术鸿沟。当数据采集从机械复制转向生态记录，当认知模型从单一指令升级为全局推演，这场智能变革正在重塑人机协作的边界。未来，谁能率先突破这些瓶颈，谁就能在人机共生时代占据先机。