围绕具身智能从实验室走向产业一线,数据正在成为制约其规模化落地的关键变量。
业内普遍认为,具身智能不仅要“看懂”环境,更要在复杂物理世界中完成连续决策与动作协同;而支撑这种能力的训练数据,必须兼顾真实、完整、可复用与可合规。
库帕思与它石智航此次战略合作,直指行业共性痛点:数据标准缺位、数据来源范式分散、工程化落地成本高。
问题:现有数据难以支撑高质量规模化应用。
当前具身智能训练主要依赖互联网数据、仿真数据以及遥操作真机数据等路径。
互联网数据偏向“认知表达”,对动作链路和物理交互的覆盖不足;仿真数据虽易扩展,但与真实世界存在域差异,迁移成本高;遥操作真机数据能够接近真实,但在一致性、任务完整性、成本与合规管理等方面仍面临挑战。
与此同时,不同机构采集口径、标注体系、数据格式与安全规范不统一,导致数据难以流通复用,训练与部署的边际成本居高不下。
原因:产业进入快跑期,标准与基础设施跟进不足。
具身智能应用场景横跨制造、物流、服务等领域,任务链条长、交互环节多,数据既包含视觉、触觉、力控、位姿等多模态信息,也包含任务意图、流程约束与安全边界等结构化要素。
行业在快速迭代中形成了“各自为战”的数据体系:一方面,企业为抢占窗口期倾向于自建闭环,数据难共享;另一方面,统一标准的制定需要兼顾技术可行性、商业可持续与合规安全,推进周期较长。
由此造成“模型能力提升快、数据供给体系建设慢”的错配。
影响:数据范式之争将影响产业竞争力与应用扩散速度。
谁能率先形成可复制的数据标准与合规流通机制,谁就更可能在规模化部署中获得成本优势与稳定性优势。
若缺乏统一标准,企业在数据采集、清洗、标注、存储与审计上重复投入,导致研发资源被“工程消耗”;同时,数据质量参差也会引发模型在真实生产中的不稳定,增加安全风险与运维成本。
反之,若能形成行业认可的数据规范与共享生态,将显著提升数据利用效率,推动“从单点示范到批量复制”的扩散。
对策:以真实场景人类操作流程为核心推进标准与语料体系共建。
根据双方披露的信息,此次合作将围绕三项重点展开:一是联合推进具身数据标准研制,探索以Human-centric为核心的数据范式,即以真实场景下的人类操作流程数据为基础,强调任务长时性与完整性,提升数据一致性与可泛化能力;二是共建覆盖垂直行业的高质量具身智能语料库,形成面向行业任务的规范化数据供给;三是联合发起“具身数据星火计划”,构建安全、合规、高效的数据共享生态,目标推动实现亿小时级数据流通规模,从而降低采集、获取与使用成本,提升产业协同效率。
从合作分工看,库帕思侧重语料数据平台化供给能力,面向基础模型与行业模型提供低成本、高质量数据服务;它石智航强调全栈技术与数据基础设施构建能力,主张以真实场景流程数据贴近具身智能“理解—行动”一体化需求。
双方提出以“需求牵引”与“技术驱动”形成闭环,实质上是把数据生产与应用部署更紧密地绑定,减少“为数据而数据”的低效投入,让数据体系直接服务于产业任务与商业化落地。
前景:标准化、规模化与合规化将成为下一阶段主线。
随着具身智能加速进入工厂、仓储、园区等场景,行业对数据的要求将从“可用”转向“可审计、可复用、可迁移、可扩展”。
预计未来一段时期,数据标准将逐步从格式与标签层面,延伸至任务定义、评测指标、安全边界与隐私保护等更完整的体系;语料库建设将更多聚焦垂类任务的可复制流程;共享生态将从单纯交换数据走向“数据—工具—评测—合规”一体化协作。
若相关计划推进顺利,有望加速形成一批可规模复制的行业应用范式,进一步带动上下游企业在采集设备、标注工具、数据治理与系统集成等方面协同升级。
数据是人工智能时代的“新石油”,而标准化则是高效开采与利用的关键。
库帕思与它石智航的战略合作,不仅为具身智能技术落地扫清了数据障碍,更探索出一条产学研协同创新的可行路径。
在数字经济与实体经济深度融合的背景下,此类合作或将成为推动技术革命与产业升级的重要范式。