工信部发布具身智能基准测试方法行业标准：数据采集成本高与异构难题待破

问题：标准体系加速建立，数据难题却更为紧迫随着人形机器人产业进入规模化探索阶段，标准化正成为量产绕不开的一道门槛。近日，工业和信息化部批准发布《YD/T 6770—2026 人工智能关键基础技术具身智能基准测试方法》，对仿真环境与真实环境下的基准测试环境设置、任务库构建、测试流程和指标计算方法作出明确规定。标准落地后，行业将拥有更可对比、可复现的评价依据，有助于降低“各测各的”带来的成本和沟通摩擦。但多位业内人士同时指出——评价体系可以先建立——能力提升却离不开高质量数据。对应的研究认为，要推动具身智能能力出现明显“涌现”，需要百万小时量级的真实世界长周期物理交互数据，而目前行业积累仍偏少，数据缺口与结构不统一的问题正加速暴露。原因：真实交互成本高、形态差异大、数据结构难对齐一是采集门槛高。不同于互联网文本、图片等可自然沉淀并规模化获取的数据，具身智能训练更依赖“机器人如何做”的过程数据，涉及执行器状态、力觉/触觉、位姿轨迹、视觉与环境反馈等多模态信息，往往还要同步标注任务目标与结果。采集、清洗、标注与安全管理叠加，成本很快上升。二是系统高度耦合。机器人软硬件紧密绑定，不同本体的关节拓扑、传感器配置、控制频率、坐标系定义与通信协议差异明显，导致同一任务在不同平台上生成的数据难以直接复用。业内通常将这类“形态、模态、坐标、格式不一致”的数据称为异构数据，相比同构数据，跨平台使用需要额外的转换与校准投入。三是路径多元却难统一。当前数据采集主要来自遥操作、动作捕捉以及互联网视频（含合成数据）等路径。遥操作可获得高保真、细粒度的操作记录，是现阶段较常用的方案，但对控制设备、场地与维护投入要求高，采集速度与规模化能力受限；动作捕捉在全身运动控制数据上具备真实且可控的优势，但在精细接触、力反馈和复杂工具操作上存在天然短板；互联网视频与合成数据资源丰富、扩充速度快，但要实现从“看得懂”到“做得对”，仍需突破三维重建、时序对齐、可执行性映射等关键问题。影响：数据“瓶颈”外溢至研发、量产与应用落地业内分析认为，数据难题不只是影响模型训练效率，还会反向拖慢产品工程化进度。其一，研发迭代被迫放缓。数据不足会导致算法对长尾场景、异常状态与复杂接触任务覆盖不够，容易出现“实验室可用、现场不稳”的落差，进而拉长调参与安全验证周期。其二，量产优势难转化为能力优势。近期多地加速布局人形机器人产线，部分企业已探索万台级自动化产能，但如果数据与评测体系不匹配，硬件规模提升未必带来作业技能的快速复制，影响成本摊薄与交付节奏。其三，生态协同成本上升。企业各自采集、各自定义、各自评测，数据资产难以流通，重复建设加剧；中小主体更难长期承担高成本数据投入，产业分工与协作效率随之受限。对策：以基准测试为牵引，推动数据治理与工具链共建业内建议，数据标准化不必一开始就追求“完全统一”，可先在“可比、可用、可控”层面取得进展。一是用统一基准测试框架牵引“任务标准”。在不强制统一采集设备与流程的前提下，围绕典型作业场景建立可执行、可评估的任务库与指标体系，让数据采集更贴近训练目标，减少无效采集。二是推动跨平台数据“最小公约数”建设。围绕坐标系、时间戳、传感器标定、动作语义等关键环节，形成基础元数据规范与转换工具链，降低异构数据融合门槛，提高复用率。三是发展分层数据策略。高风险、高精度任务继续依托遥操作获取“金标准”数据；通用运动控制与姿态学习可更多采用动作捕捉与仿真合成；需要覆盖场景多样性与长尾问题时，可引入互联网视频与合成数据进行预训练，再用少量高保真数据校正与对齐，在成本与效果之间取得平衡。四是探索数据共享与合规机制。在确保安全与商业边界的前提下，鼓励建设行业级数据资源池、评测平台与第三方验证机制，减少重复投入，提高整体创新效率。前景：标准先行促良性竞争，数据体系建设将决定“下一程” 从产业规律看，标准化往往意味着从“能做出来”走向“能稳定做、批量做、可对比做”。随着基准测试行业标准落地，企业研发与产品交付有望获得更清晰的性能坐标系，市场也更容易识别真实能力与持续迭代水平。面向未来，硬件规模化与零部件体系成熟仍将推进，但具身智能能否深入突破，关键将取决于数据治理能力、工具链工程化水平以及跨平台协作生态的完善程度。

具身智能的标准化之路既检验技术成熟度，也考验产业协同能力。在政策引导与市场需求共同作用下，我国有望在该新兴领域实现从跟跑到领跑的跨越，并为全球人工智能与机器人技术发展提供更多可借鉴的实践经验。