京东拟依托多元业务场景建设具身数据采集中心两年目标汇聚千万小时真实数据

具身智能作为人工智能技术发展的前沿方向，正在成为万亿级新兴市场。

与传统算法仿真不同，具身智能需要机器人在真实环境中学习和执行任务，这对高质量、多场景的实际数据提出了迫切需求。

当前，具身智能产业面临的核心瓶颈正是数据的严重不足，这制约了相关技术的快速迭代和应用落地。

京东此次启动的具身智能数据采集中心项目，正是针对这一行业痛点的系统性解决方案。

该中心将充分发挥京东在零售、物流、健康、工业、外卖、家政等领域积累的丰富真实业务场景优势，构建覆盖五大核心领域的数据采集体系。

其中，物流仓储、工业制造、健康医疗、家庭服务、城市运维等场景将成为重点采集对象，涵盖视觉、触觉、空间轨迹等全维度数据类型。

为实现这一宏大目标，京东采取了创新的众包采集模式。

项目将发动数十万人参与数据采集工作，其中包括京东内部超过10万名各类职业员工，以及外部最多50万来自各行业的参与者。

仅在宿迁一地，就将有超过10万市民参与其中。

这种大规模、全社会参与的方式，使得采集范围能够覆盖家庭、办公室、工厂、物流中心、商店、餐厅、医疗机构、环卫作业等超百个细分场景，真实记录人类日常活动的全方位信息。

在数据质量保障方面，京东建立了完整的"采集—标注—训练—验证"全流程数据处理体系。

所有采集活动都将严格依法依规进行，确保数据合规性和伦理规范。

这一系统化的流程设计，不仅能够保证数据的准确性和可用性，也为具身智能模型的训练提供了坚实基础。

根据计划，京东将在一年内积累500万小时人类真实场景视频数据，两年内突破1000万小时，同步实现采集机器人本体数据100万小时。

这样的数据规模在全球范围内属于前所未有的，将使京东成为全球最大的具身智能数据公司。

通过这些海量、高质量的真实数据，具身智能产业有望实现从算法仿真向真实数据驱动的重大转变。

从技术层面看，京东的这一举措将加速具身智能中"大脑"与"小脑"的协同进化。

具身智能不仅需要学会"看"和"动"，更重要的是学会"理解"真实世界的复杂性。

充足的真实场景数据将帮助机器人建立更准确的世界模型，提升其在复杂环境中的适应能力和决策水平。

当科技巨头竞逐大模型参数规模之际，京东选择深耕真实世界的地基工程。

这场百万小时量级的数据长征，不仅关乎企业自身技术护城河的构筑，更折射出中国人工智能发展路径的务实转向——唯有扎根产业土壤，方能让智能技术真正服务于人类生产生活。

未来，数据要素与场景创新的化学反应，或将重新定义人机协作的边界。

京东拟依托多元业务场景建设具身数据采集中心 两年目标汇聚千万小时真实数据