京东拟依托多元业务场景建设具身数据采集中心 两年目标汇聚千万小时真实数据

具身智能作为人工智能技术发展的前沿方向,正在成为万亿级新兴市场。

与传统算法仿真不同,具身智能需要机器人在真实环境中学习和执行任务,这对高质量、多场景的实际数据提出了迫切需求。

当前,具身智能产业面临的核心瓶颈正是数据的严重不足,这制约了相关技术的快速迭代和应用落地。

京东此次启动的具身智能数据采集中心项目,正是针对这一行业痛点的系统性解决方案。

该中心将充分发挥京东在零售、物流、健康、工业、外卖、家政等领域积累的丰富真实业务场景优势,构建覆盖五大核心领域的数据采集体系。

其中,物流仓储、工业制造、健康医疗、家庭服务、城市运维等场景将成为重点采集对象,涵盖视觉、触觉、空间轨迹等全维度数据类型。

为实现这一宏大目标,京东采取了创新的众包采集模式。

项目将发动数十万人参与数据采集工作,其中包括京东内部超过10万名各类职业员工,以及外部最多50万来自各行业的参与者。

仅在宿迁一地,就将有超过10万市民参与其中。

这种大规模、全社会参与的方式,使得采集范围能够覆盖家庭、办公室、工厂、物流中心、商店、餐厅、医疗机构、环卫作业等超百个细分场景,真实记录人类日常活动的全方位信息。

在数据质量保障方面,京东建立了完整的"采集—标注—训练—验证"全流程数据处理体系。

所有采集活动都将严格依法依规进行,确保数据合规性和伦理规范。

这一系统化的流程设计,不仅能够保证数据的准确性和可用性,也为具身智能模型的训练提供了坚实基础。

根据计划,京东将在一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,同步实现采集机器人本体数据100万小时。

这样的数据规模在全球范围内属于前所未有的,将使京东成为全球最大的具身智能数据公司。

通过这些海量、高质量的真实数据,具身智能产业有望实现从算法仿真向真实数据驱动的重大转变。

从技术层面看,京东的这一举措将加速具身智能中"大脑"与"小脑"的协同进化。

具身智能不仅需要学会"看"和"动",更重要的是学会"理解"真实世界的复杂性。

充足的真实场景数据将帮助机器人建立更准确的世界模型,提升其在复杂环境中的适应能力和决策水平。

当科技巨头竞逐大模型参数规模之际,京东选择深耕真实世界的地基工程。

这场百万小时量级的数据长征,不仅关乎企业自身技术护城河的构筑,更折射出中国人工智能发展路径的务实转向——唯有扎根产业土壤,方能让智能技术真正服务于人类生产生活。

未来,数据要素与场景创新的化学反应,或将重新定义人机协作的边界。