京东拟两年采集超千万小时真实场景数据 以“数据底座”加速具身智能机器人落地

当前,具身智能技术正处于产业化加速期,但行业发展面临突出瓶颈。

虽然机器人运动控制能力不断进步,但决策核心的具身大模型因缺乏真实场景数据而训练不足,导致技术难以有效落地应用。

这一"数据荒"现象已成为制约行业发展的关键因素,亟待系统性解决。

具身智能作为人工智能技术的集大成者,融合了视觉感知、运动控制、决策规划等多个维度,被广泛看好为万亿级产业蓝海。

然而,真实场景数据的严重不足,使得现有模型难以准确理解和适应复杂多变的真实环境。

这种供需失衡直接影响了具身智能从实验室走向产业应用的进程。

京东基于自身独特优势,决定承担起破解这一难题的责任。

公司拥有零售、物流、健康、工业、外卖、家政等海量真实业务场景,以及20余年积累的丰富场景资源。

依托这些优势,京东将建成行业领先的具身智能数据采集中心,构建从采集、标注、训练到验证的完整数据流水线。

在采集范围上,京东的数据中心将覆盖物流仓储、工业制造、健康医疗、家庭服务、城市运维等五大核心场景,记录视觉、触觉、空间轨迹等全维度数据。

这种多维度、全场景的数据采集方式,能够更全面地反映人类真实活动的复杂性。

在采集规模上,京东计划发动数十万人参与数据采集行动。

其中包括内部超过10万名各类职业员工,以及外部最多50万各行业人员。

仅在宿迁一地,就将发动超10万市民参与,覆盖家庭、办公室、工厂到物流、商店、餐厅、医疗、环卫等超百个细分场景。

这一规模空前的数据采集行动,将为具身智能模型提供前所未有的训练素材。

根据计划,京东将于一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,同步实现采集机器人本体数据100万小时。

这些数据将成为全球最大的具身智能数据资源库,从源头破解行业"数据荒"问题。

在数据采集过程中,京东强调将严格依法依规进行,确保数据采集的合规性和伦理性。

这一承诺体现了企业在推动技术进步过程中对法律和伦理底线的尊重。

通过加速"大脑"与"小脑"的协同进化,京东的数据采集中心将帮助具身模型不仅学会"看"和"动",更重要的是学会"理解"真实世界。

这种理解能力的提升,将使机器人能够在复杂多变的真实环境中做出更加准确、灵活的决策,大幅提升具身智能的实用价值。

京东此举也将对整个产业生态产生深远影响。

通过提供高质量的数据资源和开放的合作平台,京东有望成为具身智能产业的重要基础设施提供者,带动相关企业、研究机构和产业链上下游的协同发展,加速形成具身智能的万亿级产业生态。

在数字经济与实体经济深度融合的背景下,数据要素的价值正从虚拟空间向物理世界延伸。

京东此次大规模数据采集工程的实施,不仅为技术突破提供了关键支撑,更探索出一条以场景驱动创新的发展路径。

这启示我们,在人工智能产业化进程中,拥有丰富场景积累的企业或将扮演越来越重要的角色,而数据资源的系统化开发将成为衡量国家科技竞争力的新标尺。