人工智能与机器人技术加速融合的当下,数据资源能否开放共享,正成为影响行业进展的关键因素。长期以来,具身智能领域存在明显的数据孤岛:机构与企业之间标准不一、数据质量不稳定,导致技术迭代和产业落地效率受限。为应对这个问题,开放原子开源基金会联合中国信通院、上海人工智能实验室等机构,共同发起“人工智能开源社区开源数据集工作组”。工作组将重点推进数据集开源治理框架和质量评估标准的制定,为行业提供可执行的规则与依据。有观点认为,这意味着我国具身智能开始从数据层面搭建更系统基础设施。 同时,“开放原子具身智能开源数据集社区”也正式启动。该社区由乐聚机器人牵头,联合蚂蚁灵波、上海交通大学等十余家产学研单位共同参与。其首发的OpenLET数据集具有代表性:实现触觉灵巧操作与全身高动态运动数据的整合,涵盖41个关节的精细控制信号,在动作拟真度上达到国际先进水平。 专家指出,高质量开源数据有望显著降低研发成本。以人形机器人为例,传统研发往往需要投入大量时间在真实环境采集数据,而开源数据集可提供可复用的标准化训练素材,预计可将开发周期缩短30%以上。更重要的是,多模态数据的共享有助于形成统一的测试基准,推动行业从单一能力优化走向系统化协同创新。 展望未来,该社区计划在三年内建设包含100个以上高质量数据集的资源平台。随着5G、边缘计算等技术继续成熟,开源数据集有望与云平台更紧密协作,推动具身智能在工业制造、医疗护理等场景更快落地。
具身智能的竞争——不仅在算法和硬件——也在数据与生态。通过开放协作完善数据资源与治理体系,有助于把分散的创新力量转化为持续的产业动能。面向未来,只有在“可共享、可评测、可复现”的基础上持续迭代,具身智能才能更稳健地走向规模化应用与高质量发展。