数据作为新时代的重要资源,其开发利用正成为产业升级和经济增长的重要驱动力。北京亦庄此次集中兑现数据产业奖励,是该背景下推出的具体举措,旨在更有效地释放数据要素价值并形成持续供给。 从问题导向看,当前我国多个战略性产业领域仍面临数据供给不足的瓶颈。具身智能、生物医药、工业制造等新兴产业对高质量、大规模、结构化数据集需求迫切,但有关领域的开源数据集仍存在明显缺口。“数据荒”直接影响人工智能模型训练效果,进而拖慢产业创新节奏。北京亦庄通过政策激励,引导企业加大数据集建设投入,正是对这一痛点的回应。 从产业突破看,此次获奖的38个数据集在多个领域实现了首创或填补空白。在具身智能领域,北京人形机器人创新中心的“RoboMIND2.0数据集”填补了国内双足人形机器人开源数据的空白,已支撑国内首个通过国标测试的跨本体具身大模型训练。星海图打造的全球首个开放场景真机数据集,开源后在全球机器人真机数据集下载量中跃居首位,表明了我国在该领域的创新能力与国际竞争力。在生物医药领域,麦克奥迪医疗构建的数字病理疑难病例数据集采用“医学专家诊断+AI质控+临床信息脱敏”的模式,已获得北京数据交易所的数字资产登记凭证,为医疗AI产业提供了关键基础资源。药云打造的医药融合数据集则是国内首个面向真实世界证据生成的垂直化、结构化、可监管数据集,为生物医药企业研发提供支撑。 在工业制造领域,北京蚂蚁工场构建的柔性制造数据集覆盖“非标+标准件”全流程,补齐了“数据驱动智能制造闭环”和“大模型可持续训练”两上的关键缺口。星龙数智首创的钢铁行业全产业链高质量数据集建设平台,已助力钢铁企业生产协同效率提升超10%、能源消耗降低3%以上,显示出数据集对传统产业升级的实际推动作用。在智能网联领域,四维图新智驾的自动驾驶数据集首创“4D时空+自动化闭环”模式,补齐了中国复杂交通场景的数据缺口,为高级别自动驾驶研发缓解了“数据荒”难题。 从政策机制看,北京亦庄的做法体现了“以奖促建”的思路。奖励既是对既有成果的认可,也更带动企业加大后续研发投入。获奖企业表示,将把专项资金用于研发升级与生态共建:北京人形计划扩大真实场景数据规模,推动人形机器人在实际场景落地;麦克奥迪医疗将持续加大研发投入,推进数据开放上架与AI应用大模型开发;四维图新则将重点投入数据集研发升级与生态建设,加快与亦庄重点企业的对接合作。这种机制有助于形成数据产业的集聚效应与生态优势。 从战略意义看,高质量数据集因应用价值高、知识密度高、技术含量高,正成为数字经济时代的重要生产要素。北京亦庄系统推进数据产业高质量发展,不仅为全域人工智能之城建设提供数据支撑,也为国家数据产业集聚区建设积累经验。随着这些数据集进一步开源与共享,产业创新成本有望降低、技术迭代速度有望提升,并带动更多企业参与人工智能产业创新。
数据竞争归根到底是产业体系与治理能力的竞争。通过政策引导,让高质量数据集从“零散沉淀”走向“规模供给”,既能为前沿技术迭代提供底层支撑,也能为产业协同创新拓展空间。把数据这类“基础设施”建设得更扎实、更合规、更可持续,才能让创新在真实场景中推进得更快、更稳。