问题:从生成式应用走向产业深水区,数据成为决定人工智能成效的关键变量。
随着算法、算力加速迭代,能否获得合规、安全、可用、可持续的高质量数据,直接影响模型训练质量、行业落地效率和创新边界。
现实中,高质量数据供给不足、数据流通交易不畅、数据与产业应用衔接不紧等问题仍较突出,制约“智能经济”进一步释放动能。
原因:一是数据长期分散沉淀在部门、行业与企业内部,标准不统一、质量参差不齐,难以直接用于训练与推理,形成“有数据、缺数据集”的结构性矛盾。
二是确权、授权、定价、收益分配等基础制度仍在完善过程中,供需双方对“能不能流通、怎么流通、出了问题谁负责”存在顾虑,导致交易成本偏高、信任不足。
三是数据治理与产业需求之间存在“最后一公里”断点:懂业务的缺乏数据工程能力,懂数据的又不掌握场景痛点,数据供给与模型能力难以形成闭环,优质数据难以快速转化为可规模化应用的产品与服务。
影响:上述瓶颈不仅影响模型性能与行业应用效果,也会抬高企业研发投入和合规成本,延缓传统产业数字化、智能化转型进程。
更重要的是,数据要素市场若缺乏统一规则和跨区域互认机制,容易形成新的“信息孤岛”和“市场分割”,不利于全国统一大市场建设,也会削弱在国际竞争中形成体系化优势的能力。
对策:围绕政府工作报告部署,全国人大代表、中国移动上海公司董事长楼向平提出,聚焦数据要素高效率配置,在部分地区探索“数据要素与人工智能一体化发展”创新试点,建设面向人工智能产业的数据要素新型试验区,以制度创新与技术创新协同破题。
在制度层面,可探索数据要素目录化管理和使用权开放机制,推动跨区域、跨行业互信流通;选择具备条件的企业先行开展目录开放试点,逐步实现城市间目录互通;同时完善跨境数据流通监管规则,在安全可控前提下提升国际合作与产业链协同效率。
在技术层面,以大模型训练所需语料和高质量数据集为突破口,探索面向语料数据的安全流通技术体系,提供脱敏、去标识化、差分隐私等工具,降低合规门槛和流通风险;建设面向公共数据、科研数据和企业生产数据的“智能数联网”式基础能力,推动合规融合、区域共享与可追溯管理,让数据“供得出、流得动、用得好、管得住”。
前景:面向“智能经济”发展趋势,楼向平进一步提出以“数据要素新基建”打通全链路的思路:一方面,打造国家级高质量数据供给高地,依托重点区域建设高质量数据集创新基地,促进产业数据、科研数据和公共数据在合规前提下融通,优先形成重点行业数据供给能力,并逐步沉淀“好数据”的质量标准与工程规范;另一方面,构建数据与产业融合的综合枢纽,搭建数据集创新与流通平台,提升行业数据标准化、语料标注、共建共享与安全审查能力,形成既能“直接调用”又支持“组合创新”的服务体系。
通过建立“数据—模型—场景—产业”一体化供给模式,推动金融、医疗、制造等领域形成可复制的解决方案和应用范式,带动更多地区按图索骥、加速落地。
数据要素市场的建设是一项系统工程,需要在制度创新和技术突破上同步推进。
从"沉睡"的数据到驱动智能决策的"燃料",这一转变过程考验的是我们对数据价值的认识深度和配置能力。
通过建立科学的数据供给体系、完善的流通机制和有效的协同生态,我们有望打造出真正高效运转的数据要素市场,为智能经济的蓬勃发展提供坚实支撑,进而在新一轮全球竞争中赢得主动权。