在数字经济加速发展的背景下,数据要素已成为推动人工智能产业高质量发展的关键资源。
1月16日,第三届“大模型 大未来”人工智能大模型基准测试发展大会在成都高新区召开,标志着西部数据要素发展迈出重要一步。
作为大会的重要成果,“四川数据标注和数据质量评估能力共建计划”正式启动,中国信通院、四川长虹等8家单位将协同推进数据标注与质量评估能力建设,为区域人工智能产业发展注入新动能。
问题:数据质量成为产业瓶颈 当前,人工智能技术的快速迭代对数据质量提出了更高要求。
天津大学计算机科学与技术学院教授熊德意在主题分享中指出,尽管大模型依赖海量数据,但“数据量”并不等同于“数据智”。
如何筛选高质量数据集,已成为制约模型性能和应用落地的关键瓶颈。
原因:数据要素价值亟待释放 中国人工智能产业发展联盟数据委员会主任李荪表示,高质量数据集的概念提出仅一年多,但已在各行业引发强烈反响。
成都作为国家七大标注基地之一,具备数据资源管理、应用场景培育的先天优势。
然而,数据要素的流通与价值挖掘仍面临标准化不足、协作机制不完善等挑战。
影响:区域协作赋能产业升级 四川省大数据发展研究会秘书长秦强子介绍,四川已初步构建涵盖288家会员单位、3900余家生态企业的协同发展网络。
此次共建计划的启动,将进一步整合区域资源,推动数据标注标准化、规模化发展,为全国提供可复制的实践经验。
对策:多方联动构建生态体系 中国信通院专家樊威预测,2026年世界模型、具身智能等四类数据集需求将迎来爆发。
为此,工信部提出“模数共振”策略,倡导模型与数据集协同创新。
成都作为西部数字经济高地,将通过“生态行”活动探索跨区域协作模式,加速数据要素市场化配置。
前景:数据驱动产业高质量发展 随着数据标注基地的完善和行业标准的建立,高质量数据集将成为人工智能产业的“燃料库”。
专家认为,未来需通过“数据工厂+体系建设+合规可控”三措并举,实现数据要素价值的最大化释放,为智能经济提供坚实支撑。
大模型竞速的下半场,拼的不只是算力投入,更是数据底座的厚度与治理能力的精细度。
把分散沉睡的数据转化为可流通、可评测、可迭代的高质量数据集,需要制度设计、技术体系与生态协作同向发力。
以共建计划为起点,推动标准、能力与场景联动,才能让数据真正成为驱动产业创新的“关键生产要素”,为新质生产力培育提供更坚实的支撑。