高质量数据集建设生态行首站成都启动产学研携手助力大模型产业发展

在数字经济加速发展的背景下，数据要素已成为推动人工智能产业高质量发展的关键资源。

1月16日，第三届“大模型大未来”人工智能大模型基准测试发展大会在成都高新区召开，标志着西部数据要素发展迈出重要一步。

作为大会的重要成果，“四川数据标注和数据质量评估能力共建计划”正式启动，中国信通院、四川长虹等8家单位将协同推进数据标注与质量评估能力建设，为区域人工智能产业发展注入新动能。

问题：数据质量成为产业瓶颈当前，人工智能技术的快速迭代对数据质量提出了更高要求。

天津大学计算机科学与技术学院教授熊德意在主题分享中指出，尽管大模型依赖海量数据，但“数据量”并不等同于“数据智”。

如何筛选高质量数据集，已成为制约模型性能和应用落地的关键瓶颈。

原因：数据要素价值亟待释放中国人工智能产业发展联盟数据委员会主任李荪表示，高质量数据集的概念提出仅一年多，但已在各行业引发强烈反响。

成都作为国家七大标注基地之一，具备数据资源管理、应用场景培育的先天优势。

然而，数据要素的流通与价值挖掘仍面临标准化不足、协作机制不完善等挑战。

影响：区域协作赋能产业升级四川省大数据发展研究会秘书长秦强子介绍，四川已初步构建涵盖288家会员单位、3900余家生态企业的协同发展网络。

此次共建计划的启动，将进一步整合区域资源，推动数据标注标准化、规模化发展，为全国提供可复制的实践经验。

对策：多方联动构建生态体系中国信通院专家樊威预测，2026年世界模型、具身智能等四类数据集需求将迎来爆发。

为此，工信部提出“模数共振”策略，倡导模型与数据集协同创新。

成都作为西部数字经济高地，将通过“生态行”活动探索跨区域协作模式，加速数据要素市场化配置。

前景：数据驱动产业高质量发展随着数据标注基地的完善和行业标准的建立，高质量数据集将成为人工智能产业的“燃料库”。

专家认为，未来需通过“数据工厂+体系建设+合规可控”三措并举，实现数据要素价值的最大化释放，为智能经济提供坚实支撑。

大模型竞速的下半场，拼的不只是算力投入，更是数据底座的厚度与治理能力的精细度。

把分散沉睡的数据转化为可流通、可评测、可迭代的高质量数据集，需要制度设计、技术体系与生态协作同向发力。

以共建计划为起点，推动标准、能力与场景联动，才能让数据真正成为驱动产业创新的“关键生产要素”，为新质生产力培育提供更坚实的支撑。

高质量数据集建设生态行首站成都启动 产学研携手助力大模型产业发展