围绕数据要素市场化配置改革和产业数字化升级需求,广东省政务服务和数据管理局近日启动首届高质量数据集创新大赛第一期赛事。
赛事以“构建可用、好用、可复用”的高质量数据集为导向,聚焦能源、生物医药、金融服务、交通、医学检验、低空、教育创新、工业制造等重点方向,集中发布10个高质量数据集构建与应用赛题,旨在推动数据资源从“分散沉淀”向“规模供给”、从“单点试用”向“场景赋能”转变。
从现实问题看,不少行业在推进智能化应用过程中仍面临数据供给不稳定、标准不统一、质量参差不齐等瓶颈。
一方面,数据分布在政务、企业、科研院所等多类主体中,跨部门、跨行业的共享协同成本较高;另一方面,数据治理基础薄弱会导致训练样本偏差、标签质量不高、更新频率不足等情况,直接影响算法模型可靠性与业务落地效果。
高质量数据集作为“可直接用于研发与应用的生产资料”,已成为提升创新效率、降低试错成本的重要支撑。
从原因分析看,构建高质量数据集并非简单“汇集数据”,而是系统工程,涉及数据采集、清洗脱敏、标注校验、规范建模、版本管理、合规审查和安全防护等多环节。
尤其在金融、医学检验、生物医药等敏感领域,既要满足合规要求与隐私保护,又要保证数据的真实性、时效性和代表性,需要政产学研用多主体协同推进。
以赛事形式汇聚需求侧与供给侧力量,有利于把分散的技术能力、应用场景和治理经验组织起来,形成可复制推广的解决方案。
就赛事安排而言,本期赛事分为报名、初赛、复赛、路演四个阶段。
报名阶段为2026年1月1日至1月31日;比赛阶段为2026年2月1日至5月31日。
赛事官方网站为http://www.gddatafair.com。
参赛对象为广东省内依法注册的企业事业单位、科研院所、高校等独立法人单位。
赛事鼓励牵头单位与省内外机构联合组队参赛,支持产学研用一体化团队及跨领域协作团队,以提升数据集建设能力与应用转化效率。
有关单位如有参赛意向,需在2026年1月30日前将参赛意向表反馈至梅州市政务服务和数据管理局邮箱dzzwk@meizhou.gov.cn。
从影响层面看,赛事对提升区域数据资源供给能力、促进产业链协同创新具有现实意义。
其一,通过发布赛题倒逼数据治理与标准化建设,推动形成一批可验证、可交付的高质量数据集产品,增强公共服务与行业应用的底座能力。
其二,通过政策激励、人才支持和成果转化等权益设计,引导更多创新主体把“数据治理投入”转化为“可衡量的创新产出”,提升数据资源开发利用的积极性。
其三,围绕八大领域组织竞赛,有望促成一批可落地的应用示范,带动上下游企业在数据采集、合规处理、工具平台和行业应用等环节形成协同,进一步释放数据要素对实体经济的放大、叠加、倍增作用。
在对策层面,参赛单位要在“可用”与“合规”之间把握平衡,把数据质量与安全治理作为核心竞争力。
一是强化问题导向,围绕赛题场景明确数据集目标、指标体系与验收标准,避免“为建而建”。
二是夯实治理基础,建立从数据来源、处理流程到标注规范、质量抽检的全流程管理,确保数据集具备稳定性与可持续更新能力。
三是突出应用牵引,把数据集与具体业务流程、行业痛点深度绑定,形成可复用的模型训练与应用方案,提高成果转化效率。
四是守牢安全底线,严格落实数据分类分级、脱敏处理和权限控制等要求,以制度与技术双重手段降低风险。
展望未来,随着数据要素相关制度体系不断完善,社会各界对高质量数据供给的需求将持续增长。
通过赛事组织方式汇聚创新资源、验证解决方案、促进成果对接,有望推动一批具有行业影响力的数据集产品和应用标杆加速形成,并进一步带动数据标准、工具平台和人才体系建设。
可以预期,围绕重点产业与新兴场景的高质量数据集建设将从“项目化探索”迈向“体系化供给”,为广东推进数字经济高质量发展、培育新质生产力提供更坚实的支撑。
高质量数据集的创新应用是推动产业数字化转型的重要抓手。
广东省此次举办的高质量数据集创新大赛,不仅为各类市场主体提供了展示创新成果的舞台,更搭建了产学研用协同创新的平台。
通过竞争激励和政策支持相结合的方式,大赛有望发掘出一批具有重大应用价值的数据集产品,助力广东在数据经济时代抢占发展先机。
有关单位和机构应充分认识到这一机遇的重要性,踊跃参与其中,共同推进数据要素的高效流通和创新应用,为粤港澳大湾区建设和广东经济高质量发展贡献力量。