在“人工智能+”的大潮中,高质量数据集已经成了推动产业智能化、培育新经济的关键。大家都在盼着江苏苏南地区能给出个像样的答案。就在前不久,记者从省里听说,南京、无锡、常州、苏州、镇江这五个城市已经吹响了号角。苏南五市决定给高质量数据集建设按下加速键。什么是高质量数据集?国家数据局弄了个《高质量数据集建设指引》,里头说得很清楚:这是经过采集、加工后能直接用来开发训练模型的好东西。 怎么建得可持续、有推广价值、能落地?省政府最近给了张底牌,发了个通知要搞要素市场化配置试点,五年的行动方案也一并放出来了。五市结合各自的家底和产业基础,打算走差异化路子。南京这边主要是想搞城市治理的数据,争取把标准提高到省里层面,再把共建共享这事搞活。他们还想抢个全省首家高质量数据集产业基地的头衔,带头搞医疗行业的试点。无锡支持滨湖率先去当国家级试点。常州是要搞医疗数据标注平台,计划弄150个以上的高质量数据集,把这里打造成高端基地。苏州呢,想参与数据标注和标准制定的事儿,结合产业优势先把重点行业的高质量数据集弄出来再推到全国去。 到了2027年,苏州那边计划弄100个公共数据开发利用产品,还要搞出300个重点领域的高质量数据集。苏州还依托一些基础设施平台来建设服务平台和实验室。南京也有大动作,要建起AI融合底座和模型测评中心。常州更是要直接建好20个以上的行业高质量数据集,还要培育60家以上的数据企业和100个以上的数据产品。镇江则是要把整个“供给-标注-流通-应用”的链路打通。镇江市力争把这些任务高标准完成,成为高质量数据集国家试点的成功案例。 看看南京和常州市还有什么打算?南京市要推动城市治理高质量数据集全省共享共用,完善物联感知技术规范;常州市要建设医疗领域数据标注平台;苏州市要支持参与数据标注、数据集相关标准的制定和验证;无锡要支持滨湖区率先开展国家高质量数据集建设项目试点。到了2027年,南京和常州市还要建成一批公共数据开发利用产品和重点领域高质量数据集。 无锡还要加快国家数据发展研究院高质量数据集实验室(工业制造领域)等国家级平台建设。到2027年,公共数据开发利用产品达100个,重点领域高质量数据集达300个。镇江市要构建“数据集供给—标注加工—市场流通—场景应用”全链路体系,建设高质量数据集。到2027年,打造20个以上行业高质量数据集,培育60家以上数据企业,开发100个以上数据产品,高标准完成高质量数据集国家试点任务。