咱把目光转向2026年,那时候中国北京可能会发生点有意思的事儿。工信部打算把这次行动叫做“工业数据筑基行动”,想把数据“采”、“集”、“用”这几个难关给破解了。孙丽朝在《中国经营报》那儿发了消息,说工信部刚发了个通知,就是要先在搞高质量行业数据集建设上探探路。 通知里还说了,到了2026年年底,想培养一批大伙儿一起干活的联合体,建个大家能互相信得过的互联平台。得把数据都攒在一起,搞懂点技术,定一些规矩,还要做出那些能用得着的高质量数据集。这样才能让行业大模型和工业智能体这两样东西真正落地。 盘古智库的吴琦就聊了聊这个瓶颈问题。他觉得现在“采”数据难就难在源头不一样、接口不统一、设备还关着门,现场的数据质量忽高忽低且花钱不少;“集”数据难在没规矩、治理跟不上、跨公司跨环节转不动;“用”数据难在场景不够多,转成大模型训练的语料或者工业智能体的能力不容易。 为了搞定这些事,通知就盯着那些本来基础就不错、还有潜力挖的制造业重点行业。它打算靠龙头企业、平台机构、先进集群和中小企业试点这几类人推动成立联合体来试试水。 行业布局上挑了钢铁和汽车这种大佬带头。利用它们在产业链上的整合力,把上下游的企业、科研院所、数据服务商还有做模型的公司凑一块儿。探索怎么搞开发和怎么流通协作的路子。主要任务是攻克技术难关、制定标准、打造好数据集和落地应用场景。 重点任务这块儿呢?通知说要靠联合体把可信互联平台建起来。这得弄出四个资源库:资源库、技术攻关库、标准库和数据集库。还得围着研发设计、中试生产这些关键环节落地大模型应用和智能体研发。 组联合体的时候怎么解决大家都怕共享数据的心理障碍?吴琦觉得关键是把联合体做成“既有钱赚又有保障”的组织。一是得让龙头企业、平台机构和科研院所一起定规矩;二是靠那个互联平台让大家能授权、能追溯;三是得有分钱的办法让大家有动力;四是要给中小微企业提供工具和服务,让它们能放心分享。 他还说这个通知就是要通过可信平台和四大库形成一套可以采集、能治理、能流通、能用的体系。这不仅能帮制造业省钱提效搞清楚家底,也给了行业大模型和工业AI落地提供了好的制度保障。 最后通知还要求各地政府多给点钱支持,鼓励地方部门发奖金搞试点。还要依托国家级开源社区搞个专区支持开源建设。鼓励联合体多跟学校合作培养那种既懂行又懂数据的复合型人才。(编辑:吴婧 审核:朱紫云 校对:颜京宁)