iso 24617-15:可度量数量信息抽取(mqie)

中国标准团队拿下了15部国际标准,给非结构化数据找出了一大把“规律”,国际标准化组织(ISO)这次正式发布了《ISO 24617-15:语言资源管理—语义标注框架(SemAF)—第15部分:可度量数量信息抽取(MQIE)》,让机器能自动把文本里的数量信息精准提取出来。中国标准化研究院和华南师范大学领头干这事,广西电网有限责任公司提供了电力行业的实操经验,大家伙儿一块儿想办法。 以前医疗病历、财务报告那些乱七八糟的文字里藏着很多关键数据,可就是因为没法统一识别,导致这些价值没法完全释放出来。这次出的这个MQIE标准,就像是一本通用说明书,专门用来教机器怎么读懂数值、单位这些复杂的东西。它是在之前的ISO 24617-11(MQI语义表示框架)基础上进一步完善的,构建了一套跨领域都能用的规范流程。 这个标准把从文本识别、解析到变成结构化数据的路子都画出来了,尤其重点解决了不同地方说的话意思不一样的问题。这样一来,不管是中文还是英文的系统都能互相配合干活了。 其实这事儿不光是技术上的突破,也是咱们中国产、学、研、用一起发力的成果展示。大家在国际会议上发报告、做斡旋,证明咱们在这一块确实有话语权。专家说这不是单干成功了,而是从理论到应用的全链条创新。 以后用这个标准来处理数据就更方便了。在医院里能从病历里抠出用药剂量;在电力公司能帮着找到设备运行的关键数值;在金融审计上能解析财报里的数字;哪怕是在政府治理或者做舆情分析时,都能用它来激活那些藏在文字里的信息。 现在这个标准算是全球语义计算路上的一座里程碑,不仅是中国科技自立自强的体现,还给全世界破解数据难题提供了中国方案。随着它在全世界被更多人用起来,肯定能加速数据在各行各业流动起来的速度。 下一步咱们还要继续在这个领域深挖潜力,争取拿出更多基础性、引领性的国际标准出来,为构建数字世界贡献更多中国智慧。