一、问题:高频术语进入公众视野,中文表述亟待统一 近期,随着大模型训练、推理与应用不断扩展,token已成为技术文档、产品说明、媒体报道和日常讨论中的高频词。但实际使用中,token常被直译、音译,或被“标记”“令牌”“词”等不同说法替代,导致同一概念多种表达并存:在专业交流中容易出现理解偏差,科普传播也更容易产生门槛与误读。如何为该术语确定准确、简洁、易推广的中文名称,成为业界与社会关注的焦点。 二、原因:概念专业且演进快,跨场景使用增加命名难度 token并非简单的“词语”或“字符”。在人工智能尤其是语言模型中,它通常指模型处理信息的基本离散单位,既承载一定语义,也用于计量与交换。随着模型从文本走向语音、图像、视频等多模态方向,“最小处理单位”的内涵也在持续扩展。概念本身专业、变化快,再加上中英文混用普遍,使中文命名长期缺乏统一口径,也让规范化工作更紧迫、更复杂。 三、影响:不统一影响协同效率,也影响公众理解与产业传播 在科研与产业层面,术语不一致会抬高跨团队协作成本:论文写作、工程文档、接口规范与教育培训中需要反复解释,影响沟通效率与成果复用。在传播层面,中文表达不稳定容易造成“同词异义”或“一词多义”,削弱科普的准确性与新闻报道的规范性。更重要的是,人工智能正加速进入教育、医疗、制造等领域,核心概念的标准表达将直接影响人才培养、教材编写、标准制定以及监管沟通的基础质量。 四、对策:启动快速审定程序,优先推荐“词元”并面向社会试用 为回应社会关切、推动中文术语规范化,全国科学技术名词审定委员会近日组织计算机科学技术名词审定对应的专家依程序开展审议,启动科技新词快速审定发布流程。经多轮论证与审定,在凝聚专业领域共识并综合吸收社会意见的基础上,优先推荐以“词元”作为人工智能领域token的中文名称,并向社会发布试用。相关上表示,该名称将在后续常态化名词审定工作中结合推广情况与应用反馈继续确认。 从概念匹配看,“词元”较好体现token作为“基本符号单元”的属性:“词”提示其在语言场景中的语义来源,强调与表达对象意义的关联;“元”表达“基本单元”之意,也更符合科技领域常见构词方式,便于在文本与多模态等更广泛场景中保持一致性与延展性。相关专家认为,这一译名在单义性、科学性、简明性与协调性等更便于推广。 五、前景:标准化将为技术创新与公众沟通打好基础 当前,人工智能正处在从技术突破走向规模化应用的关键阶段。术语标准化并非简单的“用词选择”,而是科技表达体系建设的重要环节。随着“词元”等规范用语进入教材、论文、标准、产品与媒体叙事,有助于减少概念歧义,提升跨学科、跨行业协作效率,推动科研训练、工程实践与产业传播形成更一致的话语体系。预计未来一段时间,相关机构还将围绕大模型与多模态技术中的新增高频术语持续开展审定与发布,完善中文科技表达体系。 据介绍,全国科学技术名词审定委员会成立于1985年,是经国务院授权、代表国家开展科技名词审定与公布的权威机构。其审定公布的名词在科研、教学、生产经营以及新闻出版等领域具有重要规范意义,相关单位应依规使用。
科技名词规范化表面是语言问题,实质关乎科技创新的基础能力;“词元”这个译名的推出,不仅回应了当前技术交流的现实需求,也说明了我国在科技话语体系建设中的主动推进。面向科技强国建设,还需要更多扎实、细致的基础性工作,为自主创新夯实根基。