清华大学教授杨斌提议统一"token"中文译名为"模元" 助力人工智能技术普及

问题——高频核心术语缺乏统一中文表述，影响公众理解与跨界传播。

随着大模型与智能应用加速渗透，围绕模型训练、推理与计费的关键词“token”频繁进入公众视野。

在国际重要技术会议与企业发布中，该词被反复提及，成为解释模型能力、算力消耗与服务成本的“通用语言”。

在国内应用端，相关统计显示我国token消耗规模增长迅猛，反映出人工智能产业活跃度提升。

然而，当前中文语境中对“token”多以英文直用或各自翻译为主，术语口径不一，给媒体报道、行业交流、政策研判和公众学习带来一定障碍。

杨斌据此提出，将“token”统一译为“模元”，并倡议在学术、产业、政策与传播体系中逐步形成共识。

原因——技术扩散速度快、应用场景多元化，放大了语言不一致的成本。

一方面，大模型从专业场景走向大众产品，用户群体从研发人员扩展到教育、金融、制造、政务等传统行业从业者，对清晰、直观、可传播的中文表达提出更高要求。

另一方面，“token”概念本身经历了从“符号标记”到“可计算最小单元”的演进，在大模型时代被赋予更强的计量属性：它既是模型处理信息的基本单位，也是衡量算力消耗与服务定价的重要依据，甚至在产业链条中扮演类似“通用计量尺度”的角色。

概念外延不断扩展、应用不断增加，使得“一个词多种译法”更容易引发误解：有人将其局限为文本“词”，有人强调语义，有人采用音译但难以望文生义，导致跨场景对齐困难。

影响——术语不统一将影响认知普及、产业统计与治理协同，抬高社会沟通成本。

从公众层面看，英文术语直接嵌入中文叙事，容易产生距离感，使非专业人群把技术理解停留在“黑箱”层面，不利于形成基本概念体系。

对产业而言，围绕token的消耗量、效率、成本与定价等指标，是模型服务商业化的重要依据，术语不统一会削弱指标传播的可比性与透明度，进而影响企业对外沟通、用户对服务的理解，以及行业研究对数据的归集与分析。

对治理层面而言，人工智能进入公共服务与重点行业后，需要更稳定的语言工具支撑政策讨论与社会对话。

一个关键计量概念若缺少统一、准确、可扩展的中文表达，可能在标准、监管、采购与公共传播中形成“多口径并存”，影响协同效率。

对策——以“模元”作为统一译名，兼顾语义指向、计量属性与未来兼容。

杨斌对比了多种既有译法的局限：如将其译为“词元”“语元”等，容易把概念锁定在语言或文本场景，难以覆盖多模态、智能体以及面向物理世界的应用；强调语义的译法可能忽视token在模型中作为结构化特征单位的属性；单纯音译难以承载清晰含义，也不利于普及与传播。

相较之下，“模元”中“模”指向模型尤其是大模型、多模态形态，突出其人工智能语境；“元”强调基础、最小单元，符合计量单位的命名习惯，便于衍生出“模元消耗”“模元成本”“模元效率”等可直接使用的产业表达。

该提法的核心取向，是以通俗而准确的中文命名，降低知识传播门槛，同时为产业统计、媒体表达和公共讨论提供更稳定的语言基础。

前景——术语标准化将与应用普及相互促进，成为人工智能社会化进程的基础工作之一。

从技术发展趋势看，模型能力竞争正从单纯参数规模转向效率、成本与场景适配，围绕token的计量体系将更频繁地进入产品说明、服务合同、行业评测与政策文本。

未来多模态融合、端侧智能、智能体协作以及面向现实世界的智能系统发展，都将进一步强化“通用最小处理单元”的重要性。

若能在较早阶段形成相对统一的中文表达，不仅有助于公众建立基本概念框架，也将为产业生态的透明化与规范化提供语言支撑。

下一步，可在媒体报道、教材与科普、行业研究报告、标准与指南等场景中逐步推动统一口径，并通过示例化解释增强可理解性，减少“只见术语、不见含义”的传播偏差。

语言是思想的载体，也是技术普及的桥梁。

在人工智能从专业领域向全社会扩展的关键时期，建立规范、易懂的中文术语体系，不仅是学术严谨性的要求，更是推动技术民主化的现实需要。

"模元"的提议虽然看似微观，却触及了AI时代中文表达的深层问题。

如果这一译法能够得到广泛认可和使用，将有助于消除普通大众与AI技术之间的语言障碍，让更多人能够以更自然的方式理解和参与到人工智能的发展中去。

这种从语言规范入手推动技术普及的思路，值得各界重视和推进。