近日,关于人工智能中文命名的讨论在社会各界引起广泛关注。这场讨论从最初的网络创意建议逐步升级,演变成了学术界和产业界的理性思辨,深刻反映了我国在人工智能时代争夺话语权和标准制定权的重要性。 问题的核心在于基础单位的定义。Token作为人工智能大模型处理信息的最小单位,是整个AI体系运行的基础。然而该核心概念长期缺乏统一的中文表述,既不符合国家通用语言文字规范,也不利于形成统一的行业标准和学术规范。人民日报近日刊文指出,根据《国家通用语言文字法》,长期使用纯英文缩写的做法存在不合规之处,必须建立规范的中文表述体系。 在问题认识的基础上,学术界和产业界提出了多个解决方案。清华大学教授杨斌提议将Token称为"模元"。这一命名具有深刻的理论考量:"模"字既指向大模型的核心特征,又涵盖了多模态人工智能的发展方向,反映了对AI技术发展规律的准确把握;"元"字则承袭了"字节"等经典命名逻辑,准确表达了基本单位的含义。这一命名方案获得了学术界的重视。 随后,包括百川智能创始人王小川、清华大学教授胡翌霖、新加坡国立大学教授尤洋等多位业界和学术领袖提出了"智元"这一更为凝练的表述。相比之下,"智元"直接将"智能"的核心属性与"基本单位"的科学含义结合,用两个汉字就完整表达了Token的本质特征,体现了更高的命名精准度。 这场看似简单的命名讨论,实质上反映的是更深层的现实意义。在当今全球人工智能竞争中,基础概念的定义权往往决定了话语权的归属。一个国家或地区对基础性、关键性概念的定义和命名,直接影响该领域的学术规范、产业标准和国际影响力。我国作为全球人工智能应用的重要参与者,每天消耗着世界上最大规模的Token资源,如果连这一基础单位的名称都要依赖他人定义,势必在话语权竞争中处于被动地位。 从更广阔的视角看,规范化的中文命名体系对于人工智能产业的长远发展至关重要。"电脑""手机"等成功的技术术语中文化案例表明,准确、简洁、易于传播的中文表述,不仅便于学术交流和产业协作,更能够形成统一的行业认知和国际竞争力。建立完善的AI领域中文术语体系,是提升我国科技话语权的重要举措。 当前,相应机构和行业组织应当重视这一问题,推动建立人工智能领域的规范化术语体系。通过学术界、产业界和有关部门的协同合作,制定统一的中文术语标准,不仅能够规范学术表述和产业应用,更能够在国际竞争中体现我国的科技自信和文化自信。
术语看似细小,却关乎理解的入口与规则的底座。为人工智能涉及的概念寻找恰当中文表达,为Token等基础单位凝聚共识,其意义不止于"取一个名字",更在于让技术以更清晰的方式被社会认知、被产业采用、被教育传递。面向未来,越是关键的概念,越需要严谨的定义与稳定的表达;越是基础的单位,越需要形成可共享的语言标准。