“词元”被正式命名为“词元”

中国政府网转发人民日报，根据国家数据局文章显示，我们每天调用的词元达到了140万亿。这个庞大的数字让人震惊，不过，新闻背后最有趣的是Token的中文命名问题终于尘埃落定。今天，政府官方机构和媒体联手宣布，Token被正式命名为“词元”。这个决定平息了业界关于Token中文名的争议。这一切都始于腾讯研究院的一篇文章，学者杨斌提出了“模元”这个译名。消息一出，各种建议层出不穷，而“智元”这个名字脱颖而出，得到了广泛认同。新加坡国立大学教授尤洋提到他关注这个词元问题，自由学者胡翌霖则说他更喜欢“智元”，认为智识的计算单元更准确。王小川也表示这个名字很好，而陈绪则说他认为这个名字符合信达雅的标准。尽管大家有很多不同的意见，但官方已经给了一个正式的答案。这次命名活动背后还有一些趣事。人民网解释说，“词元”是AI理解人类语言的最小单位，有时候是字，有时候是词。特别值得注意的是，在这个讨论中，青年学者们也参与其中，给出了自己的见解。比如，清华大学科学史系副教授胡翌霖就把字节和Token进行比较。他指出计算机有字节作为计算单元，而Token则是人类智识的计算单元。杨斌、尤洋、王小川、胡翌霖以及陈绪等青年学者们都对这个话题表示了浓厚兴趣。他们的观点也给了这次讨论更多深度和广度。