中国政府网转发人民日报,根据国家数据局文章显示,我们每天调用的词元达到了140万亿。这个庞大的数字让人震惊,不过,新闻背后最有趣的是Token的中文命名问题终于尘埃落定。今天,政府官方机构和媒体联手宣布,Token被正式命名为“词元”。这个决定平息了业界关于Token中文名的争议。这一切都始于腾讯研究院的一篇文章,学者杨斌提出了“模元”这个译名。消息一出,各种建议层出不穷,而“智元”这个名字脱颖而出,得到了广泛认同。新加坡国立大学教授尤洋提到他关注这个词元问题,自由学者胡翌霖则说他更喜欢“智元”,认为智识的计算单元更准确。王小川也表示这个名字很好,而陈绪则说他认为这个名字符合信达雅的标准。尽管大家有很多不同的意见,但官方已经给了一个正式的答案。这次命名活动背后还有一些趣事。人民网解释说,“词元”是AI理解人类语言的最小单位,有时候是字,有时候是词。 特别值得注意的是,在这个讨论中,青年学者们也参与其中,给出了自己的见解。 比如,清华大学科学史系副教授胡翌霖就把字节和Token进行比较。 他指出计算机有字节作为计算单元,而Token则是人类智识的计算单元。 杨斌、尤洋、王小川、胡翌霖以及陈绪等青年学者们都对这个话题表示了浓厚兴趣。 他们的观点也给了这次讨论更多深度和广度。