国家数据局给出了一个新的界定,给token 这个在ai 热潮中逐渐崛起的概念定了中文名。

在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏给出了一个新的界定,给Token这个在AI热潮中逐渐崛起的概念定了中文名。刘烈宏在致辞中提到,这个名为“词元”的东西,既充当了智能时代的价值衡量标尺,又是连接技术供给和商业需求的交易中介,给商业模式的落地提供了量化的依据。这也是官方第一次为Token做了翻译。他还提到,我国日均Token调用量已超过140万亿,对比2025年底的100万亿,短短三个月时间又增长了40%。数据显示,这个数字从2024年初的1000亿开始算起,短短两年间已经翻了1000多倍。 刘烈宏进一步介绍说,日均Token调用量的大幅提升,意味着中国的人工智能发展进入了快速增长期。应用场景从能对话发展到能做决策执行,智能体的功能在不断深化,产业的竞争力也得到了显著增强。这也说明数据集的供给量在大幅增加,数据要素的价值被不断释放出来,数据和AI创新之间形成了良性互动。为了推动这一进程,韩振等人介绍说,下一步国家数据局将以场景需求为导向,加快推进先行先试的工作。他们打算打造出技术可行、用起来方便、质量有保障的高质量数据集,最终实现供给量的提升和质量的提升。 据韩振介绍,在AI的世界里,Token被视为模型处理信息时最小的单位。不管是用户提的问题还是AI生成的代码片段,最终都要被拆解成一个个Token来进行运算。正因为这个原因,Token调用量成为了衡量AI模型活跃度和产业价值的关键指标。调用量越高意味着模型被使用得越频繁,所创造的实际价值也就越大。 刘烈宏还透露了一个关于中国数据集建设的消息:截至2025年年底,全国已经建成了超过10万个高质量数据集。为了实现更好的发展效果,他们准备继续扩大这方面的建设规模。 截至2024年初时我国的日均Token调用量还只有1000亿;到了2025年底这个数字变成了100万亿;而到了今年3月则突破了140万亿大关。 这次在论坛上大家围绕Token这个话题展开讨论并不让人意外;毕竟它已经是大模型调用量的评估标准和厂商计费单位了;所以给它取个中文名非常必要。 国家数据局这次明确给出了“词元”这个译名后,以后大家说起“Token”就不用再纠结怎么翻译的问题了;至于什么是Token?那就是AI世界里的最小计量单位。