从千亿到数十万亿的词元流动就像一道光,照亮了中国人工智能产业蓬勃发展的景象

2024年年初,国家数据局透露的数字显示,当时中国日均消耗词元的总量大约是1000亿。而到了2025年9月底,这个数字居然突破了40万亿大关。仅仅在不到两年的时间里,增长了超过400倍。这可不是简单的数字游戏,这表明中国人工智能技术正从实验室走向大规模应用和深度融合。词元,也就是Token,是人工智能处理信息时的最小单位。它把数据切割成模型可以识别的小块,不论是用户问问题、模型回答还是图片识别都需要消耗一定数量的词元。所以,词元消耗量反映了人工智能与现实世界交互的频率和深度。它的迅速增加意味着应用场景越来越多,渗透到各行各业中。从金融到智能制造,从智能汽车到教育,越来越多的传统行业借助人工智能提高效率、降低成本。以前企业可能会“精打细算”地使用几十、几百个词元,现在已经能轻松处理数亿甚至更多的词元。这说明人工智能正在从尝鲜走向常用,解决的问题也越来越复杂。宏观政策也推动了这个趋势。去年发布的《关于深入实施“人工智能+”行动的意见》提出了推动人工智能与各领域深度融合。政策红利释放出来了更多应用需求,也预示着一个长期结构性变化:人工智能作为新型生产力正在和实体经济结合得更紧密。支持词元消耗量增加的原因有两个:技术进步和数据供给。算法优化和算力成本下降使得处理庞大数据变得更经济。高质量、大规模的数据也为词元增长提供了能量源泉。没有好数据就没法训练好模型,甚至可能导致错误。所以产业界和政策制定者需要共同努力,既要突破技术瓶颈也要完善数据治理体系。从千亿到数十万亿的词元流动就像一道光,照亮了中国人工智能产业蓬勃发展的景象。展望未来,“人工智能+”行动会继续推进技术创新和数据基础建设。 所以要让这个变革走得更远更稳,必须持续夯实技术根基和保障数据安全。