问题—— 在大模型从“能训练”走向“广推理”的过程中,行业衡量技术能力与产业规模的口径正在调整。过去,算力多用每秒浮点运算次数等指标来描述,强调“装了多少、能跑多快”;如今——讨论更多转向词元消耗量——关注“实际调用了多少、支撑了多少需求”。在中国发展高层论坛2026年年会及国新办新闻发布会上,国家数据局负责人以“词元”该中文表述介绍:我国日均词元调用量从2024年初约1000亿,增至2025年底约100万亿,并在今年3月更突破140万亿,显示智能应用渗透明显提速。同时,企业界也披露了词元消耗数据,部分机构的估算与官方披露大体同量级,但仍存在差异。 原因—— 词元成为新的关注点,首先因为更贴近真实负载。算力指标更像“装机容量”,体现供给能力;词元更像“实际用电量”,能反映数据中心、模型服务与终端应用的真实吞吐。其次,推理需求快速增长推动了统计口径的更新。随着办公、内容生成、智能客服、软件研发等场景普及,调用呈现高频、碎片化、多终端等特征,仅用算力峰值已难准确刻画使用强度。再次,词元具备可计量、可定价的潜力,适配按量计费、分发结算等商业模式,为产业从“展示能力”转向“经营规模”提供了更直接的尺度。 影响—— 从宏观层面看,词元指标有望成为观察智能经济活跃度的重要窗口,用于判断新型信息基础设施负荷水平、产业链景气度以及用能结构变化。对企业而言,围绕词元的统计会直接影响成本核算与经营策略:模型能力、算法优化、芯片效率、调度体系等因素,都会通过“同等任务消耗多少词元、单位词元成本多少”反映到财务表现与竞争力上。对市场而言,围绕词元调用、分发、计费与结算的新体系正在形成,可能推动算力服务、模型服务与应用服务更透明、更可比较,进而提升资源配置效率。 对策—— 需要注意,词元并非“天然统一”的统计单位。不同模型的分词方式、上下文长度、压缩策略以及多模态处理路径都会带来口径差异;同一业务在高吞吐与低时延两类负载下,词元消耗结构也可能不同。此外,词元规模由供需共同决定:算力供给不足会抑制调用,应用集中爆发又会推高需求,叠加后使测算存在不确定性。为此,应加快完善统计口径与披露规则:一是明确词元定义、计量边界与换算方式,形成可复核、可对比的行业规范;二是在合规前提下,鼓励重点平台与算力服务商分层披露关键指标,提升透明度;三是统筹算力布局与能耗管理,以效率为导向推动数据中心绿色运行;四是推进“按量计费”与“可交易结算”有关制度探索,完善数据要素与算力要素的协同配置机制。 前景—— 从趋势看,词元将与算力、能耗、网络等指标共同构成智能基础设施的“运行仪表盘”。随着更多应用从试点走向常态化,词元的统计价值会进一步凸显:既能呈现技术扩散速度,也能反映产业从投入期走向运营期的成熟度。可以预期,围绕词元的标准体系、成本模型与监管规则将加快完善,并在一定程度上影响大模型服务的定价方式、企业竞争策略与产业分工格局。
从蒸汽时代的马力到电力时代的千瓦时,再到智能时代的词元,衡量经济运行的尺度往往随技术演进而更新;中国在词元计量上的探索,为理解和管理智能应用的规模化运行提供了新的思路。随着标准与规则逐步完善,“词元经济”有望推动数字经济更高质量发展,并为现代化产业体系建设带来新的支撑。