问题——词元用量高增长与价格波动引发“用得起、用得好”关切 近年来,大模型应用加速落地,词元逐渐成为衡量模型调用与计费结算的基础单位;随着应用规模扩大,调用量快速攀升的同时,价格调整也发生:一上,企业与个人对生成、检索、分析等能力的需求持续增长;另一方面,部分平台近期上调接口价格,引发“使用门槛提高”“成本难以控制”等讨论。词元价格如何看、投入产出怎么算,成为行业普遍关心的问题。 原因——多模态内容生产与智能体工具链推动调用量跃升 谭待活动期间披露,截至今年3月,豆包大模型日均词元使用量已超过120万亿,近三个月实现翻倍增长;与两年前发布初期相比,调用规模约增长1000倍。业内人士认为,此变化不只是用户变多,更是应用形态变化带来的“单次任务消耗上升”和“任务数量增加”叠加所致。 一是多模态生成带动内容生产方式升级。随着视频生成、图像生成等能力迭代,单次任务的词元消耗明显高于文本对话。以视频生成场景为例,生成一段约1分钟、720P的视频,词元消耗可达百万级,远超传统文本问答。多模态应用从“尝试创作”走向“批量生产”,词元用量随之快速上升。 二是智能体框架普及带来“多轮推理+多工具调用”的新模式。以近期受到关注的智能体产品为代表,复杂任务往往需要几十轮甚至上百轮的工具调用与结果校验,词元消耗会随轮次放大,单次任务可达数十万词元。相比“问一次答一次”,智能体更强调任务拆解、工具调用和反复验证,整体消耗自然更高。 同时,词元增量正在从消费端的“体验型调用”转向企业端的“生产型调用”。谭待表示,当前词元消耗较大的领域集中在非结构化信息处理与分析,如金融投研、教育辅导、内容生产等。火山引擎披露,其平台上累计消耗达到万亿词元的企业数量,已由2025年年底的100家增至当前的140家,覆盖互联网、教育、金融、消费电子等行业,其中互联网行业占比超过一半。业界也将其视为企业数字化、智能化推进程度的一项可量化指标。 影响——竞争焦点由“单价”转向“综合效率”,产业进入价值比拼阶段 面对价格与成本讨论,谭待指出,评估词元价格不能脱离模型能力,企业更应关注端到端完成任务的总体成本,而不是单一词元成本。这也反映出产业竞争逻辑的变化:模型能力、工具生态与工程化水平不同,即便词元单价更低,也可能因生成质量不稳定、返工率高、人工复核成本高而导致总体成本更高;反过来,能力更强、成功率更高的模型,可能减少试错与返工,从而降低整体支出。 在企业应用中,成本核算正从“调用费用”扩展到“全链条费用”,包括数据准备、系统集成、流程改造、合规安全、人工复核、运维治理等。尤其在金融、政务、教育等对准确性与可追溯性要求更高的行业,“一次做对”的能力往往比“单次更便宜”更关键。由此,大模型商业化正从参数与价格竞争,转向可用性、稳定性、交付效率、行业适配度的综合较量。 对策——以端到端成本核算引导理性采购,以产品化与规模化降低长期成本 业内人士建议,企业应建立面向业务结果的评估体系:明确任务完成标准与质量阈值,将完成率、准确率、时延、人工介入比例、合规风险等纳入统一指标,通过小规模试点、分阶段扩容的方式推进,避免仅凭单价做采购决策。落地时可优先选择流程清晰、回报明确的场景,如知识库问答、客服辅助、内容审校、投研摘要等,再逐步拓展至更复杂的多模态生产与智能体协作。 平台侧则需在提升模型能力之外,强化工程化与产品化:一上,通过提升推理效率、优化算力调度、改进压缩与缓存等方式降低单位成本;另一方面,提供更易用的工具链与行业组件,降低企业集成门槛与二次开发成本。针对价格波动带来的不确定性,也可探索更透明的计费与套餐机制,提高企业预算可预期性,并以分层服务满足不同质量与时延需求。 前景——词元“电表”效应将持续,应用深化推动行业走向高质量增长 从产业演进看,词元用量持续增长是大模型走向生产力的重要信号:只有在真实业务中被高频调用,模型与工具链才能在反馈闭环中迭代优化。随着多模态生成、智能体协同、行业知识增强等技术加速成熟,未来词元消耗仍可能保持高位增长,但更重要的是增长质量:是否真正节省人力、是否推动流程再造、是否形成可复制的行业方案,将成为衡量产业进阶的重要标准。 同时,价格并非简单“越低越好”,而是由能力、效率与供需共同决定。随着竞争加剧与规模效应释放,单位成本长期仍有下降空间,但短期内受算力供给、模型迭代、需求激增等因素影响,价格阶段性波动或将延续。行业需要在创新与可负担之间找到平衡,以更可持续的商业模式推动应用深入落地。
当Token计量器上的数字突破百万亿量级,我们看到的不仅是技术进步,更是生产方式的改变;在这场智能化浪潮中,能否穿透短期成本波动,回到技术为业务创造价值的核心,决定了算力能否转化为真正的生产力。就像工业时代用电量记录着效率提升一样,今天每一次Token的增长,也在记录数字经济向更高质量发展的脚步。