资本开支飙升引发云巨头财报震荡:Token计费失灵倒逼AI算力“包量”新模式加速

问题:营收增长难掩“成本焦虑”,资本市场重新定价云业务逻辑 近期北美云计算企业陆续披露业绩,云业务收入整体保持增长,但市场反应更为谨慎。多家企业在营收扩张的同时,数据中心、服务器和加速计算等投入明显上行,资本开支增幅高于以往周期。分析人士认为,资本市场担心的并非需求不足,而是以生成式应用为代表的新一轮算力消耗,正在把云服务从“规模越大边际成本越低”的传统逻辑,推向“规模越大投入越重、回收周期更长”的新阶段。 原因:词元调用激增与高复杂度应用普及,推动单位任务成本抬升 其一,词元(token)计费降低了生成式应用的试用门槛,也放大了调用规模。数据显示,近两年词元调用出现跃升式增长,规模扩张带动算力消耗同步攀升。 其二,应用形态正从对话问答走向“智能体”,单次任务的推理轮次、工具调用次数和上下文长度明显增加。业内测算显示,智能体处理多步骤任务时的词元消耗可达普通对话的数十倍,在复杂场景下甚至出现百倍、千倍级放大。 其三,视频生成等多模态应用对图形处理器资源占用更高,成本压力更集中。以海外某视频生成产品为例,研究机构测算其日均运营成本达到千万美元量级,项目方也公开表示现行经济模型面临可持续性挑战。这类高消耗业务不仅推高运营成本,也可能挤占资源配置,影响平台其他核心服务的稳定供给。 影响:账单不确定性抑制大客户规模化采购,云厂商增长预期承压 在“按词元计费”模式下,客户用量与费用高度绑定,表面透明,却带来预算波动。对需要年度预算与严格审批的大型企业来说,成本曲线的不确定性会直接影响采购决策:试点阶段用量可控,但一旦进入生产并与业务系统深度耦合,用量往往快速上升,账单波动加大,财务部门难以做出长期承诺。结果可能是客户“能不用则不用、能少用则少用”,从而限制云平台中高端需求的释放。 对云厂商而言,若增长主要来自高消耗应用,短期收入上行可能伴随资本开支快速扩大、利润率承压;若为控成本而限制供给,又可能影响客户体验与市场份额。因此市场更关注企业能否建立可复制、可预测的商业化路径,而不只是单季增速。 对策:从“按量”走向“包量”,以预配吞吐量锁定预算与供给 面对上述矛盾,北美云厂商正加快推出预配吞吐量单位(PTU)等新定价工具。其核心思路是:客户预先购买一定计算吞吐与容量,以月度、季度或年度支付固定费用,使费用与实际词元波动弱涉及的,从而获得预算确定性;云厂商则通过合同锁定需求,提升资源调度效率与现金流稳定性。 这也意味着风险在客户与云厂商之间重新分配:按量计费下,成本波动主要由客户承担;包量模式下,云厂商需要依靠更精细的资源管理、模型效率优化和差异化服务,来消化需求波动带来的压力。业内认为,这个定价机制的演进类似通信行业从“按字节计费”向“套餐化”的转型,目的在于降低使用门槛、推动规模化落地,并以更稳定的方式实现长期收益。 前景:商业模式重塑将牵引产业链再平衡,效率与标准化成为竞争焦点 展望未来,生成式应用正从“新奇体验”走向“生产工具”。决定胜负的不仅是模型能力,还包括成本结构与交付体系。可以预见:一是定价将更分层,研发试验阶段保持按量灵活,生产级应用将更快走向包量、包年并与服务等级协议绑定;二是模型压缩、推理加速、缓存复用,以及更高效的芯片与网络架构将成为降本关键,技术效率将直接转化为商业竞争力;三是云厂商与企业客户将围绕数据安全、合规与可控成本开展更深入合作,推动形成更清晰的成本核算口径和采购标准。 同时,资本开支高位运行短期难以改变,但结构可能从“单纯堆算力”转向“算力、网络、存储与软件平台协同优化”,以提升单位投入产出比。市场对云业务的评估也将更看重可持续盈利能力与现金流质量。

云计算行业的这场“成本危机”,表面是商业模式调整,本质是技术变革带来的价值重构。在全球数字化持续加速的背景下,如何在技术投入与商业回报之间找到更可持续的平衡,不仅关系到企业的增长与利润,也将影响数字时代的产业生态。这场变化或将重塑未来十年的科技竞争规则。