腾讯云上调混元模型计费并终止部分免费公测 智能体热潮推高Token消耗与算力需求

一、涨价潮席卷全球云计算市场 2026年3月,腾讯云发布公告称,将调整旗下智能体开发平台部分模型的计费策略,并于3月13日生效;此次调整涉及混元系列两款主力模型。其中,Tencent HY2.0 Instruct的输入价格由每千个Token 0.0008元上调至0.004505元,涨幅超过460%;输出价格由0.002元调整至0.01113元,涨幅也超过450%。另一款推理模型Tencent HY2.0 Think的输入、输出价格同步上调,幅度相近。 ,原本处于限时免费公测阶段的GLM 5、MiniMax 2.5、Kimi 2.5三款模型也将转入商用计费,按调用量收费。 腾讯云此次调价,反映出全球云计算行业正发生变化。进入2026年以来,多家国际头部云平台陆续提价:亚马逊AWS将面向大模型训练的机器学习容量块服务价格上调约15%;谷歌云宣布自今年5月起上调全球数据传输费率,北美地区每GB从0.04美元提高至0.08美元;OpenAI也调整了主力模型价格,输入为每百万Token 2.5美元,输出达15美元。国内上,智谱AI将部分订阅产品价格上调最高60%,API调用价格涨幅67%至100%之间。 二、智能体崛起重塑Token消耗格局 此轮涨价背后,是大模型服务需求出现结构性跃升。 过去较长时间里,用户主要通过单轮或多轮对话与大模型交互,单次调用消耗的Token相对有限。但随着智能体技术快速成熟并进入规模化应用,该模式正在改变。 以近期在全球迅速走红的开源个人智能体助手OpenClaw为例,它可在用户自有设备上独立运行,具备自主规划、工具调用和持续执行任务的能力。中银证券分析指出,一个配置合理的OpenClaw每天可能发起数百次甚至上千次模型调用,并且每次调用都携带完整上下文。由此带来的Token消耗,可能是传统对话用户的数十倍乃至上百倍。OpenClaw上线仅一个月,Token消耗量就增长超过四倍,并迅速成为全球主流模型调用平台OpenRouter上消耗量最大的应用。 从宏观数据看,中国整体日均Token消耗量在2025年中突破30万亿;到2026年2月,主流大模型合计日均消耗已升至180万亿量级,增长速度显著。 国盛证券认为,智能体天然具备多工具调用、长上下文处理和多流程并发执行等特征,Token消耗远高于传统对话。随着智能体规模扩大、任务复杂度上升,活跃智能体的Token消耗正在进入快速增长阶段。IDC预测,中国活跃智能体数量将在2031年突破3.5亿,届时智能体Token消耗有望出现年均超30倍的指数级增长。 三、算力供需矛盾凸显,国产算力迎来窗口期 Token消耗激增直接传导至算力供给端,供需缺口随之扩大。多家主流模型厂商已不同程度出现算力紧张,这也成为本轮云服务涨价的重要推力之一。 因此,国产算力产业迎来阶段性机会:一上,国内Token消耗的爆发带来持续且刚性的算力需求;另一方面,国产算力在成本控制和本土生态建设上具备优势,有望在基础设施层面逐步扩大份额。 业内人士指出,智能体渗透率提升、应用复杂度加深,将继续强化算力需求的刚性。对国内算力企业而言,当下既是加快技术迭代、补齐生态能力的关键阶段,也是争取在全球算力竞争中掌握主动的窗口期。

云计算行业定价策略的变化,既是对技术与成本现实的回应,也意味着市场正走向成熟。在智能时代的基础设施竞赛中,如何在技术创新、用户体验与商业可持续之间找到平衡,将成为企业必须回答的问题。这个轮调整或许只是起点,更深层的产业变化仍在推进。