OpenRouter调用量榜单国产模型占比逾六成 低成本供给重塑全球大模型应用格局

一、数据背后:国产模型强势占据全球调用榜单 据财联社援引OpenRouter最新周度统计数据,该平台前十大模型当周总调用量约8.7万亿Token,其中中国模型合计贡献5.3万亿,占比约61%;调用量排名前三的模型均为国产,分别是MiniMax M2.5、Kimi K2.5和智谱GLM-5:MiniMax M2.5以2.45万亿Token居首,Kimi K2.5以1.21万亿位列第二,DeepSeek V3.2也进入前五。 OpenRouter汇聚了全球开发者的真实调用需求,其榜单对市场具有一定参考价值,能够反映不同模型实际生产环境中的使用规模与开发者偏好。国产模型在该平台上的集中上升,并非偶然,而是多种结构性因素叠加的结果。 二、根本原因:成本优势成为核心竞争力 需要说明的是,国产大模型此轮领先并不等同于在所有维度“全面超越”。在复杂逻辑推理、高难度代码工程等任务上,部分海外头部闭源模型仍有优势。但在当前阶段,决定开发者选择的关键不只是谁更强,还包括谁更划算。 以每百万Token的调用价格为例,国产主流大模型多集中在2至3美元区间,而同等规模的海外顶尖模型往往高出数倍甚至十余倍。这种差距在智能体应用中会被更放大。不同于传统问答,智能体执行自动化任务通常需要多轮规划、反复试错并持续循环调用,单次任务的Token消耗可能是普通对话的数十倍。在这种情况下,调用成本几乎直接决定应用能否跑得通、算得过账。 三、行业背景:算力成本压力推动市场重新分配 近期海外科技圈围绕开源智能体工具与订阅制服务的矛盾,出现多起限制与封禁事件,暴露出大模型商业化中的现实冲突。一些开发者为降低按量计费API的成本,尝试通过技术手段把自动化任务接入按月付费的个人订阅服务,导致平台算力被大量占用。对此,谷歌、Anthropic等相继加强限制,对高频调用账号采取封禁措施,并明确禁止第三方工具接入订阅通道。 这些事件的核心,是智能体时代的算力消耗方式与既有定价体系之间的不匹配。当大模型从“辅助工具”变成可以自主执行任务的“数字劳动力”,算力消耗的结构已发生变化。如果定价机制跟不上,高性能模型将逐渐成为中小开发者与初创团队难以承受的成本,进而影响智能体生态的扩张速度。 四、深层影响:竞争焦点从能力比拼转向工程效率 国产大模型的这次突破,反映出行业竞争逻辑正在变化。技术探索期,讨论的重点是“谁更聪明”;进入规模化落地阶段,“谁更经济、更稳定、更好集成”正在成为新的关键指标。 国内大模型企业通过持续工程优化,在推理效率、硬件适配、部署与运维成本控制等积累了优势,在保持可用性能的同时显著降低单位算力成本。这条路径更像制造业的降本逻辑:靠工程与规模把成本打下来,也反映了国内企业在产业化落地上的系统能力。 五、前景研判:低成本趋势或将加速全球生态重塑 从中长期看,大模型服务走向低成本基本不可逆。随着更多开发者与企业把智能体应用纳入核心业务流程,对调用成本的敏感度会持续上升,性价比将成为平台选择的重要指标。国产大模型如果能在维持成本优势的同时继续抬升能力上限,并在数据安全、合规接入、本地化服务等上补齐短板,有望在全球开发者生态中获得更稳固的位置。 此外,此趋势也会重塑全球产业格局。海外头部企业可能面临更大的降价与控本压力,行业竞争重心也将从参数规模与基准测试成绩,逐步转向实际部署效率与商业可持续性。

这场由算力成本引发的产业变化,本质上考验的是技术创新与落地能力的协同。国产大模型的阶段性突破说明,在人工智能这场长跑中,既需要科研突破,也离不开扎实的工程能力。当全球都在回答“如何让AI用得起”这个现实问题时,中国在成本与工程效率上的实践,可能正在为智能时代的商业模型提供新的思路。