大模型领域的技术迭代快得惊人,尤其在2025年以后,行业里的新模型更新节奏从一年一代,变成了一个季度甚至一个月就会有新款登场。不管是那种MoE架构的多模态模型,还是能进行复杂推理的思维链模型,大家的注意力都集中在了知识、数学还有编程这些特别难的地方。哪怕是谷歌、OpenAI、Anthropic这些海外的大牌厂商,像Gemini 3.1 Pro、Claude Opus 4.6还有GPT-5.4都在拼命刷新纪录;而国内的DeepSeek、字节跳动、智谱还有MiniMax也没有闲着,它们不断加速迭代,中美之间的性能差距现在已经缩小到了历史最低点。 字节跳动出的Seedance 2.0在做视频生成这块特别牛,智谱的GLM-5还有MiniMax的M2.5在编程、智能体集群这些场景里都有顶尖表现。就在这些技术大爆发的时候,AI智能体这种应用特别火,一下子把大家对Token的需求给带起来了。像OpenClaw这种个人AI助手突然就像病毒一样传开了,把全球大模型的Token消耗量给推到了新高度。 看看OpenRouter平台的数据你就知道变化有多大:从2025年12月到2026年3月,这短短三个月里,模型的周调用量就从5.78T猛增到了14.8T,涨幅足足有156%。最开始的时候前十的模型全是海外产品,可到了今年3月,国产模型的占比已经超过了50%。这次的国产代表像Minimax M2.5、DeepSeek V3.2、Kimi K2.5都挤进了排行榜的前列。 国产模型之所以能这么吃香,主要是因为成本极低。拿M2.5来说吧,单次测试的成本才125美元,这跟Claude Opus 4.6的4970美元比起来简直是天壤之别。它的Token价格也只有海外模型的6%到20%,这种高性价比让海外的开发者特别买账。 现在大家对AI算力的需求也变了味儿,以前都是盯着训练算力不放,现在全盯着推理算力看。因为海外的开发者更倾向于用国内的数据中心来调用模型,国内的GPU租赁价格本来就比海外便宜不少,再加上国内的电力和带宽也有优势,大量的推理算力需求就像潮水一样回流到了国内。 看看那些科技巨头的动作就知道了。海外的微软和亚马逊每年在资本开支上都能砸下1000亿美元以上;国内的阿里、腾讯、百度也在拼命投入资源。阿里还直接宣布要在三年内砸进去4800亿元。在这种大环境下,中国的云计算市场规模从2024年的8288亿元涨到了现在的规模大爆发态势。 要知道中国的云计算市场规模2024年同比增长了34.4%,估计到了2030年能突破3万亿元大关;而2026年的国内数据中心市场规模也有望达到3621亿元。这一波热潮直接带动了算力租赁、IDC、光模块、液冷还有AI服务器等产业链上下游一起受益。