陈宁做云天励飞董事长兼CEO的时候提出个新看法,说以后5到10年,全球搞AI的竞争重点不再是谁最聪明,而是看谁能把AI的应用让更多人用起来。目前让AI落地的最大难点就是成本太高了,像OpenClaw那种智能体想用起来,Token费用就是个大坎儿。为了把这个坎儿填平,云天励飞想把成本降到100万分之一,也就是说2030年的100亿Token只要1分钱。至于怎么做到这一点,具体细节公司没细说,但年初发了新GPU路线图。他们准备弄个叫GPNPU的芯片,名字有GPU加NPU的双重意思,还能兼容CUDA,搞迁移的时候就把代码改一行就行。在产品设计上,他们用了一种prefill和decode分离的架构,P芯片负责大量计算,D芯片负责快速读取数据。这次他们的GPNPU芯片也会搞多个芯片一起干活的超节点。2026年先推第一代超节点P芯片,算力要跟英伟达的Hopper一样强;2027年再推第一代超节点D芯片,主要是为了减少时延,和英伟达的Blackwell对标;2028年的第二代超节点D芯片就要跟英伟达的Rubin比一比了,希望能达到毫秒级的推理速度。摩根士丹利会议上,NVIDIA的CEO黄仁勋也分享了对Agentic AI的看法。他把OpenClaw评价成“当代最重磅的软件发布”,还说OpenClaw在短短三周内普及得比Linux过去三十年还快,成了史上下载量最大的开源软件。黄仁勋说AI生态就像个五层蛋糕,而OpenClaw所在的应用程序层现在产出最高、最赚钱。它之所以火得快,是因为证明了AI能深入各种个性化环境,帮用户和企业解决琐碎任务。现在AI代理开始搞大规模搜索、做图、分析数据,全球消耗的Token一下子多了1000倍。这也导致市场出现了巨大的算力缺口。因为无论硬件怎么堆量,只要Agentic AI继续渗透工作场景,算力迟早还是不够用。跟Hopper和Blackwell这种专门练模型的架构不同,下一代Vera Rubin架构主要是为了解决Agentic AI的约束问题。通过加板载显存和用ICMS这种平台,Vera Rubin打算把长上下文处理这种痛点给解决掉。估计大家对这种芯片的需求会很大。