英伟达CEO黄仁勋在圣何塞举办的GTC大会上发言时表示,Token经济这个新事物正悄然崛起。他把AI Token比作一种新的货币,这玩意儿不仅能拿来招兵买马,还能用来做预算,甚至能直接给公司干活赚钱。黄仁勋直言不讳地说,Token就跟比特曾经是基于CPU的老计算单位一样,现在变成了现代AI计算的命根子。他还特别强调,在现在这个软件几乎都离不开AI的年代,Token经济学必然会像浪花一样一个接一个地在各个行业里冒头。黄仁勋算了笔账:要是公司能拿到更多的容量去搞Token生成,赚的钱自然就多了。现在很多云服务商对文本模型收费就是按Token来算的,可基于视频的模型通常不按这个套路走,多半是按任务或者按GPU用了多久来收费。 有业内人士Jack Gold估计,黄仁勋脑子里的想法其实是把Token当成了一种福利送给开发者。他觉得往后大家都会跟硬件买设备似的领年度预算,工程师们只要拿这个去干活就能提效十倍。现在硅谷招人最看重的就是你手里管了多少Token的份额,毕竟这玩意儿能让工程师变得更有生产力。大家伙儿对Token的需求那是前所未有地高,价格自然也就居高不下。但等到新技术铺开了,成本肯定会慢慢稳下来甚至降下来。 这次大会上黄仁勋带来了一大堆新玩意儿,像Rubin这种新GPU和Vera这种CPU都有亮相。他还把这些芯片跟Groq的推理芯片结合在了一起,宣称要把生成Token的速率从2200万猛推到7亿——这可是涨了350倍!他把这个概念叫作AI工厂。这套体系有个核心理念:赚的钱就等于每瓦能跑出多少个Token。要知道在有限的功耗下,每一个没用上的瓦都是在亏本。 J. Gold Associates的首席分析师Jack Gold分析说,目前大家讨论得最多的是推理环节而不是训练环节。推理本身不会花掉那种天文数字的Token钱。黄仁勋强调Veras是个好东西,既能让系统价格往上窜又能把计算成本往下压。戴尔的产品负责人Charlie Walker也表示,现在的客户已经看明白了云里的Token有多烧钱,所以都在找那些更省钱的本地部署方案。比如戴尔推出的Pro Max GB300就是一款基于英伟达数据中心GPU的AI PC。 为了把话说透点,黄仁勋还特意推出了OpenClaw——这是个用来构建AI智能体的开放框架。他顺便拿出了基于这项技术的英伟达企业级平台NemoClaw。OpenClaw能让智能体互相配合干活、把流程拉长运行下去。他甚至拿HTML和Linux作类比来说明OpenClaw的重要性:“咱们现在有了一个全世界顶尖的开放智能体框架。” 问个实际的吧:到底啥是AI Token经济学?它咋影响企业发展?说白了就是拿Token当钱花。有了这东西能帮忙招到人、做预算还能提升生产力。一个公司拥有的Token容量越大,生成的钱就越多。 为啥说Token成了招聘工具?因为在硅谷看你手里管了多少Token份额已经成了铁打的标准。黄仁勋还说了句大实话:“往后大家都得领年度Token预算。” 英伟达是怎么把生成成本降下来的?他们搞出了Rubin和Vera这对组合拳。还把它们跟Groq的推理芯片串在一起用。这样一来就能把生成速度从2200万直接飙到7亿。