随着人工智能AI在全球的加速应用,行业的焦点已经从大模型的集中训练阶段转向了规模化应用与商业变现。最近在美国英伟达公司举办的GTC大会上,英伟达创始人兼CEO黄仁勋提出了“token工厂”概念。他认为,行业竞争已经从大模型时代发展到了token产能时代,“未来的数据中心不再是存储文件的仓库,而是生产token的‘工厂’”。“计算能力等同于收入”,黄仁勋在会上还提到了这个观点。这次GTC大会吸引了全球目光,“薇拉·鲁宾”新一代AI计算平台亮相,每瓦特性能提升10倍。英伟达同时展示了可以容纳256个语言处理单元的配套机架系统,每瓦特词元生成效率提升约35倍。2022年,“token工厂”这个概念被提出来,让大家开始重新认识数据中心的角色。它不仅仅是存储文件的仓库,而是持续吞吐海量数据并输出智能内容的“token工厂”。在AI世界里,“token”是指词元,即模型处理和生成信息的基本单位。它可以是一个词、一段代码,甚至是图像和视频中的一个像素区块。2024年10月,执行GPT-3.5级别系统的推理成本在2022年11月至2024年10月间骤降280多倍。虽然模型越来越大、上下文越来越长会让AI变得更聪明,但“token”的生成速率会降低。为了提升“token”生成效率和降低成本,黄仁勋在演讲中强调了架构优化的重要性。2025年6月,亚马逊公司与塔伦能源公司达成长期协议获得电力供应。2025年10月,谷歌公司计划重启美国艾奥瓦州一座核电站为其AI基础设施供电。这些例子表明全球大型科技企业正在加速布局清洁能源来支持自己的AI基础设施建设。2030年之前到2025年基础上德国通用数据中心算力将翻一番。德国政府本月17日公布了一项数据中心扩容战略规划这个消息就说明全球各地都在加紧算力布局和绿色转型深度融合。红杉资本公司在一份行业观察报告中指出GPU计算正日益商品化GPU计算已成为数字经济运转基础设施并得到广泛认可。2025年人工智能指数报告显示小型模型能力跃升执行GPT-3.5级别系统推理成本大幅下降。除了电力供应AI产业还面临物理空间冷却水资源等多重约束这些因素推动全球算力布局加速发展。德国政府公布战略规划提到德国通用数据中心算力将翻一番新增容量优先由德国和欧洲企业建设这样做减少了德国对欧洲以外大型云服务提供商依赖根据这个消息可以看出许多经济体认识到掌握算力意味着掌握数字经济定价权和数据安全主动权从欧洲到中东许多国家正在斥巨资建立本土数据中心确保其AI模型能够基于本国语言文化和价值观进行训练和内容生成避免在数字经济底层基础设施上过度依赖跨国巨头3月20日新华社北京发布新闻分析“token工厂”开启算力经济新逻辑随着人工智能在全球加速落地行业焦点正从大模型集中训练阶段快速演进至规模化应用与商业变现阶段最近在美国英伟达公司年度GTC大会上英伟达创始人兼首席执行官黄仁勋提出“token工厂”概念认为行业竞争已从大模型时代发展到token产能时代未来的数据中心不再是存储文件仓库而是生产token工厂对相关企业来说计算能力等同于收入从电子仓库到token工厂在AI世界里token是指词元即模型处理和生成信息基本单位可以是一个词一段代码甚至图像与视频中一个像素区块简单来说AI不直接认识字或词而是通常把语言切割成词元再映射成AI可以理解和处理数字ID当用户向AI提问时经过深度推理输出分析报告或高清影像首先就是高频次大规模生成一系列词元伴随这一过程数据中心角色正在发生根本性转变传统意义上数据中心主要用于数据静态存储和网络交换被视为电子仓库如今随着AI智能体开始自主调用工具执行复杂逻辑任务数据中心正全面转变为持续吞吐海量数据并输出智能内容token工厂业内普遍认为无论是所谓token工厂还是AI工厂其实质就是把数据中心重新定义成智能产线输入是电力数据模型和调度系统输出则是AI智能体执行能力和行业场景实际生产率每瓦特token定义AI时代生死线黄仁勋在演讲中将token比作数字经济时代硬通货认为在既定电力和空间资源约束下数据中心产出token速度质量和成本将直接决定科技企业能否存活因此每瓦特电力token吞吐量将替代传统服务器数量存储容量成为决定数据中心竞争力与营收核心指标在未来AI服务体系中token成为可计价数字商品AI服务按吞吐量速率智能密度等为它分层定价免费层级token吸引更多客户而高端层级token服务于最有价值客户相关观点已经得到业内广泛认同红杉资本公司发布行业观察报告指出GPU计算日益商品化充裕低成本算力已成为支撑数字经济运转基础设施斯坦福大学发布2025年人工智能指数报告显示得益于小型模型能力跃升执行GPT-3.5级别系统推理成本在2022年11月至2024年10月间骤降280多倍黄仁勋在演讲中说随着模型越来越大上下文越来越长AI会变得更聪明但token生成速率会降低因此架构优化至关重要英伟达宣布将推出新一代AI计算平台薇拉·鲁宾每瓦特性能预计达到上一代系统10倍同时展示可容纳256个语言处理单元配套机架系统与薇拉·鲁宾平台协同工作可将每瓦特词元生成效率提升约35倍全球加紧算力布局全球半导体供应链与云服务商研发焦点全面转向提高单位瓦特下词元产出率核心目标都是在有限能源供给下让算力设施产出更多硬通货除了电力供应AI产业还面临物理空间冷却水资源等多重约束在此背景下能源瓶颈促使全球算力布局加速与绿色转型深度融合一段时间以来全球大型科技企业正密集向核电地热等清洁能源领域延伸投资亚马逊公司与塔伦能源公司达成长期协议获得电力供应为亚马逊云科技公司数据中心供电还考虑合作建造小型模块化反应堆和为核电站扩容谷歌公司公布计划重启美国艾奥瓦州一座核电站为其AI基础设施供电面对“token工厂”带来产业重塑许多经济体认识到掌握算力意味着掌握数字经济定价权与数据安全主动权从欧洲到中东许多国家斥巨资建立本土数据中心确保其AI模型能够基于本国语言文化价值观进行训练内容生成避免过度依赖跨国巨头德国政府本月17日公布一项数据中心扩容战略规划到2030年德国通用数据中心算力至少翻一番新增容量优先由德国和欧洲企业建设减少对欧洲以外大型云服务提供商依赖。