20%,200亿美元,300亿美元,3月15日,3月5日,AI,CEO,CES,CPX,DRAM,Feynman,GPU,GTC,Groq,HBM这些关键数字和词汇在英伟达即将举行的新品发布会前夕再度被热议。因为随着中东战火的重燃,韩国股市在过去的几个交易日里遭遇了大幅下挫,三星电子和SK海力士等巨头的股价累计跌幅接近20%。一些市场声音将内存公司股价的下跌归因于英伟达即将推出的新产品抢走了HBM的市场份额。事实上,这一说法源于外媒爆料称英伟达将在GTC大会上发布一款由Groq设计的芯片。这个平台被视为专门用于推理计算的新系统。 去年年底,英伟达花了200亿美元拿下了Groq公司的团队和非独占专利授权,这是他们在核心算力产品上第一次大规模引入外部架构。Groq自研的LPU芯片在片上集成了数百兆SRAM,这种访问速度比HBM快约20倍的特性让它能大幅降低延迟。因为OpenAI宣布从英伟达获得300亿美元融资时提到了“专用推理算力”,外界就更有理由猜测这次发布会上出现的新品与这种新型处理器有关。 对于“Groq是否利空HBM”的讨论,韩国科技分析师Jukan引用了独立机构KIS的分析指出:认为SRAM推理芯片会取代HBM的看法反映出对存储器理解的不足。与DRAM相比,SRAM的单元面积大且密度低,相同容量需要5到10倍的芯片面积才能实现。正因如此,SRAM通常被用作对延迟要求极高的缓存或缓冲区而非主存储器。因此这类芯片更多是针对特定推理任务的额外选项,比如物理AI边缘应用中的机器人和自动驾驶场景。 早在1月份CES的分析师问答活动上,黄仁勋就详细解释过这个问题:“如果把所有东西都放进SRAM里当然不需要HBM内存了。”但他也直言这样做会把模型规模缩小100倍左右。考虑到工作负载形态一直在变化(比如MoE模型和多模态模型),英伟达必须提供普适性的解决方案。黄仁勋同时表示,在某些特定场景下SRAM确实能带来惊人的速度优势。 那么这次GTC发布会上出现的产品究竟是什么呢?“世界前所未见”的全新芯片是否真的是以SRAM为核心的LPU?黄仁勋曾强调这将是一次全新的架构变革。市场猜测这可能不是Rubin CPX或下一代Feynman架构的GPU旗舰产品。作为CEO,黄仁勋需要在平衡技术前瞻性和市场需求之间找到最佳答案。