东方证券最新的研报给咱们科普了Groq3 LPX机架跟太空算力未来的动向。眼下通信这行当里头,铜线这东西虽说快被光缆淘汰,但在短距离的Scale-up系统里还是相当好用,干脆搞个双层架构,把铜线和光一起上,效果就更顶。这一来高算力密度的Kyber架构就有了落脚点,背板互相垂直连起来的技术也就自然而然出现了。 虽说AI推理领域一直被GPU霸占着,但Groq3 LPX这次给咱们搞了个新花样。这个机架特别盯着低延迟的活儿,能让赚快钱的路子更顺畅。核心部件Groq3 LP30 LPU用的是一种平扁的SRAM设计,就是为了让生成那些token的时候又快又准。单台机架里塞了32个液冷的1U计算单元,总共能挤出315 PFLOPS的算力、128GB的内存和640TB/s的带宽。这些硬指标摆在那儿,那绝对是能打硬仗的。 比起英伟达自家的Blackwell来说,用Rubin机架配上Groq3 LPX,在处理大模型的时候那效率就翻倍了,单兆瓦能跑出超过35倍的token处理量,盈利机会更是多了十倍不止。东方证券觉得这玩意儿解决了高端模型推理成本太高的大问题。以后云厂商要是想把Rubin跟LPX搭起来用,肯定能把腰包鼓起来,市场上大量的推理需求也能给激活。 除了Groq3 LPX,英伟达那边还推出了VeraCPU机架。这玩意里面塞了32个液冷的VeraCPU单元,每一个里头还藏着8颗CPU和2颗BlueField DPU。它的Olympus核心在单线程的活儿上比老x86提升了50%。这一套系统能支持超过22500个并发强化学习的Agentic沙箱环境,这对咱们搞AI Agent的发展可是个大助力。 在太空这一块,英伟达跟伙伴联手搞了个Space-1 Vera Rubin Module,专门给未来的太空数据中心加速用。再加上RubinUltra Kyber架构的出现,那计算和交换板之间的正交背板互联算是彻底落地了。那些搞PCB、液冷、供电和光通信的公司肯定也跟着沾光赚钱。 不过随着AI技术越来越普及,市场胃口自然越来越大。不过这行业走得太快也伴随着风险,比如技术发展慢、竞争太激烈啥的。所以咱们企业得盯着点风险、积极应对才行。 总而言之,Groq3 LPX加上太空算力这一波革新,算是推理技术迈入了新纪元。等这些技术成熟了,AI肯定会在各行各业起大作用,推动社会发展呢。