positron把asimov推来了,号称在推理这块儿比英伟达rubin强了五倍

Positron把他们家的Asimov推出来了,号称在推理这块儿比英伟达Rubin强了五倍。这种革命性的AI芯片,其实就是内存优先设计,把Transformer推理时的瓶颈给通了,能效一下子提升了五倍,这对2026年的IT算力格局影响肯定不小。Positron这家初创企业在发布会说,他们的第二代ASIC设计Asimov,不管是Token能效还是性价比都把英伟达Rubin给超过了。 他们觉得现在Transformer推理跑不动主要是因为内存带宽不够用,跟算力关系不大。所以Asimov这个芯片就是专门为内存优化的,利用率高达90%,还能把那些不必要的远程数据搬运给干掉。这颗芯片分成两部分,每个部分里面都有那种支持多种数据格式的脉动阵列。每个部分直接连到432GB的LPDDR5x内存上,再通过PCIe 6.0或者CXL 3.0接上至少720GB的KV Cache。 这张卡整体功耗是400W,内存总容量2304GB,带宽冲到了2.76 TB/s。散热方面用风冷就行。芯片之间还能用支持16Tbps的多样化拓扑结构连起来。他们搞了个Titan推理服务器系统,放在19英寸4U机架里塞了四颗Asimov。这系统能跑16T的参数模型和10M的上下文窗口,单台机器能做4096个这样的系统。Positron表示这次芯片流片计划在2026年底搞定,2027年初开始量产。