在全球人工智能算力需求持续爆发的背景下,芯片能效比成为制约行业发展的关键瓶颈。
传统GPU架构在运行Transformer等大模型时,常因内存带宽不足导致算力闲置。
Positron此次发布的Asimov芯片,正是针对这一行业痛点提出的创新解决方案。
技术分析显示,该芯片采用革命性的内存优先设计,通过优化数据流动路径,将内存带宽利用率提升至90%,较传统架构减少80%的远程数据移动损耗。
其核心由双计算模块构成,单芯片配备432GB LPDDR5x内存,并支持最高720GB的KV Cache扩展内存,整体内存带宽达2.76TB/s。
行业专家指出,Asimov芯片的400W功耗设计平衡了性能与能耗,其创新的风冷方案可支持4U机架部署16T参数模型推理。
更值得关注的是,该芯片采用PCIe 6.0/CXL 3.0接口标准,支持16Tbps芯片间互联,为未来AI算力集群的扩展奠定基础。
市场影响方面,Positron计划在2026年实现量产的时间节点,恰逢全球AI基础设施升级周期。
若其技术指标如期实现,将直接挑战英伟达在AI推理市场的主导地位。
不过业内人士也提醒,芯片从设计到量产存在技术风险,实际性能仍需通过第三方验证。
推理芯片的创新发展反映了人工智能产业从追求通用性向追求专业化、高效化转变的大趋势。
Asimov芯片通过深入理解推理计算的本质特征,在架构设计上进行了大胆创新,展现了初创企业在芯片设计领域的竞争潜力。
随着越来越多的企业投身于推理芯片的研发,推理阶段的算力成本有望进一步下降,这将为生成式AI技术的广泛应用创造更加有利的条件。
同时,这也提醒我们,在AI芯片产业的发展中,专业化、差异化的创新路径同样具有重要价值。