问题:大模型训练与推理需求持续增长的背景下,算力系统的性能提升越来越受“供给侧”限制:高带宽内存(HBM)的产能、能效与可靠性,以及服务器内存对高并发数据吞吐的支撑能力。随着GPU加速器大规模部署,内存带宽、单位功耗性能和系统集成复杂度,正成为决定数据中心整体效率的关键因素。 原因:一上,AI工作负载普遍具有参数规模大、访存密集、数据并行度高等特征,传统内存与互连架构很难可控功耗下持续扩展带宽。另一上,HBM依赖先进封装与工艺协同,产业链对良率、测试、封装能力和供货稳定性要求很高,一旦供需失衡,往往会在新一代产品迭代时被深入放大。基于此,三星与AMD通过签署合作备忘录提前对齐下一代产品节奏,以联合规划降低“代际切换”带来的不确定性。 影响:据三星披露,双方合作将重点覆盖AMD下一代Instinct MI455X GPU的HBM4供应,并为代号“Venice”的第六代AMD EPYC处理器提供先进DRAM方案,涉及的技术将支撑由Instinct GPU、EPYC处理器及机架级架构组成的下一代AI系统(包括AMD Helios平台)。三星称,其HBM4将采用第六代10纳米级(1c)DRAM工艺与4纳米逻辑基底芯片,数据传输速率可达13Gbps、带宽最高3.3TB/s。业内观点认为,若HBM4按期实现规模化应用,将直接提升训练吞吐、缩短任务完成时间,并降低单位算力能耗,从而影响加速器平台的综合竞争力。 对策:从供给端看,这份备忘录的核心在于将“采购关系”进一步推进到“联合研发与平台级适配”。除HBM4外,双方还计划面向“Venice”共同开发高性能DDR5内存,以满足机架级系统对通用内存容量与带宽的需求,形成“HBM+DDR”协同的系统内存方案。同时,双方将探讨晶圆代工合作的可能性,意味着未来在先进工艺与产能调度上或将更紧密协同,以提高关键环节的可预期性与抗风险能力。值得关注的是,三星与AMD在图形、移动与计算领域合作已近二十年,三星此前也是AMD Instinct MI350X与MI355X加速器的主要HBM3E合作伙伴,此次延续合作有既有基础。 前景:行业正在从“单卡性能”转向“平台效率”竞争,即以机架为单位评估算力密度、供电散热、互连带宽与全生命周期成本。HBM的代际演进与稳定供货,将更直接影响加速器的产品路线与交付能力。随着HBM4逐步落地,内存厂商、芯片设计企业与系统平台之间的联合研发将更常见。同时,全球半导体供应链仍受地缘、贸易与产能周期等因素影响而波动,提前在关键器件与制造环节开展合作,有助于提升供应安全与交付韧性。若双方在代工、封装测试与平台验证等环节进一步推进落地,其影响可能扩展至更广泛的数据中心客户与生态伙伴。
这次合作既是两家公司在关键器件上的前瞻布局,也反映出AI基础设施竞争正在走向“产业链协同”的新阶段。未来算力能力的提升,将越来越依赖内存、算力芯片与系统平台在产品节奏、制造能力和验证体系上的共同推进。如何通过更紧密的合作提升供应稳定性与交付确定性,将成为行业需要持续解决的问题。