随着人工智能产业从“算力驱动”走向“应用驱动”,存储正成为影响推理服务体验与成本结构的关键因素。近期,闪迪与SK海力士在闪迪美国总部联合举办HBF规格标准化联盟启动会,意味着两家存储厂商开始推动高带宽闪存的全球标准化,并在开放计算涉及的框架下建立工作机制,着手制定技术规范与互通要求。当前推理阶段的核心矛盾,正在从“能否训练”转向“能否规模化服务”。在大模型与行业模型加速落地的背景下,在线推理要应对海量并发请求、频繁数据调取以及严格的响应时延约束。以往依赖单一层级的存储体系,往往不得不在性能、容量、能耗与成本之间取舍:高带宽内存吞吐极高,但成本高、容量扩展受限;固态硬盘容量优势明显,但带宽与时延难以直接满足推理链路对“就近供数”的要求。随着用户规模增长、业务负载波动加大,该矛盾更为突出。造成上述问题,一上于推理任务的数据路径更复杂。推理不仅依赖模型权重,还涉及检索增强、向量数据库、上下文缓存等多类数据,访问模式呈现高频、小块、随机与突发并存。另一上,数据中心运营越来越强调能效与总体拥有成本,单纯堆叠高规格内存难以持续;而将更多热点数据下沉到低成本介质,又容易带来带宽瓶颈与时延抖动,影响服务稳定性。因此,行业需要在“内存—存储”之间引入更合适的层级,在性能与容量之间取得更好的平衡。 在这一背景下,HBF被提出作为介于高带宽内存与固态硬盘之间的新型存储层,强调与高带宽内存协同,通过更靠近计算侧的部署形态与更高的数据通道能力,缓解推理场景中热点数据供给不足的问题。相关厂商认为,HBF有望提升系统扩展性,降低单位服务成本,并以更优能耗比改善数据中心运行效率。从产业链角度看,标准化启动的意义不仅在于提出一种产品形态,更在于明确接口、管理与互操作要求,为不同厂商、不同平台之间的兼容与规模化采购创造条件。 其影响主要体现在三个层面:首先,平台侧可能形成更清晰的分层存储架构,将不同热度、不同访问特征的数据放在更匹配的层级,减少“用最贵介质承载所有热点”的低效方式。其次,对服务器整机与系统软件而言,新存储层会推动调度策略、缓存体系与数据编排机制升级,围绕带宽、时延与能耗的综合最优进行系统性调整。第三,标准化将降低生态协同门槛,带动控制器、介质、封装、测试以及运维工具链完善,从而影响数据中心的建设与迭代节奏。 关于如何推动HBF从概念走向可用、可采并实现规模化,业内普遍认为需要多线并进:一是加快形成开放、可验证的规范体系,明确关键指标与测试方法,避免“各自为政”带来的兼容成本;二是围绕典型推理负载建立参考架构与评测基线,用真实业务指标验证其对吞吐、时延稳定性、能耗与成本的综合收益;三是推进软硬件协同,尤其补齐数据编排、资源隔离、故障恢复与可观测性能力,确保在高并发场景下稳定运行;四是通过开放生态吸引更多参与者,形成供应链与应用侧的正向循环。 从前景看,随着推理服务向更多行业渗透,存储系统的“带宽—容量—成本”再平衡将成为长期课题。业内预测,以HBF为关键组件的整合型存储解决方案需求有望在2030年前后加速扩张。但同时也要看到,新层级能否快速落地仍取决于标准完善程度、生态成熟度以及与既有平台的集成成本。总体而言,标准化进程的启动传递出明确信号:面向推理规模化时代,存储创新的重要性将与算力创新并重,系统级优化将成为提升服务能力与产业竞争力的重要路径。
高带宽闪存标准化的启动,反映出全球存储产业对AI时代需求变化的积极回应。通过产业链上下游协作建立统一技术标准,不仅有助于推动存储技术持续演进,也将为AI产业生态的完善提供支撑。随着标准化推进,HBF有望成为未来AI基础设施的重要组成部分,为人工智能在更广泛场景中的落地提供稳定的底层能力。