虽然三星的HBM4尚处于英伟达验证阶段,但在技术日新月异的存储领域,上周五(9月19日)传来重大突破——三星12层HBM3E成功通过英伟达认证测试,这意味着三星即将跻身英伟达HBM核心供应商行列,为全球AI算力基建注入新鲜血液。
这场认证无疑在半导体行业掀起巨浪。AI浪潮不仅推动着大模型和算力芯片的创新发展,更将内存需求推至前所未有的高度。作为关键支撑技术,高带宽内存(HBM)已悄然成为AI硬件生态中的"隐形支柱"。从英伟达A100到H200系列GPU的爆发式增长,再到各类大模型的快速迭代,HBM都扮演着不可或缺的角色。
然而,HBM的火热供应也带来了"甜蜜的烦恼"。这种技术壁垒高、良率低的存储产品已成为半导体界的"硬通货",让主要供应商SK海力士成功超越三星,登顶全球存储芯片制造商榜首。

HBM的容量困境与HBF的战略机遇
随着AI模型参数量的爆炸式增长,HBM在速度和带宽优势之外,正面临严峻的容量瓶颈。即便SK海力士即将量产的HBM4单封装最大容量将提升至36GB(后续计划扩展至64GB),面对动辄上千亿参数的大模型仍显捉襟见肘。尤其当DeepSeek等MoE(混合专家)模型降低算力需求后,内存墙问题更加凸显。
在这样的大背景下,被誉为"HBM之父"的韩国科学技术研究院金正浩教授近期给出了前瞻性判断:下一代存储技术的竞争焦点将转向高带宽闪存(HBF)。这一预测并非空穴来风,存储巨头SK海力士已与闪存龙头企业闪迪达成战略合作,共同推进HBF技术的研发与标准化进程。

从内存堆叠到闪存堆叠的技术变革
要理解HBF的创新价值,首先需要把握HBM的技术特性。作为GPU专用高性能内存,HBM通过立体堆叠DRAM芯片与超宽互连设计,实现了远超传统DDR内存的传输速度。比如英伟达H200搭载的HBM3e,其单卡内存带宽高达4.8TB/s。
然而,这种高端存储方案面临着成本高企、产能受限等现实挑战。作为应对方案,HBF创新性地采用NAND闪存堆叠技术,既保留了HBM高带宽特性,又显著提升了存储密度。其核心思路并非取代HBM,而是构建互补型存储架构:HBM继续处理时延敏感的关键任务,HBF则负责存储模型权重等需要大容量的数据组件。

实际上,金正浩教授早在今年9月初的演讲中就指出,AI发展已从算力中心转向内存中心。在数据吞吐成为关键瓶颈的当下,HBF以其优异的单位成本存储能力和规模化潜力,有望成为突破容量天花板的重要解决方案。
产业生态的协同创新
技术预测的背后是扎实的产业实践。在今年8月举办的第14届FMS存储器峰会上,闪迪首次披露了HBF研发进展。通过与SK海力士的战略合作,双方将优势互补:SK海力士贡献先进的3D堆叠封装工艺,闪迪则提供突破性的键合技术。值得一提的是,HBF在设计上针对AI推理场景做了特别优化,充分发挥闪存在读密集型应用中的性能优势。
随着上下文窗口的不断扩展,AI系统对存储容量提出了更高要求。HBF的出现恰好填补了这一需求缺口,为突破万亿参数大关铺平了道路。

从数据中心到边缘计算的革命性影响
根据闪迪与SK海力士的路线图,首款HBF样品预计在2026年下半年问世,商用产品可能在2027年初面市。这种新技术将首先应用于高性能计算领域,比如为NVIDIA H200等专业GPU提供存储扩容方案,显著提升模型装载效率并降低I/O延迟。
更值得期待的是,HBF技术将逐步渗透至消费电子领域。在当前AI PC、AI手机等终端设备难以本地部署大模型的困境下,HBF通过小型化封装技术,有望让终端设备获得处理数十亿参数模型的能力,推动离线AI应用的普及。

相比HBM的高成本、高功耗特性,HBF凭借更高存储密度和更低单位成本,将成为推动消费级AI设备发展的关键推手。这不仅关乎技术演进,更是重塑AI应用生态的重要契机。
展望:存储技术的未来图景
从HBM到HBF的技术迭代,反映了AI发展对存储系统提出的一系列革命性要求。在这个数据驱动的时代,存储介质已不仅仅是辅助组件,而是决定AI发展维度的重要基石。
HBF的价值在于其精准把握了AI应用在容量与带宽间的平衡点,为突破现有存储瓶颈提供了创新解决方案。当这项技术与现有HBM形成互补优势,AI硬件生态将迎来全新发展维度。
站在技术革新的临界点,我们有必要思考:
- HBF能否如同HBM般成为行业标配?
- 从数据中心到消费终端的扩展路径是否通畅?
- 当存储瓶颈被突破后,AI发展的下一个制约因素会是什么?
这些问题答案有望在2027年HBF商用产品面世时逐步揭晓。但可以确定的是,定义AI未来的不仅是算力军备竞赛,存储技术的创新同样至关重要。这场改变计算范式的新赛跑,才刚刚拉开序幕。
