2026年的台北国际电脑展上,SK海力士扔出了一颗重磅冲击波——他们展出了下一代HBM4E高带宽内存的样品,目标直指英伟达、AMD等厂商即将推出的AI数据中心GPU平台。这背后其实是一个很明确的信号:随着生成式和推理型AI模型规模越滚越大,行业对更高带宽、更大容量、更高能效的存储需求已经到了“饥渴”的程度,而HBM4E就是在这个节骨眼上,被视为HBM4基础上的又一次重大跨越。

具体来看,这次展出的HBM4E单颗芯片采用了32Gb的芯粒,相比HBM4,裸片密度提升了大约33%。这里有个很有意思的细节:HBM4E通过12层堆叠就能实现48GB的容量,而之前要达到同样的容量通常需要16层堆叠。这意味着什么?意味着在保持容量不变的前提下,封装高度和复杂度都有望降下来,给系统设计留出了更多余地。性能方面同样激进,HBM4E单引脚速率最高可以达到16Gbps,比HBM4提升了大约37%,单颗带宽直接冲到了4TB/s,创下了这类产品的新纪录。
业内人士都很清楚,英伟达的Rubin以及AMD的MI400系列等新一代AI数据中心GPU,今年就会陆续采用HBM4内存方案,而HBM4E就是后续升级的方向。SK海力士这次在展会上提前亮出样品,摆明了是在抢跑下一阶段HBM竞争的赛道。从目前的信息看,HBM4E预计会先出现在计划明年推出的英伟达Rubin Ultra GPU上,再往后一代的产品,则可能采用多GPU与HBM4E芯粒的高密度封装,进一步拉高AI算力和内存带宽的天花板。

把这条技术线拉长了看,HBM4E其实延续了HBM家族在带宽和能效上的迭代逻辑。之前的HBM3E,在36GB、12层堆叠的配置下,已经做到了每颗1.2TB/s级别的带宽和功耗改进;而HBM4在48GB、16层堆叠的形态下,进一步提高了针脚速率和总体带宽。现在HBM4E公布的数据,是在同样的48GB容量下,用更高的单芯密度和更少的堆叠层数,实现了带宽和功耗效率的同步提升。这对AI推理和训练等高负载场景来说,是一个很关键的内存瓶颈缓解方案。


不止HBM:堆叠式NAND与AI PC的完整布局
除了HBM这条主线,SK海力士在展会上还披露了一个很有意思的新型堆叠式NAND方案——“AI-N B”。这个方案借鉴了HBM的通孔硅穿接(TSV)堆叠思路,把多层NAND芯片纵向堆叠起来,目标很明确:实现“HBM级带宽、SSD级容量”的组合能力。直白点说,就是为大规模AI推理提供更高吞吐的存储系统,同时缓解当前高带宽存储供应紧张带来的产业压力。这个思路和业内其他厂商提出的HBF、Z-Angle等技术路径有不少相似之处,大家都在尝试用三维堆叠加高速互连的方式,去弥合高带宽内存与大容量存储之间的性能和成本鸿沟。


在客户端和终端侧产品上,SK海力士也没有闲着。他们展示了多款面向“AI PC”的新品,其中包括基于1cnm工艺的96GB LPCAMM2内存模组。这个模组采用LPDDR5X标准,传输速率最高能达到9.6Gbps,预计今年晚些时候会随着新一代AI PC平台一起推向市场。固态存储这边,V9 NAND系列也亮相了,提供QLC和TLC两种颗粒形态,单颗容量最高能做到2TB,还可以封装成紧凑型cSSD产品。主打的就是小型化设计和能效,而且采用了无DRAM架构,进一步优化成本和功耗表现。
整体来看,从HBM4E到堆叠式NAND,再到高密度LPCAMM2和V9 NAND SSD,SK海力士在这次台北国际电脑展上,把围绕AI数据中心和AI PC两大方向的存储布局展示得相当完整。在AI算力与存储需求同步爆发的这个时间点,新一代高带宽、高密度、低功耗的存储产品,已经成了GPU等计算芯片释放性能的关键支撑。而HBM4E样品的首次公开亮相,无疑是下一轮HBM技术竞争中最具标志性的信号之一。
