1月13日消息,花旗银行在其最新报告中指出,随着英伟达采用推理语境记忆存储等新技术,全球NAND供应短缺的状况恐将进一步加剧。
在AI推理过程中,为避免重复计算、提升响应速度,系统会采用KV缓存机制,这类似于AI模型的“短期记忆”。但随着上下文长度的爆炸式增长,昂贵的HBM早已不堪重负。
为了解决这一瓶颈,英伟达宣布推出由BlueField-4 DPU驱动的ICMS平台。该平台建立了一个名为G3.5的全新存储层级:将原本挤在HBM中的KV缓存,卸载到可扩展性更强的本地SSD之中。

得益于此,英伟达能够显著提升推理速度,最高可达5倍,同时能源效率提升高达5倍,延迟也大幅降低。
花旗预计,为了支持ICMS运作,在一套Vera Rubin NVL72 AI配置中,英伟达将为每个机架配置最多16TB的额外存储,总体SSD容量将达到约1152TB。
根据市场预测,Vera Rubin服务器在2026年的出货量预计为3万台,2027年将达到10万台。
这意味着2026年由此产生的额外NAND需求将达到3456万TB,占全球总需求的2.8%;而到2027年,需求将飙升至1.15亿TB,占全球NAND总需求的9.3%。
而且,花旗的分析仅基于Vera Rubin平台,并未考虑更高规格的Rubin Ultra系统,也未纳入后续Feynman架构可能带来的新增需求。这意味着实际的NAND需求增长,可能比目前预测的更为显著。
花旗认为,英伟达采用ICMS技术,将成为NAND供应商的积极催化剂,三星、SK海力士、铠侠、西部数据及美光将成为最大受益者。

