首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英伟达AI新架构解析:1PB单台服务器如何缓解NAND短缺

英伟达AI新架构解析:1PB单台服务器如何缓解NAND短缺

热心网友
17
转载
2026-02-21



在2026 年国际消费电子展(CES)上,英伟达CEO黄仁勋发布了Vera Rubin AI 超算平台,并推出推理上下文内存存储(ICMS)—— 这一被视为AI存储架构革新的方案,正为 NAND闪存与SSD开辟全新的AI推理应用场景。现场展示的独立黑色存储机架,标志着AI硬件从“算力优先”向“算力+存储协同”的深刻转变。

爱集微VIP频道近日上线Citi Research发布的《英伟达推理上下文内存平台,进一步加剧NAND短缺》。本报告深度解析了英伟达为Vera Rubin平台引入的ICMS架构,并通过量化的需求模型预测:这项创新将为全球NAND闪存市场带来结构性、大规模的增量需求,可能使本已紧张的供应短缺局面雪上加霜。

欢迎订阅爱集微VIP频道

核心洞察:一项架构革新如何重塑NAND市场

一、技术核心:用SSD解决AI推理的“内存墙”

英伟达为其Vera Rubin平台搭载了基于BlueField-4芯片的推理上下文内存存储(ICMS)架构,旨在解决大规模 AI 推理场景中普遍存在的内存瓶颈问题。该架构的核心创新在于:将AI推理过程中的关键键值缓存(KV Cache)从传统高带宽内存(HBM)中分流剥离,迁移至扩展性更强的专用存储介质,摆脱对昂贵且容量受限的HBM的过度依赖。

这一设计可带来三大性能提升:生成令牌速度最高提升5倍、能效最高提升5倍、延迟显著降低,从而全面强化Vera Rubin平台的AI推理算力。

为清晰阐释ICMS的技术逻辑,报告首先明确了KV Cache的核心作用:作为Transformer 模型的关键内存优化机制,KV Cache 通过缓存已计算的键值对避免重复运算。按照内存层级,其可划分为四类:

-GPU HBM(G1层级):承载活跃KV缓存;

-系统 DRAM(G2层级):承载过渡/溢出 KV 缓存;

-本地SSD(G3层级):承载温/偏热KV缓存;

-传统共享企业存储(G4层级):用于存储冷 KV 缓存数据。

ICMS的核心突破,是在现有内存层级中新增一个G3.5层级。该层级以16TB TLC SSD 为存储介质,可高效将海量、访问频率较低的冷KV缓存数据,转化为计算单元可快速访问的温/热数据,相当于在高速但容量有限的HBM与大容量但速度较慢的传统企业存储之间,搭建起一层高容量、中高带宽的高速桥梁,从架构层面系统性缓解大模型推理的内存墙问题。

二、需求量化:单台服务器需求超1PB,市场影响显著

报告通过严谨的硬件规格推演,量化了ICMS带来的NAND需求冲击:

1.单台服务器需求惊人

一台完整的Vera Rubin服务器配备72块GPU。根据架构,每块GPU需对应16TB的SSD用于ICMS。因此,单台服务器就需要额外搭载高达1152TB(即1.152PB)的NAND闪存。

2.全球需求占比可观

保守情景:假设2026年Vera Rubin服务器出货3万台,将新增3460万TB的NAND需求,占2026年全球NAND总需求的2.8%。

积极情景:若2027年出货量增至10万台,新增需求将跃升至1.152亿TB,占2027年全球NAND总需求的9.3%。

对于一个产能扩张周期长(通常需18-24个月)、供需本就紧平衡的市场而言,如此集中且庞大的新增需求,无疑将显著加剧供应短缺,并可能对价格产生强劲的向上支撑。

三、市场影响:核心NAND供应商直接受益

报告明确指出,ICMS架构的落地将成为NAND闪存核心供应商的重大利好。直接受益的企业包括全球市场的领导者:三星电子、SK海力士、西部数据(闪迪)、铠侠、美光科技。

这些公司凭借其技术、产能与客户关系,将率先承接来自英伟达及其服务器合作伙伴的订单,其市场份额与盈利能力有望获得提升。

产业前瞻:AI驱动存储架构的范式转移

报告揭示了一个超越短期市场波动的长期趋势:AI推理工作负载正在重塑数据中心存储层级。当模型参数和上下文长度不断增长,KV Cache的大小可能达到TB甚至PB级,单纯依赖HBM在成本和物理上都不再可行。

英伟达的ICMS架构标志着一个明确的转向:通过软件与系统架构创新,将海量、温冷的数据存储负担向更高容量、更具成本效益的NAND闪存转移。这不仅是为解决眼前的内存墙问题,更可能定义了未来AI服务器的标准存储配置。

立即注册爱集微VIP账号

解锁报告全部内容

爱集微VIP频道:您的前沿技术雷达

在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。爱集微VIP频道致力于打造ICT产业的全球报告资源库,通过“行业报告”“集微咨询”“政策指引”三大板块,为您提供:

-超过2万份深度产业与技术研究报告,持续更新;

-每周新增数百篇前沿分析与技术解读,紧扣脉搏;

-覆盖技术演进、市场动态、产业链布局的多维信息体系。

我们坚持“信息普惠”原则,会员一次订阅即可访问全平台内容,无二次收费,无分级限制。

限时会员通道现已开启,为您的专业决策注入持续动能:

-首月体验价仅需9.9元,以最低成本,超值体验完整服务。

-月卡19.9元,灵活应对短期、高强度的信息需求。

-季卡54.9元,以稳定的节奏,持续把握产业脉搏。

-年卡199元,是长期主义者最具性价比的智囊伙伴。

立即注册爱集微VIP账号,一键获取《英伟达推理上下文内存平台,进一步加剧NAND短缺》完整报告,深入理解英伟达ICMS架构如何颠覆AI存储体系,及其对全球NAND闪存市场供需与核心企业的深远影响。

来源:https://www.163.com/dy/article/KMA0QKKA0511RIVP.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

内存价格全面上涨影响所有用户与行业
科技数码
内存价格全面上涨影响所有用户与行业

2026年的全球半导体市场,正被一场深刻的结构性失衡所定义。高带宽内存、DRAM及NAND闪存等关键存储组件的价格一路飙升,其根源在于数据中心正以前所未有的胃口,吞噬着全球近七成的内存产能。这场由上游引发的风暴,如同精准传导的多米诺骨&牌,迅速波及PC、智能手机、新能源汽车等下游产业,最终让每一位普

热心网友
05.17
ROG首款24GB双条DDR5-6000内存上市首发价5999元
科技数码
ROG首款24GB双条DDR5-6000内存上市首发价5999元

ROG发布幻刃DDR5RGB20周年版内存条,采用24GBx2的DDR5-6000规格,时序CL26-36-36-76,搭载海力士M-DIE颗粒,提供终身质保。产品定位高端,首发价5999元,计划6月下旬上市。

热心网友
05.16
CPU-Z 2.20 新版发布 支持 AMD Gorgon Halo 系列处理器
科技数码
CPU-Z 2.20 新版发布 支持 AMD Gorgon Halo 系列处理器

CPU-Z发布2 20版本,显著扩展了对新一代处理器的识别支持,包括AMD锐龙PRO9000、锐龙AI400G系列及代号“GorgonHalo”的多款高端型号,以及英特尔相关平台。同时,新版本新增了对HUDIMM和HSODIMM等前沿内存模组的识别能力。

热心网友
05.15
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕
游戏评测
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

据外媒报道,近期发生了一件可能是最离谱的“捡漏”故事,不过这种运气可不是人人都有。 最近在Reddit上,一位用户的经历让整个硬件圈都直呼“离谱”。他在一家本地的清仓店里,只花了6 99美元,就成功拿下了一套64GB的DDR5笔记本内存(2×32GB)。 价格错误的“捡漏”故事之前也听过不少,比如半

热心网友
04.29
内存价格狂泻!DDR5最高降22%:创下四个月新低
科技数码
内存价格狂泻!DDR5最高降22%:创下四个月新低

日本DDR5内存价格“跳水”,但市场迷雾仍未散 最近,日本PC硬件市场传来一个值得玩味的消息:多款DDR5内存套装价格在4月中旬出现了显著松动,部分型号的降幅甚至超过了20%。这波降价,是市场回归理性的信号,还是又一次短暂的波动? 主流规格领跌,高频型号跟进 先看具体数据。根据市场监测,32GB(1

热心网友
04.25

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

微星PRO MAX系列ATX 3.1白金全模组电源上市 579元起售
科技数码
微星PRO MAX系列ATX 3.1白金全模组电源上市 579元起售

微星PRO MAX系列ATX 3 1全模组电源现已于京东平台全面上市。该系列精心规划了850W、1000W与1200W三档功率规格,全线产品均严格通过80PLUS白金能效认证,为用户带来高效节能的供电体验。首发期间,850W版本售价579元,1000W版本679元,1200W版本799元,参与晒单活

热心网友
05.18
光帆科技发布首款带摄像头AI耳机5月15日正式上市
科技数码
光帆科技发布首款带摄像头AI耳机5月15日正式上市

行业首款集成视觉能力的AI智能耳机即将面世。光帆科技近日正式宣布,其创新产品“光帆全感AI耳机”定于5月15日全面发售。这款耳机以“全感知、主动式、个性化”为核心定位,旨在彻底革新用户与可穿戴音频设备之间的交互模式。 本质上,它颠覆了传统耳机的被动响应模式。根据官方介绍,这款AI耳机能够主动感知并理

热心网友
05.18
币安止损设置技巧与参考指标全解析
web3.0
币安止损设置技巧与参考指标全解析

止损是交易中控制风险的关键手段,在币安等交易平台设置止损时,主要参考市场波动率、技术分析关键位以及个人风险承受能力。合理的止损应基于对价格走势的客观判断,而非情绪化决策,同时需结合仓位管理,避免因单次止损过大而影响整体资金安全。动态调整止损位以适应市场变化,是提升交易纪律性的重要环节。

热心网友
05.18
Agent时代HTML逆袭 Markdown为何不再受宠
科技数码
Agent时代HTML逆袭 Markdown为何不再受宠

过去两年,要问大模型最习惯用什么格式交付内容,答案多半是Markdown。 原因不难理解:Markdown足够干净,没有冗余格式,复制到文档、知识库、GitHub,甚至直接粘贴到微信公众号后台,基本都不会出问题。某种程度上,它已经被公认为AI时代最理想的标记语言。 不过,随着Agent时代的到来,M

热心网友
05.18
iPhone 18 Pro七大升级曝光 小岛设计续航突破
科技数码
iPhone 18 Pro七大升级曝光 小岛设计续航突破

距离2026-2027年度旗舰手机的大幕拉开,大约还有四个月时间。按照惯例,届时在全球舞台上率先亮相的主流旗舰,很可能依然是苹果的iPhone 18 Pro系列。 就在昨天(5月8日),知名爆料人Jon Prosser发布了iPhone 18 Pro Max的视频渲染图,与此同时,关于该系列手机的七

热心网友
05.18