NVIDIA下代AI服务器揭秘：1800W芯片液冷散热，成本解析

11月6日消息，如今的AI芯片越发强大，也越发“饥渴”，微软CEO纳德拉都感慨电力供应已经跟不上，NVIDIA可谓难辞其咎。根据摩根士丹利的最新报告，NVIDIA Blackwell Ultra G

11月6日消息，如今AI芯片性能日益强大，对电力的渴望也愈发迫切。微软首席执行官萨提亚·纳德拉坦言，电力供应已跟不上需求步伐，英伟达对此同样感到压力重重。

摩根士丹利最新报告指出，在NVIDIA Blackwell Ultra GB300 NVL72机架式AI服务器系统中，仅液冷散热组件的单价就达到49860美元，约合人民币36万元，比上一代GB200 NVL72系统高出约20%。

这还不是全部。

下一代系统的功耗还将继续攀升，预计Vera Rubin NVL144服务器的液冷系统成本将再次增加17%，达到55170美元，约合人民币40万元。

一颗芯片1800W功耗！NVIDIA下代AI服务器液冷就要40万元

根据报告披露，GB300 NVL72服务器包含18个计算托盘，每颗GPU芯片功耗为1400W，每个计算托盘功耗至少6600W，为此需要配备6200W的散热能力。单个液冷单元成本约2260美元，18个单元总计40680美元。

此外还有9个NVSwitch交换机托盘，单个液冷成本约1020美元，9个单元总计9180美元。

不出所料，整个液冷散热系统中，最昂贵的组件是为GPU和CPU定制的高性能液冷板，每个成本高达300美元，而用于NVSwitch交换机的定制冷板，每个也需要200美元。

摩根士丹利预计，下一代Vera CPU与Rubin GPU的功耗将进一步提升，其中GPU功耗将高达1800W，NVSwitch 6.0交换机的耗电量也会增加，散热成本自然水涨船高。

具体来看，每个计算托盘的散热成本将上升18%，达到2660美元。其中更大容量的冷板成本上涨至400美元，而托盘总数保持不变，合计47880美元。

好消息是交换机托盘的散热成本将下降约15%，每个单元870美元，合计7830美元。

一颗芯片1800W功耗！NVIDIA下代AI服务器液冷就要40万元

至于后续的Rubin Ultra架构，计划在每个GPU封装内集成4个计算模块和16个HBM4E内存模块。热设计功耗大幅提升至3600W，因此需要采用全新的液冷板，甚至可能转向浸没式液冷方案。

与此同时，NVIDIA正在筹备新的NVL576机架方案，包含多达144颗GPU，比现有配置增加一倍，散热成本势必会急剧上升。

当然，这些跟咱们普通用户关系不大……

一颗芯片1800W功耗！NVIDIA下代AI服务器液冷就要40万元