11月6日消息,如今AI芯片性能日益强大,对电力的渴望也愈发迫切。微软首席执行官萨提亚·纳德拉坦言,电力供应已跟不上需求步伐,英伟达对此同样感到压力重重。
摩根士丹利最新报告指出,在NVIDIA Blackwell Ultra GB300 NVL72机架式AI服务器系统中,仅液冷散热组件的单价就达到49860美元,约合人民币36万元,比上一代GB200 NVL72系统高出约20%。
这还不是全部。
下一代系统的功耗还将继续攀升,预计Vera Rubin NVL144服务器的液冷系统成本将再次增加17%,达到55170美元,约合人民币40万元。

根据报告披露,GB300 NVL72服务器包含18个计算托盘,每颗GPU芯片功耗为1400W,每个计算托盘功耗至少6600W,为此需要配备6200W的散热能力。单个液冷单元成本约2260美元,18个单元总计40680美元。
此外还有9个NVSwitch交换机托盘,单个液冷成本约1020美元,9个单元总计9180美元。
不出所料,整个液冷散热系统中,最昂贵的组件是为GPU和CPU定制的高性能液冷板,每个成本高达300美元,而用于NVSwitch交换机的定制冷板,每个也需要200美元。
摩根士丹利预计,下一代Vera CPU与Rubin GPU的功耗将进一步提升,其中GPU功耗将高达1800W,NVSwitch 6.0交换机的耗电量也会增加,散热成本自然水涨船高。
具体来看,每个计算托盘的散热成本将上升18%,达到2660美元。其中更大容量的冷板成本上涨至400美元,而托盘总数保持不变,合计47880美元。
好消息是交换机托盘的散热成本将下降约15%,每个单元870美元,合计7830美元。

至于后续的Rubin Ultra架构,计划在每个GPU封装内集成4个计算模块和16个HBM4E内存模块。热设计功耗大幅提升至3600W,因此需要采用全新的液冷板,甚至可能转向浸没式液冷方案。
与此同时,NVIDIA正在筹备新的NVL576机架方案,包含多达144颗GPU,比现有配置增加一倍,散热成本势必会急剧上升。
当然,这些跟咱们普通用户关系不大……

