英伟达首款CPO交换机已正式交付每机架省电3千瓦

时间：2026-06-12 13:06

NVIDIA首款CPO交换机Quantum-XQ3450-LD交付，采用共封装光学技术，光学引擎集成至ASIC旁，链路损耗4dB。4U液冷，144个800G端口，总带宽115 2Tbps，功耗仅3 95kW，单机省电3 05kW。首批客户包括Lambda、Meta、微软。

近日，NVIDIA 正式对外宣布了一项业界期待已久的里程碑事件——旗下首款采用共封装光学（CPO）技术的 Quantum-X InfiniBand Photonics Q3450-LD 交换机，现已交付给 AI 云服务商 Lambda 的 GPU 集群。这并非工程样片或演示部署，而是硅光 CPO 技术首次真正迈入量产阶段，从实验室走向了实际数据中心场景。该款 Q3450-LD 是一款 4U 液冷交换机，整机配备 144 个 800G InfiniBand 端口，总无阻塞交换带宽高达 115.2 Tbps。如此强大的交换能力源自内部集成的四颗 NVIDIA Quantum-X800 ASIC 芯片，它们构成了多平面交换架构，每颗芯片可提供 28.8 Tbit/s 的交换能力。仅从这些数字便能感受到这台设备的体量与性能在行业中的领先地位。然而，这台交换机的真正亮点并非仅在于数字本身，而是它背后采用的 CPO 方案——这与传统可插拔光模块截然不同。传统方案中，光模块与 ASIC 之间隔着数厘米甚至更长的电路路径，信号传输过程中损耗巨大；而 CPO 则将光学引擎直接集成到 ASIC 封装旁，信号路径从厘米级缩短至微米级，链路损耗从约 20dB 骤降至仅 4dB，DSP 也被彻底移除。这意味着信号质量更优、功耗更低、系统可靠性更高。说到功耗，这才是最直观的改变。传统同等规格交换机的功耗大约为 7.0kW，而 Q3450-LD 只需 3.95kW，单台节省 3.05kW，能效比相比传统设计提升了约 1.77 倍。别小看这一台节省的电力——如果部署在一个拥有 41,472 块 GPU 的集群中，CPO 交换机总共可以释放出 4,392kW 的电力，这足以额外驱动 3,137 块 GPU。简单计算，每台交换机的节能效果都会直接转化为集群的算力或吞吐量。 Lambda 方面测算，如果一个数据中心拥有 12.8 万块 GPU，传统方案需要部署 65.5 万个独立光收发模块——每一个都是潜在的故障点。CPO 方案大幅减少了光学组件数量，集群的整体可靠性自然显著提升。Lambda 还特别指出，在三层 800G GPU 架构中，后端网络本身已占到总网络功耗的 86%，而通过降低交换层的功耗，CPO 方案能让后端网络将更多电力释放给 GPU，最终直接表现为更高的 token 吞吐量。目前首批采用这一方案的客户名单已经就位，包括 Lambda、CoreWeave、Meta、微软以及甲骨文云基础设施。行业对这项技术的期待，在交付那一刻已成为现实。