10月14日,业界巨头英伟达发布官方消息,Meta与甲骨文公司将对自身AI数据中心网络进行同步升级,采用英伟达推出的Spectrum-X以太网网卡及交换机。
本次合作中,Meta计划将Spectrum-X以太网交换机集成至其Facebook开放交换系统(FBOSS)网络基础设施内——这是一套专为大规模网络交换设备管理与调控而研发的软件平台。
二者的深度整合,将显著加快系统部署的速度,进一步提升人工智能训练效率,更快获得模型洞察力。
而Oracle则将依托NVIDIA Vera Rubin架构提供算力加速,借助Spectrum-X以太网进行互联,构建规模庞大的“千兆级”AI工厂集群。

Vera和Rubin分别为英伟达下一代AI专用CPU与GPU,已于去年中旬正式发布,目前已在台积电流片成功。
其中,Rubin系列将率先采用台积电3纳米EUV制程工艺,首发产品R100将搭配新一代HBM4高带宽内存,预计明年推向市场,随后还将推出性能更强的Rubin Ultra版本。
Spectrum-X以太网平台作为NVIDIA人工智能全栈解决方案的重要组成部分,专门面向万亿参数级模型训练而设计,是全球首个专门优化AI工作负载的以太网网络平台,内含Spectrum-X以太网交换机与Spectrum-X SuperNIC以太网网卡,能够将数百万颗GPU高效连接。

英伟达方面表示,Spectrum-X已展现出突破性的网络效能与前沿的拥塞控制机制,在全球最大规模的AI超级计算机部署中,实现了高达95%的数据吞吐率。相较而言,常规的以太网在大规模部署时,常因频繁的数据流碰撞导致吞吐率下降至约60%。
同样隶属于下一代产品线的CX9 SuperNIC目前也已完成流片,其网络带宽将升级至1600Gbps,折合为160万兆。
英伟达创始人黄仁勋对此评论道:“万亿参数模型正在将传统数据中心转化为千兆级的AI工厂。Spectrum-X不仅是速度更快的以太网技术,它已成为AI工厂的神经网络系统,助力超大规模云计算企业连接数百万GPU,构建前所未有的巨型超级计算机,训练有史以来最复杂的AI模型。”

