当地时间1月5日,英伟达CEO黄仁勋在CES演讲中揭晓了公司新一代AI平台Rubin。该平台包含六款新型芯片,分别是Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU以及Spectrum-6以太网交换机。其中,Rubin GPU芯片搭载了第三代Transformer引擎,其NVFP4推理算力高达50 PFLOPS,是Blackwell平台的五倍。与Blackwell平台相比,Rubin能将推理代币生成成本降低最多十倍,并让训练混合专家模型所需的GPU数量减少四倍。
英伟达Rubin平台目前已进入全面生产阶段,基于该平台的产品预计将在2026年下半年通过合作伙伴面市。英伟达表示,包括亚马逊的AWS、谷歌云、微软和甲骨文云在内的厂商都计划在2026年率先部署基于Vera和Rubin平台的实例。云合作伙伴CoreWeave、Lambda、Nebius和Nscale也将跟进。此外,思科、戴尔、惠普企业、联想和超微预计将推出基于Rubin产品的各类服务器。包括Anthropic、Cohere、Meta、Mistral AI、OpenAI和xAI在内的AI实验室正期待利用Rubin平台训练更大型、更强大的模型。
