据智通财经APP获悉,Nebius (NBIS.US)近日宣布,计划从2026年下半年开始,在美国和欧洲市场推出英伟达(NVDA.US)的Vera Rubin NVL72图形处理器(GPU)。
这家总部位于荷兰的AI基础设施提供商透露,将通过其Nebius AI云服务和Nebius Token Factory(代币工厂)来部署英伟达Rubin平台,并成为首批提供该计算平台的AI云供应商之一。
Nebius表示,计划将Vera Rubin NVL72整合到其位于美国和欧洲数据中心的AI全栈基础设施中,让客户能够构建具备区域可用性和可控性的下一代AI应用程序。
Nebius创始人兼首席执行官阿尔卡季·沃罗兹表示:“通过将Vera Rubin集成到Nebius AI云和我们的推理平台Nebius Token Factory中,我们正在为AI创新者和企业打造领先的基础设施,帮助他们更快速、更高效地开发代理式和推理式AI系统。”
据该公司介绍,Nebius Token Factory是一个面向企业的专业推理及训练后优化平台。
Nebius进一步指出,Rubin加速计算平台将与其现有的英伟达GB200 NVL72和英伟达Grace Blackwell Ultra NVL72产能形成互补,从而扩大客户对平台的选择范围。
周一,英伟达首席执行官黄仁勋在公开演讲中透露,作为Grace Blackwell的继任者,下一代计算平台Vera Rubin目前已进入全面量产阶段。
英伟达高性能计算与AI基础设施解决方案高级总监Dion Harris将Vera Rubin描述为“由六颗芯片构成的AI超级计算机”。这一平台由Vera CPU、Rubin GPU、第六代NVLink交换芯片、ConnectX-9网卡、BlueField 4 DPU以及Spectrum-X 102.4T CPO六大核心组件构成,专为面向云端与大型数据中心的下一代AI工作负载而设计。
其中,Rubin GPU芯片搭载了第三代Transformer引擎,NVFP4推理算力高达50 PFLOPS,是英伟达上一代Blackwell GPU的五倍。在整体架构层面,Vera Rubin平台能在相同训练时间内完成超大规模“专家混合”模型的训练,而所需的GPU数量仅为原来的四分之一,且每个token的训练成本更是降至原先的七分之一。英伟达同时强调,Vera Rubin将支持第三代机密计算技术,并将成为业界首个机架级可信计算平台,以满足对安全隔离、数据隐私与多租户环境有高要求的AI应用场景。
