
2026年1月6日,英伟达在其年度技术盛会的主题演讲中正式宣布,其全新的“Rubin”计算架构平台已进入量产阶段。该平台涵盖了六款核心芯片产品,包括Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU以及Spectrum-6以太网交换机。目前,所有芯片已完成合作制造并顺利回厂,部分关键测试也已成功通过,整体研发与生产进度均符合既定规划。
根据最新公布的技术数据,Rubin平台在训练性能上达到了前代Blackwell架构的3.5倍,运行人工智能软件时的性能更是提升了5倍。在推理效率方面,其token生成成本最高可降低10倍,训练混合专家模型(MoE)所需的GPU数量也缩减至此前的四分之一,显著提升了资源利用效率。
新一代Vera CPU采用了88个定制的Olympus核心,其主频性能是同类替代产品的两倍,专为代理型推理任务优化设计,被定位为大规模AI工厂中能效表现最优的中央处理器。该芯片完整支持Armv9.2指令集架构,并集成高速NVLink-C2C互连技术,实现了更低的延迟与更高的芯片间通信带宽。
Rubin GPU则搭载了第三代Transformer引擎,并引入了硬件级自适应压缩机制,为AI推理提供高达50 petaflops的NVFP4算力支持。单颗GPU的数据带宽达到3.6TB/s,而由其构成的Vera Rubin NVL72机架系统,整体带宽进一步扩展至260TB/s,充分满足了超大规模模型部署的需求。
多家主流云服务提供商已确认,将于2026年率先推出基于Vera Rubin架构的计算实例,覆盖全球主要公有云平台。同时,CoreWeave、Lambda、Nebius和Nscale等专业云计算基础设施合作伙伴也将陆续接入该平台,共同推动新一代AI计算生态的落地与扩展。
