3月17日,英伟达在美国加州圣何塞举办的2026年GTC大会上,正式发布了Vera Rubin AI平台,旨在加速智能体AI(Agentic AI)的技术发展。
英伟达创始人兼首席执行官黄仁勋在发布会上强调,Vera Rubin平台标志着公司史上规模最庞大的基础设施建设项目正式启动,该平台全面覆盖从大规模预训练到实时智能体推理的完整AI生命周期。
在核心算力架构方面,新一代NVL72机架实现了突破性的效率提升。该系统通过NVLink 6高速互联技术,将72块Rubin GPU与36块Vera CPU紧密连接。
与上一代Blackwell平台相比,新系统仅需四分之一数量的GPU即可完成混合专家模型(MoE)的训练任务,同时每瓦推理吞吐量提升了十倍,单个Token的处理成本降至十分之一。
值得关注的是,专为验证AI模型结果设计的Vera CPU机架集成了256块液冷CPU,其运行效率达到传统CPU的两倍,处理速度提升50%。
为满足智能体系统对低延迟和长上下文的需求,英伟达同步推出了Groq 3 LPX推理加速机架。该系统搭载256个LPU处理器,与Vera Rubin平台协同工作时,每兆瓦推理吞吐量最高可提升35倍。
在数据存储架构上,全新BlueField-4 STX机架构建了原生AI存储基础设施。借助创新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在大幅降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互体验。
