在近日举行的NVIDIA GTC DC 2025大会上,英伟达创始人兼首席执行官黄仁勋发表主题演讲,全面展示了AI时代的最新技术路线图,涵盖大规模GPU部署、量子计算突破、AI工厂、机器人技术及自动驾驶等关键领域。

新一代Vera Rubin Superchip正式亮相,性能实现跨越式提升
黄仁勋首次揭晓了下一代Vera Rubin Superchip,其集成了一颗Vera CPU和两颗Rubin GPU,并配套8个SOCAMM模块。Vera CPU拥有88个定制Arm核心,支持176线程;每个Rubin GPU对应8个HBM4堆栈,显存容量达288GB。通过NVLINK-C2C互联技术,CPU与GPU之间的连接带宽高达1.8TB/s。
与上一代Blackwell Ultra B300 NVL72相比,在相同配置数量(144个GPU芯片)下,Vera Rubin NVL144的FP4计算性能从1.1 PFLOPS跃升至3.6 PFLOPS。尽管显存容量保持不变,但HBM4的采用使带宽从8TB/s增至13TB/s。此外,新一代NVLink将总吞吐量提升一倍至260TB/s,而ConnectX-9链路的速率达到28.8TB/s。

Rubin Ultra计划于2027年面世,算力再翻数倍
英伟达计划在2027年下半年推出Rubin Ultra平台,在保留Vera CPU的基础上,升级至HBM4E显存,并采用新的机架布局Rubin Ultra NVL576,单机架集成576个GPU。这一设计将FP4推理性能推升至15 ExaFLOPS,FP8训练性能达5 ExaFLOPS,约为Vera Rubin NVL144的4倍。NVLink和ConnectX-9的速率也将进一步提升至1.5 PB/s和115.2 TB/s。
量子计算与GPU深度融合,NVQLink实现低延迟互联
英伟达推出NVQLink开放式系统架构,将GPU计算与量子处理器(QPU)紧密结合,实现实时CUDA-Q调用,延迟低至约4微秒,为构建量子超级计算机奠定基础。通过NVIDIA CUDA-Q软件平台,开发者可创建跨CPU、GPU和QPU的混合应用,推动混合量子-经典超级计算机的发展。目前,该技术已连接17家QPU制造商、5家控制器制造商和9个美国国家实验室。
Omniverse DSX正式发布,推动AI工厂模块化建设
Omniverse DSX为设计及运营百兆瓦至吉瓦级AI工厂提供综合蓝图。该方案已在美国弗吉尼亚州马纳萨斯AI工厂研究中心完成验证,首次实现建筑、供电、冷却系统与AI基础设施的协同设计。合作伙伴可提供预制模块,大幅缩短建设时间并支持模块化扩展。建成后,数字孪生系统将作为“操作系统”实时监控和优化流程。

BlueField-4 DPU加速十亿瓦级AI基础设施
英伟达推出BlueField-4 DPU,集成Grace CPU和ConnectX-9网络技术,支持800Gb/s吞吐量,为AI数据存储、网络和安全提供突破性加速。相比BlueField-3,其计算能力提升6倍,支持的AI工厂规模扩大4倍。新平台还支持多服务架构,实现网络、安全与存储服务的统一管理。
携手诺基亚进军6G,注资100亿美元布局AI原生无线网络
英伟达与诺基亚合作推出AI原生6G技术栈NVIDIA Arc,基于Aerial平台和加速计算驱动。诺基亚将集成该技术,而英伟达以每股6.01美元注资100亿美元,成为诺基亚第二大股东。这一非排他性合作旨在共同推动6G通信技术的创新。
通过上述技术布局,英伟达正从硬件性能、量子融合到基础设施构建全面推进,加速AI时代的到来。
