近日,英伟达首席执行官黄仁勋透露,公司全新的Vera CPU将以“独立基础设施产品”的身份进军市场,不再仅仅是GPU的陪衬。这意味着英伟达首次将一款能够独立支撑完整计算栈的处理器商品化,直接挑战由AMD EPYC和英特尔Xeon长期主导的数据中心市场。黄仁勋将Vera称为“革命性”产品,并透露包括CoreWeave在内的早期合作伙伴已在规划部署,尽管正式的设计规格尚未全部对外公布。

英伟达强调,此次发布不仅是单一新品的问世,更是其“全栈一站式”算力战略的重要节点。公司不再满足于用GPU去加速其他厂商的CPU,而是希望以自家架构贯穿从通用计算到AI推理的每一个环节。通过提供从CPU、GPU到高速互联的整体解决方案,英伟达希望在云计算与企业级基础设施领域,从“部件供应商”升级为“完整系统供应商”。
在技术规格方面,Vera采用88个自研Armv9.2 Olympus核心,每个核心支持两线程的空间多线程技术,构成88核心、176线程的并行计算能力。英伟达选择Arm架构,旨在性能扩展性与能效优化之间获得更大灵活性,这一点对数据中心整体能耗控制尤为关键。芯片集成了1.5 TB的LPDDR5X内存,提供1.2 TB/s的带宽,这一高带宽配置对于AI模型预处理、数据分析与仿真等内存密集型工作负载具有明显优势。目前尚不确定Vera是否会支持传统DDR5 RDIMM模块,抑或完全依赖类似其模块化系统常见的LPDDR5X方案。

Vera的核心架构一大亮点在于第二代可扩展一致性互联架构,这是一条贯穿单芯片上88个核心的高速互联通路。该互联系统提供3.4 TB/s的对分带宽,使各核心间的数据交换高效且延迟更低,有意规避部分多芯片粒设计中常见的同步开销问题,例如AMD EPYC这类产品所面临的跨芯片粒协调挑战。同时,这一互联结构还与英伟达第二代NVLink芯片间技术直接相连,最多可向包括即将到来的Rubin GPU在内的外部组件提供1.8 TB/s的一致性带宽。借助这一设计,Vera与Rubin能够共享内存模型与数据,在同一计算框架内构建起统一的CPU-GPU计算环境。
在指令与向量计算能力方面,Vera核心支持FP8运算,并集成六组128位SVE2向量单元,以提升数据与AI处理效率。这使得Vera能够在CPU端直接承担部分AI与浮点运算任务,而无需将所有工作都卸载给GPU,从而在某些企业级AI推理与数据处理场景中降低能耗与延迟。对英伟达而言,Vera CPU既是技术层面的里程碑,也是战略布局上的转折点:公司正从全球领先的GPU供应商,转型为在通用计算领域与AMD EPYC、英特尔Xeon正面竞争的新玩家。随着Vera以独立形态进入数据中心市场,传统x86阵营将迎来一位更深层次融合CPU与GPU的强劲对手。
