据8月26日消息,NVIDIA正在筹备Blackwell架构GPU的迭代产品——"Blackwell Ultra",代号为B300和GB300。这款主打人工智能与高性能计算领域的新品预计将于年底前发布,随后才会迎来下一代革命性架构"Rubin"。
Blackwell Ultra延续台积电4NP制程工艺,拥有2080亿晶体管规模,依旧采用双芯片NV-HBI高速互联设计(带宽达10TB/s)。该GPU集成160个SM单元(每个单元含128个CUDA核心)和640个第五代Tensor核心,维持统一的二级缓存架构。
在互联方案上,GPU间继续采用1.8TB/s带宽的第五代NVLink,GPU与CPU间的NVLink-C2C通道保持900GB/s速率。值得一提的是,此次Blackwell Ultra首次开放了对PCIe 6.0标准的支持,传输带宽实现翻倍提升。此外,HBM3E显存容量从192GB扩容至288GB(带宽8TB/s),但峰值功耗也相应从1200W攀升至1400W。
值得注意的是,NVIDIA透露Blackwell架构原本就具备PCIe 6.0的技术支持,只是此前未向市场开放此功能。
性能表现方面,最突出的改进体现在两方面:首先,NVFP4稠密计算性能跃升50%,达到惊人的15PFlops;其次,SFU单元的注意力加速性能实现翻倍提升,从5TF/s暴涨至10.7TF/s。不过FP8、FP16、TF16等数据格式的处理性能基本维持原有水平。
Blackwell Ultra将主要通过GB300 NV72服务器进行部署,采用液冷机架方案。每个计算节点依然配置两颗B300 GPU搭配一颗Grace GPU的经典组合。
