3月17日消息,在今天举行的GTC大会上,NVIDIA推出了多款重磅产品。其中Vera Rubin系统是今年即将出货的重点产品,也是当前性能最强大的AI平台。
实际上,Vera Rubin并非首次在GTC大会上亮相,去年的大会就已经公布了相关信息。不过之前的说法是集成6种芯片,而如今它已经不再是一张简单的AI显卡,而是一套复杂的AI整机系统,由7种芯片和5种机架组合而成。
这些芯片主要包括Rubin GPU、Vera CPU、NVLink 6.0互联芯片、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6网络交换机,以及这次新加入的Groq 3 LPU。其中LPU技术是NVIDIA去年底斥资200亿美元收购获得的技术授权,主要面向推理AI应用。
这7款芯片需要搭配5种机架——Vera Rubin NVL72机架、Vera CPU机架、Groq 3 LPX机架、BlueField-4 STX存储机架、Spectrum-6 SPX以太网机架,最终才能形成完整系统。

最终Vera Rubin平台实现了高达3.6ExaFlops(1E相当于100亿亿次)的运算性能,具备260TB/s的全网络带宽,采用100%水冷散热,Token生成速度达到每秒70亿个。
这个性能到底有多夸张?黄仁勋在现场提出了一个对比——相比10年前的计算系统,Vera Rubin的性能提升了4000万倍。仔细数了数后面的零才确认没看错,不过这个数据对比的是10年前的什么系统就不得而知了。

考虑到黄氏对比法也不是第一次出现,4000万倍的提升也不必较真。因为10年前的计算系统根本没有AI性能的概念,FP4之类的算法更是不支持,Vera Rubin随便秒杀之前的顶级系统都没什么意外的。
Vera Rubin还不会是NVIDIA最强大的AI系统,接下来还会有Vera Rubin Ultra,GPU数量从当前的72个提升到144个,性能再次翻倍都没问题。
再往后就是下一代GPU架构费曼,首发台积电的A16制程,也就是1.6nm级别的工艺,还采用3D堆叠封装,定制HBM内存,搭配新一代LP40 LPU芯片,还有NVLink 8.0、CX10等全新一代芯片,预计2028年问世。

