11月28日消息,在AI大模型训练与推理领域,NVIDIA显卡毫无疑问占据了主导地位,AMD、Intel及谷歌等竞争对手的市场份额难以与其相提并论。那么问题来了:NVIDIA的领先优势到底体现在哪些方面?
如果抛开CUDA生态优势或AI算力参数不谈,Artificial Analysis直接对比了当前三大主流推理方案的实际表现,测试平台分别采用谷歌TPU v6e、AMD MI300X及NVIDIA H100/B200系列芯片。
虽然测试内容涵盖多个维度,但我们可以通过一个综合指标来快速了解整体情况——在30 Token/s的响应速度下,每处理百万次输入输出所需的成本对比,测试模型为Llama 3.3 70B。

成本数据显示,H100处理相同任务仅需1.06美元,H200也只要1.17美元,B200 TensorRT方案为1.23美元,标准B200则为1.45美元。相较之下,AMD MI300X需要2.24美元,而谷歌TPU v6e的成本高达5.13美元。
通过对比不难发现,NVIDIA显卡相较AMD产品至少具备两倍的性价比优势,相较于谷歌方案更是领先五倍左右,差距相当显著。
即便是使用NVIDIA最新旗舰产品B200显卡,虽然成本略有上升,但考虑到其性能的大幅提升,相较AMD和谷歌的方案依然保持明显优势。
可以说,当前AMD与谷歌的AI加速卡在性价比方面还存在一定差距。不过两家下一代产品将有显著升级——AMD MI400X系列将配备最高432GB HBM4显存,谷歌TPU v7据称也会有数倍的性能提升,届时测试结果或将全面改写。
当然,NVIDIA也不会停滞不前。新一代Rubin架构显卡已经发布,预计明年陆续上市,有望进一步扩大其领先优势。

