10月15日,跳票数月之久的NVIDIA迷您AI超算DGX Spark终于正式上市,3999美元的定价折合人民币大约3万元起步。
DGX Spark的硬件规格堪称奢华,处理器采用GB10 Grace+Blackwell SuperChip组合,CPU部分为20核ARM架构,由10个Cortex-X925与10个Cortex-A725构成,GPU基于Blackwell架构,FP4性能达到1PFLOPS,同时集成了第五代Tensor核心与第四代RT光追核心,整体规格相当于RTX 5070显卡。
内存方面配备了256位宽的LPDDR5X统一内存,最高频率达9400MHz,原始带宽约301GB/s,搭配128GB内存容量,可运行最高2000亿参数的AI大模型,或支持700亿参数的微调模型。
2000亿参数对AI大模型来说已经相当可观,若能在这样一款迷你设备上运行无疑极具吸引力。因此DGX Spark上市后,已有网友实测其性能,其中Peter Gostev还制作了详细的性能对比图表,将RTX Pro 6000、RTX 5080、RTX 5090及苹果M1 Max、M4 Pro等产品纳入对比。

简单来说,DGX Spark测试了Deepseek R1、Llama-3、Gemma-3等模型,其中Llama-3.1-8b模型输出速度为每秒36个token,R1模型则为20个token。
这样的表现处于什么水平?对比可见,RTX 5090对应的性能数据分别为200和114,意味着DGX Spark至少领先3-5倍性能,而价格却仅有一半。
苹果M4 Pro运行对应大模型时分别达到34和18个token的性能,与DGX Spark相差无几,但价格仅为1400美元。
总的来说,在这次性能测试中,DGX Spark虽然能够运行大模型,但性能表现似乎有些失常,估计是内存带宽仍然受限,比高端游戏GPU差了不少,与价格仅为其三分之一的苹果M4 Pro芯片版Mac Mini表现接近,完全对不起它奢华的规格和定价。

