昨天临时起兴,去了一趟人工智能大会,主要想给自己充充电,顺便看看这波AI浪潮里,硬件领域到底翻出了哪些新花样。
到了现场发现,有些趋势确实值得拿出来好好聊聊。

10-12卡AI一体机:硬件的“面子”与“里子”
单看硬件,特别是那些同质化严重的产品,其实并不是这类大会的焦点。传统服务器厂商这次参展的并不多,会场里真正把AI一体机摆到展台上的,也就只有这一家。
这款9U的服务器,理论上最多能塞进12块GPU。但展台上那台,因为采用的是4090显卡,宽度超过标准2-Slot设计,所以实际只装了10块。
跟大厂那些堆料十足的AI服务器相比,这台一体机的设计思路明显更务实,或者说更贴近实际需求——CPU那块主板,肉眼可见地做了缩减,目的很明确:控制成本。CPU Socket插座,如果我没看错,应该是AMD EPYC家族的SP6。内存通道只有6条,单路CPU的PCIe插槽利用率倒是很高,7个槽里理论上可以支持5个x16。
上面这段话,懂的人自然懂,有些细节不方便展开细说。毕竟正规渠道的生意,早就卷成一片红海了。
做GPU生意:服务才是真正的护城河
不过,下面这款RTX 4090 48GB,既然厂家已经大方地印到了宣传彩页上,那也就没什么好遮遮掩掩的了。
印象中,以往在公开场合,发言人在谈到这种“显存扩容”的GPU卡时,多少都会加上一句“提醒”:非官方渠道,稳定性没保障,正规单位要谨慎使用。但这次会议上,几位专家大佬的口风明显都更“现实”了。也许是在他们的短期测试里,这批4090 48GB还没有爆出什么大问题。
无独有偶,另一位知名公司的发言人在PPT里,直接亮出了“2080Ti 22G”的配置参数。上台演讲的可不是什么山寨小厂。这说明一个很清晰的事实:“魔改”显卡,已经不再是极客圈子里的小众玩具,而是真真切切地被部署到了一些生产级项目里。
究其原因,性价比自然排在第一。2080Ti 22G在DeepSeek V3/R1这波热潮到来之前,就在圈子里广为认知了。而新一轮大模型应用对平均参数量的提升,客观上又为4090 48G推了一把。
另一个关键原因,恐怕跟禁令脱不了干系。以前很多人在服务器上用A40、L40(都是48GB显存),工作站的RTX 6000 Ada现在也一样买不到了。虽然4090 D和RTX 5880算是开了个小口子,但这也严重动摇了大家对下一代GPU的信心,包括市场上流传的关于5090 D(传闻只有32GB显存)的那些小道消息。
从行业角度来看,5090 D的硬件参数本身不是已经合规了吗?怎么还是被卡在显存这一项上……
大显存GPU的未来:不止是消费级的事
像GeForce、Radeon这些消费级显卡,温度和故障率偏高,一个重要原因是它们的功耗释放太激进。还有一个问题:非公版的大尺寸散热器,不利于在服务器里高密度部署。这个问题对于显卡厂商来说,其实并不算技术难题。至于工作站显卡,先不谈那些图形性能优化,它在AI计算场景下,本身就扮演着游戏卡和服务器GPU之间的折中角色。
NVIDIA最新一代的工作站旗舰显卡RTX PRO 6000 Blackwell,已经把显存拉到了96GB。AMD那边RDNA 4架构的新品还没发布,但按常规思路,也应该会大幅提升显存容量吧?
与NV的RTX 4090对位,AMD有一款24GB显存的Radeon RX 7900 XTX消费级显卡。而在Radeon Pro专业卡产品线里,则有三款48GB的型号。其中W7900有双插槽和三插槽两个版本;W7800除了48GB,还有一款32GB显存的配置。
GPU厂商当然更愿意销售毛利高的产品,这样才有资金持续投入CUDA、ROCm这些软件生态的研发。所以我们看到,在5090之下,RTX 5080的显存依然只有16GB。正常打游戏的话,这个容量倒也够用。
至于AMD这边,最新一代的Radeon RX 9070 XT也只有16GB,因为它本身对位的,就是NVIDIA的GeForce 5070系列。于是有人开始猜测:AMD RDNA 4消费级显卡,会不会还有一款更高规格的型号?要么是连同GPU核心一起拉高规格,要么就是只简单地把显存堆到32GB。
说到底,大家期待的,还是AI应用能有一个高性价比的方案。当然,如果能像常规显卡那样,提供不缩水的保修服务,那就更完美了。

