12月11日消息称,美国日前放开了NVIDIA H200显卡的对华出口限制。这款显卡与此前的特供版H200相比性能大幅提升,对于增强大模型训练与推理能力将起到显著作用。
与此同时,H200解禁背后还有一个关键问题值得留意:该显卡所采用的HBM3e显存是否同样获得了出口许可?遗憾的是,答案似乎并不乐观——美国对本土企业的HBM出口禁令依然有效,并不允许其单独对外销售。
NVIDIA的H200显卡采用了上一代的Hopper架构,其FP32性能达到67 TFLOPS,FP16性能更是高达1979 TFLOPS,是特供版H20显卡的6倍。同时,它也是全球首款搭载HBM3e显存的产品,显存容量高达141GB,带宽达到4.8TB/s。
此前,国内AI显卡普遍还在使用HBM2e标准的显存,无论是容量还是性能,都已难以满足当前顶级AI模型的发展需求。
尽管HBM3e目前仍无法对华出口,但华为已经推出了自主研发的替代方案。今年9月,华为正式公布了两款自研HBM技术,分别命名为HiBL 1.0和HiZQ 2.0,可根据不同应用场景适配于不同的AI加速卡。
预计明年上半年发布的Ascend 950PR+将采用华为自研的低成本HBM技术HiBL 1.0。相比高性能、高价格的HBM3e/4e方案,该技术能够显著降低推理预填充阶段与推荐业务场景的部署成本。
而计划明年下半年问世的Ascend 950DT则将搭载HiZQ 2.0技术,使得显存容量提升至144GB,内存访问带宽达到4TB/s。同时,其互连带宽也提升至2TB/s。

未来的Ascend 960、Ascend 970还将进一步把显存容量提升至288GB,带宽分别达到9.6TB/s和14.4TB/s。预计这些产品将在2027年至2028年间陆续面世。

