NVIDIA坦言:AI时代下64位计算我们仍未全面释放
12月14日消息,最近两年AI技术的爆发式增长,不仅重塑了人工智能产业,实际上也悄然改变了芯片技术的发展轨迹。然而,这一转向对于高性能计算(HPC)和科学计算领域来说,却未必是个好消息。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
究其原因,在于NVIDIA近年来已将AI性能视作一切的核心,计算精度实际上在不断降低。以往比较GPU性能时,FP64和FP32精度还是核心指标;但步入AI时代,FP16、FP8乃至FP4精度才是重点。
我们此前曾提到,NVIDIA新一代显卡会转向FP4标准。从Blackwell架构开始,虽然也支持FP4和MXFP4两种格式,但重点推广的是NVFP4。它与E2M1+FP4结构相似,精度损失却微乎其微。
GB300在支持FP4后,性能提升了50%,精度相较FP8几乎没有损失,内存占用大幅减少了2-3倍,能效更是实现了50倍的提升。
但在FP64性能上,近几年的显卡,尤其是顶级产品,不仅没有提升,反而在倒退。HPCWire对这几代显卡进行了对比,如下图所示:

A100时代的FP64性能还有9.7 TFLOPS,H100和H200达到34 TFLOPS,B100、B200是30 TFLOPS,而B300则大幅降低到了1.2 TFLOPS。
这已经引发了学术界的抱怨。在SC25大会期间,TOP500发起人、田纳西大学教授Jack Dongarra就表示,NVIDIA从Hopper架构转向Blackwell时,并未实质性地提升FP64性能。
AI性能固然重要,但在科学计算领域,比如材料科学、气候建模、流体力学模拟等研究中,FP64性能是不可替代的。
对于这些质疑,NVIDIA负责HPC和AI超大规模基础设施解决方案的高级总监Dion Harris强调,他们并没有放弃64位计算,它依然是核心。
他提到十月份推出的cuBLAS,这是一个CUDA-X数学库,可以在矢量核心上模拟FP64计算,使用这个库可以让FP64性能提升1.8倍。
至于专业人士所期待的FP64性能硬件提升,Dion Harris提到NVIDIA未来的GPU会在核心底层提升FP64计算能力,但具体信息暂时不能透露。
明年三月份的GTC大会上,NVIDIA应该会公布下一代GPU架构了,或许在这方面会有所变化。

相关攻略
快科技3月26日消息,近日,微星科技携手《魔兽世界:至暗之夜》,推出GeForce RTX 5070 12G魔兽世界至暗之夜限定版显卡。本次联名显卡以重返奎尔萨拉斯为设计核心,两大版本风格鲜明。虚空
IT之家 3 月 26 日消息,英特尔昨日发布了 Q1 26 版锐炫 Arc Pro 专业显卡 Windows 驱动程序,版本号来到 32 0 101 8515。这版本显卡支持锐炫 Pro B70
IT之家 3 月 29 日消息,极夜(TOPFEEL)新推出了一款 Next 2 迷你主机,搭载 AMD R7 H255 处理器,相比一般的迷你主机最大亮点在于可安装独显。IT之家汇总价格如下:Ne
IT之家 3 月 27 日消息,YouTube 频道 Red Gaming Tech 在最新一期视频中,爆料称相比较 RTX 50 系列,英伟达 RTX 60 系列显卡纯光栅性能提升约 30~35%
IT之家 3 月 27 日消息,长城 X 系列金牌全模组电源最近推出两款新品,分别为 X10 X12,额定功率 1000 1200W,均支持 ATX 3 1 标准,兼容 40 50 系显卡,售价 6
热门专题
热门推荐
惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即
F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实
helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很
3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需
幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统





