英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍
IT之家2月18日援引英伟达最新动态,该公司于2月16日通过官方博客宣布,其Blackwell Ultra AI架构(GB300 NVL72)在能效与成本控制方面实现重大突破。根据DeepSeek-R1模型测试结果显示,相较于前代Hopper GPU架构,新一代架构的每兆瓦吞吐量提升达50倍,处理百万tokens的成本降至原先的三十五分之一的水平。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

值得注意的是,英伟达在公告中还预告了下一代Rubin平台的技术规划,预计其每兆瓦吞吐量将比Blackwell架构再提升10倍,持续推动AI基础设施的迭代升级。
IT之家技术解读:每兆瓦吞吐量(Tokens / Watt)是衡量AI芯片能效表现的核心指标,具体指消耗每瓦特电力所能处理的Token数量。该数值越高,代表芯片能效表现越优异,实际运营成本也相应降低。
英伟达在技术文档中强调,实现性能飞跃的关键在于架构层面的全面升级。Blackwell Ultra通过NVLink高速互联技术,将72个GPU连接为统一的计算单元,互联带宽高达130TB/s,远超Hopper架构时代的8芯片设计方案。此外,全新的NVFP4精度格式与极致协同设计架构相结合,进一步巩固了其在计算吞吐性能方面的领先地位。

在AI推理成本方面,新平台相较Hopper架构实现显著优化,处理百万Token的成本降至原先的三十五分之一。即便是与同代Blackwell架构的GB200相比,GB300在长上下文任务中的Token成本也降低至1.5分之一,注意力机制处理速度实现倍数级提升,完美适配代码库维护等高负载应用场景。

OpenRouter发布的《推理状态报告》指出,与软件编程相关的AI查询量在过去一年中呈现爆发式增长,占比从11%攀升至约50%。这类应用通常要求AI代理在多步工作流程中保持实时响应,并具备跨代码库推理的长上下文处理能力。
为应对这一技术挑战,英伟达通过TensorRT-LLM、Dynamo等开发团队的持续优化,进一步提升了混合专家模型(MoE)的推理吞吐量。以TensorRT-LLM库的改进为例,使得GB200在低延迟工作负载上的性能在短短四个月内提升了5倍。
相关攻略
IT之家 3 月 19 日消息,英伟达今日宣布,为 GeForce NOW 带来一轮更新,内容分为两部分:新增游戏、VR 串流体验升级。新加入的游戏包括 Pearl Abyss 开发的开放世界作品《
IT之家 3 月 27 日消息,YouTube 频道 Red Gaming Tech 在最新一期视频中,爆料称相比较 RTX 50 系列,英伟达 RTX 60 系列显卡纯光栅性能提升约 30~35%
IT之家 3 月 28 日消息,据中国台湾地区媒体《电子时报》昨天报道,随着 2026 年第二季度将至,越来越多集成电路设计大厂跳出来直言,先进制程产能在云端 AI 的庞大需求下变得越来越吃紧,3n
文 | 深流研究所,作者 | 绛枫2025年12月,黄仁勋做客Joe Rogan播客,承认自己一直处于焦虑状态。他说了一句用了三十多年的老话—— "英伟达离倒闭永远只有30天 ",然后补了一句很少有人注
“500人的技术团队投入,换不来与谷歌、英伟达同台竞技的话语权。” 作者丨刘伊伦 编辑丨包永刚 “超节点互联协议生态的碎片化,正成为制约其规模化部署的核心瓶颈。”奇异摩尔CEO田陌晨说
热门专题
热门推荐
3月28日消息,中国联通近日发布2025年度业绩报告,在网络建设领域交出亮眼答卷。中国联通表示,公司持续落实信号升格、宽带升级相关举措,目前近九成宽带已具备千兆接入能力,万兆光网更在全国100多个城
163邮箱个人版登录入口为https: mail 163 com,支持网页及手机浏览器直接访问,提供手机号、邮箱账号、扫码三种登录方式,界面简洁,功能齐全,适配多终端使用。163
在冒泡社区中,设置键盘能为用户带来更便捷、舒适的操作体验。以下是详细的设置方法。首先,打开冒泡社区应用程序。进入社区主界面后,找到屏幕上的设置选项。这通常可以在界面的某个角落,以一
一场谎言的终幕是崩坏星穹铁道中4 1版本的新光锥之一,其属性可以提高装备的暴击率,下面小编就为大家带来《崩坏:星穹铁道》一场谎言的终幕光锥效果一览,不清楚的一起来看看吧。《崩坏:星
2026年3月28日中午12时整,由腾讯视频全网独播的古装奇幻剧《白日提灯》准时上线。该剧开播前预约人数高达674万人次,被平台力推为“年度古偶扛鼎之作”,然而仅播出六小时后,口碑便急速崩塌,引发全





