首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍

英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍

热心网友
94
转载
2026-02-18

IT之家2月18日援引英伟达最新动态,该公司于2月16日通过官方博客宣布,其Blackwell Ultra AI架构(GB300 NVL72)在能效与成本控制方面实现重大突破。根据DeepSeek-R1模型测试结果显示,相较于前代Hopper GPU架构,新一代架构的每兆瓦吞吐量提升达50倍,处理百万tokens的成本降至原先的三十五分之一的水平。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈


值得注意的是,英伟达在公告中还预告了下一代Rubin平台的技术规划,预计其每兆瓦吞吐量将比Blackwell架构再提升10倍,持续推动AI基础设施的迭代升级。

IT之家技术解读:每兆瓦吞吐量(Tokens / Watt)是衡量AI芯片能效表现的核心指标,具体指消耗每瓦特电力所能处理的Token数量。该数值越高,代表芯片能效表现越优异,实际运营成本也相应降低。

英伟达在技术文档中强调,实现性能飞跃的关键在于架构层面的全面升级。Blackwell Ultra通过NVLink高速互联技术,将72个GPU连接为统一的计算单元,互联带宽高达130TB/s,远超Hopper架构时代的8芯片设计方案。此外,全新的NVFP4精度格式与极致协同设计架构相结合,进一步巩固了其在计算吞吐性能方面的领先地位。


在AI推理成本方面,新平台相较Hopper架构实现显著优化,处理百万Token的成本降至原先的三十五分之一。即便是与同代Blackwell架构的GB200相比,GB300在长上下文任务中的Token成本也降低至1.5分之一,注意力机制处理速度实现倍数级提升,完美适配代码库维护等高负载应用场景。


OpenRouter发布的《推理状态报告》指出,与软件编程相关的AI查询量在过去一年中呈现爆发式增长,占比从11%攀升至约50%。这类应用通常要求AI代理在多步工作流程中保持实时响应,并具备跨代码库推理的长上下文处理能力。

为应对这一技术挑战,英伟达通过TensorRT-LLM、Dynamo等开发团队的持续优化,进一步提升了混合专家模型(MoE)的推理吞吐量。以TensorRT-LLM库的改进为例,使得GB200在低延迟工作负载上的性能在短短四个月内提升了5倍。

来源:https://www.163.com/dy/article/KM2ARCMI0511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达黄仁勋:到2027年底,AI芯片将创造至少1万亿美元收入【附全球AI芯片行业市场分析】
科技数码
英伟达黄仁勋:到2027年底,AI芯片将创造至少1万亿美元收入【附全球AI芯片行业市场分析】

英伟达黄仁勋:到2027年底,AI芯片将创造至少1万亿美元收入 (图片来源:摄图网) 北京时间周二凌晨,英伟达CEO黄仁勋用一场长达两个半小时的演讲,向全球勾勒出一幅前所未有的AI算力商业图景。他大胆预测,英伟达新一代AI加速芯片架构Blackwell与下一代Rubin产品,到2027年底将创造至少

热心网友
04.18
微星发布DGX Station系统XpertStation WS300
科技数码
微星发布DGX Station系统XpertStation WS300

微星推出XpertStation WS300:一台能放在桌面的超级计算机 IT之家3月18日消息,微星MSI在美国当地时间16日宣布了一款重量级产品:面向企业级市场的DGX Station桌面超级计算机整机系统——XpertStation WS300。这款机器的定位非常明确,就是为了应对当下LLM(

热心网友
04.18
下调降至150万颗!HBM4验证延迟拖累英伟达Rubin GPU量产
科技数码
下调降至150万颗!HBM4验证延迟拖累英伟达Rubin GPU量产

英伟达Rubin GPU量产进度调整,HBM4验证成关键变量 最近供应链传来消息,英伟达备受瞩目的下一代Rubin GPU,量产节奏可能要比预期慢上半拍。根据最新信息,其生产目标已从原先的200万颗下调至150万颗左右。这背后,下一代高带宽内存HBM4的验证进度,成了眼下最主要的制约因素。 产能布局

热心网友
04.17
英伟达升级云游戏服务,苹果Vision Pro头显专享4K@90 FPS
科技数码
英伟达升级云游戏服务,苹果Vision Pro头显专享4K@90 FPS

英伟达专为苹果Vision Pro优化云游戏画质,4K 90帧体验上线 云游戏领域的画质之争,又有新动态了。英伟达最近为自家的GeForce Now服务推送了2 0 83版本更新,而这次更新的一个重头戏,就是专门为苹果Vision Pro头显做了大幅度的画质提升。 简单来说,这次更新全面解锁了高帧率

热心网友
04.17
Akamai牵手英伟达,推出AI边缘云,释放了什么行业信号?
业界动态
Akamai牵手英伟达,推出AI边缘云,释放了什么行业信号?

边缘AI新战场:当推理算力“下沉”到用户身边 最近,云服务领域有个动静值得关注。老牌网络优化与安全公司Akamai,宣布和英伟达联手,推出了一个名为“Akamai Inference Cloud”的全新边缘云平台。这个动作的核心意图很明确:未来AI模型的推理和响应,不必再千里迢迢跑回数据中心去处理,

热心网友
04.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领主契约死亡恢复机制是什么-领主契约死亡恢复机制介绍
游戏攻略
领主契约死亡恢复机制是什么-领主契约死亡恢复机制介绍

《领主契约》死亡恢复机制全解析:掌握复活技巧,提升游戏生存率 死亡恢复基础规则详解 在《领主契约》中,角色死亡并非冒险的终点,而是一个战术调整的契机。游戏设定了明确的复活机制:角色倒下后,通常会在最近的安全区域——如城镇的复活祭坛——自动重生。复活后,系统将为角色恢复一定比例的生命值与基础状态,确保

热心网友
04.18
美国加强港口封锁,伊朗威胁发动袭击,谈判前景黯淡
web3.0
美国加强港口封锁,伊朗威胁发动袭击,谈判前景黯淡

美国实施港口封锁,伊朗威胁发动空袭,这使得双边会谈的希望变得渺茫。 你猜怎么着?伊朗在4月30日前停止铀浓缩的可能性,目前来到了 39 2%。没错,比起昨天的21%,这个数字确实有显著上升。 市场的反应总是最直接的。封锁的消息一出,伊朗铀浓缩相关的预测市场一度飙升了16个百分点,冲高至46%,随后才

热心网友
04.18
VectorArt AI
AI
VectorArt AI

VectorArt AI是什么 说到把创意想法快速变成清晰的矢量图形,有一款工具正在引起设计师们的注意:VectorArt AI。它由VectorArt团队打造,专为艺术家、设计师以及所有需要高质量矢量图像的创意人士服务。其核心能力非常直接——你只需用文字描述或简单勾勒草图,它就能在短时间内生成高质

热心网友
04.18
全链网:油价会跌回之前的水平,可能更低
web3.0
全链网:油价会跌回之前的水平,可能更低

全链网报道 4月15日消息,国际原油市场传来新动向。美国总统特朗普公开表示,油价不仅会跌回之前的水平,甚至可能更低。这一表态,无疑给近期波动的能源市场投下了一颗石子。 与此同时,另一则关键信息也浮出水面:沙特方面并未对封锁霍尔木兹海峡的潜在可能性表示反对。霍尔木兹海峡作为全球能源运输的咽喉要道,其任

热心网友
04.18
AnotherPixel ArtAI
AI
AnotherPixel ArtAI

AnotherPixel ArtAI是什么 如果说数字艺术的门槛一直让许多人望而却步,那么AnotherPixel ArtAI的出现,或许就是那把降低门槛的钥匙。这个由开发者Xinshuai Lyu打造的在线工具,巧妙地将前沿的人工智能技术与艺术创作融为一体。它的目标很明确:为艺术家、设计师乃至普通

热心网友
04.18