首页 游戏 软件 资讯 排行榜 专题
首页
AI
英伟达Blackwell架构将AI推理成本暴降90%,压缩至十分之一

英伟达Blackwell架构将AI推理成本暴降90%,压缩至十分之一

热心网友
18
转载
2026-02-13

IT之家2月13日消息,英伟达近日发布官方博文,宣布在AI推理领域的"token经济学"研究取得突破性进展,其Blackwell架构实现了里程碑式的性能飞跃。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

英伟达在文中指出,通过实施"极致软硬件协同设计"策略,该架构显著优化了硬件处理复杂AI推理任务时的能效表现,有效解决了模型参数膨胀导致的算力成本激增问题。数据显示,与上一代Hopper架构相比,Blackwell平台将单位Token生成成本降低至十分之一。

暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

在行业落地方面,包括Baseten、DeepInfra、Fireworks AI及Together AI在内的多家推理服务商已开始利用Blackwell平台托管开源模型。

IT之家援引博文介绍,英伟达强调通过结合前沿智能开源模型、Blackwell的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。

暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

以专注多智能体工作流的Sentient Labs为例,其成本效率较Hopper时代提升了25%至50%;而游戏领域的Latitude等公司也借此实现了更低的延迟和更可靠的响应性能。

暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

Blackwell架构的高效能核心在于其旗舰级系统GB200 NVL72。该系统采用72颗芯片互联配置,并配备了高达30TB的高速共享内存。这种设计完美契合当前主流的"混合专家"架构需求,能够将Token批次高效拆分并分散到各个GPU上并行处理。

暴降90%!英伟达Blackwell架构将AI推理成本压缩至十分之一

在Blackwell大获成功的同时,英伟达已将目光投向下一代代号为"Vera Rubin"的平台。据悉,Rubin架构计划通过引入针对预填充阶段的CPX等专用机制,进一步推高基础设施的效率天花板。

来源:https://tech.ifeng.com/c/8qi7vnKT1tY
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

特斯拉AI芯片里程碑!马斯克官宣AI5成功流片,双芯性能对标Blackwell
web3.0
特斯拉AI芯片里程碑!马斯克官宣AI5成功流片,双芯性能对标Blackwell

特斯拉AI5芯片流片成功:2027年量产,性能与能效双重革命 全球电动汽车与人工智能巨头特斯拉,在其核心算力自研道路上再下一城。公司首席执行官埃隆·马斯克近日在社交平台X上正式宣布,下一代AI5芯片已完成流片。这一关键里程碑意味着,芯片设计已最终定稿并交付给代工厂,即将进入实体制造阶段。根据规划,A

热心网友
04.16
Alphacool发布RTX PRO 6000 Blackwell分体水冷头,散热效率提升40%
娱乐
Alphacool发布RTX PRO 6000 Blackwell分体水冷头,散热效率提升40%

IT之家 3 月 11 日消息,Alphacool 昨日宣布在其企业级产品线中推出两款 ES 系列紧凑型显卡分体式水冷冷头。其中 1 槽厚度型号面向英伟达 RTX PRO 6000 Blackwel

热心网友
03.11
IREN锁定5万块Blackwell芯片,比特币矿商转型AI云服务
科技数码
IREN锁定5万块Blackwell芯片,比特币矿商转型AI云服务

智通财经APP获悉,澳洲数据中心巨头 IREN(IREN US)于美东时间3 月 5 日与戴尔科技(DELL US)达成一项具有里程碑意义的采购协议。根据协议内容,IREN 将增购超过 50000

热心网友
03.05
英伟达RTX 5090 Ti功耗突破700W,性能提升超10%再曝光
电脑教程
英伟达RTX 5090 Ti功耗突破700W,性能提升超10%再曝光

2月21日消息,就在前不久,有消息称NVIDIA正在测试一款Blackwell架构的旗舰级GPU,定位比RTX 5090更高,预计为RTX 5090 Ti或Titan型号。而根据Moore’s La

热心网友
02.21
英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍
科技数码
英伟达Blackwell架构:每兆瓦吞吐量达Hopper的50倍

IT之家 2 月 18 日消息,英伟达于 2 月 16 日发布博文,宣布其 Blackwell Ultra AI 架构(GB300 NVL72)在能效与成本上实现显著突破,通过 DeepSeek-R

热心网友
02.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年十大加密货币交易所排名与安全选择指南
web3.0
2026年十大加密货币交易所排名与安全选择指南

本文梳理了2026年主流数字资产交易平台的特点与选择策略。重点从安全性、资产丰富度、交易体验、创新功能及合规性等维度进行分析,旨在帮助用户根据自身需求,在众多平台中做出明智选择,而非简单罗列排名。选择平台需综合考量资金安全、操作习惯与长期发展愿景。

热心网友
05.14
2026年全球十大现货交易所排名与深度评测
web3.0
2026年全球十大现货交易所排名与深度评测

本文梳理了2026年现货交易所的竞争格局,从交易深度与流动性、资产安全与合规性、用户体验与产品创新三个维度进行深度分析。文章指出,头部平台在合规与技术创新上持续领跑,新兴交易所在细分市场寻求突破,行业整体呈现出专业化、合规化与用户体验并重的发展趋势,为不同需求的用户提供了多元选择。

热心网友
05.14
2026年最佳加密货币交易平台权威评测与推荐指南
web3.0
2026年最佳加密货币交易平台权威评测与推荐指南

本文梳理了2026年主要数字资产交易平台的综合表现,从安全性、资产多样性、用户体验及创新服务等维度进行分析。榜单反映了行业向合规与专业化发展的趋势,头部平台在技术架构与风控体系上持续投入,新兴平台则凭借细分领域创新获得关注。投资者需结合自身需求,理性评估平台特点与风险。

热心网友
05.14
Aria Networks CEO解读推理技术如何改变AI网络格局
AI
Aria Networks CEO解读推理技术如何改变AI网络格局

今年四月,AI网络初创公司Aria Networks携1 25亿美元融资高调登场,并向业界抛出了一个直指核心的判断:下一阶段AI基础设施的竞争,焦点已不仅仅是堆砌更多的GPU,而在于能否构建一个能充分释放这些算力潜能的“神经网络”。 这家由前Arista和Juniper高管创立、总部位于帕洛阿尔托的

热心网友
05.14
英伟达MIT华人团队开源技术大幅降低大模型推理内存消耗
AI
英伟达MIT华人团队开源技术大幅降低大模型推理内存消耗

仅凭一张家用RTX 4090显卡的24GB显存,就能流畅运行一个拥有320亿参数的AI大模型,一口气读完6份长文档并自动生成周报?这并非极客魔改,而是来自MIT、英伟达与浙江大学研究者的最新突破。 这项名为TriAttention的技术,精准瞄准了大模型推理中的核心瓶颈——KV缓存显存占用。其核心思

热心网友
05.14