英伟达Blackwell架构将AI推理成本暴降90%,压缩至十分之一
IT之家2月13日消息,英伟达近日发布官方博文,宣布在AI推理领域的"token经济学"研究取得突破性进展,其Blackwell架构实现了里程碑式的性能飞跃。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
英伟达在文中指出,通过实施"极致软硬件协同设计"策略,该架构显著优化了硬件处理复杂AI推理任务时的能效表现,有效解决了模型参数膨胀导致的算力成本激增问题。数据显示,与上一代Hopper架构相比,Blackwell平台将单位Token生成成本降低至十分之一。

在行业落地方面,包括Baseten、DeepInfra、Fireworks AI及Together AI在内的多家推理服务商已开始利用Blackwell平台托管开源模型。
IT之家援引博文介绍,英伟达强调通过结合前沿智能开源模型、Blackwell的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。

以专注多智能体工作流的Sentient Labs为例,其成本效率较Hopper时代提升了25%至50%;而游戏领域的Latitude等公司也借此实现了更低的延迟和更可靠的响应性能。

Blackwell架构的高效能核心在于其旗舰级系统GB200 NVL72。该系统采用72颗芯片互联配置,并配备了高达30TB的高速共享内存。这种设计完美契合当前主流的"混合专家"架构需求,能够将Token批次高效拆分并分散到各个GPU上并行处理。

在Blackwell大获成功的同时,英伟达已将目光投向下一代代号为"Vera Rubin"的平台。据悉,Rubin架构计划通过引入针对预填充阶段的CPX等专用机制,进一步推高基础设施的效率天花板。
相关攻略
特斯拉AI5芯片流片成功:2027年量产,性能与能效双重革命 全球电动汽车与人工智能巨头特斯拉,在其核心算力自研道路上再下一城。公司首席执行官埃隆·马斯克近日在社交平台X上正式宣布,下一代AI5芯片已完成流片。这一关键里程碑意味着,芯片设计已最终定稿并交付给代工厂,即将进入实体制造阶段。根据规划,A
IT之家 3 月 11 日消息,Alphacool 昨日宣布在其企业级产品线中推出两款 ES 系列紧凑型显卡分体式水冷冷头。其中 1 槽厚度型号面向英伟达 RTX PRO 6000 Blackwel
智通财经APP获悉,澳洲数据中心巨头 IREN(IREN US)于美东时间3 月 5 日与戴尔科技(DELL US)达成一项具有里程碑意义的采购协议。根据协议内容,IREN 将增购超过 50000
2月21日消息,就在前不久,有消息称NVIDIA正在测试一款Blackwell架构的旗舰级GPU,定位比RTX 5090更高,预计为RTX 5090 Ti或Titan型号。而根据Moore’s La
IT之家 2 月 18 日消息,英伟达于 2 月 16 日发布博文,宣布其 Blackwell Ultra AI 架构(GB300 NVL72)在能效与成本上实现显著突破,通过 DeepSeek-R
热门专题
热门推荐
本文梳理了2026年主流数字资产交易平台的特点与选择策略。重点从安全性、资产丰富度、交易体验、创新功能及合规性等维度进行分析,旨在帮助用户根据自身需求,在众多平台中做出明智选择,而非简单罗列排名。选择平台需综合考量资金安全、操作习惯与长期发展愿景。
本文梳理了2026年现货交易所的竞争格局,从交易深度与流动性、资产安全与合规性、用户体验与产品创新三个维度进行深度分析。文章指出,头部平台在合规与技术创新上持续领跑,新兴交易所在细分市场寻求突破,行业整体呈现出专业化、合规化与用户体验并重的发展趋势,为不同需求的用户提供了多元选择。
本文梳理了2026年主要数字资产交易平台的综合表现,从安全性、资产多样性、用户体验及创新服务等维度进行分析。榜单反映了行业向合规与专业化发展的趋势,头部平台在技术架构与风控体系上持续投入,新兴平台则凭借细分领域创新获得关注。投资者需结合自身需求,理性评估平台特点与风险。
今年四月,AI网络初创公司Aria Networks携1 25亿美元融资高调登场,并向业界抛出了一个直指核心的判断:下一阶段AI基础设施的竞争,焦点已不仅仅是堆砌更多的GPU,而在于能否构建一个能充分释放这些算力潜能的“神经网络”。 这家由前Arista和Juniper高管创立、总部位于帕洛阿尔托的
仅凭一张家用RTX 4090显卡的24GB显存,就能流畅运行一个拥有320亿参数的AI大模型,一口气读完6份长文档并自动生成周报?这并非极客魔改,而是来自MIT、英伟达与浙江大学研究者的最新突破。 这项名为TriAttention的技术,精准瞄准了大模型推理中的核心瓶颈——KV缓存显存占用。其核心思





