游乐游手机版
首页/科技数码/文章详情

英伟达发布Vera Rubin平台,单Token成本降至十分之一

时间:2026-03-17 09:58
3月17日消息,3 月 17 日在美国加州圣何塞举行的 2026 年 GTC 大会上,英伟达为推动智能体 AI(Agentic AI)发展,发布 Vera Rubin AI 平台。英伟达创始人兼首席

3月17日,英伟达在美国加州圣何塞举办的2026年GTC大会上,正式发布了Vera Rubin AI平台,旨在加速智能体AI(Agentic AI)的技术发展。

英伟达创始人兼首席执行官黄仁勋在发布会上强调,Vera Rubin平台标志着公司史上规模最庞大的基础设施建设项目正式启动,该平台全面覆盖从大规模预训练到实时智能体推理的完整AI生命周期。

在核心算力架构方面,新一代NVL72机架实现了突破性的效率提升。该系统通过NVLink 6高速互联技术,将72块Rubin GPU与36块Vera CPU紧密连接。

与上一代Blackwell平台相比,新系统仅需四分之一数量的GPU即可完成混合专家模型(MoE)的训练任务,同时每瓦推理吞吐量提升了十倍,单个Token的处理成本降至十分之一。

值得关注的是,专为验证AI模型结果设计的Vera CPU机架集成了256块液冷CPU,其运行效率达到传统CPU的两倍,处理速度提升50%。

为满足智能体系统对低延迟和长上下文的需求,英伟达同步推出了Groq 3 LPX推理加速机架。该系统搭载256个LPU处理器,与Vera Rubin平台协同工作时,每兆瓦推理吞吐量最高可提升35倍。

在数据存储架构上,全新BlueField-4 STX机架构建了原生AI存储基础设施。借助创新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在大幅降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互体验。

来源:https://www.donews.com/news/detail/1/6469523.html
上一篇蚂蚁集团拟收购香港耀才证券金融业务获批 下一篇苹果收购知名插件商MotionVFX,Final Cut Pro生态升级
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态
科技数码 · 2026-07-01

国内首个开源鸿蒙机器人系统社区启动,破局国产软件生态

6月30日,机器人ETF易方达(159530)盘中涨幅超过4 3%,报收1 555元,机器人板块整体表现活跃。消息面上,国内首个基于开源鸿蒙的机器人操作系统社区(M-Robots)正式启动运营并发布了年度发展路线,日本GMO INTERNET集团子公司与宇树科技达成合作协议。国产机器人软件生态建设取

ROI利剑悬顶,AI员工面临效益大考
科技数码 · 2026-07-01

ROI利剑悬顶,AI员工面临效益大考

先说说现在AI行业一个普遍现象:几乎所有公司都在按“使用量”来收费。不管是按token消耗算,还是按额度制走,本质上都是“用多少,付多少”。 这套模式放在模型API上当然没问题,但放到那些越来越深入企业工作流的Agent身上,就有点水土不服了。你想想,一个Agent为了完成一个任务,需要反复读取上下

武汉光谷三年投入超10亿元打造智能体之城
科技数码 · 2026-07-01

武汉光谷三年投入超10亿元打造智能体之城

6月29日,武汉光谷智能体经济大会正式召开,会上重磅发布了“光谷智能体引力计划”。根据规划,未来3年内,光谷将在政策扶持、算力基建、产业基金等领域投入超过10亿元,致力于全域打造智能体之城,抢占人工智能产业新高地。 具体如何推进?主要依托湖北科创供应链平台,设立光谷智能体场景发布厅,引导百亿级人工智

苹果印度梦受挫 iPhone 18 Pro机密文件泄露
科技数码 · 2026-07-01

苹果印度梦受挫 iPhone 18 Pro机密文件泄露

从暗网流出的文件来看,窃取苹果印度供应商塔塔电子数据的勒索软件组织,此次曝光的“重磅信息”中,明确包含了即将发布的iPhone 18 Pro机型的敏感组件清单、供应商名单以及实物照片。消息人士和文件内容均证实了这一点。 这绝非小事。苹果在全球供应商之间精密运转的iPhone组装业务,直接面临威胁。众

企业级AI聚焦全场景闭环办事加速成为业绩抓手
科技数码 · 2026-07-01

企业级AI聚焦全场景闭环办事加速成为业绩抓手

AI产业正从技术验证阶段迈向深度产业落地的关键转型期,这一趋势正成为驱动企业数智化增长的核心引擎。6月30日,联想乐享迎来重要升级——4 0版本正式发布。作为业界首个企业级超级智能体,此次升级带来了三项扎实成果:自主研制的Harness运行层、自我进化与反思机制,以及多场景Skill能力体系,三大支