英伟达Vera Rubin AI平台发布:单Token成本降至1/10
来源:环球网
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
【环球网科技综合报道】3月17日消息,据Investing报道,在今年的GTC大会上,英伟达正式发布了Vera Rubin AI平台,专为智能体AI发展量身打造。该平台被视为英伟达在AI基础设施领域的一次重大飞跃,也标志着其开启了史上最大规模的AI基建布局,全面覆盖从大规模预训练到实时智能体推理的AI全生命周期,为智能体AI技术发展提供强大的算力与技术支撑。

英伟达创始人兼首席执行官黄仁勋表示,Vera Rubin AI平台在核心算力、推理加速、数据存储等多个维度实现技术突破,从底层基础设施层面优化AI全流程运算效率,助力智能体AI的规模化落地。
在核心算力层面,平台搭载的新一代NVL72机架实现效率突破性提升,通过NVLink 6完成72块Rubin GPU与36块Vera CPU的连接。相较于上一代Blackwell平台,该系统完成混合专家大模型训练仅需四分之一的GPU,每瓦推理吞吐量提升10倍,成功将单Token成本降至原来的十分之一,大幅降低了AI模型训练与推理的成本。同时,专为验证AI模型结果设计的Vera CPU机架集成256块液冷CPU,运行效率达到传统CPU的两倍,运算速度提升50%,进一步提升AI模型验证环节的效率。
针对智能体系统低延迟、长上下文的核心需求,英伟达同步推出Groq 3 LPX推理加速机架。该系统配备256个LPU处理器,与Vera Rubin平台结合后,每兆瓦推理吞吐量最高可提升35倍,有效解决智能体AI运行过程中的延迟问题,适配长上下文的运算需求。
数据存储环节的技术升级同样亮眼,全新BlueField-4 STX机架构建起AI原生存储基础架构。依托全新的DOCA Memos框架,该系统能高效处理大型语言模型生成的海量键值缓存数据,在显著降低能耗的同时,将推理吞吐量最高提升5倍,让AI多轮交互的响应速度大幅加快,更好地匹配智能体AI的实际应用场景。(纯钧)
相关攻略
IT之家 3 月 28 日消息,据中国台湾地区媒体《电子时报》昨天报道,随着 2026 年第二季度将至,越来越多集成电路设计大厂跳出来直言,先进制程产能在云端 AI 的庞大需求下变得越来越吃紧,3n
文 | 深流研究所,作者 | 绛枫2025年12月,黄仁勋做客Joe Rogan播客,承认自己一直处于焦虑状态。他说了一句用了三十多年的老话—— "英伟达离倒闭永远只有30天 ",然后补了一句很少有人注
“500人的技术团队投入,换不来与谷歌、英伟达同台竞技的话语权。” 作者丨刘伊伦 编辑丨包永刚 “超节点互联协议生态的碎片化,正成为制约其规模化部署的核心瓶颈。”奇异摩尔CEO田陌晨说
芯东西(公众号:aichip001)编译 刘煜编辑 陈骏达芯东西3月27日消息,3月25日,《连线(Wired)》杂志发布了对Arm CEO Rene Haas的46分钟的采访报道。在本次采访中,H
文|任倩具身数据层的全球竞赛正在迅速升温。NVIDIA Research在2026年发布EgoScale数据与训练框架,在Ego-centric人类操作视频上训练VLA模型,用 20,854小时带动
热门专题
热门推荐
洛克王国世界圣羽翼王怎么样?大家在洛克王国世界里到处跑的时候,肯定都想找个又能打、跑得又快的精灵。圣羽翼王就是那种,能在天上飞着就把对面打懵的角色。今天小编就带来洛克王国世界圣羽翼
如果把谍战剧当成一场比赛,《悬崖》绝对不是那种节奏飞快、比分拉锯的对攻战,它更像一场在冰面上踢的“慢速决赛”——每一步都滑,每一次失误都可能直接出局。它没有那么多枪火轰鸣,却用一寸一寸逼近的危机,把
可在PPT中通过三种方式实现打字机音效:一、用“出现”动画设“按字母”播放并选内置“打字机”声;二、插入自定义WAV音效,同步逐字动画时长;三、分段文本框+触发器,为每句绑定独立音
在日常使用钉钉的过程中,不少用户希望能便捷地获取天气信息。其实,钉钉是可以显示天气的,以下为您详细介绍具体方法。首先,打开手机中的钉钉应用程序。进入钉钉主界面后,点击界面左上角您所
在红色沙漠中,想要进入埃尔南德城堡。需先获得埃尔南德宴会服,可通过完成主线“善意的考验-二话不说地伸出援手”由阿兰赠送,或在铁匠铺旁服装店购买,穿上该礼服即可进入城堡,未穿则会被门卫阻拦。红色沙漠进





