英伟达发布Vera Rubin平台,单Token成本降至十分之一
3月17日,英伟达在美国加州圣何塞举办的2026年GTC大会上,正式发布了Vera Rubin AI平台,旨在加速智能体AI(Agentic AI)的技术发展。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
英伟达创始人兼首席执行官黄仁勋在发布会上强调,Vera Rubin平台标志着公司史上规模最庞大的基础设施建设项目正式启动,该平台全面覆盖从大规模预训练到实时智能体推理的完整AI生命周期。
在核心算力架构方面,新一代NVL72机架实现了突破性的效率提升。该系统通过NVLink 6高速互联技术,将72块Rubin GPU与36块Vera CPU紧密连接。
与上一代Blackwell平台相比,新系统仅需四分之一数量的GPU即可完成混合专家模型(MoE)的训练任务,同时每瓦推理吞吐量提升了十倍,单个Token的处理成本降至十分之一。
值得关注的是,专为验证AI模型结果设计的Vera CPU机架集成了256块液冷CPU,其运行效率达到传统CPU的两倍,处理速度提升50%。
为满足智能体系统对低延迟和长上下文的需求,英伟达同步推出了Groq 3 LPX推理加速机架。该系统搭载256个LPU处理器,与Vera Rubin平台协同工作时,每兆瓦推理吞吐量最高可提升35倍。
在数据存储架构上,全新BlueField-4 STX机架构建了原生AI存储基础设施。借助创新的DOCA Memos框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在大幅降低能耗的同时,将推理吞吐量提升最高5倍,从而实现更快速的AI多轮交互体验。
相关攻略
财联社3月20日讯(编辑 卞纯)随着AI算力需求呈指数级增长,而地面数据中心面临耗能巨大等挑战,硅谷科技巨头已纷纷将目光瞄准太空,在太空建立数据中心成为他们AI竞赛的下一个战场。当地时间周四,英伟达
AIPress com cn报道3月30日消息,随着全球科技巨头竞相入局 AI 赛道,晶圆代工巨头台积电的订单迎来了史无前例的大爆发。据供应链消息透露,其最尖端工艺的产能已经排期到了 2028 年。
来源:环球网【环球网科技综合报道】3月30日消息,英伟达创始人、首席执行官黄仁勋在3月24日播出的《Lex Fridman》视频播客中,谈及与台积电的长期合作,高度肯定台积电的产业竞争力与合作价值。
你有没有想过,为啥现在AI芯片越做越大,但单次推理延迟就是降不下来?你去问做AI部署的哥们,十个有九个会跟你吐槽:GPU这块,大模型推理就是看batch吃满了能跑多少吞吐量,但你要真给用户做实时交互
允中 发自 凹非寺量子位 | 公众号 QbitAI还得是咱国产世界模型牛!极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。而且还是唯一一个综合得分突破6
热门专题
热门推荐
3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自
WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找
3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌
电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末
白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党





