2026年上线,NVL72算力集群将登陆Nebius云平台
据智通财经APP获悉,Nebius (NBIS.US)近日宣布,计划从2026年下半年开始,在美国和欧洲市场推出英伟达(NVDA.US)的Vera Rubin NVL72图形处理器(GPU)。
这家总部位于荷兰的AI基础设施提供商透露,将通过其Nebius AI云服务和Nebius Token Factory(代币工厂)来部署英伟达Rubin平台,并成为首批提供该计算平台的AI云供应商之一。
Nebius表示,计划将Vera Rubin NVL72整合到其位于美国和欧洲数据中心的AI全栈基础设施中,让客户能够构建具备区域可用性和可控性的下一代AI应用程序。
Nebius创始人兼首席执行官阿尔卡季·沃罗兹表示:“通过将Vera Rubin集成到Nebius AI云和我们的推理平台Nebius Token Factory中,我们正在为AI创新者和企业打造领先的基础设施,帮助他们更快速、更高效地开发代理式和推理式AI系统。”
据该公司介绍,Nebius Token Factory是一个面向企业的专业推理及训练后优化平台。
Nebius进一步指出,Rubin加速计算平台将与其现有的英伟达GB200 NVL72和英伟达Grace Blackwell Ultra NVL72产能形成互补,从而扩大客户对平台的选择范围。
周一,英伟达首席执行官黄仁勋在公开演讲中透露,作为Grace Blackwell的继任者,下一代计算平台Vera Rubin目前已进入全面量产阶段。
英伟达高性能计算与AI基础设施解决方案高级总监Dion Harris将Vera Rubin描述为“由六颗芯片构成的AI超级计算机”。这一平台由Vera CPU、Rubin GPU、第六代NVLink交换芯片、ConnectX-9网卡、BlueField 4 DPU以及Spectrum-X 102.4T CPO六大核心组件构成,专为面向云端与大型数据中心的下一代AI工作负载而设计。
其中,Rubin GPU芯片搭载了第三代Transformer引擎,NVFP4推理算力高达50 PFLOPS,是英伟达上一代Blackwell GPU的五倍。在整体架构层面,Vera Rubin平台能在相同训练时间内完成超大规模“专家混合”模型的训练,而所需的GPU数量仅为原来的四分之一,且每个token的训练成本更是降至原先的七分之一。英伟达同时强调,Vera Rubin将支持第三代机密计算技术,并将成为业界首个机架级可信计算平台,以满足对安全隔离、数据隐私与多租户环境有高要求的AI应用场景。
相关攻略
摩根斯坦利研究报告显示,国产AI芯片自给率正经历高速增长。2021年自给率仅为10%,预计今年将跃升至41%,并有望在2030年达到86%。目前,国内已涌现出摩尔线程、壁仞科技、沐曦科技等一批GPU芯片设计公司,连同华为、寒武纪等NPU主力厂商,共同构建起国产AI芯片生态。分析指出,随着AI计算芯片
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
随着人工智能技术进入高速发展期,全球对算力的需求呈现爆发式增长。在众多算力资源中,GPU(图形处理器)已成为最核心且最紧缺的硬件。市场热度持续攀升,甚至带动了多年前发布的旧型号GPU价格逆势上涨,形成了一股罕见的市场风潮。 近日,英伟达(NVIDIA)首席执行官黄仁勋对这一现象给出了一个生动的比喻—
这项由香港中文大学多媒体实验室、快手科技以及香港创新科技研究院联合开展的研究,已于2026年3月发表在计算机视觉顶级会议上,论文编号为arXiv:2603 25746v1。对技术细节感兴趣的读者,可以据此查阅完整论文。 当前的AI视频生成技术,更像是一位只会使用固定机位的摄影师。它能产出精美的单帧画
AI需求爆发导致GPU严重短缺,连四五年前的旧款芯片价格也持续上涨。英伟达CEO黄仁勋将此现象比作“好酒效应”,形容GPU价格随时间不降反升。全球AI数据中心高度依赖GPU算力,供需失衡推高了全产业链价格。旧款GPU需求强劲,升值速度甚至超过真正陈年佳酿,反映出市场对算力资源的极度渴求。
热门专题
热门推荐
钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流
在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办
在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M
ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。
在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练





