首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
英伟达GTC 2026前瞻:黄仁勋剖析200亿美元Groq算力蛋糕

英伟达GTC 2026前瞻:黄仁勋剖析200亿美元Groq算力蛋糕

热心网友
41
转载
2026-03-17


GTC 2026大会即将拉开帷幕,这一次黄仁勋准备亮出的,不再是单纯刷新参数的怪兽级GPU,而是一张价值200亿美元的明牌——一款基于SRAM(静态随机存取存储器)的专用推理芯片。

这标志着英伟达历史上最大规模的收购案(吞并Groq核心资产)的底层技术正式落地。但这绝不是一次常规的产品迭代,黄仁勋正在亲手打破自己维持了多年的神话:“一颗通用GPU可以包打天下”。

在笔者看来,本轮架构调整的表象是硬件路线的演进,底层却是英伟达面对科技巨头“诸侯割据”与监管高压时,极其老辣的防御性进攻。

物理定律写死的“算力阶级分化”

外界有一种极其粗暴的误读,认为英伟达转向SRAM是为了“抛弃HBM”。这在半导体的物理规律上根本站不住脚。

标准的SRAM单元需要6个晶体管(6T)来存储1个比特,而HBM依赖的DRAM只需要1个晶体管加1个电容(1T1C)。这种先天的物理结构差异,导致SRAM的硅片面积是DRAM的5到10倍。这意味着SRAM速度极快,但极其昂贵且根本做不出大容量,它装不下动辄数千亿参数的大模型。

英伟达真正的算盘,是搞“算力的阶级分化”。

过去,无论是炼大模型还是日常的AI问答,大家都在抢极其昂贵且缺货的HBM和GPU。但现在,AI的重心已经彻底滑向了“推理(Inference)”。思科等机构的最新预测显示,到2027年,高达75%的AI工作负载将全面转向实时推理。

面对这种不可逆的趋势,英伟达给出了路线图切割:一边是即将登场的下一代Vera Rubin架构,继续把GPU和HBM的堆料推向极致,死死锁住云厂商的“大模型训练”底座;另一边,就是这次基于Groq技术推出的LPU(语言处理单元)。它用片上SRAM替代片外存储,彻底干掉数据搬运的延迟,专门用来收割那些对实时性要求极高、单次请求成本极敏感的场景。

规避审查的残酷清场:200亿美元的“窃壳”游戏

为什么一向推崇通用计算的英伟达,会突然调转车头搞起专用推理架构?

答案是被逼出来的。

就在近期,业界传出Meta计划在2027年将部分推理工作负载切给谷歌TPU。当大模型逐渐走向同质化,推理成本的极致压缩就成了生死线。如果英伟达继续强迫所有客户用“杀鸡用牛刀”的GPU去做低延迟推理,大客户迟早会跑向谷歌、AMD,甚至是以Groq为代表的初创公司。

为了掐灭这个苗头,黄仁勋在2025年底砸出了200亿美元。但最绝的不是金额,而是操盘手法。

如果英伟达直接全盘收购Groq,这笔交易必定会被美国FTC和欧盟的反垄断监管机构以“垄断AI算力”为由直接毙掉。因此,英伟达采取了极其狡猾的“资产收购+技术授权+核心团队挖角(Acquihire)”模式。

他们花200亿美元买断了Groq的核心专利使用权,并把创始人Jonathan Ross连同两百多名核心工程师直接“收编”进英伟达。而Groq这家公司的空壳,在名义上依然作为独立实体存在。

这是一种合法但极其残酷的“掏空”式并购。黄仁勋用200亿美元的“过路费”,绕开了反垄断的红线,兵不血刃地干掉了最危险的推理端刺客,顺手接收了Groq生态上超过200万名开发者。

算力洗牌:裁判下场,没有中间商赚差价

这套“GPU主内(训练),SRAM主外(推理)”的组合拳一旦打出,整个算力产业链的利润池将面临残酷的重新分配。

首先,HBM的神话将被撕破。它依然是训练端不可或缺的皇冠明珠,但那种“只要搞AI就必须买HBM”的非理性繁荣将一去不复返。

其次,留给其他芯片创业公司的单点突破空间被焊死。过去几年,无数初创公司拿着“比英伟达推理快X倍”的PPT找融资。如今,当裁判员自己下场推出极致低延迟的专用芯片,并且将其无缝接入英伟达庞大的CUDA软件生态栈时,单靠底层架构创新就能撕开一道口子的时代,正式终结了。

当所有人都以为GTC 2026将是一场关于“算力规模有多大”的肌肉秀时,黄仁勋其实不关心SRAM和HBM谁替代谁,他只关心如何用最密不透风的产品矩阵,把每一分流向AI数据中心的钱都截留在自己的口袋里。

这早就不是一场比拼芯片跑分的极客游戏,而是商业帝国的捍卫战。

来源:https://www.163.com/dy/article/KO68GKIU05118O92.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

匹兹堡大学新作实现一句话生成逼真3D场景
AI
匹兹堡大学新作实现一句话生成逼真3D场景

视觉语言大模型(VLM)在描述图像内容时往往头头是道,可一旦面对三维空间推理,短板就暴露无遗。物体一多,视角一换,模型的认知底线很容易被击穿。 更棘手的是,想精准评估这种能力也困难重重。真实世界的数据集采集成本高昂,且难以灵活调整参数;而程序生成的3D场景又常常显得虚假、违背物理规律。业界一直缺少一

热心网友
05.20
隐式思维链模型LRT推理能力更强速度更快
AI
隐式思维链模型LRT推理能力更强速度更快

最近,大模型推理领域出现了一个挺有意思的新思路。来自哈尔滨工业大学(深圳)、深圳河套学院和Independent Researcher的研究团队,提出了一种名为LRT(Latent Reasoning Tuning,隐式思考模型)的方法。它试图解决一个越来越明显的痛点:那些“慢思考”模型动辄生成数千

热心网友
05.20
多模态幻觉高熵节点病因发现 全基准幻觉率显著下降
AI
多模态幻觉高熵节点病因发现 全基准幻觉率显著下降

多模态大模型的幻觉问题,一直是阻碍其实际落地的核心挑战。传统观点认为,模型“胡言乱语”源于视觉感知错误。然而,最新研究揭示了一个更深层的原因:很多时候,模型并非“看”错了,而是在推理链条最脆弱的转折点上,“想”偏了方向。 这项关键研究发现,当模型生成“因为”、“但是”、“等等”这类表示因果、转折或反

热心网友
05.19
开源通用视觉推理RL框架零思考数据刷新SOTA刘壮陈丹琦新作
AI
开源通用视觉推理RL框架零思考数据刷新SOTA刘壮陈丹琦新作

通用视觉推理的强化学习框架开源版本正式发布,为AI社区带来突破性进展。 这项名为Vero的研究项目由普林斯顿大学刘壮团队主导,陈丹琦教授参与协作。项目基于创新的方法论构建,其视觉推理模型在图表解析、科学问答、空间关系判断及多样化开放视觉任务中均展现出卓越性能。尤为突出的是,该模型在超过30项权威基准

热心网友
05.19
蚂蚁武威推理模型范式猜想与未来演进趋势
AI
蚂蚁武威推理模型范式猜想与未来演进趋势

长思维链虽热门,但其高能耗高维特性可能并非最优。未来推理模型需向更稳定、低维的系统发展,高效结合快慢思考。当前模型易错且纠错成本高,而深度思考的潜力在于发现新知识。推理本质是逻辑组合知识以解决新问题,发展应追求“多快好省”与“双商齐备”,并突破目前局限于数学与代码的。

热心网友
05.16

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

异人之下手游陆瑾连招技巧 安卓版技能玩法教学
游戏攻略
异人之下手游陆瑾连招技巧 安卓版技能玩法教学

陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。

热心网友
05.20
欧易投资策略指南:新手如何制定稳健的Web3投资计划
web3.0
欧易投资策略指南:新手如何制定稳健的Web3投资计划

投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。

热心网友
05.20
异人之下手游巴伦技能强度解析与安卓实战教程
游戏攻略
异人之下手游巴伦技能强度解析与安卓实战教程

巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。

热心网友
05.20
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线
AI
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线

谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。

热心网友
05.20
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能
AI
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能

谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。

热心网友
05.20