英伟达200亿美元押注背后:AI芯片战略的深层布局

芯东西(公众号:aichip001)
作者 ZeR0
编辑 漠影
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
200亿美元。
这是英伟达买下AI芯片独角兽Groq团队和非独家技术授权后,最先被市场记住的数字。它超过了此前英伟达任何一笔并购交易的金额。
Groq主攻的是其特有的LPU芯片技术,一种用软件定义硬件的可重构数据流架构,加之Groq由谷歌TPU初始研发团队创办,于是也被一些业内人士称作“进阶版TPU”。
经过多天发酵,此事的核心关注点已经转移。英伟达的选择,使「非GPU」赛道新型技术路径受到高度关注。类似技术路线的代表企业,还包括Intel正在收购的美国的SambaNova、刚刚完成数十亿融资的中国的清微智能等。
在公司主体未被收购的前提下,200亿美元这个天价数字值得被反复咀嚼:
英伟达究竟在为一种怎样的技术能力付费?
一、花掉近1/3现金储备,英伟达在下一盘多大的棋?
答案是AI推理。
在对外表态保持克制的同时,英伟达CEO黄仁勋发送了一封致员工邮件。邮件后来被媒体获取,其中明确提到,英伟达计划将Groq的低延迟处理器集成进NVIDIA AI Factory架构,服务于更广泛的AI推理与实时工作负载。
随着模型进入规模化部署阶段,AI算力消耗形态发生变化。服务于大量终端用户的推理请求持续膨胀,对并行吞吐能力提出更高要求,延迟是否稳定、能效是否可控、单位算力能承载多少并发,逐渐成为影响整体成本的关键因素。
擅长并行计算但具有高能耗特点的GPU,未必是满足长期推理需求的最佳高效路线。
在英伟达接洽前,Groq并没有寻求出售,刚刚完成多轮数亿美元融资。交易额达200亿美元的消息,最早来自其主要投资方Disruptive。该机构CEO Alex Davis透露。
英伟达预计2025年年底现金储备可能超过700亿美元。斥资200亿美元收购Groq的人才和技术授权,相当于要花掉接近1/3的现金储备。
那么英伟达为何如此看好Groq团队?
这得益于Groq手里的三张王牌:沙特市场、大模型推理、可重构架构。
在推理战场,英伟达对庞大的主权AI市场虎视眈眈,遍地土豪的沙特无疑是“必征之地”。而Groq在2025年2月宣布已获得来自沙特阿拉伯15亿美元的投资承诺,用于扩大基于LPU的AI推理基础设施。更早之前,Groq在2024年12月建成沙特阿拉伯最大的推理集群。
据外媒透露,被英伟达递出橄榄枝时,Groq并未处于出售压力之下。在2025年9月完成新一轮7.5亿美元融资后,Groq的投后估值达到约69亿美元,2025年营收目标为5亿美元,主要来自大模型推理服务和基础设施大单。
而这些核心业务的底层硬件,就是一种面向推理负载设计、采用可编程流式架构的新型LPU芯片。
二、弥补GPU短板,走出差异化技术路径
Groq将芯片设计重点放在极致的推理性能优化。资料显示,该芯片在int8精度下峰值算力达到750TOPS,运行万亿参数的月之暗面Kimi K2模型可实时生成token。

这主要通过TSP架构、极致确定性、采用SRAM来实现。该芯片取消了指令分发、分支预测、缓存控制等硬件逻辑,编译器将每个执行步骤精确到最小执行周期,实现时钟级确定性。相比GPU通常采用的外部HBM,它采用的SRAM访问速度更快。
而它最核心TSP(Tensor Streaming Processor)架构,从底层芯片设计逻辑来看,就是一种软件定义硬件的可重构架构。
不同于遵循冯·诺依曼架构(指令驱动数据)的GPU,可重构数据流是一种支持芯片内部及芯片间的流水线式流程,无需等待计算或内存资源,可以弥补GPU架构的短板,已在持续运行的推理场景中体现出系统工程优势。
这可能就是英伟达选择通过技术和团队引入,将Groq经验嵌入自身平台的直接原因。
英伟达、英特尔陆续押注,以及后续可以预见的巨量研发投入,主流AI芯片三大技术流派至此形成:
GPU:擅长暴力并行计算,生态最强,是大模型训练和通用计算任务的首选,但做推理任务时难避高能耗的劣势。代表企业有英伟达、摩尔线程等。
ASIC/DSA:专用芯片、领域特定架构路线,硬件路径是固定的,专为AI运算的矩阵乘法极致优化,但在处理非矩阵类运算时性能会大幅下降。代表企业有谷歌、寒武纪、昆仑芯等。
可重构:根据数据流动态重构计算路径,能够适应多元化的算法,随时调整电路连接方式,相比GPU可大幅减少能耗,相比静态ASIC又保留了对模型演进的适配能力。代表企业有SambaNova、Groq以及清微智能等。
在可重构的实现方法上,Groq团队硬件逻辑是静态、固定的,全靠编译器来实现逻辑上的重构,这种方法会牺牲一定的通用性。
更经典的做法则是依靠硬件内部的可编程交换矩阵,来动态或半静态地改变处理单元之间的物理连接。这样一来,硬件就像会变身的“算力乐高”,能根据算法动态重构计算阵列和互连拓扑,实现更高的通用性。
此外,Groq的优势还在于“确定性”:基于AI推理任务步骤的可预测性,比如大模型是按顺序处理token,来通过软件提前规划“数据走哪条路、用多少时间、多芯片怎么配合”,硬件只需按图索骥,做到“指哪打哪、毫秒不差”。也正因如此,Groq在推理延时和吞吐上,能实现比GPU快5-18倍、能效比高10倍的突破,本质是通过软件提升了硬件利用率,让“每一分算力都用在刀刃上”
如今Groq大部分成员归入英伟达,SambaNova屡传被英特尔洽谈收购。可重构作为第三大AI芯片主流赛道,已被国际芯片巨头们虎视眈眈。国产可重构AI芯片头部企业的清微智能,则已启动IPO筹备。
三、开启全新资本周期,国产AI芯片迎来第三种解法
2025年12月,清微智能宣布完成超20亿元C轮融资,并已启动上市筹备相关工作,目标打造国内“非GPU”新型架构芯片领域首个上市标杆企业。
当前,中国AI芯片市场呈现多元架构并起的格局,上市公司多为GPU或ASIC企业。清微智能作为全球最早实现可重构计算商用的企业之一,其IPO具有破局意义。
据悉,清微智能是国家集成电路产业投资基金唯一投资的新型架构算力芯片企业,并得到国开装备基金、京能集团、北创投、京国瑞等多家国资机构,以及蚂蚁集团、百度、商汤、兆易创新等产业投资方的持续支持。
在先进制程工艺受限的背景下,可重构芯片通过架构创新换取性能的国产替代方案,是中国实现算力自给的重要方向之一。而清微智能研发的芯片代表了目前中国在可重构计算领域的最前沿。
清微智能今年推出下一代芯片,性能还将大幅提升,其可重构数据流架构具备3D扩展的天然优势,能够与3D芯片、晶圆级芯片技术等前沿集成技术结合,形成清晰且可持续的升级迭代路径。
面向大规模扩展,为可重构架构设计的高效数据互连技术TSM-LINK支持多芯片点对点直连,能够实现数据高效传输,规避传统交换机架构存在的带宽瓶颈与通信延迟问题。
针对长期生态建设,清微智能持续推进软件栈适配与工具链建设,以降低开发与迁移成本。
中国拥有丰富的端侧AI应用场景,许多场景都对功能、延时极其敏感,这为可重构芯片提供了优质的练兵场。
清微智能可重构芯片2025年算力卡订单超过3万张,累计出货超过3000万颗,在全国十多座千卡规模智算中心实现规模化落地,对国内AI推理应用算力形成有力支撑。据IDC数据披露,清微智能可重构芯片的出货已跻身国内AI芯片第一梯队。
可重构芯片凭借高能效优势,既符合低碳目标的国情所需,又能够消解单一架构遇阻的风险。此类企业走向IPO,将有助于鼓励更多企业探索底层创新技术,为国家算力主权发展出更多条可持续发展的生命线。
结语:英伟达200亿美元高价,拉高了可重构赛道的稀缺性
随着大模型应用重心向“快”和“便宜”转移,可重构芯片的高能效、低延迟等特性,正好迎合了爆发式增长的AI商业化普及潮。
而英伟达为Groq掏出的200亿美元高价,某种程度上提供了可重构这类新架构的技术估值,让业界意识到AI计算路线胜负未定、软件定义硬件将是接下来的重要技术发展方向。这一领域的国内头部企业,在资本市场的稀缺性也在2026年被进一步放大。
相关攻略
2026年4月,一则来自西门子与英伟达的联合公告,在AI芯片设计领域投下了一枚重磅冲击波。双方宣布,在前硅设计验证这个关键环节取得了突破性进展。简单来说,过去需要耗时数月才能完成的、数万亿次级别的芯片功能验证,现在被压缩到了仅仅几天之内。这背后,是西门子的Veloce™ proFPGA CS硬件辅助
近日,英伟达与康宁公司签署的战略合作协议,在光通信与人工智能领域引发了广泛关注。 根据协议内容,康宁计划将其在美国本土的光连接产品制造产能提升至原先的十倍,同时将光纤总产量扩大50%以上。为实现这一目标,康宁将在美国北卡罗来纳州和德克萨斯州投资新建三座先进的制造工厂。 尤为关键的是,为支持康宁的产能
亚马逊CEO安迪·贾西在2026年致股东的信件中,释放了一个关键信号:公司正积极评估将自研的AI训练与推理芯片直接销售给外部客户的可能性。这一战略转向,预示着亚马逊不仅将巩固其云服务的领先地位,更可能重塑全球AI芯片市场的竞争格局。据披露,亚马逊芯片业务的年化营收已悄然突破200亿美元大关,而一旦开
英伟达旗下的云游戏服务GeForce NOW近期发布了一项重要功能更新。此次升级的核心目标,是显著优化玩家在平台内发现并游玩Xbox Game Pass(XGP)与育碧+(Ubisoft+)订阅游戏库的体验。 本次更新的关键在于引入了一套全新的智能标签系统。该系统专门针对XGP和育碧+订阅服务进行了
英伟达B300AI服务器国内价格飙升至约700万元,远超美国市场,促使部分企业转向月租19万元的租赁模式。其高价源于强大性能及供应链不确定性导致的稀缺。与此同时,华为等国内厂商正加速研发昇腾系列AI芯片,未来市场竞争格局或将重塑。
热门专题
热门推荐
主流币与山寨币在市值、技术、共识和风险上差异显著。主流币市值巨大、流动性强,技术经过长期验证,拥有全球共识和明确应用场景,适合长期配置。山寨币则市值小、流动性差,技术基础薄弱且缺乏审计,共识脆弱且多依赖炒作,价格波动剧烈且归零风险高,属于高风险投机标的。
进行Bitget身份认证时,除了正确上传照片,证件本身的清晰度至关重要。模糊、反光或信息不全的图片会直接导致审核失败。此外,认证申请提交后的等待时间受平台审核队列、资料完整度及网络状况等多重因素影响,高峰期可能延长。建议用户确保在光线均匀环境下拍摄高清证件照,并耐心等待系统处理,以提升一次性通过率。
本文详细介绍了Bitget交易所在不同设备上的下载与访问方法。安卓用户可通过官方应用商店或APK文件安装,需注意权限设置。iPhone用户需切换至非中国大陆AppStore账户下载官方App。网页端则提供最直接的访问方式,无需安装,但务必核对网址安全性。文章还补充了常见问题与安全建议,帮助用户顺利完成平台使用前的准备工作。
对于初次接触Bitget的新用户,从注册到完成第一笔交易,平台提供了一条清晰的操作路径。关键在于完成账户注册与安全设置,包括身份验证和资金密码。随后,通过法币入金通道为账户注入启动资金,并熟悉现货交易界面的基本操作。最后,在模拟交易中实践后,即可尝试小额真实交易,完成从入门到实操的完整闭环。
对于初次接触Bitget这类专业交易平台的新用户来说,感到无从下手是普遍现象。关键在于熟悉核心功能区的布局,特别是资产总览、现货交易、合约交易、资金划转、订单管理和个人设置这六个关键页面。掌握它们的位置和基本逻辑,就能快速理清平台操作脉络,大幅提升使用效率,避免在基础操作上耗费过多时间。





