黄仁勋重大决策影响深远_AI热点日报

黄仁勋重大决策影响深远

类型：热点整理2026-06-03

英伟达联合微软、ARM推出RTXSpark芯片，采用统一内存架构，AI算力达1petaflop，旨在打破Wintel联盟。但端侧AI尚无杀手级应用，出货量预计仅占PC市场2%。其真意是将CUDA开发者生态扩展到笔记本端。

有朋友在问，怎么看待英伟达和微软联手推ARM架构的AI PC。

这问题问得好。芯片参数那些东西，翻两篇新闻就能看全，真正有意思的，是有人在拆一个存在了整整40年的联盟。

PC行业有个老词儿，叫Wintel。Windows加Intel，一个出操作系统，一个出CPU。就这么个组合，牢牢锁死了全球几十亿台电脑的底层架构。

40年了，你买一台Windows电脑，CPU不是英特尔就是AMD，全是x86架构，没第三个选项。

但这个联盟，最近挨了两刀。

第一刀，来自苹果。2020年M1芯片横空出世，直接把英特尔踢出了Mac阵营。苹果自己造CPU、自己配系统，效果确实惊艳，但代价是它只管自家那一亩三分地。macOS跟Windows毛关系都没有。

第二刀，则是高通。2024年，骁龙X Elite带着Windows on ARM的梦想来了。我翻了翻Canalys的数据，2024年第三季度，骁龙X总共出货72万台，市场份额只有0.8%。

没起来的核心原因就一个：软件生态。

微软连ARM版Windows 11的官方安装包都拖着不肯发。大量应用需要转译，反作弊软件、企业级驱动也搞不定。高通有芯片，但没生态，一个人根本撬不动Wintel这把锁。

但这次，情况变了。6月1日，黄仁勋在台北Computex上发布了RTX Spark。英伟达、微软、ARM三家在同一时间，发了同一条消息：「A new era of PC」。

跟高通过来做骁龙X那次完全不一样。上次微软的态度是“支持”，发了几台Surface，推了个Copilot+ PC的概念，然后对ARM的适配继续拖。这次微软是主动的。Build 2026大会上，纳德拉几乎是把Windows重新定义成了本地AI Agent的运行平台，一口气发了Aion 1.0本地模型、Windows Local AI运行时、还有Project Solara。微软第一次把端侧AI当成了正经事来干，压上了真金白银的筹码。

你再回头看，整个逻辑就清晰了。苹果那刀砍在了自家院子里，高通那把锁撬了半天没撬动。而这次，造芯片的和造锁的，直接坐一桌了。连锁都换了。

......

换的那把锁，叫RTX Spark。黄仁勋在Computex上给了它一个词：超级芯片（Superchip）。这不是营销话术。你把它的架构看一遍就知道，他没吹牛。

过去两年，PC行业一直在喊AI PC。怎么喊的？拿一颗x86处理器，旁边贴一个NPU，也就是神经网络处理单元，跑点轻量级的AI任务。微软给Copilot+ PC定的门槛是NPU算力40 TOPS。

40 TOPS能干嘛？

语音转文字。做一些基础的图像识别，支撑Windows Copilot做点文本补全。想在本地跑一个百亿参数的大语言模型？别想了。差一个数量级都不止。

RTX Spark的思路，完全不一样。

这颗芯片，700亿个晶体管，台积电3nm工艺。它把20核的Grace CPU和一颗Blackwell架构的GPU封在同一块芯片上，中间用NVLink-C2C互联，带宽高达600GB/s。GPU那边是6144个CUDA核心，AI算力达到1 petaflop FP4。大概是之前那些NPU的25倍。

翻译一下，这GPU性能大致相当于一块笔记本版的RTX 5070。以前这个级别的GPU是独立显卡，插在主板上。现在，它跟CPU长到一起了。

内存架构也改了。

传统笔记本，CPU一份内存，GPU一份内存，各跑各的。RTX Spark用的是统一内存架构，最高支持128GB，CPU和GPU共享。你在本地加载一个大模型，不用在CPU和GPU之间来回搬数据，直接在同一块内存里跑。

这个架构不陌生，苹果M系列走的就是这条路——统一内存、CPU和GPU封在一起、芯片级集成。RTX Spark做的事，是在Windows阵营里第一次复刻了这个思路，同时把GPU规模拉到了苹果给不了的级别。

它有个前身，叫DGX Spark，是英伟达年初发布的桌面AI工作站，定价3999美元。RTX Spark是它的笔记本化版本。OEM厂商已经排好了队，微软Surface Laptop Ultra打头阵，戴尔、惠普、联想、华硕、MSI全部跟进。今年秋天上市，整台电脑的设计核心变了，以前是塞一块显卡进去，现在是把AI引擎放在了最中间，围着它转。

......

芯片是好芯片。但问题是，谁需要它？

郭明錤在RTX Spark发布前一天发了一条分析，拿的是供应链数据。搭载这颗芯片的设备，未来两年出货量大概在1000万台左右。1000万台，听着不少。但你放到全球PC市场里算一下：一年卖2.5亿台，1000万分两年，一年500万，占比2%。

郭明錤给了一个定性：小众市场。这东西瞄准的，是对端侧AI算力有极致需求的重度用户。

这个判断背后藏着一个更扎心的事实。他说，目前PC上的AI应用，核心全在云端。你打开浏览器用ChatGPT、用Claude、用Gemini，算力全跑在别人服务器上。你通过API调用大模型，算力也在云端。你的电脑在这个过程中，干的活就是一个浏览器。什么芯片跑浏览器，有差别吗？根本没有。

郭明錤举了两个例子：2026年PC行业最热的一件事是MacBook Neo，苹果出了一款低价MacBook，卖疯了，出货量预估从500万台直接调到1000万台。消费者买的是什么？低价、设计、生态。跟端侧AI算力半毛钱关系都没有。

另一个例子是便宜的小主机，比如Mac mini这类产品。因为能7×24小时挂着跑AI Agent，很多开发者关注。听着像端侧AI的应用场景对吧？但实际上，这些Agent的推理算力几乎全部来自云端。小主机干的事就是保持在线、调度任务，真正的计算根本不在本地。

所以，这事指向一个根本问题：端侧AI目前没有杀手级应用。不是硬件不够。RTX Spark的算力，在本地跑百亿参数的模型绰绰有余。但问题是，跑它干嘛？用户根本想不出一个非要在本地跑不可的理由。

微软不是没看到这件事。Build 2026上发的那一堆东西，本质上都在回答同一个问题：操作系统怎么让端侧AI变得有用。Aion 1.0是一个140亿参数的本地小模型，支持工具调用，直接内置在Windows里。以后Windows上的AI Agent，不用每次都去云端取指令，一部分推理和决策可以在你的电脑上直接完成。方向是对的，就是刚起步。

端侧AI真正能干、而云端干不了的事，其实很清楚：隐私数据不出本机，跨应用的数据调度不经过第三方服务器，还有低延迟的实时响应。这些能力需要操作系统层面的深度整合，不是装一个 App能解决的。

那现在是什么局面？很清晰：芯片已经准备好了，操作系统刚迈出第一步，而用户需求还停留在“用浏览器上ChatGPT”的阶段。三样东西跑在三条不同的时间线上，芯片最快，生态最慢。

......

英伟达又不傻。份额就那么大，干这事图什么？

黄仁勋在Computex的媒体问答上说了一句：英伟达已经不是一家GPU公司了，是一家基础设施公司。放在PC的语境里，意味完全不一样。英伟达做RTX Spark，不是来抢英特尔那点CPU份额的。PC市场一年3000多亿美元，听着很大；但英伟达光数据中心业务，上个季度就做了752亿美元。PC那点钱，犯不着让它专门打一仗。

它要的是另一件东西。我查了一下。今年3月GTC大会上，英伟达纪念CUDA二十周年，公布了一个数字：600万开发者。

这600万人用CUDA写代码，跑在英伟达的GPU上，覆盖了AI训练、推理、科学计算、图形渲染、视频生产。整个AI产业的软件栈，底层就是CUDA。CUDA的护城河是迁移成本。大学教CUDA，论文发CUDA基准测试，创业公司招CUDA工程师。一个团队一旦在CUDA上积累了代码、工具链和工程经验，换平台？代价是组织级的。

这600万开发者现在在哪？在数据中心里，用着几万美元一块的芯片。RTX Spark干的事，就是把CUDA拉到笔记本上。这些人写的代码，不用改、不用重新编译，直接在一台笔记本上就能跑。因为架构是通的。

黄仁勋在发布会上还说了一句：我们要重新发明人类最重要的工具。说的就是PC。他还同时宣布了一件事：RTX Spark之后的第二代、第三代芯片已经在规划中。未来英伟达每一代平台架构，都会包含一颗Spark芯片。30多款笔记本、10多款台式机，同时上市。

这不是试水，这是战略布局。不过，CUDA能不能真正长到每一台终端上，取决于一个英伟达自己控制不了的变量：价格。全球DRAM现在正处在供应紧张的周期里，内存涨价。笔记本版第一批产品的起步价不会低。想让CUDA的覆盖不只局限于重度用户，需要更多代的产品，以及制程和内存的成本曲线配合。

英伟达选择在这个时间点落子，说白了，是因为它看到了一个窗口：微软第一次认真对待端侧AI；ARM架构在Windows上第一次有了成规模的OEM支持；而CUDA的开发者基数已经足够大。你看，三件事凑到一起了，这才是背后真正的动机。

来源：https://36kr.com/p/3837092383044736

黄仁勋

延伸阅读

补充最近整理过的热点入口。

黄仁勋重大决策影响深远

相关热点

延伸阅读