有朋友在问,怎么看待英伟达和微软联手推ARM架构的AI PC。
这问题问得好。芯片参数那些东西,翻两篇新闻就能看全,真正有意思的,是有人在拆一个存在了整整40年的联盟。
PC行业有个老词儿,叫Wintel。Windows加Intel,一个出操作系统,一个出CPU。就这么个组合,牢牢锁死了全球几十亿台电脑的底层架构。
40年了,你买一台Windows电脑,CPU不是英特尔就是AMD,全是x86架构,没第三个选项。
但这个联盟,最近挨了两刀。
第一刀,来自苹果。2020年M1芯片横空出世,直接把英特尔踢出了Mac阵营。苹果自己造CPU、自己配系统,效果确实惊艳,但代价是它只管自家那一亩三分地。macOS跟Windows毛关系都没有。
第二刀,则是高通。2024年,骁龙X Elite带着Windows on ARM的梦想来了。我翻了翻Canalys的数据,2024年第三季度,骁龙X总共出货72万台,市场份额只有0.8%。
没起来的核心原因就一个:软件生态。
微软连ARM版Windows 11的官方安装包都拖着不肯发。大量应用需要转译,反作弊软件、企业级驱动也搞不定。高通有芯片,但没生态,一个人根本撬不动Wintel这把锁。
但这次,情况变了。6月1日,黄仁勋在台北Computex上发布了RTX Spark。英伟达、微软、ARM三家在同一时间,发了同一条消息:「A new era of PC」。
跟高通过来做骁龙X那次完全不一样。上次微软的态度是“支持”,发了几台Surface,推了个Copilot+ PC的概念,然后对ARM的适配继续拖。这次微软是主动的。Build 2026大会上,纳德拉几乎是把Windows重新定义成了本地AI Agent的运行平台,一口气发了Aion 1.0本地模型、Windows Local AI运行时、还有Project Solara。微软第一次把端侧AI当成了正经事来干,压上了真金白银的筹码。
你再回头看,整个逻辑就清晰了。苹果那刀砍在了自家院子里,高通那把锁撬了半天没撬动。而这次,造芯片的和造锁的,直接坐一桌了。连锁都换了。
......
换的那把锁,叫RTX Spark。黄仁勋在Computex上给了它一个词:超级芯片(Superchip)。这不是营销话术。你把它的架构看一遍就知道,他没吹牛。
过去两年,PC行业一直在喊AI PC。怎么喊的?拿一颗x86处理器,旁边贴一个NPU,也就是神经网络处理单元,跑点轻量级的AI任务。微软给Copilot+ PC定的门槛是NPU算力40 TOPS。
40 TOPS能干嘛?
语音转文字。做一些基础的图像识别,支撑Windows Copilot做点文本补全。想在本地跑一个百亿参数的大语言模型?别想了。差一个数量级都不止。
RTX Spark的思路,完全不一样。
这颗芯片,700亿个晶体管,台积电3nm工艺。它把20核的Grace CPU和一颗Blackwell架构的GPU封在同一块芯片上,中间用NVLink-C2C互联,带宽高达600GB/s。GPU那边是6144个CUDA核心,AI算力达到1 petaflop FP4。大概是之前那些NPU的25倍。
翻译一下,这GPU性能大致相当于一块笔记本版的RTX 5070。以前这个级别的GPU是独立显卡,插在主板上。现在,它跟CPU长到一起了。
内存架构也改了。
传统笔记本,CPU一份内存,GPU一份内存,各跑各的。RTX Spark用的是统一内存架构,最高支持128GB,CPU和GPU共享。你在本地加载一个大模型,不用在CPU和GPU之间来回搬数据,直接在同一块内存里跑。
这个架构不陌生,苹果M系列走的就是这条路——统一内存、CPU和GPU封在一起、芯片级集成。RTX Spark做的事,是在Windows阵营里第一次复刻了这个思路,同时把GPU规模拉到了苹果给不了的级别。
它有个前身,叫DGX Spark,是英伟达年初发布的桌面AI工作站,定价3999美元。RTX Spark是它的笔记本化版本。OEM厂商已经排好了队,微软Surface Laptop Ultra打头阵,戴尔、惠普、联想、华硕、MSI全部跟进。今年秋天上市,整台电脑的设计核心变了,以前是塞一块显卡进去,现在是把AI引擎放在了最中间,围着它转。
......
芯片是好芯片。但问题是,谁需要它?
郭明錤在RTX Spark发布前一天发了一条分析,拿的是供应链数据。搭载这颗芯片的设备,未来两年出货量大概在1000万台左右。1000万台,听着不少。但你放到全球PC市场里算一下:一年卖2.5亿台,1000万分两年,一年500万,占比2%。
郭明錤给了一个定性:小众市场。这东西瞄准的,是对端侧AI算力有极致需求的重度用户。
这个判断背后藏着一个更扎心的事实。他说,目前PC上的AI应用,核心全在云端。你打开浏览器用ChatGPT、用Claude、用Gemini,算力全跑在别人服务器上。你通过API调用大模型,算力也在云端。你的电脑在这个过程中,干的活就是一个浏览器。什么芯片跑浏览器,有差别吗?根本没有。
郭明錤举了两个例子:2026年PC行业最热的一件事是MacBook Neo,苹果出了一款低价MacBook,卖疯了,出货量预估从500万台直接调到1000万台。消费者买的是什么?低价、设计、生态。跟端侧AI算力半毛钱关系都没有。
另一个例子是便宜的小主机,比如Mac mini这类产品。因为能7×24小时挂着跑AI Agent,很多开发者关注。听着像端侧AI的应用场景对吧?但实际上,这些Agent的推理算力几乎全部来自云端。小主机干的事就是保持在线、调度任务,真正的计算根本不在本地。
所以,这事指向一个根本问题:端侧AI目前没有杀手级应用。不是硬件不够。RTX Spark的算力,在本地跑百亿参数的模型绰绰有余。但问题是,跑它干嘛?用户根本想不出一个非要在本地跑不可的理由。
微软不是没看到这件事。Build 2026上发的那一堆东西,本质上都在回答同一个问题:操作系统怎么让端侧AI变得有用。Aion 1.0是一个140亿参数的本地小模型,支持工具调用,直接内置在Windows里。以后Windows上的AI Agent,不用每次都去云端取指令,一部分推理和决策可以在你的电脑上直接完成。方向是对的,就是刚起步。
端侧AI真正能干、而云端干不了的事,其实很清楚:隐私数据不出本机,跨应用的数据调度不经过第三方服务器,还有低延迟的实时响应。这些能力需要操作系统层面的深度整合,不是装一个 App能解决的。
那现在是什么局面?很清晰:芯片已经准备好了,操作系统刚迈出第一步,而用户需求还停留在“用浏览器上ChatGPT”的阶段。三样东西跑在三条不同的时间线上,芯片最快,生态最慢。
......
英伟达又不傻。份额就那么大,干这事图什么?
黄仁勋在Computex的媒体问答上说了一句:英伟达已经不是一家GPU公司了,是一家基础设施公司。放在PC的语境里,意味完全不一样。英伟达做RTX Spark,不是来抢英特尔那点CPU份额的。PC市场一年3000多亿美元,听着很大;但英伟达光数据中心业务,上个季度就做了752亿美元。PC那点钱,犯不着让它专门打一仗。
它要的是另一件东西。我查了一下。今年3月GTC大会上,英伟达纪念CUDA二十周年,公布了一个数字:600万开发者。
这600万人用CUDA写代码,跑在英伟达的GPU上,覆盖了AI训练、推理、科学计算、图形渲染、视频生产。整个AI产业的软件栈,底层就是CUDA。CUDA的护城河是迁移成本。大学教CUDA,论文发CUDA基准测试,创业公司招CUDA工程师。一个团队一旦在CUDA上积累了代码、工具链和工程经验,换平台?代价是组织级的。
这600万开发者现在在哪?在数据中心里,用着几万美元一块的芯片。RTX Spark干的事,就是把CUDA拉到笔记本上。这些人写的代码,不用改、不用重新编译,直接在一台笔记本上就能跑。因为架构是通的。
黄仁勋在发布会上还说了一句:我们要重新发明人类最重要的工具。说的就是PC。他还同时宣布了一件事:RTX Spark之后的第二代、第三代芯片已经在规划中。未来英伟达每一代平台架构,都会包含一颗Spark芯片。30多款笔记本、10多款台式机,同时上市。
这不是试水,这是战略布局。不过,CUDA能不能真正长到每一台终端上,取决于一个英伟达自己控制不了的变量:价格。全球DRAM现在正处在供应紧张的周期里,内存涨价。笔记本版第一批产品的起步价不会低。想让CUDA的覆盖不只局限于重度用户,需要更多代的产品,以及制程和内存的成本曲线配合。
英伟达选择在这个时间点落子,说白了,是因为它看到了一个窗口:微软第一次认真对待端侧AI;ARM架构在Windows上第一次有了成规模的OEM支持;而CUDA的开发者基数已经足够大。你看,三件事凑到一起了,这才是背后真正的动机。

