这周,微软扔出了一台很不“Surface”的Surface Laptop Ultra。它不仅是微软史上最强的Surface Laptop,更是全球首款搭载英伟达RTX Spark的Windows笔记本。
但话说回来,它未必就是Agent时代的那台“天选之机”。
按微软的规划,Surface Laptop Ultra是为创作者、开发者和AI builders量身打造的——大型3D场景、长时间编译、本地模型和数据集,这些都是它的主场。英伟达那边,更是直接把RTX Spark定义为面向个人AI Agent的Windows PC超级芯片:6144个CUDA核心、第五代Tensor Core、FP4精度,通过NVLink-C2C连接一颗20核NVIDIA Grace CPU,最高支持128GB统一内存。
最终呈现的效果也确实炸裂:本地跑1200亿参数的大模型、最高100万token上下文、渲染90GB以上的3D场景、剪辑12K 4:2:2视频、生成4K AI视频,甚至能在1440p下以超过100帧的速率运行3A级游戏。

图片来源:英伟达
强得确实不像一台传统笔记本。
RTX Spark的强,本质上是GPU的强,是CUDA、Blackwell GPU、统一内存和本地模型推理能力的强。如果AI PC的核心命题仍然是“能不能在本地跑一个更大的模型”,那么RTX Spark确实拿出了足够有说服力的答卷。不过,当问题变成“Agent能不能长期替用户执行任务”,答案就没那么清晰了。
Agent意味着什么?拆解任务、调用应用、查询文件、跑代码、开网页、维护沙盒、处理权限、等待外部响应,还得在不同任务之间灵活切换上下文。这些负载既需要云端的强大模型能力,也极度依赖端侧的CPU、I/O、系统调度、安全隔离、应用接口和云端状态协同。
反观端侧模型,其性能远远不足以支撑Agent所需的模型能力。即便是RTX Spark这样的“怪兽”,也更像是把一台小型AI工作站硬塞进笔记本形态,而非为Agent时代重新设计的一台个人电脑。说得直白一点,它是在用2024年的本地大模型想象,来回答2026年的Agent问题。
从NPU到CPU,英伟达强化PC存在
英伟达并非突然对PC处理器来了兴趣。
从短期生意角度看,这家公司甚至没必要亲自下场做一颗PC SoC。它在PC市场本来就过得足够舒服:独立显卡长期占据绝对优势,游戏、创作、专业图形和CUDA生态全都握在手里;数据中心GPU更是供不应求,排队买卡的客户比英伟达还着急。
但AI PC改变了PC的负载结构,也改变了英伟达在PC里的位置。(注:这里的AI PC主要指笔记本电脑,不包括DIY主机。)
过去,PC的核心负载主要围绕CPU和图形性能展开。英伟达只需要把GPU做得越来越强,再通过PCIe接口接入PC,就能稳稳地站在性能链条的上游。
进入AI PC时代后,情况开始变化。越来越多的负载开始围绕本地推理、多模态理解、语音视频处理、语义搜索、本地知识库和系统级AI功能展开,而NPU比GPU更贴近日常PC的使用形态。
NPU的低功耗、常驻、安静、长续航、系统级调用,这些特性正是AI PC早期最需要的体验。传统独显的数据需要在系统内存和显存之间来回搬运,功耗一上来风扇就开始疯狂转动,续航也跟着崩盘。
对于笔记本这种天生受限于电池、散热和体积的瘦终端来说,NPU的逻辑无疑更有吸引力。
2024年,微软用AI+ PC(最早是Copilot+ AI)划下了一条硬性标准:NPU算力至少40TOPS,才能跑新一代Windows AI功能。高通、AMD、英特尔轮番上场,PC厂商也终于找到了一个比CPU多核性能、屏幕素质和续航时间更新鲜的卖点。

图片来源:微软
但如果未来的PC AI负载都被NPU接管,英伟达在PC里的角色就可能从平台定义者退回到高端图形配件的位置。
所以,英伟达必须做RTX Spark。它把CUDA、RTX、TensorRT、OptiX、DLSS、FP4、Blackwell GPU和统一内存一起带进Windows笔记本,让PC不仅能运行AI功能点,还能承载本地AI工作流,从而避免AI PC时代绕开GPU和CUDA。
在微软Build大会的连线中,黄仁勋提到,三年前他就与微软CEO萨蒂亚·纳德拉讨论过一种新的个人电脑:既适合设计师和创作者,也适合人工智能;既有本地处理能力,又能与Windows、创作软件以及AI软件栈深度整合。

图片来源:X
RTX Spark和Surface Laptop Ultra就是那次对话的产物。它确实回答了一个问题:如果Windows阵营想造一台真正能跑本地大模型、本地创作、本地AI开发的高端笔记本,硬件应该激进到什么程度。
但三年时间,AI已经变了太多。
三年前,整个行业还处在ChatGPT刚刚爆发后的本地推理想象里。很多人相信,AI PC的关键就是把模型跑到本地。这样一来,用户不用把隐私数据丢进云端,不用为每次调用付token账单,还能获得更低延迟、更稳定的AI体验。
这个逻辑并没有错,今天也依然成立一部分。但到了2026年,AI已经不只是聊天机器人了。从推理到Agent,上下文、推理链、KV cache……几乎每个维度的要求都在提高,本地设备和云端模型之间的能力差距,在很多任务上也被进一步拉大。

图片来源:X
事实上,今天几乎所有针对Agent训练过的大模型,对硬件的要求都大幅超过了以往。量化压缩后的模型,根本无法满足Agent的良好运行,也无法达到用户对Agent表现的预期。
简而言之,至少目前来看,端侧根本无法支撑好的本地Agent体验,它必须基于云端。所以对个人PC来说,CPU反而变得更加重要。
「过时」的Arm CPU,能适应Agent时代吗?
到了Agent时代,用户要的不只是一个答案,而是希望AI能真正完成任务。
但完成任务和本地生成文本完全是两回事。一个Agent要执行任务,往往需要访问网页、调用软件、运行代码、读取文件、处理权限、验证结果,还要在后台持续运行。它更像一个操作员,而不是一个离线模型。越是复杂的工作流,就越需要CPU、I/O、系统调度、浏览器环境、沙盒和云端服务的协同配合。
与此形成鲜明对比的是,RTX Spark的重心几乎全部放在GPU和AI侧:1 petaflop AI性能、6144个CUDA核心、Blackwell RTX GPU、128GB统一内存、本地120B模型、百万token上下文。
而在CPU上,英伟达选择了联发科,采用了10核Cortex-X925和10核Cortex-A725。这两个核心已经是Arm两年前发布的IP,被广泛用于过去两年的旗舰、次旗舰手机SoC上,包括天玑9400、天玑8400、玄戒O1、Exynos 2500等。
而去年的天玑9500,已经用上了Arm最新的旗舰架构C1-Ultra,采用下一代C2核心的SoC也预计在未来几个月内推出。

图片来源:Arm
当然,RTX Spark的CPU核心数量要多得多,但从规划到预期,CPU恐怕都不是英伟达打造这款消费级PC SoC的核心。
这也不奇怪,英伟达最强的护城河本来就是GPU和CUDA。但智能体时代会重新抬高CPU的地位。英伟达面向数据中心发布的Vera CPU,本质上已经承认了这一点:当AI从聊天机器人走向智能体,代码执行、数据处理、沙盒环境、任务编排都会变成关键路径,CPU不再只是给GPU打杂的角色。
可RTX Spark把太多预算、功耗、芯片面积和系统想象都压在了GPU和本地推理上,却没有真正回答智能体最关键的执行、调度、长期状态和跨设备协同问题。
而与Surface Laptop Ultra同场发布的Project Solara,则是微软给出的另一个答案。
按照微软Applied Sciences Group负责人Steve Bathiche的说法,Project Solara是一个“芯片到云”的平台,专为agent-first experiences和新的设备形态而设计。它不是把智能带进PC、浏览器或手机,而是让智能进入工作流、环境和任务现场。设备不再围绕App设计,而是围绕Agent设计。
对了,Project Solara用的还是Android,而不是Windows。
更重要的是,Project Solara的状态不是只放在某一台设备里,而是经由Azure覆盖一组专用设备。微软展示了便携形态和桌面形态,并且明确高通和联发科会是第一批芯片合作伙伴。

Project Solara,目前还有两款设备,图片来源:微软
这条路线看起来没有Surface Laptop Ultra那么震撼,甚至还有点早。但它更接近Agent的真实需求。Agent的价值不在于每个入口都拥有一整座本地AI工厂,而在于能不能在正确的时间、正确的地点、正确的设备上出现,并且把任务交给云端状态和后台智能继续推进。
换言之,Surface Laptop Ultra是把PC做“大”,Project Solara是把设备做“瘦”。Agent时代更需要的,可能恰恰是后者。
写在最后
本地算力当然不是不重要。
隐私数据、本地文件、低延迟交互、离线场景、创作素材和开发环境,都需要足够强的端侧能力。对于需要本地模型、本地渲染、本地视频生成、本地CUDA工作流的专业用户来说,Surface Laptop Ultra可能会是一台很好的机器。
但Agent时代的个人电脑应该长什么样?Surface Laptop Ultra恐怕不是最好的答案。
Agent天然更适合以云端为中心,再由多个轻量级设备作为入口。手机、PC、工牌、桌面屏、耳机、眼镜都可以成为Agent的触点,但它们不必都变成一台小型AI工作站。
从这个角度看,Surface Laptop Ultra和RTX Spark这类AI PC,确实像是用2024年的本地推理想象,来回答2026年的Agent问题。它们很强,也很重要,但并不是下一代Agent设备的起点。

