6月2日消息,Arm边缘AI事业部执行副总裁Chris Bergey近日分享了一个颇具前瞻性的观点:随着智能体AI进入“自主工作”阶段,PC的设计逻辑正在被重新定义。
他直言不讳地指出,过去几十年来,PC始终围绕着“用户手动打开应用、逐项操作”的模式运转。而智能体AI的到来改变了这一切——应用程序开始具备自主能力,用户只需下达一个指令,剩下的观察、推理、规划与执行均由AI自主完成。换言之,过去是人跑流程,现在是AI代替人跑流程。
那么,这种转变对算力提出了哪些新要求?Bergey认为,智能体AI催生出两种截然不同的计算需求。一种是极致能效——AI需要全天候在线、随时响应,续航与效率成为硬性指标;另一种是极致性能——用于承载复杂的AI负载、内容创作、软件开发以及必须在本地完成的推理任务。这本质上是“既要又要”的挑战,传统PC架构未必能同时胜任。
正因如此,Bergey重点提及了基于Arm架构的NVIDIA RTX Spark。在他看来,这款产品正是同时满足这两种需求的关键方案。
背景信息显示:在COMPUTEX 2026上发布的RTX Spark,本质上是一次架构层面的深度整合——将Arm架构的Grace CPU与Blackwell RTX GPU集成在同一个主板上,并采用完全统一的内存架构。这意味着CPU与GPU不再各自为政,而是共享同一个内存池,数据调用无需反复搬运,响应速度更快,效率更高。
NVIDIA产品管理副总裁Kaustubh Sanghani也补充道:想要真正实现低延迟的端侧AI体验,智能体需要的并非简单的CPU+GPU拼凑,而是从内存到计算单元的深度集成与优化。RTX Spark正是这一思路的实际落地。
最后,Bergey还抛出了一个值得深思的观点。他指出,随着AI模型使用的词元(token)数量持续增长,降低单任务成本的关键越来越倾向于采用更大的端侧模型。因为大模型能更高效地利用词元,单位成本更低、更可控,同时数据隐私也能从根本上得到更好的保障。
简单理解就是:与其将数据发送到云端进行大模型推理,不如在本地运行一个足够强大的模型,既节省成本又确保安全。而RTX Spark,正是这一方向上的关键布局。

