智能体驱动模型厂商CPU需求激增5倍_AI热点日报

智能体驱动模型厂商CPU需求激增5倍

类型：热点整理2026-07-05

智能体正成为计算设备的新用户，推动数据中心CPU需求激增，某大模型厂商CPU需求一年提高5倍。计算主力从GPU转向CPU，英伟达、英特尔等厂商推出专用芯片。智能体硬件需更高核数、能效及内存优化，专用个人计算设备已出现。

智能体需要什么样的硬件？这个问题，眼下正成为硬件行业讨论最热烈的话题之一。

在第一财经记者最近参加的一场行业论坛上，一位物联网公司的技术负责人提了一个很有意思的观点：智能硬件的第二类用户来了——不是人，而是智能体。

这个趋势，连GPU霸主英伟达都已经看到了。它正准备在今年秋天推出一款专门为智能体设计的个人电脑芯片。而在数据中心，变化已经发生：CPU正在重新回到舞台中央。承接智能体计算的主力平台，正从GPU逐渐转向CPU。

业界普遍认为，给智能体“用”的计算设备，可能和给人用的设备完全不同。一场围绕新用户的处理器竞赛，已经悄然拉开。

CPU需求井喷

业内最近频繁讨论一个话题：数据中心的CPU和GPU，究竟要从1:8的搭配，演变成1:1的配置？

英特尔数据中心集团副总裁兼中国区总经理陈葆立，在一次采访中谈到CPU需求的暴涨。他说，CPU的供应现在已经有些紧张，英特尔正在全力提升产能，但市场实在太火爆，没有任何一家供应商能迅速填满需求。他透露，国内某家大模型厂商反馈，过去一年时间，CPU需求已经翻了5倍。

智能体应用的爆发，是这一轮CPU需求拐点的根本原因。Arm边缘AI事业部执行副总裁Chris Bergey解释说，很多智能体本身由专属CPU驱动，而大量与AI工作负载相关的数据库操作——比如管理上下文、调度整个运行过程——同样是CPU密集型任务，对算力的需求极高。

腾讯云计算产品运营总监周驰也观察到，涌入云平台的自动化任务，很多是来处理日常琐事的。这些任务不需要GPU，更依赖CPU的调度能力以及高并发执行小脚本的能力。

不少业界人士相信，CPU的需求还会呈倍数增长。Arm的CEO Rene Hass表示，按出货量计算，CPU的增长速度比预想的更快，他目前无法确定倍数是4、6还是8，但这个数字正在变大。陈葆立则认为，现在还很难说未来CPU和GPU的比例一定会是1:1，但大逻辑已经清晰：要给AI更多任务，而多数任务的执行者，是CPU。

数据中心的“C位”，也在悄无声息地发生变化。资本市场上的表现就很能说明问题：英伟达的股价自2022年底ChatGPT面世后经历了暴涨，而CPU厂商AMD、英特尔，以及CPU设计IP厂商Arm，它们的股价快速拉涨却更多集中在今年——三家公司在年内都已翻倍。

这些迹象只是开始。业界普遍判断，以CPU需求增长为代表的数据中心硬件变迁，可能只是一场更大变革的序曲。智能体将更彻底地改变硬件的运行方式乃至形态。Chris Bergey补充说，支撑AI产业变革，芯片硬件层面的设计复杂度和研发成本都在急剧上升，同时还要面对严苛的功耗限制。当AI成为核心工作负载，系统里的每一类计算单元，都必须尽可能强化AI任务的运行能力。全新的计算硬件，已经崭露头角。

智能体呼唤什么样的硬件？

面向智能体，CPU本身也将变得和以往截然不同。新的工作负载对CPU的效率、能力、核心数都提出了新的要求。

云尖信息副总裁张欢军直言，运行智能体的核心痛点在于“单颗CPU处理业务的能力”——一台设备能承载多少个智能体？每个智能体的运行成本和效率是否足够好？

要承载更多智能体，一个直接的办法就是增加CPU的核数。陈葆立认为，智能体需要更高的CPU核数，其中一些智能体非常适合用核数极多、单核性能要求不高的轻量核处理器来运行。目前，英特尔至强6+已经可以在单个CPU核心上同时运行3到4个处理简单日常工作的智能体。

上周，Arm和英伟达合作推出了RTX Spark个人电脑芯片，搭载了20颗Arm处理器内核，是目前采用统一内存架构的PC产品中CPU核心数最多的产品。Chris Bergey表示，“我们在云端和边缘侧都看到对更多CPU、更高性能的强烈需求。大家真正需要的是更高的CPU密度，也就是更好的能效比。”

在边缘硬件上运行智能体，还面临着一个现实挑战：内存空间有限。创通联达CTO黄小严总结说，智能体已经成为硬件的核心用户，但智能体场景涉及多轮对话，需要长时间记忆，而移动端的内存容量受成本约束，内存紧缺加上算力约束，很容易导致上下文溢出，形成所谓的“AI智力鸿沟”。

芯片厂商已经在探索更多方法来更高效地利用存储空间。英伟达和Arm合作的RTX Spark，采用了Grace CPU、Blackwell RTX GPU加统一内存紧密耦合的方式。Chris Bergey介绍，进入智能体阶段，用户需要高性能GPU与CPU的紧密结合。统一内存让CPU和GPU能完整调用全部DRAM及带宽资源，不再依赖PCIe或CXL等传统传输接口，从而大幅提升CPU与GPU间的传输带宽。这项技术正在推动边缘计算的变革。

英特尔则通过QAT和IAA技术来应对显存和闪存资源紧缺。陈葆立解释，AI运行时，海量的KV Cache需要存储——100万上下文大约等于10G以上的KV Cache，是一笔不小的闪存开销。而QAT技术可以将压缩比做到50%，节省闪存成本。多个智能体同时运行时，IAA则能实时压缩内存数据，以节省内存。

除了内存问题，黄小严还指出，智能体在移动计算设备上不停歇运行，设备必须在省电和高唤醒率之间找到平衡。传统物联网软件架构已经失效，设备需要重构，以便智能体理解和调用。智能体的安全问题也需要新的保障。他们公司为此使用了高通开发工具链，在软硬件和系统平台层面进行了设计，搭建了端侧智能体中间件运行平台。

智能体专用硬件平台兴起

今年初，OpenClaw的爆火带动了Mac Mini这类计算设备的销售——人们买Mac Mini，更多是让智能体在本地运行，而不是自己亲手操作电脑。这可以说是智能体专用设备的雏形。现在，真正为智能体设计的个人计算设备，已经开始出现了。

今年秋季即将上市、搭载RTX Spark芯片的笔记本和台式电脑，将由联想、华硕、Microsoft Surface等厂商推出。英伟达CEO黄仁勋评价这款芯片时表示，它“重新发明了个人电脑的工作方式”。

Arm同样看到了个人电脑行业的巨大改变。Rene Haas说，“PC需求正在分化为两种：一种是续航好、随处可联网，就像一个大号手机加一个键盘，能用来工作；另一种则需要极致性能，能运行智能体、模型或做开发工作。”

Chris Bergey向记者进一步解释，以往的PC从入门级向高性能产品演进，整体架构大致相同，高端机型靠提升主频、扩充核心数、选用更强性能内核来实现迭代。而随着智能体专用硬件平台兴起，对PC市场的区分已经与以往迥然不同。

“用户对这类设备有非常明确的需求，”Chris Bergey说，“PC能7×24小时不间断运行智能体；设备依托高性能硬件，以高吞吐规格运行各类大模型；除了设备采购、供电和网络接入成本外，不产生额外算力费用，模型本地运行，用户隐私数据留存本机。”传统PC一天只使用一小部分时间，而新一代硬件作为本地的Token生成引擎，需要全时段输出算力。

Chris Bergey进一步判断，现在的传统PC还会继续迭代，整机趋向轻薄紧凑，主打便携。而另一类可供智能体使用的设备，便携性会偏弱，适合留在家中不间断运行。两者在外观、摆放结构等物理设计层面也会有明显差异。

高通技术公司（中国）资深产品市场经理朱元堃则认为，个人用户使用AI的方式也在发生根本变化。以往人们以手机为核心使用AI，耳机、眼镜、手表等穿戴设备只是附属连接。未来将转向以AI和用户为中心的多终端体验——AI不再绑定某个具体设备，而是通过多设备灵活协同来服务用户。

一个全新的市场，正在徐徐展开。为智能体设计的硬件，可能才刚刚拉开序幕。

来源：https://www.bestblogs.dev/article/98b27719?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

智能体

延伸阅读

补充最近整理过的热点入口。