游乐游手机版
首页/AI热点日报/热点详情

智能体驱动模型厂商CPU需求激增5倍

类型:热点整理2026-07-05
智能体正成为计算设备的新用户,推动数据中心CPU需求激增,某大模型厂商CPU需求一年提高5倍。计算主力从GPU转向CPU,英伟达、英特尔等厂商推出专用芯片。智能体硬件需更高核数、能效及内存优化,专用个人计算设备已出现。

智能体需要什么样的硬件?这个问题,眼下正成为硬件行业讨论最热烈的话题之一。

在第一财经记者最近参加的一场行业论坛上,一位物联网公司的技术负责人提了一个很有意思的观点:智能硬件的第二类用户来了——不是人,而是智能体。

这个趋势,连GPU霸主英伟达都已经看到了。它正准备在今年秋天推出一款专门为智能体设计的个人电脑芯片。而在数据中心,变化已经发生:CPU正在重新回到舞台中央。承接智能体计算的主力平台,正从GPU逐渐转向CPU。

业界普遍认为,给智能体“用”的计算设备,可能和给人用的设备完全不同。一场围绕新用户的处理器竞赛,已经悄然拉开。

CPU需求井喷

业内最近频繁讨论一个话题:数据中心的CPU和GPU,究竟要从1:8的搭配,演变成1:1的配置?

英特尔数据中心集团副总裁兼中国区总经理陈葆立,在一次采访中谈到CPU需求的暴涨。他说,CPU的供应现在已经有些紧张,英特尔正在全力提升产能,但市场实在太火爆,没有任何一家供应商能迅速填满需求。他透露,国内某家大模型厂商反馈,过去一年时间,CPU需求已经翻了5倍。

智能体应用的爆发,是这一轮CPU需求拐点的根本原因。Arm边缘AI事业部执行副总裁Chris Bergey解释说,很多智能体本身由专属CPU驱动,而大量与AI工作负载相关的数据库操作——比如管理上下文、调度整个运行过程——同样是CPU密集型任务,对算力的需求极高。

腾讯云计算产品运营总监周驰也观察到,涌入云平台的自动化任务,很多是来处理日常琐事的。这些任务不需要GPU,更依赖CPU的调度能力以及高并发执行小脚本的能力。

不少业界人士相信,CPU的需求还会呈倍数增长。Arm的CEO Rene Hass表示,按出货量计算,CPU的增长速度比预想的更快,他目前无法确定倍数是4、6还是8,但这个数字正在变大。陈葆立则认为,现在还很难说未来CPU和GPU的比例一定会是1:1,但大逻辑已经清晰:要给AI更多任务,而多数任务的执行者,是CPU。

数据中心的“C位”,也在悄无声息地发生变化。资本市场上的表现就很能说明问题:英伟达的股价自2022年底ChatGPT面世后经历了暴涨,而CPU厂商AMD、英特尔,以及CPU设计IP厂商Arm,它们的股价快速拉涨却更多集中在今年——三家公司在年内都已翻倍。

这些迹象只是开始。业界普遍判断,以CPU需求增长为代表的数据中心硬件变迁,可能只是一场更大变革的序曲。智能体将更彻底地改变硬件的运行方式乃至形态。Chris Bergey补充说,支撑AI产业变革,芯片硬件层面的设计复杂度和研发成本都在急剧上升,同时还要面对严苛的功耗限制。当AI成为核心工作负载,系统里的每一类计算单元,都必须尽可能强化AI任务的运行能力。全新的计算硬件,已经崭露头角。

智能体呼唤什么样的硬件?

面向智能体,CPU本身也将变得和以往截然不同。新的工作负载对CPU的效率、能力、核心数都提出了新的要求。

云尖信息副总裁张欢军直言,运行智能体的核心痛点在于“单颗CPU处理业务的能力”——一台设备能承载多少个智能体?每个智能体的运行成本和效率是否足够好?

要承载更多智能体,一个直接的办法就是增加CPU的核数。陈葆立认为,智能体需要更高的CPU核数,其中一些智能体非常适合用核数极多、单核性能要求不高的轻量核处理器来运行。目前,英特尔至强6+已经可以在单个CPU核心上同时运行3到4个处理简单日常工作的智能体。

上周,Arm和英伟达合作推出了RTX Spark个人电脑芯片,搭载了20颗Arm处理器内核,是目前采用统一内存架构的PC产品中CPU核心数最多的产品。Chris Bergey表示,“我们在云端和边缘侧都看到对更多CPU、更高性能的强烈需求。大家真正需要的是更高的CPU密度,也就是更好的能效比。”

在边缘硬件上运行智能体,还面临着一个现实挑战:内存空间有限。创通联达CTO黄小严总结说,智能体已经成为硬件的核心用户,但智能体场景涉及多轮对话,需要长时间记忆,而移动端的内存容量受成本约束,内存紧缺加上算力约束,很容易导致上下文溢出,形成所谓的“AI智力鸿沟”。

芯片厂商已经在探索更多方法来更高效地利用存储空间。英伟达和Arm合作的RTX Spark,采用了Grace CPU、Blackwell RTX GPU加统一内存紧密耦合的方式。Chris Bergey介绍,进入智能体阶段,用户需要高性能GPU与CPU的紧密结合。统一内存让CPU和GPU能完整调用全部DRAM及带宽资源,不再依赖PCIe或CXL等传统传输接口,从而大幅提升CPU与GPU间的传输带宽。这项技术正在推动边缘计算的变革。

英特尔则通过QAT和IAA技术来应对显存和闪存资源紧缺。陈葆立解释,AI运行时,海量的KV Cache需要存储——100万上下文大约等于10G以上的KV Cache,是一笔不小的闪存开销。而QAT技术可以将压缩比做到50%,节省闪存成本。多个智能体同时运行时,IAA则能实时压缩内存数据,以节省内存。

除了内存问题,黄小严还指出,智能体在移动计算设备上不停歇运行,设备必须在省电和高唤醒率之间找到平衡。传统物联网软件架构已经失效,设备需要重构,以便智能体理解和调用。智能体的安全问题也需要新的保障。他们公司为此使用了高通开发工具链,在软硬件和系统平台层面进行了设计,搭建了端侧智能体中间件运行平台。

智能体专用硬件平台兴起

今年初,OpenClaw的爆火带动了Mac Mini这类计算设备的销售——人们买Mac Mini,更多是让智能体在本地运行,而不是自己亲手操作电脑。这可以说是智能体专用设备的雏形。现在,真正为智能体设计的个人计算设备,已经开始出现了。

今年秋季即将上市、搭载RTX Spark芯片的笔记本和台式电脑,将由联想、华硕、Microsoft Surface等厂商推出。英伟达CEO黄仁勋评价这款芯片时表示,它“重新发明了个人电脑的工作方式”。

Arm同样看到了个人电脑行业的巨大改变。Rene Haas说,“PC需求正在分化为两种:一种是续航好、随处可联网,就像一个大号手机加一个键盘,能用来工作;另一种则需要极致性能,能运行智能体、模型或做开发工作。”

Chris Bergey向记者进一步解释,以往的PC从入门级向高性能产品演进,整体架构大致相同,高端机型靠提升主频、扩充核心数、选用更强性能内核来实现迭代。而随着智能体专用硬件平台兴起,对PC市场的区分已经与以往迥然不同。

“用户对这类设备有非常明确的需求,”Chris Bergey说,“PC能7×24小时不间断运行智能体;设备依托高性能硬件,以高吞吐规格运行各类大模型;除了设备采购、供电和网络接入成本外,不产生额外算力费用,模型本地运行,用户隐私数据留存本机。”传统PC一天只使用一小部分时间,而新一代硬件作为本地的Token生成引擎,需要全时段输出算力。

Chris Bergey进一步判断,现在的传统PC还会继续迭代,整机趋向轻薄紧凑,主打便携。而另一类可供智能体使用的设备,便携性会偏弱,适合留在家中不间断运行。两者在外观、摆放结构等物理设计层面也会有明显差异。

高通技术公司(中国)资深产品市场经理朱元堃则认为,个人用户使用AI的方式也在发生根本变化。以往人们以手机为核心使用AI,耳机、眼镜、手表等穿戴设备只是附属连接。未来将转向以AI和用户为中心的多终端体验——AI不再绑定某个具体设备,而是通过多设备灵活协同来服务用户。

一个全新的市场,正在徐徐展开。为智能体设计的硬件,可能才刚刚拉开序幕。

来源:https://www.bestblogs.dev/article/98b27719?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。