游乐游手机版
首页/科技数码/文章详情

智能体AI时代CPU如何重回智算中心核心

时间:2026-06-11 13:28
智能体AI时代,CPU凭借任务调度与编排能力重回数据中心核心。CPU与GPU配比升至1:2,QAT与IAA硬件压缩技术可降低50%闪存开销。云厂商推出“智能体即服务”模式,依赖CPU机密计算保障数据安全。

先给出几个核心判断。

大模型正在从“你问我答”的被动工具,进化为能够自主规划、主动调用工具并一气呵成完成多步任务的智能体(Agent)。这一趋势听起来令人兴奋,但背后,AI数据中心的基础架构正经历一场深刻变革。

Agentic AI时代,CPU如何重回智算中心C位?

面对智能体数量预期超过200%的爆发式增长,以及由此引发的“内存与闪存焦虑”,数据中心该如何重新构建?未来的AI算力又将如何交付?在英特尔至强6+新品发布会暨数据中心创新日上,一个共识被反复强调:在Agentic AI时代,CPU不再只是GPU的配角,它正重新回归智算中心的核心位置。

算力格局之变:从“GPU独奏”到“CPU指挥的交响乐团”

过去两年,AI数据中心的绝对主角无疑是GPU。但进入Agentic AI时代后,这一局面已彻底扭转。

“前沿AI模型的训练好比一场GPU独奏,然而随着智能体AI的兴起,整个计算平台需要协同作战。这是一场涵盖多种工作负载的真正‘交响乐’。”英特尔公司全球副总裁兼首席市场营销官Brett Hannath比喻道,“CPU的角色,就是这支交响乐团的指挥。”

这种“指挥”作用的凸显,源自智能体工作负载的本质变化。金山云计算研发负责人杨峰点出关键:“在Agent架构中,CPU实际上变成了指挥者和大脑。它需要思考任务如何编排、知识库如何检索、工具如何调用。这些Agent运行的任务,实际上是所有GPU请求的驾驭者。”

算力配比的数据也出现了反转。英特尔市场营销集团副总裁、中国区总经理郭威透露,目前数据中心内CPU与GPU的比例已从去年的1:8、1:4,回升至1:2,未来甚至可能达到1:1。

但这并非简单的单机硬件堆砌。腾讯云计算产品运营总监周驰指出,不要只盯着单台服务器内部的比例,而应放眼全球业务量。他坦言,当前AI应用出现了强烈的“破圈”现象,从开发者扩展到了律师、农民甚至10岁的小朋友。“这种破圈导致大量原本ROI不合算的日常琐碎业务被自动化。这些海量、高并发的小脚本不需要很多GPU,却极度依赖CPU的调度能力。从全球装机量来看,CPU的需求正迎来爆发式增长。”

破解“存储焦虑”:QAT与IAA,打开Agent普及之门的两把关键密钥

智能体在运行过程中需要维持长周期的上下文记忆,这直接导致了KV Cache(键值缓存)容量的指数级飙升。

“以100万Token上下文为例,单个用户的KV Cache就需要近10GB,而且会随用户数线性增长。”新华三集团存储产品线首席产品经理王其勇指出,KV Cache正在驱动存储行业进入新范式,对高端SSD和内存的需求已到了“奇货可居”的地步。

面对昂贵的闪存和内存,如何降低Token的生产成本?英特尔数据中心集团副总裁兼中国区总经理陈葆立给出了破局思路:“机会留给有准备的人。我们多年前布局的QAT(压缩加速)和IAA(内存分析加速)技术,正好成了今天打开Agentic AI普及大门的两把‘金钥匙’。”

英特尔中国区技术部总经理高宇进一步解释:“QAT可以在KV Cache存入SSD前进行硬件级压缩,压缩比至少达到50%,直接砍掉一半的闪存开销;而IAA则对内存数据进行实时硬件级压缩与解压,在不增加加载延迟的前提下,大幅节省宝贵的内存资源。”

这一技术红利已在头部云厂商中落地。阿里云智能集团块存储研发总监谷跃胜分享了实践成果:“在协同优化后,我们使用新的QAT引擎替换了以往的软件压缩,压缩带宽提升了400%,同时减少了75%的通用CPU核数占用。”新华三也顺势推出了AI原生存储X20000,通过自研X Cache推理加速软件,将Token生产效率最高提升了10倍。

商业模式也在变:“Agent as a Service”

当底层算力被重构,云厂商向客户交付AI能力的方式也在发生根本性转变。

周驰提到了腾讯云正在践行的全新商业模式:“未来客户不需要关心需要多大的内存、多少核的CPU。我们推出了to B的ClawPro和to C的LightVela。对企业而言,员工可以一键认领一个Agent;对个人而言,就是领养一只‘虾’。我们屏蔽了底层虚拟机的概念,提供的是包含安全、审计、系统打通在内的完整智能体运行环境。”

这种“Agent as a Service”的模式,对数据安全提出了极高的要求。火山引擎AICC产品研发负责人张尧指出,大模型向云端演进是必然趋势,但隐私数据上云面临合规挑战。为此,火山引擎依托英特尔至强处理器的TDX(可信域扩展)机密计算技术,构建了公有云AI安全底座。“TDX在CPU层面创建受保护的信任域,确保模型权重与用户敏感数据在推理过程中免受窃取,真正实现数据‘可用而不可见’。”

从288核的至强6+能效核处理器,到Crescent Island数据中心GPU,再到E835以太网控制器,英特尔这次展示的不仅是单一芯片的升级,而是涵盖“算力、存力、连接力、保障力”的系统级重塑。

“如果把AI数据中心当作未来世界的超级工厂,它的产出是Token,驱动GPU集群、CPU集群和高性能存储集群这三台机器的,都可以是英特尔至强处理器。”高宇这样总结。

回顾历史,每一次计算架构的变革,都不是一方独大,而是让每一块硬件都找到最合适的位置。这一次,CPU重新站到了聚光灯下。

来源:https://www.163.com/dy/article/KV0FH3460514R9OJ.html
上一篇长城五星全链路品控定义葡萄酒品质新标准 下一篇朱雀二号改进型遥六运载火箭成功发射
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。