先给出几个核心判断。
大模型正在从“你问我答”的被动工具,进化为能够自主规划、主动调用工具并一气呵成完成多步任务的智能体(Agent)。这一趋势听起来令人兴奋,但背后,AI数据中心的基础架构正经历一场深刻变革。

面对智能体数量预期超过200%的爆发式增长,以及由此引发的“内存与闪存焦虑”,数据中心该如何重新构建?未来的AI算力又将如何交付?在英特尔至强6+新品发布会暨数据中心创新日上,一个共识被反复强调:在Agentic AI时代,CPU不再只是GPU的配角,它正重新回归智算中心的核心位置。
算力格局之变:从“GPU独奏”到“CPU指挥的交响乐团”
过去两年,AI数据中心的绝对主角无疑是GPU。但进入Agentic AI时代后,这一局面已彻底扭转。
“前沿AI模型的训练好比一场GPU独奏,然而随着智能体AI的兴起,整个计算平台需要协同作战。这是一场涵盖多种工作负载的真正‘交响乐’。”英特尔公司全球副总裁兼首席市场营销官Brett Hannath比喻道,“CPU的角色,就是这支交响乐团的指挥。”
这种“指挥”作用的凸显,源自智能体工作负载的本质变化。金山云计算研发负责人杨峰点出关键:“在Agent架构中,CPU实际上变成了指挥者和大脑。它需要思考任务如何编排、知识库如何检索、工具如何调用。这些Agent运行的任务,实际上是所有GPU请求的驾驭者。”
算力配比的数据也出现了反转。英特尔市场营销集团副总裁、中国区总经理郭威透露,目前数据中心内CPU与GPU的比例已从去年的1:8、1:4,回升至1:2,未来甚至可能达到1:1。
但这并非简单的单机硬件堆砌。腾讯云计算产品运营总监周驰指出,不要只盯着单台服务器内部的比例,而应放眼全球业务量。他坦言,当前AI应用出现了强烈的“破圈”现象,从开发者扩展到了律师、农民甚至10岁的小朋友。“这种破圈导致大量原本ROI不合算的日常琐碎业务被自动化。这些海量、高并发的小脚本不需要很多GPU,却极度依赖CPU的调度能力。从全球装机量来看,CPU的需求正迎来爆发式增长。”
破解“存储焦虑”:QAT与IAA,打开Agent普及之门的两把关键密钥
智能体在运行过程中需要维持长周期的上下文记忆,这直接导致了KV Cache(键值缓存)容量的指数级飙升。
“以100万Token上下文为例,单个用户的KV Cache就需要近10GB,而且会随用户数线性增长。”新华三集团存储产品线首席产品经理王其勇指出,KV Cache正在驱动存储行业进入新范式,对高端SSD和内存的需求已到了“奇货可居”的地步。
面对昂贵的闪存和内存,如何降低Token的生产成本?英特尔数据中心集团副总裁兼中国区总经理陈葆立给出了破局思路:“机会留给有准备的人。我们多年前布局的QAT(压缩加速)和IAA(内存分析加速)技术,正好成了今天打开Agentic AI普及大门的两把‘金钥匙’。”
英特尔中国区技术部总经理高宇进一步解释:“QAT可以在KV Cache存入SSD前进行硬件级压缩,压缩比至少达到50%,直接砍掉一半的闪存开销;而IAA则对内存数据进行实时硬件级压缩与解压,在不增加加载延迟的前提下,大幅节省宝贵的内存资源。”
这一技术红利已在头部云厂商中落地。阿里云智能集团块存储研发总监谷跃胜分享了实践成果:“在协同优化后,我们使用新的QAT引擎替换了以往的软件压缩,压缩带宽提升了400%,同时减少了75%的通用CPU核数占用。”新华三也顺势推出了AI原生存储X20000,通过自研X Cache推理加速软件,将Token生产效率最高提升了10倍。
商业模式也在变:“Agent as a Service”
当底层算力被重构,云厂商向客户交付AI能力的方式也在发生根本性转变。
周驰提到了腾讯云正在践行的全新商业模式:“未来客户不需要关心需要多大的内存、多少核的CPU。我们推出了to B的ClawPro和to C的LightVela。对企业而言,员工可以一键认领一个Agent;对个人而言,就是领养一只‘虾’。我们屏蔽了底层虚拟机的概念,提供的是包含安全、审计、系统打通在内的完整智能体运行环境。”
这种“Agent as a Service”的模式,对数据安全提出了极高的要求。火山引擎AICC产品研发负责人张尧指出,大模型向云端演进是必然趋势,但隐私数据上云面临合规挑战。为此,火山引擎依托英特尔至强处理器的TDX(可信域扩展)机密计算技术,构建了公有云AI安全底座。“TDX在CPU层面创建受保护的信任域,确保模型权重与用户敏感数据在推理过程中免受窃取,真正实现数据‘可用而不可见’。”
从288核的至强6+能效核处理器,到Crescent Island数据中心GPU,再到E835以太网控制器,英特尔这次展示的不仅是单一芯片的升级,而是涵盖“算力、存力、连接力、保障力”的系统级重塑。
“如果把AI数据中心当作未来世界的超级工厂,它的产出是Token,驱动GPU集群、CPU集群和高性能存储集群这三台机器的,都可以是英特尔至强处理器。”高宇这样总结。
回顾历史,每一次计算架构的变革,都不是一方独大,而是让每一块硬件都找到最合适的位置。这一次,CPU重新站到了聚光灯下。
