GPU独领风骚的时代,正在过去
过去两年,要是聊AI硬件,基本绕不开一个名字:GPU。
从大模型训练到推理集群,再到端云算力分配,整个行业都在为GPU份额争得面红耳赤。谁拿到的算力卡多,谁似乎就握住了通往AI未来的门票。这股浪潮,也把英伟达的股价一路推向了新高。
但在COMPUTEX 2026上,英特尔却给出了一个不同的判断——AI的下一阶段,GPU不再是绝对的主角。而这个判断的核心,正是陈立武在主题演讲中反复强调的关键词:Agentic AI,也就是我们常说的智能体。

图源:英特尔
智能体正在改变计算生态
智能体和传统AI的区别,其实挺大的。传统AI用起来更像是“回合制”的问答机器,你问一句,它答一句。而智能体呢?它是要进入真实工作流程的,得自己完成一套“思考—规划—行动—反思”的闭环。换句话说,它要能主动读取数据、调用工具、执行任务,然后检查结果,再根据反馈不断调整下一步。
这也就意味着,AI推理不再是过去那种“一锤子买卖”,而变成了一套持续运行、自我决策和自我推理的系统。算力的运用方式,也因此发生了根本性的改变。所以,英特尔这次最核心的观点就是:Agentic AI会重塑数据中心的算力配比。
目前,在前沿模型的训练阶段,CPU和GPU的比例可以接近1:8,GPU几乎包揽了绝大部分计算压力。但到了智能体推理模式,情况就完全不同了。CPU需要承担起任务编排、工具调用、数据迁移和系统协调等一系列工作,此时CPU与GPU的比例会逐渐走向1:1,甚至需要更高的CPU密度来快速拆解任务。
事实上,当一个智能体不只是生成一段答案,而是需要不断调用模型、工具和外部系统时,它的工作状态就和传统AI截然不同了。英特尔在演讲中就提到过一个数据:与单轮推理相比,一个智能体的Token消耗量最高可以增加1000倍。

图源:英特尔
换句话说,智能体带来的不是简单的推理量增长,而是更复杂、更高频、更碎片化的系统负载。如果把这些负载全都丢给GPU去处理,既低效,又昂贵。
而英特尔此次发布的至强6+处理器,正是基于英特尔18A制程打造,最高搭载288颗能效核,并配备最高576MB三级缓存。它面向云原生、AgenticAI和网络密集型负载需求,能提供更高的能效和更稳定的持续性能。
在英特尔给出的方案中,单个液冷机架占用32U计算空间,就能提供36864个核心;机架功耗约100kW,足以承载高密度的智能体部署。100kW这个数字听起来确实不小,但和过去同等性能的服务器机架相比,功耗已经显著降低了。
而在至强6+之外,还有一个更值得关注的亮点:英特尔对推理架构的重新拆分。
在演讲中,英特尔宣布联合SambaNova、VistaEquityPartners、CambiumCapital等伙伴,正式推出全新的完全解耦推理方案。这个方案运行在VectorCoreCompute智能体云上,由英特尔至强6处理器负责编排与执行,通过SambaNova SN40 RDU负责解码,最后由NVIDIA Blackwell GPU负责预填充。

图源:英特尔
这套新方案就是针对智能体负载专门设计的。过去很多AI系统习惯把推理链路里的大部分工作都交给GPU,但在英特尔的新体系里,CPU、RDU、GPU各司其职,分别承担系统调度、解码、预填充等不同环节。这样一来,每个推理阶段都能在最适合它的硬件上运行,效率自然就上去了。
介绍完至强6+后,前段时间发布的第三代酷睿Ultra处理器也再次登场。它是英特尔AI生态的另一环——端侧AI的核心。在演讲中,英特尔和Perplexity展示的混合式本地服务器,正是基于第三代酷睿Ultra和至强6+云端服务器构建的。

图源:英特尔
这个方案可以根据设备能力和功能特性,在本地与云端之间动态分配工作负载,进一步降低对云端算力的依赖。这也是未来AIPC的理想形态:通过动态分配性能,在降低Token成本的同时,确保任务的即时性和数据隐私性得到保障。
除了PC,第三代酷睿Ultra还继续扩展到了游戏掌机和边缘计算领域。新发布的锐炫G3系列处理器面向掌上游戏设备,基于同代架构进行优化,将在本月晚些时候上市。
从通用到定制,英特尔也想“无处不在”
在通用处理器之外,英特尔这次还强调了定制芯片。这也是陈立武担任英特尔CEO以来,一直在主推的业务方向。
英特尔认为,定制芯片在未来会拥有庞大的市场。随着AI进入不同行业,客户对通用算力的要求会越来越高,但为了追求更高的效率和性能,他们最终会倾向于采用定制芯片来保持自己的竞争力。
在演讲中,英特尔就提到,正与Google合作推出IPU。这类芯片对云服务商提升基础设施性能至关重要。同时,英特尔也与Ericsson等电信客户合作,在全球范围内提供先进的无线基础设施芯片。
这其实是陈立武这场演讲的另一个主题:英特尔不再只靠一颗通用芯片来赢得市场,而是把芯片、系统、软件和行业合作打包成一整套解决方案,并且可以根据不同企业的需求自由定制。目的就是最大化英特尔的优势。

图源:英特尔
从整体布局来看,英特尔其实是在重新定义自己的生态位置:数据中心需要CPU负责智能体编排,推理系统需要异构解耦来降低成本,PC需要本地AI处理隐私和合规问题,边缘与具身智能需要高能效芯片,行业客户则需要定制化芯片。通过满足不同领域、不同链路上的企业需求,英特尔或许会比英伟达还要“无处不在”。
当然,英特尔面前的压力依然很大。NVIDIA在AI翻跟斗和软件生态上的优势仍然明显,AMD也在服务器CPU和AI芯片上持续进攻。英特尔想要把这条路走通,最终还要看18A的量产速度、Xeon6+的机架级方案能否快速落地,以及客户能不能从这套新方案中看到实实在在的收益。
但至少这一次,英特尔的方向比过去更加清晰了。
可以确定的是,随着AI进入智能体时代,竞争早已不再只是单颗芯片的峰值性能对比,而是整个计算系统的协同效率优化。GPU仍然重要,但CPU、边缘设备、本地AI和定制芯片,都会重新变得关键。而英特尔想抓住的,正是这个AI基础设施重新分工的窗口期。
