东吴证券：AI算力需求结构性分化，CPU多核化与需求放量成趋势

时间：2026-01-28 17:10

智通财经APP获悉，东吴证券发布研报称，AI落地方向来到Agent，由“纯对话”转向“执行任务”时，算力需求发生了结构性分化。1)执行控制流CPU化；2)记忆体系去GPU化。进入Agent时代后，C

据智通财经APP了解，东吴证券发布研究报告指出，AI落地的重要方向正转向智能体（Agent）领域。当技术从“纯对话”模式迈向“执行任务”阶段时，算力需求发生了结构性分化。具体体现在：1）执行控制流转向CPU处理；2）记忆体系逐步脱离GPU。随着AI进入Agent时代，CPU侧的工具执行与调度能力，将从GPU的附属角色中解放出来，演变为需要被独立规划与优化的核心资源池。

东吴证券的主要观点如下：

从对话模型到行动智能体

智能体架构重塑了CPU与GPU的分工。市场普遍认为AI算力等同于GPU，CPU仅负责调度。但随着AI落地方向聚焦于智能体，从“纯对话”演进至“执行任务”时，算力需求发生了结构性变化。第一，执行控制流走向CPU化：智能体的行动阶段涉及大量if/else判断与系统调用。主流的Agent架构（如Manus）为每个任务分配一个隔离的云端虚拟机，不同任务在逻辑上高度异构（如网页浏览、代码修改、环境部署等），任务之间虽可并行，但控制流却完全不同。这类分支型任务不适合GPU执行，因为其控制流高度发散会导致算力利用率急剧下降。而这恰恰是CPU微架构长期优化的主战场。第二，记忆体系去GPU化：在智能体场景下，长上下文推理会产生庞大的KV缓存（KV cache），其占用空间随对话轮次与上下文长度线性增长，会快速耗尽GPU的高带宽显存容量。而CPU搭配大容量的DDR5或LPDDR5内存（并可借助CXL协议扩展），用以承载KV缓存与部分模型参数，正成为兼顾吞吐量、可扩展性与成本效率的主流架构选择。

软件基础设施加速落地，CPU多核化与需求放量进入确定性通道

从实验数据复盘来看，CPU已成为制约Agentic AI发展的真实瓶颈。研究显示，在完整的智能体执行链路中，工具处理相关环节（如检索查询、Python/Bash命令执行、Web请求等）在CPU上消耗的时间，占端到端延迟的比例最高可达90.6%。在高并发场景下（当批处理规模提升至128时），CPU造成的端到端延迟从2.9秒跃升至6.3秒以上。该行认为，这一结果揭示出在大规模智能体场景中，系统吞吐量的瓶颈往往并非GPU的计算能力，而在于CPU的核心数量与并发调度问题。由此判断，进入智能体时代后，CPU侧的工具执行与调度能力，将从GPU的附属角色，演变为需要被单独规划与优化的核心资源池。

产业端推进方面

AWS和谷歌云等头部云服务商正在加速建设面向智能体的沙盒环境及软硬件基础设施。它们率先在软件层面强化Agent Sandbox的隔离与编排能力，通过完善运行时与调度体系，为后续CPU侧基础设施的规模化部署奠定基础。与此同时，CPU龙头厂商也在Agent趋势驱动下向超多核架构演进：AMD推出的Turin处理器最高可达192核；Intel的Sierra Forest采用纯能效核设计，核心数可达144甚至288核。该行认为，随着智能体商业化持续推进，厂商必须持续压低每次任务执行的综合成本。在此目标下，超多核CPU凭借更高的并行度、更低的单位功耗，能够支撑大规模、长期运行的智能体执行环境。英伟达也在新架构中提升CPU配比，预示着CPU的重要性正被市场重新评估，契合了智能体的叙事主线。该行认为，NVIDIA主动提升CPU权重，等同于在系统层面确认：在长上下文与高并发智能体场景中，大内存CPU是承载海量KV缓存的最优容器。

投资建议

该行看好海光信息与澜起科技。前者受益于Agentic AI推动CPU从调度角色走向高并发执行的核心算力地位提升；后者受益于长上下文与高并发场景下，由CXL技术驱动的“存力+算力”协同升级。建议关注龙芯中科、万通发展。

风险提示：Agent落地节奏不及预期风险；新型硬件架构替代风险；云服务商资本开支波动风险。

来源：https://www.163.com/dy/article/KKCBEM2E05198UNI.html