游乐游手机版
首页/科技数码/文章详情

AI Agent驱动下,CPU正成为算力新主角,GPU霸权终结?

时间:2026-03-01 15:02
当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为



当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为能够自主规划、执行、反思的智能体。这场变革不仅重新定义了人机交互的边界,更在深刻重塑整个计算体系的底层架构。

爱集微VIP频道近日上线由国金证券撰写的研究报告《AI进入新临界点》。本报告立足于2026年初AI Agent技术的最新进展,以详实数据和前沿技术分析,系统剖析了Agent生态扩张对底层硬件(CPU、存储)需求的深远影响,提出了“CPU可能比GPU更早成为瓶颈”“以存代算”等颠覆性观点,为理解AI从模型研发向实际应用迈进的关键转折提供了权威指引。

欢迎订阅爱集微VIP频道

核心洞察:Agent驱动下的算力重构与存储爆发

一、Agent生态爆发:AI产业进入新临界点

全球Agent生态正迎来爆炸式扩张,成为AI产业发展的核心新趋势。报告通过一系列量化案例揭示了这一趋势的强劲动能:

-Anthropic营收预测与Claude Code表现:预计2026年销售额将达180亿美元(较去年预测增长4倍),2027年达550亿美元;其AI编码助手Claude Code截至2025年11月年化收入已超10亿美元,占当时总年化收入的14%,总年化收入2025年底超过90亿美元。

-Kimi K2.5模型的Agent集群能力:最多可调度100个分身并行工作,可并行处理1500个步骤。典型案例显示,一次性投喂40篇心理学与AI论文,Agent集群自动完成阅读、角色分配、分章节撰写,最终生成几十页专业PDF综述。

-Clawdbot的爆发与形态创新:可接管个人终端几乎所有任务(清空收件箱、发邮件、管理日历、航班值机等),支持WhatsApp、Telegram等平台指令。这一AI助手带火苹果Macmini,谷歌AI产品负责人专门购买一台用于24小时运行;腾讯云、阿里云等已火速提供一键部署服务。

二、算力重构:CPU取代GPU成为第一瓶颈

报告提出重要观点:在Agent驱动的强化学习时代,CPU正取代GPU成为算力第一瓶颈。这一判断建立在四大技术逻辑之上:

逻辑一:Multi-Agent架构引发OS调度压力

Agent遵循“推理 → 执行 → 评估 → 反思”的循环机制,需在思考与行动间频繁切换,导致操作系统上下文切换和进程调度任务激增。同时,代码执行等操作需在隔离的云端沙盒中运行,沙盒的启动、运行与销毁完全依赖CPU算力。

逻辑二:长上下文场景下的KV Cache卸载对CPU的挑战

当上下文长度达8万token时,仅KV Cache就可能消耗数十GB显存,远超GPU HBM容量。业界采用KV Cache Offload技术将数据迁移至CPU内存或SSD,但CPU与GPU间通信带宽远低于GPU内部HBM带宽,且卸载过程需CPU承担繁重调度任务。NVIDIA在2025年9月明确将KV Cache卸载列为解决HBM瓶颈的关键手段。

逻辑三:高并发工具调用带来的CPU算力消耗

英特尔与佐治亚理工学院2025年11月论文《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》数据显示,在五大代表性Agent工作负载中,CPU端工具处理占总延迟的43.8%~90.6%,远高于GPU的LLM推理占比。

吞吐量饱和测试显示,在GPT-OSS-20B模型中,随着Batch Size增加,各Agent工作负载吞吐量增长放缓。以LangChain为例,Batch Size达128时,出现严重的CPU上下文切换瓶颈。能耗对比同样印证CPU角色转变:高并发下CPU能耗已接近GPU(LangChain负载下,Batch Size=128时AMD Threadripper CPU能耗1807 Joules,Nvidia B200 GPU为2307 Joules),表明CPU不再是低能耗配角,而是关键算力单元。

逻辑四:DeepSeek Engram架构推动“以存代算”

DeepSeek Engram架构实现大模型“计算”与“超大规模记忆”的解耦,将千亿参数表存储于CPU内存,仅产生低于3%的额外开销;叠加Anthropic的永久记忆技术,类Engram架构正推动“以存代算”需求提升,倒逼CPU配比与性能升级。这些创新揭示了一个清晰方向:AI产业正从算力堆砌转向系统级优化,CPU与存储的协同将成为下一阶段竞争的关键。

三、存储爆发:Agent规模化应用的核心刚需

Agent的规模化应用正驱动存储需求持续爆发。从技术层面看,LLM推理的Decode阶段以内存访问为主,将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,避免重新预填充的高延迟。

Agentic AI对海量历史数据的持续访问需求,以及边缘端Agent部署带来的数据爆发,将成为存储行业长期增长的核心驱动力。

立即注册爱集微VIP账号

解锁报告全部内容

爱集微VIP频道:您的前沿技术雷达

在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。爱集微VIP频道致力于打造ICT产业的全球报告资源库,通过“行业报告”“集微咨询”“政策指引”三大板块,为您提供:

-超过2万份深度产业与技术研究报告,持续更新;

-每周新增数百篇前沿分析与技术解读,紧扣脉搏;

-覆盖技术演进、市场动态、产业链布局的多维信息体系。

我们坚持“信息普惠”原则,会员一次订阅即可访问全平台内容,无二次收费,无分级限制。

限时会员通道现已开启,为您的专业决策注入持续动能:

-首月体验价仅需9.9元,以最低成本,超值体验完整服务。

-月卡19.9元,灵活应对短期、高强度的信息需求。

-季卡54.9元,以稳定的节奏,持续把握产业脉搏。

-年卡199元,是长期主义者最具性价比的智囊伙伴。

注册爱集微VIP账号,VIP频道搜索“AI新临界点,AI Agent驱动下CPU正在成为算力新主角”即可进入报告库查看完整内容,深入理解Agent时代算力重构与存储爆发的核心逻辑,为您的战略决策注入权威洞察。

来源:https://www.163.com/dy/article/KMUKJTKG0511RIVP.html
上一篇华为乾崑智驾版31.99万起,问界M9冠军版3月1日开启预订 下一篇小米汽车2月交付量破2万,产能提速背后的战略布局
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。