游乐游手机版
首页/科技数码/文章详情

AI Agent驱动下,CPU正成为算力新主角,GPU霸权终结?

时间:2026-03-01 15:02
当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为



当全球AI产业的焦点从大模型参数竞赛转向实际应用落地,一个全新的临界点正在到来——Agent生态的爆发式扩张。从Multi-Agent集群协作到“贾维斯”式个人助手,AI正在从被动的对话工具,进化为能够自主规划、执行、反思的智能体。这场变革不仅重新定义了人机交互的边界,更在深刻重塑整个计算体系的底层架构。

爱集微VIP频道近日上线由国金证券撰写的研究报告《AI进入新临界点》。本报告立足于2026年初AI Agent技术的最新进展,以详实数据和前沿技术分析,系统剖析了Agent生态扩张对底层硬件(CPU、存储)需求的深远影响,提出了“CPU可能比GPU更早成为瓶颈”“以存代算”等颠覆性观点,为理解AI从模型研发向实际应用迈进的关键转折提供了权威指引。

欢迎订阅爱集微VIP频道

核心洞察:Agent驱动下的算力重构与存储爆发

一、Agent生态爆发:AI产业进入新临界点

全球Agent生态正迎来爆炸式扩张,成为AI产业发展的核心新趋势。报告通过一系列量化案例揭示了这一趋势的强劲动能:

-Anthropic营收预测与Claude Code表现:预计2026年销售额将达180亿美元(较去年预测增长4倍),2027年达550亿美元;其AI编码助手Claude Code截至2025年11月年化收入已超10亿美元,占当时总年化收入的14%,总年化收入2025年底超过90亿美元。

-Kimi K2.5模型的Agent集群能力:最多可调度100个分身并行工作,可并行处理1500个步骤。典型案例显示,一次性投喂40篇心理学与AI论文,Agent集群自动完成阅读、角色分配、分章节撰写,最终生成几十页专业PDF综述。

-Clawdbot的爆发与形态创新:可接管个人终端几乎所有任务(清空收件箱、发邮件、管理日历、航班值机等),支持WhatsApp、Telegram等平台指令。这一AI助手带火苹果Macmini,谷歌AI产品负责人专门购买一台用于24小时运行;腾讯云、阿里云等已火速提供一键部署服务。

二、算力重构:CPU取代GPU成为第一瓶颈

报告提出重要观点:在Agent驱动的强化学习时代,CPU正取代GPU成为算力第一瓶颈。这一判断建立在四大技术逻辑之上:

逻辑一:Multi-Agent架构引发OS调度压力

Agent遵循“推理 → 执行 → 评估 → 反思”的循环机制,需在思考与行动间频繁切换,导致操作系统上下文切换和进程调度任务激增。同时,代码执行等操作需在隔离的云端沙盒中运行,沙盒的启动、运行与销毁完全依赖CPU算力。

逻辑二:长上下文场景下的KV Cache卸载对CPU的挑战

当上下文长度达8万token时,仅KV Cache就可能消耗数十GB显存,远超GPU HBM容量。业界采用KV Cache Offload技术将数据迁移至CPU内存或SSD,但CPU与GPU间通信带宽远低于GPU内部HBM带宽,且卸载过程需CPU承担繁重调度任务。NVIDIA在2025年9月明确将KV Cache卸载列为解决HBM瓶颈的关键手段。

逻辑三:高并发工具调用带来的CPU算力消耗

英特尔与佐治亚理工学院2025年11月论文《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》数据显示,在五大代表性Agent工作负载中,CPU端工具处理占总延迟的43.8%~90.6%,远高于GPU的LLM推理占比。

吞吐量饱和测试显示,在GPT-OSS-20B模型中,随着Batch Size增加,各Agent工作负载吞吐量增长放缓。以LangChain为例,Batch Size达128时,出现严重的CPU上下文切换瓶颈。能耗对比同样印证CPU角色转变:高并发下CPU能耗已接近GPU(LangChain负载下,Batch Size=128时AMD Threadripper CPU能耗1807 Joules,Nvidia B200 GPU为2307 Joules),表明CPU不再是低能耗配角,而是关键算力单元。

逻辑四:DeepSeek Engram架构推动“以存代算”

DeepSeek Engram架构实现大模型“计算”与“超大规模记忆”的解耦,将千亿参数表存储于CPU内存,仅产生低于3%的额外开销;叠加Anthropic的永久记忆技术,类Engram架构正推动“以存代算”需求提升,倒逼CPU配比与性能升级。这些创新揭示了一个清晰方向:AI产业正从算力堆砌转向系统级优化,CPU与存储的协同将成为下一阶段竞争的关键。

三、存储爆发:Agent规模化应用的核心刚需

Agent的规模化应用正驱动存储需求持续爆发。从技术层面看,LLM推理的Decode阶段以内存访问为主,将KV缓存卸载至NVMe SSD等共享存储,可实现跨节点快速恢复,避免重新预填充的高延迟。

Agentic AI对海量历史数据的持续访问需求,以及边缘端Agent部署带来的数据爆发,将成为存储行业长期增长的核心驱动力。

立即注册爱集微VIP账号

解锁报告全部内容

爱集微VIP频道:您的前沿技术雷达

在技术快速迭代、全球竞争格局瞬息万变的时代,拥有系统、权威、前瞻的信息来源是做出正确决策的前提。爱集微VIP频道致力于打造ICT产业的全球报告资源库,通过“行业报告”“集微咨询”“政策指引”三大板块,为您提供:

-超过2万份深度产业与技术研究报告,持续更新;

-每周新增数百篇前沿分析与技术解读,紧扣脉搏;

-覆盖技术演进、市场动态、产业链布局的多维信息体系。

我们坚持“信息普惠”原则,会员一次订阅即可访问全平台内容,无二次收费,无分级限制。

限时会员通道现已开启,为您的专业决策注入持续动能:

-首月体验价仅需9.9元,以最低成本,超值体验完整服务。

-月卡19.9元,灵活应对短期、高强度的信息需求。

-季卡54.9元,以稳定的节奏,持续把握产业脉搏。

-年卡199元,是长期主义者最具性价比的智囊伙伴。

注册爱集微VIP账号,VIP频道搜索“AI新临界点,AI Agent驱动下CPU正在成为算力新主角”即可进入报告库查看完整内容,深入理解Agent时代算力重构与存储爆发的核心逻辑,为您的战略决策注入权威洞察。

来源:https://www.163.com/dy/article/KMUKJTKG0511RIVP.html
上一篇华为乾崑智驾版31.99万起,问界M9冠军版3月1日开启预订 下一篇小米汽车2月交付量破2万,产能提速背后的战略布局
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南
科技数码 · 2026-06-07

2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南

国补政策一落地,身边不少朋友都开始在盘算换新机。学生党、年轻姑娘、还有那些天天拍短视频的创作者,成了这波购机主力。大家普遍头疼的是:手里预算就那么多,想要颜值、拍照、续航都兼顾,实在不容易。这次我们把vivo几款热门机型真机摸了个遍,结合实验室实测数据,从影像、做工、续航到补贴后到手价,一步步拆解。

SHEIN污染问题与环保管理框架全面解读
科技数码 · 2026-06-07

SHEIN污染问题与环保管理框架全面解读

SHEIN希音环保表现,关键要看这个框架 关注SHEIN希音的环保问题,其实是在探讨一个非常现实的话题:作为一家全球性的时尚零售商,它究竟如何应对服装行业长期面临的环境挑战——资源消耗、库存积压、碳排放、包装与纺织废弃物?如果能够把这些议题梳理清楚,那么对SHEIN希音的整体环保表现,心里也就大致有

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%
科技数码 · 2026-06-07

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%

苹果官方翻新商店再次迎来新品上架。6月5日,据MacRumors报道,美国官网的官方翻新专区悄然上线了三款2025年9月发布的智能手表——Apple Watch Series 11、Apple Watch Ultra 3以及Apple Watch SE 3。这是该系列机型首次通过翻新渠道销售,折扣幅

飞牛fnOS上线OPPO一加相册互联功能
科技数码 · 2026-06-07

飞牛fnOS上线OPPO一加相册互联功能

近日,飞牛 fnOS 发布重要更新:ARM 设备上的飞牛相册迎来大幅升级,其中最受关注的亮点是正式支持 OPPO 和一加设备互联。值得一提的是,此前 X86 平台已实现该功能,此次更新为 ARM 用户补齐了这项实用功能。 具体来说,OPPO 与飞牛之间的互联打通了四个关键场景,每项体验都非常实在:

小米米家植萃系列智能香氛机首发229元支持澎湃智联
科技数码 · 2026-06-07

小米米家植萃系列智能香氛机首发229元支持澎湃智联

米家智能香氛机植萃系列现已正式开售。大家最关心的价格方面,官方建议零售价为299元,而首发优惠价直接降至229元,性价比十足。 这款香氛机的核心亮点在于选用了奇华顿Orpur高端精油,天然植物萃取,气味清新自然,不刺鼻也不显廉价。它提供三种香型:风铃草、红茶、薰衣草,分别对应清甜、醇厚、舒缓的不同风