游乐游手机版
首页/业界动态/文章详情

中国云厂商打响第五场关键战役

时间:2026-05-22 10:27
中国云计算十九年来从硬件虚拟化演进至与AI深度融合,现进入以智能体为核心的第五次变局。行业焦点转向支撑智能体自主运行的Agent-Native架构,强调任务调度、成本与安全。头部厂商通过全栈重构,推动竞争从算力规模转向智力运营能力,以支撑海量智能体高效执行任务,引领数字化新阶段。

自2007年正式起步,中国云计算产业已高速发展近二十年。如今,云计算已渗透至千行百业,成为数字经济的核心引擎。当前,行业正迎来第五次关键变革,其核心驱动力正是智能体(Agent)技术的崛起。

过去十九年,云计算经历了硬件虚拟化、平台化、云原生及与AI深度融合等多个阶段。它不仅是构建统一数字算力底座的基石,更彻底重塑了数字资源的配置方式和价值逻辑,推动中国从消费互联网时代全面迈入产业互联网时代。

云计算的价值定位持续演进:从最初的降低成本,到提升效率,再到赋能业务创新。进入大模型时代,云的角色发生了根本性跃迁——从后台的支撑平台,走向前台的价值创造中心。行业的焦点也从IaaS、PaaS、MaaS,汇聚到一个新的战略高地:智能体基础设施(Agent Infra)。

2026年第二季度起,头部云厂商围绕“智能体基建”的布局已清晰展开。5月13日,百度创始人李彦宏提出,AI时代的核心指标应是“日活智能体数”(DAA),而非传统的日活跃用户数(DAU)。他强调,智能体作为“第二代入口”,其潜力和价值远超聊天机器人,并指出智能体的“自进化”能力是AI发展的关键。

一周后,在2026阿里云峰会上,阿里云智能集团资深副总裁刘伟光明确表示,“云基础设施是智能体时代至关重要的技术基石”,唯有全新的云架构才能满足智能体对稳定性、安全性和即时资源调度的苛刻要求。会上发布的“千问云”,即被定位为“专为智能体而生的全新云服务模式”。

战鼓已然擂响。紧随其后,腾讯云的AI产业应用大会、火山引擎的Force原动力大会也蓄势待发。智能体成为AI增长的新引擎,与之配套的基础设施服务转型,构成了云计算市场当前最核心的叙事主线。

从AI基础设施到“智能体新基建”

回顾过去三年,云计算的核心叙事是“AI原生云”,其本质是“算力优化”——即围绕大模型的训练与推理,提供高并发、大吞吐、低延迟的算力集群,竞争焦点在于集群规模、算力密度和网络性能。

然而,随着智能体开始深入真实业务场景,传统的AI基础设施显露出局限性。行业共识逐渐形成:云计算必须从“服务于模型”转向“服务于智能体”。衡量标准也随之革新,“算力利用率”不再是唯一核心,“智能体任务成功率、执行效率与可控性”成为新的关键绩效指标。

这一点,从头部厂商的技术架构中可见端倪。例如,阿里云将其规划分为两层:一是继续深耕模型训练与推理的AI Native Cloud;二是专为智能体编排、运行与治理打造的Agent Native Cloud。百度则以Agent Infra为核心,提出“芯-云-模-体”全栈架构,将模型即服务(MaaS)升级为“Token工厂”,核心目标是将每一个Token高效转化为可执行的智能体动作。

这场转向的背后,是云计算服务对象的根本性变化:从服务于“由人编写和操作的确定性程序”,转向服务于“能够自主决策、自动执行的智能体”。

传统云服务面向的是负载相对平稳、资源长期占用的确定性任务。而智能体任务则呈现四大特征:生命周期短、负载无规律突发、动态依赖复杂、安全要求高。一个智能体可能秒级启停,也可能7×24小时持续运行,并需要频繁调用各类外部工具和API。这就要求云基础设施的调度逻辑,从粗放的“资源调度”深化为精细的“任务调度”。

李彦宏在2026年百度Create大会上的判断切中要害:“Token消耗量不一定代表终局,DAA才是AI时代的新度量衡”。行业的竞争焦点,正从比拼谁烧的Token多、谁的算力集群大,转向比拼谁能支撑更多智能体稳定、高效地完成实际业务。阿里云也提出了相似观点:“我们正从规模化管理算力,进入规模化管理智力”。两大巨头的共识,宣告了云计算底层逻辑的重构已全面启动。

传统云架构的“水土不服”

云基础设施向“智能体原生”演进并非跟风,而是源于传统架构与智能体的原生需求之间存在根本性错配。这种“水土不服”主要体现在三个方面。

首先,是“算力时代”资源调度模式的失效。智能体的工作负载与传统任务截然不同:其任务多呈“脉冲式”,可能瞬间爆发万倍流量,也可能长期休眠;生命周期极短,多以秒或分钟计;同时状态依赖性强,需持续记忆上下文与工具调用历史。传统云基于“长周期部署、平稳负载”的设计,难以适配这种动态模式。例如,传统容器启动需要分钟级,无法支撑智能体秒级启停的需求;按实例长期计费的模式,也与智能体“短时高负载、长时休眠”的成本结构不匹配。有调研显示,企业自建智能体平台时,仅容器成本一项就常常远超预期。

其次,是成本与效率的矛盾日益突出。大模型推理本身成本高企,而智能体任务往往涉及多轮调用和上下文重复计算,进一步加剧了成本压力。有数据显示,在传统的MaaS服务中,高达约30%的Token消耗在了重复计算上。同时,企业落地智能体时常面临“95%的任务是重复劳动,仅5%涉及核心决策”的现状,传统基建无法有效复用历史计算结果,导致“每次调用都从头算起”,成本居高不下。正如百度执行副总裁沈抖所指出的:“智能体时代,成本不仅是算力成本,更是Token效率成本。”

最后,安全与治理成为绕不过去的关卡。智能体能够自主访问企业核心数据、调用业务系统并执行操作,这带来了全新的风险。传统云安全体系(如账号权限、网络隔离)是基于“人使用软件”的逻辑构建的,难以有效应对智能体的身份认证、细粒度权限控制、行为审计及数据泄露防护需求。例如,一个智能体若误删数据库或泄露客户数据,传统安全工具难以追溯和实时拦截。在多智能体协作场景下,记忆共享、权限隔离与任务冲突等问题,更是现有治理工具的盲区。安全与治理的挑战,已成为许多企业“敢做Demo,不敢规模化量产”的核心顾虑。

趋势已然明朗。李彦宏曾预测,未来全球日活智能体数(DAA)将超过100亿,每个岗位、每个场景都可能由多个智能体协同工作。市场研究机构Gartner则预测,到2028年,33%的企业软件将原生集成智能体能力。面对这一确定性未来,云厂商布局智能体原生基础设施已不是选择题,而是争夺下一轮产业竞争入场券的必答题。

全栈重构:从芯片到产品的系统性革命

应对上述挑战,需要一场从底层硬件到上层产品的系统性革命。目前,阿里云与百度等头部厂商的路径呈现出高度相似性,即基于“芯-云-模-体”的全栈能力进行重构。

其中,最底层的芯片是变革的起点。智能体对芯片提出了“高推理性能、低延迟、高并发、低成本”的综合要求,传统GPU难以完全适配。因此,巨头们纷纷加码自研芯片。阿里云推出了真武M800训推一体AI芯片,配套ICSwitch互联芯片,搭载于磐久AL128超节点服务器。该方案专为智能体推理优化,支持高速网络与大规模集群扩展,旨在解决智能体高并发、短时高负载的算力需求。

百度则持续迭代自研的昆仑芯,其P800版本已能交付万卡级集群,即将上市的256卡天池超节点据称能将推理效率提升50%。昆仑芯深度适配文心大模型,并支持其他主流模型,核心目标是提升Token生产效率,从而降低智能体的调用成本。

除了硬件,在架构层、产品层乃至整体生态能力上,都因智能体的深入而必须调整。例如,阿里云推出的“千问云”被视为一种为智能体而生的新服务模式;百度则通过“Token Factory”的概念,强调将算力转化为智能行动的效率。

这场转向不仅是技术迭代,更将引发深刻的产业变革。其一,尽管成本下降并非立竿见影,但长期看,效率提升将驱动总拥有成本(TCO)的优化。有厂商技术负责人坦言,即使当下为满足客户需求而投入研发看似“亏本”,但从抽象出通用Agent Infra能力、抢占未来生态的角度看,也极具战略价值。

其二,安全与治理能力的完善,将成为企业敢用、愿用的关键。针对智能体的身份认证、权限管理、行为审计和数据隔离等能力,正在被集成到云平台中,以解决企业的核心顾虑。

其三,行业竞争与洗牌将加速。云厂商的商业模式正从“卖算力”向“卖智力服务”演进,智能体的编排、记忆管理、任务执行等能力将成为新的营收增长点。具备全栈能力的巨头已抢占先机,而无法快速跟进的中小厂商可能面临边缘化风险。与此同时,聚焦金融、制造、医疗等垂直领域的解决方案商将迎来新的机遇。

总而言之,云计算的智能体化转向,是一场技术、产业与资本需求的三重共振。它意味着竞争的核心,从比拼“算力规模”转向了比拼“智力运营能力”——即支撑海量智能体高效、安全、稳定运行的综合实力。

对于企业而言,拥抱智能体就是拥抱新的生产力范式。对于云厂商而言,打赢这场智能体基础设施的战争,才能抢占未来十年的产业制高点。从算力到智力,云计算波澜壮阔的下半场,序幕刚刚拉开。

来源:https://36kr.com/p/3819103957422469
上一篇小米2026新品发布会 YU7 GT与17 Max等旗舰亮相 下一篇中小企业如何低成本应用AI技术实现数字化转型
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿