阿里云MaaS收入激增15倍,揭秘Token业务规模化增长策略

在AI的竞技场上,Token的争夺战早已超越了单纯的数量比拼,进入了追求“含金量”的新阶段。
一个最新的数据印证了这一点:阿里云MaaS业务的Token收入,在2026年前五个月里增长了惊人的15倍,月度收入已达数亿元级别。这背后最直接的驱动力,指向了一个关键词——Agent。
就在5月20日,阿里云紧锣密鼓地发布了新一代旗舰模型Qwen 3.7 Max等一系列产品。要知道,距离其前代Qwen 3.6 Max的亮相,仅仅过去了一个月。为何如此急切?
原因很直接。自今年2月OpenClaw引爆市场以来,各大模型厂商都开始全力押注Agent,尤其是提升模型的代码生成能力。这场围绕Coding的军备竞赛日趋白热化,阿里必须拿出一款在代码能力上足够能打的模型,以捍卫其MaaS业务的竞争力。用阿里云公共云总裁刘伟光的话说,“未来是Agent Cloud的时代。”
无独有偶,同一天在大洋彼岸的硅谷,Google I/O大会的主题也聚焦于Agent Cloud。从新发布的芯片、模型到应用,几乎所有的产品线都围绕着Agent展开。
一个全球性的AI共识已然清晰:Agent Coding,是当前战局的核心。

狠狠做Agent
阿里云这次发布会的第一个“前菜”,是一个名为“千问云”的独立官网。这可不是一个普通的网站,它是阿里云成立17年来,首次为单一业务线设立的独立官网。其特别之处在于,它的设计初衷并非服务于人类,而是为Agent量身打造。

这个决策源于阿里云内部在2024年底的一个关键判断:未来云计算产品的主要使用者,将逐渐从人类工程师转变为Agent。
回想一下传统的云服务使用流程:开发者需要注册、登录,面对成百上千的产品分类,自己挑选机型、配置网络、开通实例、安装环境、调试API……每一步都需要人类的专业判断,门槛不低。
而“千问云”试图碘伏这一流程。其背后的逻辑是,未来的动线将彻底反转:Agent会首先寻找合适的模型,然后匹配所需的工具和技能,最后才去调度底层的云资源。顺序完全调了个个儿。
一个现实的例子已经发生。在内部代号“龙虾”的项目上线后,阿里云发现,Agent可以在一天内自动完成云计算资源的开通。同样的工作,过去需要人类工程师花费两周时间。刘伟光对此的描述很形象:“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”
官网只是序幕。实际上,阿里云从上层的模型、中间的Infra到底层的芯片,完成了一次围绕Agent的全面重构。
首当其冲的,便是新一代旗舰模型Qwen 3.7 Max的闪电发布。距离上一代发布仅一个月就推出重大升级,其紧迫性可见一斑。
尽管阿里在开源领域积累了深厚的影响力,但相较于国内智谱GLM、Kimi等对手,其旗舰模型并未完全享受到上一轮Agent热潮的最大红利。
因此,Qwen 3.7 Max的推出,被视为阿里在代码能力战场上一次关键的“扳回一城”。
根据目前业界最权威的代码能力基准测试,Qwen 3.7 Max已经追平了DeepSeek的最强版本。而在难度更高的复杂工程任务测试中,它更是拿下了第一的位置。

△Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云
与Qwen 3.6 Max Preview相比,Qwen 3.7 Max最核心的升级在于长周期任务能力的飞跃。这意味着Agent能够自主执行跨越数十小时、涉及上千个步骤的复杂任务,全程无需人类干预。
长程任务能力越强,Agent能独立处理的业务复杂度就越高,人类需要插手的地方就越少。这也正是Claude Code、Gemini Deep Research等顶级Agent产品的核心竞争力所在。
阿里云CTO周靖人举了一个生动的例子:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超过1000次的工具调用,实现了平台关键内核的自我进化,最终将推理速度提升了10倍。
这标志着,模型已经能够像一位经验丰富的工程师那样,独立排查代码中的深层缺陷,或协助开发复杂功能。当然,这一切的实现,也离不开底层芯片和基础设施的适配。
在芯片层面,阿里云新一代训推一体AI芯片“真武M890”以及自研互联芯片ICN Switch 1.0,都被集成到超节点服务器中,专门针对Agent所需的大规模并发场景进行了优化。
目前,阿里平头哥的PPU芯片出货量已超过54万片,并已在“悟空”、“秒悟”等AI应用中提供推理服务。
怎么把Token生意越做越大
Agent的爆发,直接带来了Token消耗量的指数级增长。毕竟,Agent的本质是代码生成,完成一次任务所调用的Token量,往往是普通对话场景的十倍甚至百倍。
于是,围绕Agent的共识,迅速演变为模型市场一场“明牌”战争:谁的模型在Agent场景下被调用得越多,谁就能更快地收割收入。目前的全球最大赢家无疑是Anthropic,据《华尔街日报》报道,其营收预计将在第二季度增长一倍以上,达到109亿美元。

△图源:华尔街日报
阿里云同样是这波红利的受益者。2025年,阿里云全年营收超过1466亿元,其中28.6%的增速主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上进一步透露,包含百炼MaaS平台在内的AI模型与应用服务,其年化经常性收入(ARR)将在6月份季度突破100亿元,并计划在年底达到300亿元。
不过,在这场Token战争中,阿里和字节跳动选择了两种截然不同的路径。
“Token收入主要来自两大块:一块是以Coding为代表的大语言模型,另一块是视频模型。但过去一段时间,很多人把这两个市场的增长混为一谈了,这其实不太准确。”刘伟光特别强调。
字节跳动牢牢占据了视频模型市场。有研究机构测算,自Seedance 2.0爆火后,字节在视频模型市场的日均Token消耗量已占据整个市场的80%。火山引擎曾在2025年底立下“2026年MaaS服务收入超100亿”的目标,而在Seedance 2.0之后,这个目标已经被再次上调。
相比之下,阿里云则将优势押注在大语言模型,尤其是Coding领域。“有开发者的公司,才需要云。所以阿里云现有的存量客户,几乎天然就是Coding的潜在用户。”刘伟光解释道。
2025年底,阿里云曾喊出“拿下2026年AI云市场增量80%”的目标。如今,其业务火力高度集中于Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。”
为了配合这一战略,阿里云甚至调整了销售团队的考核方式——核心不再是比拼谁卖出的Token数量最多,而是看谁卖出的Token“最值钱”。
道理很简单。单纯聊天产生的Token消耗,其单价早已跌至地板价,并非理想的收入来源。
因此,阿里云如今关注一个更关键的指标:模型接入客户核心业务系统的数量。他们希望销售的Token,是被客户用来写代码、做业务决策、跑核心流程的。一旦模型深度嵌入企业的生产流程,Token的消耗量将呈指数级上升,单价更高,客户粘性更强,对应的收入质量也截然不同。
这源于Coding与视频在Token消耗逻辑上的根本差异。视频模型的消耗是一次性的——生成一段视频,任务结束,消耗停止。
而代码场景则是一个自我强化的飞轮:模型写出代码,代码部署成应用,应用在云上运行,运行过程中又需要持续调用模型来优化或生成新代码……循环往复,生生不息。
时至今日,大模型的竞争早已演变为一场系统工程的综合较量。芯片、基础设施与大模型之间的深度耦合,决定了训练和推理的效率;而商业场景的快速落地与验证,则为模型的持续进化反哺智能。
“芯片、模型和云,现在就像三个必须严丝合缝咬合在一起、共同螺旋上升的齿轮。”刘伟光表示。未来的胜负手或许在于,“如果比拼的是每一块芯片都能比竞争对手跑出更多、更高质量的Token,那胜利就属于我们。”
在后续的分享中,刘伟光进一步阐述了阿里云对Agent趋势和Token之战的理解:
1. 云计算的天花板被Agent再度撬开
传统云计算商业模式相对简单,但有个长期痛点:企业IT预算中,用于内部软件开发和人力外包的那部分,云厂商很难触及。现在情况反过来了,这部分预算恰恰是AI Coding能够100%覆盖的。
数据显示,互联网企业的Token支出已占其IT总支出的15%~20%,而传统企业还在5%以下,增长空间巨大。阿里云今年的目标是,在每个客户的收入中,Token收入的占比不低于20%。
以汽车行业为例,过去云厂商能做的主要是ERP上云,后来是智能驾驶算力,再后来是大模型对话。现在,连广告营销都能用AI来做了。汽车行业最大的IT投入领域,正从传统的ERP转向AI。
金融领域也是如此。以前做券商客户,很难切入对方的业务系统,那是专业壁垒很高的领域。现在则是客户主动找上门,因为头部机构的投研、量化、私募等核心业务场景,都必须与大模型深度结合。
可以说,Agent已经成为带动模型市场、乃至盘活存量云市场的最大引擎。因此,Token业务和云业务在阿里云内部是天然绑定的。这也是为什么Coding被定为最重要的方向——它几乎适用于一切(for everything)。
2. Agent天然是云业务的增长飞轮
Token消耗和GPU使用量之间存在换算关系。实际数据揭示了一个有趣的现象:Agent爆发后,每产生100元的GPU推理消耗,往往会同时带动约200元的GPU+CPU云资源消耗。因为Agent生成的应用需要部署、运行、弹性扩容,这些都会消耗额外的云资源。
这意味着,如果一家厂商没有强大的CPU云资源池,就根本无法有效服务这些Agent客户。这也是“Agent Cloud”概念的核心所在——它形成了一个真实的、可闭环的商业增长飞轮。
3. 销售体系需要快速变革
为了抓住机会,阿里云正在为大型客户单独配置纯MaaS销售,让他们与传统的IaaS销售协同作战。即便在一个客户身上出现两三个销售重叠,这个代价也可以接受,核心是绝不能错失市场窗口。
坦白说,在云产业经营太久,每个人都会有思维惯性。过去卖云,市场版图很清晰——客户线下有多少台服务器,迁移上云大概需要多少预算,答案八九不离十。但做MaaS完全不同,进去之后可能发现市场潜力远超想象。而且,MaaS销售需要直接与客户的业务部门甚至CEO对话,而不是传统的IT部门,这本身就是巨大的挑战。
一个有意思的现象是,越传统的企业,有时反而越容易拥抱AI,因为AI实实在在地简化了他们的一些复杂工作。现在,连畜牧行业的企业都在大规模引入AI,这在过去是不可想象的。
4. Token之战:质量重于数量
调用量可以通过简单的对话堆砌出来,但这没有意义。阿里云关注三个更本质的指标:付费Token客户数是否持续增长;客户是否将模型接入核心系统解决刚需;Agent自主完成任务闭环的效率。美国的行业共识也是如此——目标是用最少的Token完成最有效的任务,而不是用更多的Token完成更多的任务。
正因为追求高质量、高价值的Token,MaaS业务从第一天起就应该是一门有利润的生意。目前,阿里云的百炼平台(基础设施)和模型团队紧密协作,每天都在对推理框架进行极致优化。
尽管中国市场目前仍以按量计费为主,但行业的终极目标,无疑是让客户为最终的业务结果和价值付费。
相关攻略
阿里云MaaS业务Token收入前五个月增长15倍,核心驱动力是Agent。阿里云发布专为Agent设计的“千问云”官网及新一代模型Qwen3 7Max,强化代码能力以应对市场竞争。Agent执行复杂任务能大幅提升效率,带动Token消耗与云资源使用。阿里云聚焦高价值Token销售,推动模型嵌入企业核心流程,形成增长飞轮。其目标是将Token收入占比提升至客
最近,硬科技投资圈里有个消息挺有意思。能量桥科技(上海)有限公司完成了新一轮融资,领投方是Monolith砺思资本,中科创星也跟投了。 这家公司什么来头?简单说,他们干的活儿,是给AI数据中心“换血管”。团队在上海,核心成员在高温超导电力系统这个领域,已经摸爬滚打了二十多年。他们最硬核的成绩,是在国
最开始以为,只是一次,不会怎么样 现在,已经回不去了。 还记得第一次让Agent处理合同时,心里想着“就试这一次”。然后是邮件,接着是各种材料,再到活动复盘。如今,一小时处理几十份文档,手都不会抖一下。过去一天的工作量,现在只能算热身,处理总量翻了十倍还觉得不够。最可怕的是,已经完全不记得从前
视频生成领域,正迎来它的“GPT-3 5时刻”。 “创业只能挣到自己认知范围内的钱,认知范围外是一个巨大的陷阱,把我们这帮青蛙陷在井里。”智象未来创始人兼CEO梅涛用这句话,道出了当下AI创业的深层挑战。焦虑的根源往往不是技术或资金,而是认知的边界。如何跳出这口井?他的答案是:持续自我迭代、激发团队
马耳他政府近日宣布了一项颇具开创性的举措:向全体国民提供免费的AI课程,以及为期一年的免费ChatGPT Plus会员订阅。这意味着,这个地中海岛国成为了全球首个将人工智能作为全民基础服务来提供的国家。 这项名为“AI for All”(马耳他语为“AI għal Kulħadd”)的项目,其核心目
热门专题
热门推荐
以太坊基金会成立隐私研究集群,旨在推动私密支付与匿名投票等关键隐私技术的发展。该集群将整合研究资源,探索相关技术的最新趋势与潜在应用,为构建更安全、保护用户数据的去中心化生态系统提供支持。
MetaMask宣布将推出永续合约交易功能,允许用户进行双向开仓交易,覆盖多种加密资产。该功能伴随高波动性与爆仓风险,需谨慎操作。平台计划于十月底启动奖励计划,以吸引用户参与。投资者可通过主流交易平台注册并利用APP查看交易数据,同时需注重仓位管理、止盈止损及资金安全。
Meme币“币安汽车”市值近期大幅上涨,其背后与币圈知名人物贾跃亭的操盘策略密切相关。该现象揭示了当前加密货币市场中Meme币作为一种投机资产的波动性与关注度,反映了市场对特定人物影响力的高度敏感。
访问欧易官网需核对域名,防范钓鱼风险。建议通过官方渠道下载最新版APP。注册后需完成实名认证并绑定安全设备以提升安全。首次购币可通过C2C交易区进行,平台提供担保。此外,平台还提供合约交易、理财及行情分析等功能。新手应从官方渠道入手,逐步完成安全设置与交易。
币安交易所提供官网及移动应用两种访问方式,用户可通过官方渠道下载应用并完成注册,以使用其交易服务。平台支持多种数字资产交易,操作便捷,适合不同需求的投资者。





