首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
AI观察:Agentic AI驱动中国Token出海,算力价格承压上行

AI观察:Agentic AI驱动中国Token出海,算力价格承压上行

热心网友
12
转载
2026-03-09

3月6日,中兴通讯股份有限公司发布2025年度业绩,虽然净利下滑,但是该公司算力业务实现了跨越式增长,全年营收同比增长约150%,该公司表示将持续构建AI端到端能力矩阵,为长期竞争力夯实基础。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

伴随着人工智能产业的快速迭代,应用的持续发展,算力像水一样流淌,中国的算力服务商正迎来一个全新的发展机遇,同时也不得不直面众多不期而遇的挑战。

1月下旬,AI云计算服务商派欧云计算(上海)有限公司 (即PPIO)进入一种特别的“备战”状态。中国人工智能模型的使用占据了全球市场的主导地位。彼时,多家国产大模型厂商密集敲定档期,不约而同地选择春节前后推出新模型。为了保证首发时的算力弹性,作为算力服务商的PPIO,其核心任务是帮助模型厂商兜住不确定的流量冲击。

一方面,模型性能持续提升推动Token消耗量暴涨,另一方面,AI编程、OpenClaw等智能体应用带来了巨大的Token需求增量。清华系国产算力软件企业北京清程极智科技有限公司联合创始人师天麾表示,至少在两三年之内,直接调用API而无须关注底层技术细节的MaaS(模型即服务)还会保持高增长,算力价格正在面临上行压力。

在PPIO联合创始人兼CEO姚欣看来,AI已进入到未来一两年内十倍百倍高速增长的时期,所有没有准备好应对这种增长的行业,短期内都会遇到这种供不应求的情况。但就像水波纹那样慢慢扩散,最终会趋于平稳,产能提升。

Agentic AI爆发推动算力增长

在AI模型聚合平台OpenRouter上,中国人工智能模型的使用占据了主导地位。2月24日公布的数据显示,中国大模型占Token总消耗量的61%,这些模型主要应用于编程和智能体驱动的工作流程。

周度统计数据显示,中国模型的Token总消耗量达5.3万亿,前十大模型总消耗量为8.7万亿Token。该平台使用量排名前三的模型均来自中国。受编程应用场景推动,MiniMax M2.5 Token使用量激增近200%,以单周消耗2.45万亿Token登顶榜首。Kimi K2.5位居第二,消耗1.21万亿Token,智谱GLM-5以7800亿Token消耗量排名第三。

应用重点的结构性转变支撑了Token的消费数据。在OpenRouter上,编程已成为Token消耗的最大应用类别。此外,自主执行多步骤任务的智能体驱动工作流,消耗的Token占该平台输出Token总量的一半以上。

成立于2007年的北京并行科技股份有限公司董事长陈健告诉澎湃科技,算力服务已形成模型训练、推理服务、科学计算三大明确场景,用户需求从算力资源向Token服务转变。其中,推理服务与Token消耗深度绑定,是当前体量最大、增长最快的场景。大模型应用多为输入少、输出多,AI编程则呈现输入输出双高特征,Token消耗量呈指数级增长。

“目前行业共识是,2026年在MaaS领域,Token的需求量至少有十倍增长。”清程极智联合创始人师天麾对澎湃科技表示,模型能力持续提升是Token消耗量暴涨的根本动力,其中又以编程和角色扮演类聊天这两大应用的Token消耗量为大。在AI编程中,模型需处理极长的上下文才能准确编程,开发者要反复与模型沟通、调试、优化,长上下文和高频交互的特点使得编程调用的Token远超普通问答。

而OpenClaw等热点应用的涌现迅速吸引大量用户,推高Token消耗。未来主要的Token消耗量将集中在OpenClaw等智能体应用上。“调用一次智能体实际上是调用了多次MaaS或API(应用程序接口),比如用智能体点外卖,智能体会调用多次API执行任务。”

编程和聊天的算力消耗以Token为计,从更广义的算力消耗来看,以图片数量计价的图片生成,以及以时长和分辨率计价的视频生成,同样消耗大量算力。

云服务是AI落地的“输水管道”。PPIO联合创始人兼CEO姚欣对于算力增长的预期同样乐观,“2024年,模型训练慢慢转向推理,去年推理大爆发,Token成为核心关键词,背后和大量国产开源模型的爆发相关。到今天,无论是OpenClaw还是AI编程,主题都从生成式AI切换到Agentic AI。”

由于“算力需求增长实在太快”,他计划进一步上调今年的企业目标。一个确定性的增长就是AI编程。MiniMax M2.5、Kimi K2.5、智谱GLM-5的AI编程能力基本追平海外半年前的顶尖模型,Token出海的主要消耗几乎是AI编程。

“在海外,我们已经看到的一个趋势是,大家不是因为国内模型的Token便宜而使用它,而是因为足够好用才用它。”这让PPIO在今年春节期间面向海外市场推出Coding Plan,“本质上,大家购买的是智能能力。”

产能不足传导供应链价格整体上涨,配套部件扩产

推理需求持续增长,但在算力供给侧,高性价比的推理显卡产能有限,国内外均稀缺。算力供不应求,提高算力价格是一个合理选择。

今年2月,智谱发布Coding Plan调价公告。“由于GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升”,决定取消首购优惠,保留按季按年订阅优惠,套餐价格整体涨幅自30%起。由于算力供不应求,今年以来,智谱多次对国产芯片集群扩容,并限量发售GLM Coding Plan套餐,招募“算力合伙人”,开放核心技术接口,针对GLM-5的底层优化,提升软硬一体化性能。

随着AI编程等应用的普及,陈健表示,并行科技和Token相关的收入在总营收中的占比正持续提升。Token使用量和生成质量要求同步攀升,推理算力需求持续高涨,算力价格面临上行压力,产业链价值向算力供给和模型优化端集中。算力网络将成为支撑AI应用规模化发展的核心底层基础设施,开发面向Token生成的专用芯片成为产业共识,预计明后两年针对主流模型推理的专用芯片将规模化落地,届时专用芯片将与算力网协同,释放AI应用潜力。

师天麾表示,硬件采购成本日趋透明,国内电力支出相差无几,单纯依靠硬件堆叠难以构筑竞争壁垒,必须在软件技术层面形成差异化优势,以软件技术提升推理效率,降低算力成本,提升利润率。“MaaS的特点就是推理优化的infra技术越强,MaaS利润率越高。”

MaaS通过云端平台将预训练模型封装为可调用服务,用户可通过API直接调用而无须关注底层技术细节,由于所有用户均摊服务器成本,调用一次API的成本仅几分钱。“随着越来越多的企业明确了AI在业务场景中的落地路径,确定了所需的并发处理能力以及对应的服务器规模,今年我们接到的大规模推理性能优化的需求越来越多。”师天麾表示,“比起纯粹租算力,MaaS是一种更好的服务形式。对开发者来说,使用门槛和使用成本更低,至少在两三年之内,MaaS会保持高增长。”

算力成本整体呈上涨趋势,姚欣对此补充了一个“反直觉”视角。今天,限制AI和算力的瓶颈并非最高端的芯片,而是那些普通的IT技术、传统的配套部件。过去十年,内存、硬盘乃至交换机等传统IT基础设施产业链一直保持与全球GDP增速相当的平稳增长,长期稳定的需求预期决定了温和的产能扩张节奏。但人工智能的爆发式增长打破了这一平衡。GPU出货量大增,配套周边部件在这种“拐点式”需求下,供给能力被甩在身后。“高端芯片产能是扩上去了,但其他产能没跟上。当然,这一波大家都被打疼了,所以包括内存硬盘在内的传统部件纷纷扩产。”

姚欣表示,产能扩充只是第一层。当上游部件到位后,中游的机房建设、设备部署等基础设施环节又成为新的堵点,这些物理设施的建设周期天然缓慢。“它就像供应链一样,一层层往上传导。在北美更夸张的是,找到了电力,找到了机房,买到了所有设备,最后施工工人告诉你,排期已经排到16个月、18个月甚至2年以上了。”

AI全球扩散,价格的传导也不再局限于科技领域,大宗商品及基础工业原材料市场同样受到冲击,以铜为代表的金属材料因广泛应用于AI相关的元器件制造,导致需求增加,价格上涨。姚欣表示,AI已经进入“奇点时刻”,“进入到未来一两年内十倍百倍高速增长的时期,所有没有准备好应对这种增长的行业,短期内都会遇到这种供不应求的情况。但就像水波纹那样慢慢扩散,最终会趋于平稳,产能提升,届时全球GDP也能上涨。”

来源:https://www.163.com/dy/article/KNIRD25B0514R9P4.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI时代必懂:揭秘Token,大模型背后的关键计价单位
科技数码
AI时代必懂:揭秘Token,大模型背后的关键计价单位

今日金价,一克1000 06元;95号汽油,每升8块5毛7;电费是阶梯计价,家庭用电最多每千瓦时8毛9;克、升、千瓦时——单位一旦确定,便可以被标注价格,而价格决定了消费,也潜移默化地塑造着每个人的

热心网友
03.29
行业首发:OpenClaw全网刷屏,ClawManager一键收编AI龙虾大军
AI
行业首发:OpenClaw全网刷屏,ClawManager一键收编AI龙虾大军

新智元报道编辑:KingHZ【新智元导读】研究员三个月科研对话记录一夜清零,企业敏感数据公网裸奔……全行业首个企业级OpenClaw服务器部署管理方案ClawManager问世,让OpenClaw真

热心网友
03.29
140万Token之后:中国AI如何从规模领先转向价值跃迁
科技数码
140万Token之后:中国AI如何从规模领先转向价值跃迁

文 | 孙永杰近日,当国家数据局披露“日均Token调用量突破140万亿”的数据时,这个看似技术性的指标,很快被赋予了宏大的意义—中国正在成为AI时代最重要的“算力输出者”。Token(词元)原本只

热心网友
03.29
上海滨江惊进化龙虾,百种虾类上演生存竞争
科技数码
上海滨江惊进化龙虾,百种虾类上演生存竞争

“安装龙虾送Token”“OpenClaw实战应用”“OpenClaw攻防实战”……周六一早,2026全球开发者先锋大会就迎来了汹涌人潮,“龙虾”相关体验区更是人气爆棚,现场一片“百虾大战”的景象。

热心网友
03.29
龙虾养殖为何越养越贵,成本效益如何优化?
科技数码
龙虾养殖为何越养越贵,成本效益如何优化?

前阵子被捧上神坛的OpenClaw,现在已经成了人人喊打的吞金兽。很多人把问题归咎于大模型不够聪明,或者开源项目 Bug 太多。但我们体验一周后,可以明确告诉大家:都不是。核心原因就俩字:错配。龙虾

热心网友
03.28

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

Intel RAID配置与创建超详细步骤指南
电脑教程
Intel RAID配置与创建超详细步骤指南

惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即

热心网友
03.29
CISA警告:F5 BIG-IP漏洞正遭活跃利用,需立即防护
科技数码
CISA警告:F5 BIG-IP漏洞正遭活跃利用,需立即防护

F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实

热心网友
03.29
Helium10插件安装指南:Chrome扩展简单3步搞定
手机教程
Helium10插件安装指南:Chrome扩展简单3步搞定

helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很

热心网友
03.29
85万豪车发动机被4S店偷换,车主6年后维权索赔
编程语言
85万豪车发动机被4S店偷换,车主6年后维权索赔

3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需

热心网友
03.29
幻兽帕鲁帕鲁农场下载安装教程:快速获取与完整指南
游戏攻略
幻兽帕鲁帕鲁农场下载安装教程:快速获取与完整指南

幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统

热心网友
03.29