首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
2025模型服务展望:将如何演变为新基础设施?

2025模型服务展望:将如何演变为新基础设施?

热心网友
76
转载
2025-12-30

AI持续狂奔的2025年,大模型API基础设施化,成为最鲜明的注脚。

本月,国际市场调研机构英富曼(Omdia)发布了《2025全球企业级MaaS市场分析》报告:截至2025年10月,OpenAI、谷歌云、火山引擎分别占比31%、19%、15%,三家模型厂商合计占据全球MaaS市场65%的份额。ChatGPT带来的大模型技术变革仅3年,全球MaaS(模型即服务)市场格局初步形成。


Omdia报告中,火山引擎以30万亿日均Tokens调用量位居全球第三,仅次于OpenAI的70万亿和谷歌云的43万亿。

作为全球前三中唯一的中国厂商,火山引擎正在凭借 MaaS 服务在 AI 云市场快速突围。12月29日,火山引擎官宣成为总台春晚独家 AI 云合作伙伴,一并公布了豆包大模型的最新日均调用量,63万亿 Tokens,持续高速增长。

在大模型API成为基础设施的2025年,依旧有“MaaS薄、MaaS市场窄”的声音。2024年之前,没有MaaS这一商业模式,谈品牌忠诚度也还是太早了,用户总是会选择下一个更有性价比的模型服务。

但改变就这么发生了,推出不到600天,豆包大模型的调用量呈指数增长。


据《晚点》,今年火山引擎已实现100%的同比增长,营收超200亿。由于MaaS商业化和模型迭代超预期,火山引擎原来计划于2030年实现的 1000 亿营收目标,又上调了百分之几十。

“MaaS优先”,加速度的600天

更早地意识到MaaS的重要性,火山引擎投入早、投入的精力和资源多。

过去两年,MaaS作为这家公司的第一战略优先级目标,体现在火山引擎全员会上、在员工的OKR里,更体现在具体的销售激励和产品研发上。

2024年5月15日,火山引擎首次推出豆包大模型家族的API服务,通过模型架构、推理框架等技术创新,将主力模型定价从行业的“分计价”拉入“厘计价”时代,降幅高达99.3% 。伴随着更多模型厂商跟进的降价潮,MaaS市场就此迎来“从无到有”般的增长。

2025年2月1日,DeepSeek-R1登陆火山方舟,模型推理服务全面爆发。在部署同一个开源模型的大考中,火山方舟的各项模型部署性能领先,火山引擎也顺势成为市场上吃到最多DeepSeek推理服务红利的云厂商。

IDC报告显示的中国公有云大模型调用量月度环比增长中,显示了这两个关键的增长拐点。可以说,豆包大模型与DeepSeek的爆红,共同催生了中国MaaS市场。


中国公有云大模型调用量月度环比增长中,2024年7月和2025年2月中增长率最高。|来源:IDC

DeepSeek-R1之后,不断迭代的豆包大模型接棒Tokens调用量继续增长。

2025年6月以来,豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、豆包图像编辑模型SeedEdit、豆包语音模型2.0、豆包图像创作模型Seedream4.0、豆包大模型1.8、视频生成模型Seedance 1.5 pro等模型相继发布。每一次模型能力的提升,解锁了更多的应用场景。

伴随模型发布节奏,几乎每3个月,模型调用就会迎来一次更陡峭的增长。

2025年,Token跳动,成为基础设施,越来越多的头部云厂商,把 MaaS 当做业务长期成功的首要指标。在AI应用逐渐渗透的过程里,MaaS成为最大的幕后功臣。

与MaaS市场一同壮大的火山引擎,也顺势进化为“Token跳动”公司,率先迈向AI云。


火山引擎总裁谭待

IDC显示,2025年H1,火山引擎大模型公有云服务扩大到49.2%,中国公有云上每产生的两个tokens就有一个由火山引擎生产。此外,Gartner®发布的2025年度全球《AI应用开发平台魔力象限》中:凭借豆包大模型和火山方舟大模型服务平台 ,火山引擎领跑全球“挑战者”象限。在“执行能力”上,火山引擎位于全球第五、中国第一。

大的模型调用量,才能打磨出更好的模型和Infra

谈及把MaaS当作第一优先级时,谭待曾表示,看长期就会更早意识到MaaS的重要性,比如想想十年后的云跟现在有什么变化,而不是明年。这让火山引擎在中国MaaS市场加起来只有几亿人民币时,坚定执行MaaS战略优先。

2024年5月第一次推出豆包大模型对外服务的发布会上,他表示,“大的使用量,才能打磨出好模型,并且大幅降低模型推理的单位成本。”


豆包大模型家族

换句话说,大模型调用量越大,模型在B端场景的反馈和需求,比如:是否被用起来、哪些场景用得多用得好、哪些场景用不起来等,都可以反映在下一代模型等路线图里,让Seed团队训练出B端场景更加智能的模型。相反,如果是私有化部署,就没有这样的反馈来做真实世界的评测集。

同时,大的模型调用量,也会迭代出更极致的Infra。举例来说,以当前豆包APP日活1亿且免费的前提,决定了其对火山引擎在KV Cache优化上的要求会极其严苛。同时,在大模型平台的性能和工具易用性上,如果不是有非常大的调用量,Infra层面的各种corner case和新需求,甚至也都没有见过,也就不能在2024年5月通过PD分离、xLLM推理框架等方式,降低模型推理价格。

当然,大的模型调用量也会进一步优化MaaS服务的毛利率。对于火山引擎这样体量的调用量来说,MaaS服务已成为增长最快、毛利最高的AI云计算产品。一个可以参照的对象是,今年2月底,DeepSeek最新公布自己推理服务的最高成本利润率可达545%。

用火山引擎,薅字节的“技术羊毛”

如果上述视角是火山引擎选择MaaS份额第一为优先级目标的理由,那么63万亿日均Tokens调用量——用户的用脚投票,则来源于字节跳动的溢出效应。

谭待在媒体报道里讲过最多的一个观察,似乎是火山引擎在B端(企业客户)和C端(个人用户)的极致协同。他常说,字节的 C 端产品有大量用户,会大规模调用模型,能帮火山把服务做好,同时,豆包 App 也帮了不少忙,很多客户都会拿着跟豆包的聊天 Case 找过来,问火山引擎能不能在企业场景中实现类似的效果。企业用好AI,可以先下个豆包感受一下。


以前在ToB行业,做购买决策和开发产品的人不用最终的产品,所以很多ToB产品在流程管理上,比用户体验重要得多。但AI其实会让 ToB 和 ToC 更近一些。有了 AI 之后,动动嘴就能用起来大模型和Agent,产品体验好不好立竿见影,这时候,C端产品体验好就很关键,会给火山引擎带来很大的增益,因为字节跳动对做好产品体验比较擅长,也有洞察。

服务这些“内部客户”的时候,火山引擎知道模型和Infra上的痛点在哪,就能够去不断地提供各种方案。在 AI 的实践上,字节跳动走得更靠前,做了很多Agent,比如豆包就是一个最大的 Agent,即梦也是,字节内部 50 多个业务线在不断尝试。

在谭待看来,最重要的是认知,ToC 和 ToB 的协同有巨大优势,不仅是品牌上的协同优势(豆包APP和豆包大模型),而在于在这个过程中获得的know-how。企业想把 Agent 做好,要找最懂的人来做,火山引擎不仅自己做了,而且把量级做起来了,是做出来的认知。

事实上,作为字节跳动旗下云与AI服务平台,火山引擎自2020年以来通过把字节跳动的数据增长方法论、推荐算法、内容生态等以工具的形式外溢,同时利用抖音对服务器的规模优势外溢低成本、弹性的云服务。2024年,火山引擎发现了自动驾驶、科学计算、大模型等场景,2024年推出了模型训练服务,直到2024年,终于在模型推理服务上迎来新空间。

把能力服务化、商业化是一个过程,大模型时代,火山引擎赶上了好时机,放大了字节跳动的技术溢出。

云计算本质上是规模体系的比拼,目前市场上头部云厂商的崛起,都有庞大的业务体系托举。尤其当大模型技术投入非常大时,如果没有一个能够外溢的业务,很难保持足够的领先,AWS、谷歌、阿里无一例外。

今年6月,字节跳动CEO梁汝波在火山引擎发布会致辞时也曾表示,字节跳动决心做好技术,必须在更大的市场、更多的场景去服务客户,经受市场的检验,才算是真的好。同时,字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。

MaaS第一后,火山引擎的下一步

在12月举办的Force大会媒体群访时,谭待曾表示,MaaS份额第一后,火山引擎的目标依旧是MaaS优先。当前模型服务主要集中在 ToC 行业,比如互联网公司、智能制造、消费电子以及汽车行业,随着模型应用进入更深的领域,以Agent为技术主体的AI云原生成为新需求,对模型和工具也会提出新要求。

他表示,火山引擎致力于降低 AI 应用的门槛,通过更高层次的封装,通过成本优化,加速AI普惠。

在基础的 MaaS(模型即服务)层,追求模型效果越来越好、成本越来越低,同时易用性提升。随着客户需求的推动,用模型 API 需要选模型、调 Prompt,火山引擎推出了Prompt Pilot、Model Router和Responses API,把一些工具内嵌进去,这样应用做起来更简单。

在更底层,火山引擎这个月还推出了模型的推理代工服务。客户可以直接把自己的模型托管在方舟上,像使用豆包模型服务一样方便,不需要自建底层设施。

MaaS 往上是 Agent 开发和Agent运营,随着应用迈向以 Agent 为技术主体,以模型为中心的AI云原生架构正在形成。新架构中,模型是软件的核心,MaaS 是使用模型的最佳方式,同时围绕 Agent 开发和 Agent 运营,云平台和中间件进一步把 Tokens 组装成 Agents,并实现 Agent 和现有工作流、Agent 和 Agent 之间的智能互通。


作为国内率先推出Agent开发、运营全套产品的云厂商,在谭待看来,过去如果模型服务用得很浅,比如只是拿模型做数据打标,模型API 的确随时可换。但如果要做的事情很复杂,比如视频创作时,要把客户画像跟模型结合,针对不同人群创造不同视频,并在里面融入私有数据、特定画风;做完这些模型微调,还要端到端地跑通、把一个 Agent 做好,那还需要身份认证、各种组件。

更进一步,当客户需求更多追求直接能解决问题,把模型串联到一起做一个Agent,把Agent封装为API的新方式出现了。近日,豆包助手API,即梦API都已经通过火山引擎对外提供服务。

就像红杉美国一直在讲10万亿美金的agent市场,从Agent的结果来看,商业逻辑就从tokens调用的IT预算,变成了BPO(人力外包)的角度,市场天花板也就变成全球客服市场有多大、全球开发程序员市场有多大,Agent会把原来的市场扩大很多倍。

来源:https://www.163.com/dy/article/KI232GR60519DDQ2.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenClaw人人养虾接入Matrix平台操作指南
AI资讯
OpenClaw人人养虾接入Matrix平台操作指南

Matrix 是一种开放且去中心化的即时通讯协议,允许用户自主部署私有服务器并接入全球 Matrix 联邦网络。OpenClaw 网关通过集成 Matrix 的 Client-Server API,实现与这一分布式通信生态的无缝对接。 前置准备 在配置 OpenClaw 连接 Matrix 之前,请

热心网友
05.20
阿里官方揭秘欢乐马项目源自ATH郑波团队
AI资讯
阿里官方揭秘欢乐马项目源自ATH郑波团队

周二晚间,AI领域迎来了一则重磅消息。在权威AI评测平台Artificial Analysis的榜单上,一个名为「HappyHorse-1 0」的神秘模型异军突起,一举登顶视频生成能力排行榜,引发了业界的广泛关注与热议。 这一成绩极具含金量。无论是文本生成视频,还是图像生成视频,HappyHorse

热心网友
05.19
世界模型AI直播预约开启引爆人工智能新浪潮
AI资讯
世界模型AI直播预约开启引爆人工智能新浪潮

当AI开始学会“脑补”物理世界的运行规律,并尝试模拟一个动态变化的真实环境时,我们距离那个传说中的通用人工智能(AGI)究竟还有多远? 进入2026年以来,“世界模型”毫无悬念地成为了科技圈最炙手可热的核心议题。它标志着一个关键的范式转变:人工智能正从被动地“感知当下”,迈向主动地对时空与动态变化进

热心网友
05.19
世界模型第二期直播预约AI技术前沿与应用解析
AI资讯
世界模型第二期直播预约AI技术前沿与应用解析

上周三关于“世界模型”的线上沙龙反响空前热烈,这充分表明,从被动感知迈向主动推演,这条被视为实现通用人工智能(AGI)的核心技术路径,正深度吸引着整个AI行业的关注。鉴于持续高涨的讨论热度,我们决定加开一场深度分享会。 那么,这条充满潜力却又极具挑战性的前沿赛道,目前进展到了何种阶段?顶尖的研究者们

热心网友
05.19
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI Agent能力进化平台 水产市场实用技能全解析
AI资讯
AI Agent能力进化平台 水产市场实用技能全解析

水产市场是什么 在AI Agent的生态中,能力共享与协同进化是核心驱动力。水产市场(Seafood Market)正是为OpenClaw框架量身打造的AI Agent能力共享平台。你可以将其理解为AI领域的“应用商店”或“技能交易中心”,旨在实现AI能力的快速流通与组合创新。 目前,平台已集成超过

热心网友
05.24
MeowTXT AI音视频转文字工具 智能识别说话人
AI资讯
MeowTXT AI音视频转文字工具 智能识别说话人

在信息爆炸的时代,高效地将音视频内容转化为可编辑、可检索的文字,已经成为内容创作者、研究者和职场人士的刚需。今天要聊的这款工具——MeowTXT,正是瞄准了这一痛点,它不仅仅是一个简单的转录工具,更是一个集成了智能识别、摘要和翻译的AI生产力平台。 MeowTXT是什么 简单来说,MeowTXT是一

热心网友
05.24
开源AI Agent操作系统OpenFang自动执行完整工作流
AI资讯
开源AI Agent操作系统OpenFang自动执行完整工作流

OpenFang是什么 在AI Agent领域,我们常常面临一个困境:大多数系统仍然停留在“你说一句,它动一下”的被动模式,离真正的自动化还有距离。今天要聊的OpenFang,正是在尝试打破这个局面。它是一个用Rust语言构建的开源Agent操作系统,其核心创新在于引入了“Hands”的概念——你可

热心网友
05.24
腾讯混元开源全模态大模型压缩工具包AngelSlim详解
AI资讯
腾讯混元开源全模态大模型压缩工具包AngelSlim详解

AngelSlim是什么 随着大模型参数规模不断增长,如何实现高效推理与低成本部署已成为开发者面临的核心挑战。腾讯混元团队推出的开源工具包AngelSlim,正是为解决这一难题而生。它是一个面向全模态大模型的综合压缩与加速解决方案,集成了量化、投机采样、稀疏化及知识蒸馏等前沿技术,旨在为各类大语言模

热心网友
05.24
AI音视频转录工具Transcript LOL 智能区分说话人
AI资讯
AI音视频转录工具Transcript LOL 智能区分说话人

在信息过载的数字化时代,音频与视频内容已成为知识传递、创意表达与商业沟通的核心载体。然而,如何将这些宝贵的非结构化媒体资产,高效、精准地转化为可搜索、可分析、可编辑的文本格式,始终是内容创作者、市场研究人员、学者及商务人士的核心痛点。一款强大的AI转录工具,正是打通音视频内容价值闭环、释放生产力潜能

热心网友
05.24