游乐游手机版
首页/科技数码/文章详情

云厂商如何决胜AI底座:三大策略与未来格局

时间:2026-01-23 14:49
作者 | 周智宇编辑 | 张晓玲当全世界还在争论大模型是否只是一个昂贵的“泡沫”时,金山云高级副总裁刘涛表示,这不是泡沫。支持他论断的,是正在发生的“Vibe Coding(沉浸式开发)”热潮——当

作者 | 周智宇

编辑 | 张晓玲

当全世界还在争论大模型是否只是一个昂贵的“泡沫”时,金山云高级副总裁刘涛表示,这不是泡沫。

支持他论断的,是正在发生的“Vibe Coding(沉浸式开发)”热潮——当Claude Code已经可以熟练地用自己写的代码来迭代自身时,机器人造机器人、代码写代码的“奇点”已经真实地触碰到了产业界的脊梁。

面对这个变化,金山云出招了。1月21日,金山云宣布智算平台“金山云星流”全面升级,其不仅包含了覆盖模型全生命周期的训推平台,还正式发布了机器人平台和模型API服务。

这家老牌云服务商正试图通过身份的自我重塑,积极投身这场关于未来生产力主导权的角逐。

过去一年,智算需求持续增长,主要推手已从头部企业的训练需求,悄然转向了推理侧的爆发。

数据非常直观,火山引擎日均Token调用量已冲上50万亿大关;豆包、千问、元宝等模型的外溢需求正以不可思议的速度扩张。这种爆发式的Token消耗,本质上是AI落地现实场景的过程。对于企业而言,大模型不再是PPT里的点缀,而是实打实的降本增效工具。

“我们一直在关注推理什么时候爆发,这种增速超过了过去所有IT基础设施的认知。”金山云助理总裁孙晓感慨道。

在这种背景下,金山云将自己定位为工程化的陪伴者,其逻辑非常纯粹:既然大模型正成为万物互联的“大脑”,那么云厂商就需要提供配套的“循环系统”——稳定、高效且具备极致性价比的Token服务。

金山云走的是一条“任务驱动”的逻辑演进路线。2024年,行业主题是“大规模智算网基础设施建设”,比拼的是对底层异构资源的管理能力。2024年,重点演进为“平台化和Serverless(无服务器计算)”,核心是将资源交付转变为任务交付。而到了2026年,升级后的“金山云星流平台”则锚定了三个核心主题:追求效率提升、构建行业平台、加速推理落地。

这种转变在于,智算时代的训练任务极其脆弱,在大规模算力集群下,任何一点硬件波动都可能导致整个训练任务的中断。为了解决这个“钉子”,金山云自研了一套基于故障感知的自愈技术。

这套系统能针对硬件故障和软硬结合故障进行分级处理。有些故障重启即可,有些则需立即启动替换策略。孙晓透露,这套机制可以实现“秒级感知”和快速处理。这意味着,即便底层硬件出现波动,客户的一轮训练任务也能在不中断的情况下平稳度过。

具身智能,是金山云眼中智算云的“下半场”,也是金山云重点关注的未来。

无论是自动驾驶还是人形机器人,行业目前仍处于一个“混沌场景”中,百花齐放但痛点固化。不同厂商有的关注大脑,有的关注小脑,有的则卡在数据仿真上。

金山云发布的“金山云星流机器人平台”,试图打通从数据采集、存储、标注到模型训练、部署与仿真的全链路闭环。孙晓认为,机器人场景需要解决的是“从算法研发到真实场景部署”的落地难题。

以自动驾驶为例,模型在车端,但训练在云端,这对算力密度的要求或许没那么高,但对显存和多模态点云数据的处理能力要求极高。金山云通过构造闭环的数据平台,让客户能更便捷地接收、处理这些海量数据。

刘涛在展望未来时描绘了一个画面:2026年起,家庭场景机器人将逐步落地。从最初帮老人捡袜子、捡毛巾,到最终辅助生活,这是一个跨度长达5到10年的万亿赛道。而金山云要做的,就是成为这个万亿赛道的“底座”和“引擎”。

随着传统公有云市场进入存量博弈,智算云正带来全新的增长机会。金山云能够在去年三季度实现120%的同比增速,本质上是因为它抓住了这一波生产力重构的机会。

坚持“不做大模型”的承诺,反而让金山云在生态建设上变得极度开放。孙晓坦言,他们的职责是基于开源模型,依托自研技术,提供最稳定、最高性价比的Token服务。业内热门模型一发布,金山云当天就能上线推理服务,这种响应速度在行业内也处前列。

在智算时代,配套产品正在发生剧变。过去是计算、存储、网络,现在则是以推理加速为核心的技术栈(包括引擎、算子优化),以及围绕Agent(智能体)构建的生态。金山云正通过PD分离(预填充和解码分离)以及量化技术,极致压低推理时延,提升吞吐性能。

甚至在某些爆款游戏的背后,金山云也在提供全栈云服务。在重负载、高并发的开服阶段,金山云通过平台化+工程师重保的机制,平稳支撑了海量玩家的涌入。这种从游戏重保中沉淀下来的极限压测经验,正被移植到大模型推理的战场上。

过去十年的云市场,是一场关于资源规模的博弈,云厂商扮演的是类似水电煤的“公用事业”角色。到了2026年,技术端的“内卷”仍将继续。从更大的参数量到更先进的计算方式(如MLA或线性Attention),国内的大模型厂商依然在疯狂追求效率的极限。

但真正的分水岭在于“应用”。视频生成的实用化、VLA模型在车端与机器人端的泛化、以及Agent在老百姓日常生活中的渗透,将让推理需求呈现指数级增长。

智算云的红利期不会永远持续,只有那些能解决极限工程难题、能打通行业数据闭环、能提供极致性价比Token的厂商,才能在潮水退去后依然立于潮头。

“我们已经打下了良好的客户基础,未来3到5年,金山云会有一个显著的变化。”刘涛信心满满。

当智算的齿轮加速转动,这场关乎生产力主导权的竞赛,才刚刚进入最残酷、也最精彩的深水区。

来源:https://www.163.com/dy/article/KJVDKK5805198NMR.html
上一篇微软着手优化PC端Xbox全屏模式体验 下一篇DeepMind CEO惊讶于OpenAI加广告,Gemini暂无此计划
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。