游乐游手机版
首页/科技数码/文章详情

杨植麟详解Kimi K2.5:平台可分身百个Agents

时间:2026-01-27 19:07
作者 | 王兆洋邮箱 | wangzhaoyang@pingwest com没坐在实木茶几前,没坐在沙发里,背景也没有高雅的绿植映衬,月之暗面的CEO杨植麟在视频里站着就发布了Kimi最新的模型


作者 | 王兆洋
邮箱 | wangzhaoyang@pingwest.com

没坐在实木茶几前,没坐在沙发里,背景也没有高雅的绿植映衬,月之暗面的CEO杨植麟在视频里站着就发布了Kimi最新的模型K2.5。

而且还是中英文双语的。

“Hi 大家好,我是植麟。”杨植麟说。“K2.5是我们目前最强大的模型,它是一个全能模型,不管是视觉还是文本,对话还是agent,思考还是非思考——所有这些能力,都集中在这一个模型里。重要的是,K2.5是一个开源模型。”

显然,一个疯狂的模型集体更新季到来了。

而即便如此,在诸多新发布的模型之间,月之暗面刚刚最新发布的Kimi K2.5依然区分度明显。

根据Kimi的数据,K2.5在包括HLE、BrowseComp 和 DeepSearchQA等极具挑战性的 agent 评测中取得了当前最佳表现。在编程能力测试上,它在 SWE-bench Verified 上拿到了 76.8 分,缩小了与顶尖闭源模型之间的差距。多项视觉理解评测上也实现了当前最佳效果。


在这些能力指标之外,更重要的是,K2.5是至今为止最能充分展现月之暗面特质的一代模型:

这家公司一直被寄予厚望的是它的算法研究和产品创新能力,而这代更全面的模型充分展示了这家公司在研究和产品设计上很强的少年气。

1

先看看K2.5的几个核心特点:

在模型具体单点的能力上,它终于有了视觉能力,可以基于视觉,包括图片和视频,进行理解和推理。同时它是一个all in one架构的模型,多模态和文本、思考和快速回答、代码和agent能力都统一于一个模型一身。

在月之暗面一直坚信的“模型即产品”思路之下,K2.5这次做了多个很有新意的功能封装。

它把视觉和编码能力结合,把模型追求的few shots甚至zero shot能力直接体现在Kimi的产品上,你可以用更简单的自然语言和更直观的视觉编辑的方式,比如直接给他一个你要的产品的视频,让它拆解后还原复刻,比如直接在生成的UI上圈圈改改,就能完成创作和开发以及修改。

最新给出的一个用视觉能力复刻项目的例子

除了前端设计,伴随K2.5,Kimi还推出了Kimi Code,可以在终端里直接运行,也能集成到 VSCode、Cursor 等主流编辑器中。你可以直接输入图片和视频进行编程辅助,而且它还可以自动发现并将你现有的Skills迁移到新的工作流中。

更亮眼的则是此次发布的但依然在beta阶段的多agent能力。Kimi直接通过产品把模型训练出来的“多agent平行与串行调度能力”封装提供了出来:

当你选择Agent集群模式,模型开始给你打造一个专业团队,100个agent集群可以同时并发,串行+并行来完成复杂任务。根据Kimi介绍,这些专项 agents 本质上都是 K2.5 的“分身”但各自承担不同的角色和子任务。

“没有任何预设的规则,所有的角色分配和任务拆解,都由 K2.5 现场即时决定。”依然是模型通用能力最终大过垂直打造工作流的产品思路。

目前Agent 集群功能正在进行 Beta 测试,部分 Kimi 会员可提前试用,接下来会逐渐推广。

而在这一切的底座上,在模型训练方法以及AI技术演进的方向上杨植麟继续完善着他scale to AGI的路线。

在训练上,Agent集群对模型提出新的要求,Kimi为此重构了强化学习的基建,专门优化了训练算法,以确保它能达到极致的效率和性能。

而从K1.5开始,每一代的模型其实都在Scale一个不同的方向,K1.5 是在 token上继续Scale,到了agent能力增强的K2,重点scale 思考的步骤,而K2.5 则是对agent的规模,也就是多agent的共同协作能力做Scale,进而保持scale的可延续。

“Scaling Out, Not Just Up.”

2

这次K2.5让Kimi变成一个全面的模型,更难得的,是这些背后都有它自己思路清晰的创新思考。

都说scaling law不持续,我就要给你延续下去,而且是一个又一个“新花样”的延续。

而且这些Scale的方向后来也都成为了模型研究界在那一阶段的主流。此次的多agent其实再次把agent swarm摆到了大家面前,这个“agent蜂巢”的概念提了很久,这次Kimi用一个模型来把它展示出来,接下来如何提高高并发、大批量、多样性以及智能“分身”的能力,会成为又一个各大厂商比拼的重点。

在此次的技术报告里,Kimi也着重分享了Agent swarm背后的创新。

K2.5使用了一种并行智能体强化学习(PARL)的方法进行训练,让模型学会自我指导一个多达100个子智能体的蜂群,在最多1500个协调步骤内执行并行工作流。而这个过程里无需预定义角色或手工设计的工作流。

PARL其实包括三个部分,一个可训练的编排智能体,负责拆解任务,“分身”出可并行化的子任务,这些子任务由动态实例化的冻结子智能体执行。

这个训练过程困难重重,比如当你让它们并行后再串联起来时,很可能会发现编排器默认退化为了单智能体执行,于是一切都崩了。Kimi为解决此问题,给PARL采用了分阶段奖励塑形,在训练早期鼓励并行,并逐步将重心转向任务成功。


这一套创新带来很好的效果。在Kimi的内部评估中,Agent Swarm使端到端运行时间缩短80%,并支持更复杂的长周期任务负载。


在广泛搜索场景下,相比单智能体执行,它将达成目标性能所需的最小关键步骤减少3至4.5倍,且节省效果随目标提升而扩展——通过并行化实现高达4.5倍的实际耗时缩减。

同时,在多模态上,它不只是给一个文本模型补上这个能力就完事了,它同样展现了自己对这个能力究竟能给人们带来什么价值的思考。

眼看人们的创造都已离不开AI却又逐渐沦陷在AI味儿的模版化里无暇逃离,它就花大力气去训模型的“美学品味”。

眼看提示词工程正变得越来越悬乎,本该简洁的AI交互里,它(很多时候瞎热闹)的复杂性正被反过来用作一种新的FOMO来源,于是Kimi强化了K2.5的意图理解能力,并且在交互上做文章——

都知道多模态是必备能力,但Kimi觉得它不该是“目的”本身,而应该是一把利刃,加持到Coding的能力上去,这样能让更多人平等的享受AI带来的编程“普惠”红利,不用陷入提示词陷阱里去。

有用户使用K2.5生成的网页 Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.

Kimi从成立到今天,有一个地方一直没变,就是它是一个最有自己想法的,甚至有时候让人感到充满一股中二气质和热血感的模型公司。

一个很有意思的地方是,当这个多agent调用时,它会给不同agent起名字,在一个案例里,这些agent的名字中二气十足:


比起在榜单上对闭源模型的逼近,其实今天我们更需要的没有被困在某个阶段或是困在原地的模型和公司们,它们能让人看到继续打破一些桎梏往前走的希望,让人看到一些少年气,这真的很重要。


点个“爱心”,再走 吧

来源:https://www.163.com/dy/article/KKA1S14P0511N33R.html
上一篇理想汽车回应关闭百家门店传闻 下一篇微软VibeVoice-ASR系统:60分钟长音频智能转写,一步到位
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。