杨植麟详解Kimi K2.5:平台可分身百个Agents

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作者 | 王兆洋
邮箱 | wangzhaoyang@pingwest.com
没坐在实木茶几前,没坐在沙发里,背景也没有高雅的绿植映衬,月之暗面的CEO杨植麟在视频里站着就发布了Kimi最新的模型K2.5。
而且还是中英文双语的。
“Hi 大家好,我是植麟。”杨植麟说。“K2.5是我们目前最强大的模型,它是一个全能模型,不管是视觉还是文本,对话还是agent,思考还是非思考——所有这些能力,都集中在这一个模型里。重要的是,K2.5是一个开源模型。”
显然,一个疯狂的模型集体更新季到来了。
而即便如此,在诸多新发布的模型之间,月之暗面刚刚最新发布的Kimi K2.5依然区分度明显。
根据Kimi的数据,K2.5在包括HLE、BrowseComp 和 DeepSearchQA等极具挑战性的 agent 评测中取得了当前最佳表现。在编程能力测试上,它在 SWE-bench Verified 上拿到了 76.8 分,缩小了与顶尖闭源模型之间的差距。多项视觉理解评测上也实现了当前最佳效果。

在这些能力指标之外,更重要的是,K2.5是至今为止最能充分展现月之暗面特质的一代模型:
这家公司一直被寄予厚望的是它的算法研究和产品创新能力,而这代更全面的模型充分展示了这家公司在研究和产品设计上很强的少年气。
1
先看看K2.5的几个核心特点:
在模型具体单点的能力上,它终于有了视觉能力,可以基于视觉,包括图片和视频,进行理解和推理。同时它是一个all in one架构的模型,多模态和文本、思考和快速回答、代码和agent能力都统一于一个模型一身。
在月之暗面一直坚信的“模型即产品”思路之下,K2.5这次做了多个很有新意的功能封装。
它把视觉和编码能力结合,把模型追求的few shots甚至zero shot能力直接体现在Kimi的产品上,你可以用更简单的自然语言和更直观的视觉编辑的方式,比如直接给他一个你要的产品的视频,让它拆解后还原复刻,比如直接在生成的UI上圈圈改改,就能完成创作和开发以及修改。
最新给出的一个用视觉能力复刻项目的例子
除了前端设计,伴随K2.5,Kimi还推出了Kimi Code,可以在终端里直接运行,也能集成到 VSCode、Cursor 等主流编辑器中。你可以直接输入图片和视频进行编程辅助,而且它还可以自动发现并将你现有的Skills迁移到新的工作流中。
更亮眼的则是此次发布的但依然在beta阶段的多agent能力。Kimi直接通过产品把模型训练出来的“多agent平行与串行调度能力”封装提供了出来:
当你选择Agent集群模式,模型开始给你打造一个专业团队,100个agent集群可以同时并发,串行+并行来完成复杂任务。根据Kimi介绍,这些专项 agents 本质上都是 K2.5 的“分身”但各自承担不同的角色和子任务。
“没有任何预设的规则,所有的角色分配和任务拆解,都由 K2.5 现场即时决定。”依然是模型通用能力最终大过垂直打造工作流的产品思路。
目前Agent 集群功能正在进行 Beta 测试,部分 Kimi 会员可提前试用,接下来会逐渐推广。
而在这一切的底座上,在模型训练方法以及AI技术演进的方向上杨植麟继续完善着他scale to AGI的路线。
在训练上,Agent集群对模型提出新的要求,Kimi为此重构了强化学习的基建,专门优化了训练算法,以确保它能达到极致的效率和性能。
而从K1.5开始,每一代的模型其实都在Scale一个不同的方向,K1.5 是在 token上继续Scale,到了agent能力增强的K2,重点scale 思考的步骤,而K2.5 则是对agent的规模,也就是多agent的共同协作能力做Scale,进而保持scale的可延续。
“Scaling Out, Not Just Up.”
2
这次K2.5让Kimi变成一个全面的模型,更难得的,是这些背后都有它自己思路清晰的创新思考。
都说scaling law不持续,我就要给你延续下去,而且是一个又一个“新花样”的延续。
而且这些Scale的方向后来也都成为了模型研究界在那一阶段的主流。此次的多agent其实再次把agent swarm摆到了大家面前,这个“agent蜂巢”的概念提了很久,这次Kimi用一个模型来把它展示出来,接下来如何提高高并发、大批量、多样性以及智能“分身”的能力,会成为又一个各大厂商比拼的重点。
在此次的技术报告里,Kimi也着重分享了Agent swarm背后的创新。
K2.5使用了一种并行智能体强化学习(PARL)的方法进行训练,让模型学会自我指导一个多达100个子智能体的蜂群,在最多1500个协调步骤内执行并行工作流。而这个过程里无需预定义角色或手工设计的工作流。
PARL其实包括三个部分,一个可训练的编排智能体,负责拆解任务,“分身”出可并行化的子任务,这些子任务由动态实例化的冻结子智能体执行。
这个训练过程困难重重,比如当你让它们并行后再串联起来时,很可能会发现编排器默认退化为了单智能体执行,于是一切都崩了。Kimi为解决此问题,给PARL采用了分阶段奖励塑形,在训练早期鼓励并行,并逐步将重心转向任务成功。

这一套创新带来很好的效果。在Kimi的内部评估中,Agent Swarm使端到端运行时间缩短80%,并支持更复杂的长周期任务负载。

在广泛搜索场景下,相比单智能体执行,它将达成目标性能所需的最小关键步骤减少3至4.5倍,且节省效果随目标提升而扩展——通过并行化实现高达4.5倍的实际耗时缩减。
同时,在多模态上,它不只是给一个文本模型补上这个能力就完事了,它同样展现了自己对这个能力究竟能给人们带来什么价值的思考。
眼看人们的创造都已离不开AI却又逐渐沦陷在AI味儿的模版化里无暇逃离,它就花大力气去训模型的“美学品味”。
眼看提示词工程正变得越来越悬乎,本该简洁的AI交互里,它(很多时候瞎热闹)的复杂性正被反过来用作一种新的FOMO来源,于是Kimi强化了K2.5的意图理解能力,并且在交互上做文章——
都知道多模态是必备能力,但Kimi觉得它不该是“目的”本身,而应该是一把利刃,加持到Coding的能力上去,这样能让更多人平等的享受AI带来的编程“普惠”红利,不用陷入提示词陷阱里去。
有用户使用K2.5生成的网页 Prompt: Code me a landing page for a gym super good UI/UX single file html css javascript no limit.
Kimi从成立到今天,有一个地方一直没变,就是它是一个最有自己想法的,甚至有时候让人感到充满一股中二气质和热血感的模型公司。
一个很有意思的地方是,当这个多agent调用时,它会给不同agent起名字,在一个案例里,这些agent的名字中二气十足:

比起在榜单上对闭源模型的逼近,其实今天我们更需要的没有被困在某个阶段或是困在原地的模型和公司们,它们能让人看到继续打破一些桎梏往前走的希望,让人看到一些少年气,这真的很重要。

点个“爱心”,再走 吧
相关攻略
今年以来,或许没有比存储芯片更疯狂的市场了。“春节后整个市场的关注度都在车规级芯片。”多位车规级存储芯片分销商告诉21世纪经济报道记者,“涨完一波总要等市场消化,价格站稳了,终端市场才有下一步涨价动
如果把谍战剧比作一场长达数年的“淘汰赛”,那么《前夜》更像是一支不按套路出牌的队伍——它不靠单点爆破,而是把“人心流转”当成主线,从帮派码头一路打到城市命运,最后拼的不是谁更狠,而是谁更清醒。故事最
快科技3月29日消息,据报道,本周美国多家零售商的DDR5内存出现降价,单套最高降幅达100美元。其中海盗船复仇者(VENGEANCE)系列降价最为突出,32GB、6400MHz型号售价从近期峰值4
二刷《白日提灯》才知,段胥与贺思慕前几次见面的含“糖”量有多高?没办法,第一遍光看脸和妆造了,第二遍才开始看剧情和细节。一、尸海初见段胥初见贺思慕时,她正着一袭红衣一脸淡漠的站在尸山旁搬着尸体,两人
风雨廊亭梦已醒—公孙鄞追完《逐玉》,没想到是公孙鄞最让人上头,无论是从形象,台词,还是演员的名字以及演员的性格,他们的适配度都好高。先说剧里。公孙鄞,作为书院山长,出身顶级书香世家,他温润如玉,才德
热门专题
热门推荐
PChome 3月31日消息,OPPO官微官宣,OPPOx哈苏影像新品联合发布会将于4月21日晚19:00在成都举办,Find X9s Pro、Find X9 Ultra等新品将至。据了解,OPPO
小红书网页版登录入口为https: www xiaohongshu com explore,支持扫码、手机号验证码及微信三种登录方式,首页默认瀑布流展示热门笔记,具备多维度内容检
两年前,谢添天发现自己的声音被一款APP“盗”走——用户输入文本,即可用他的音色生成以假乱真的AI声音。维权半年,因举证难度太高,最终以和解和对方致歉了结。两年后,一场大规模的联合发声,将AI盗声侵
来源:央广网3月28日至29日,以“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”为主题的2026中国网络媒体论坛在河南郑州举行。网络媒体因技术而诞生,凭创新而繁荣。面对新一轮科技
当大语言模型与AgenticAI(智能体)从试验场进入企业级生产环境,SaaS行业的底层价值逻辑正面临系统性重估。这一轮变革的核心,正指向“AI CRM 2 0”的全面到来——它不再是传统CRM的功





