1月27日,月之暗面正式发布了其最新的Kimi K2.5模型,并宣布将其开源。与此同时,Kimo智能助手的K2.5版本也已同步上线。用户在正式聊天界面中原有的K2模型已自动切换为更强大的K2.5版本。

月之暗面在介绍中表示,K2.5是其迄今为止最智能的模型,在智能体、代码生成、图像与视频理解以及一系列通用任务上均取得了开源领域顶尖的表现。它也是Kimi迄今功能最全面的模型,采用了创新的原生多模态架构设计,能够同时处理视觉与文本输入,支持思考与非思考两种推理模式,并兼顾对话与自动化任务执行。

在模型定位上,Kimi K2.5被设计为一款通用型多模态模型,能够灵活地在日常对话、复杂逻辑推理和自动化任务执行之间切换,以适应多样化的使用场景。
相较于前代版本,该模型在视觉理解与推理能力上得到了显著增强。用户在与模型交互时,不再局限于文字描述,还可以直接上传图片、截图或屏幕录制内容,由模型进行分析和处理。这一能力被用于辅助理解界面操作、分析文档结构以及还原复杂的交互流程等实际场景。

在编程与软件开发方面,Kimi K2.5延续了K2系列在代码生成领域的技术路线,尤其在前端开发上表现突出,并支持通过截图或录屏视频来理解并复现代码逻辑。
最新演示显示,该模型能够基于自然语言指令生成完整的前端页面代码,并能处理包含动态布局、滚动触发交互等在内的复杂逻辑。同时,结合其视觉能力,Kimi K2.5可以对用户提供的界面录屏进行拆解,分析其背后的交互结构,并生成相应的实现代码。这一功能已在部分API内测用户的应用场景中得到验证,例如在视频动作识别与分析类产品中的使用。

除了单一智能体能力外,Kimi K2.5还引入了全新的“智能体集群”机制。这一机制允许模型在面对复杂任务时,不再以单一智能体形式执行,而是根据任务需求动态生成多个子智能体,并行完成不同的子任务。据最新介绍,智能体集群最多可调度上百个子智能体,并支持上千步的任务执行流程,所有角色分工与任务拆解均由模型在运行过程中自动完成,无需人工预设。在长文本处理与资料整合类任务中,智能体集群已被用于多篇论文的通读、分工撰写与最终汇总,输出结构化的长篇文档。

性能方面,在大规模搜索与复杂任务场景下,相比单一智能体执行方式,智能体集群在完成目标所需的关键步骤数量和整体执行时间上均有所减少。为支持这一能力,团队对强化学习训练基础设施和相关算法进行了重构。目前该功能仍处于Beta测试阶段,计划逐步向更多用户开放。

随Kimi K2.5模型一同发布的,还有月之暗面面向开发者的编程工具Kimi Code。该工具可在命令行环境中运行,并支持与VS Code、Cursor、JetBrains系列IDE以及Zed等主流编辑器集成。

目前,Kimi K2.5模型已在Kimi智能助手、移动端App及其API开放平台上线。普通用户可通过不同模式使用其功能,开发者和企业也可通过API进行调用。


