DeepSeek R2模型尚未发布 Kimi K2模型正式推出 VLLM与SGLang获首发支持

时间：2026-06-24 11:50

Kimi K2正式开源：杨植麟的战略抉择与技术创新在DeepSeek引发的行业震荡余波未平之际，Kimi也带来了重大更新。昨日，Moonshot AI正式发布Kimi K2大语言模型，并选择了开源路线。杨植麟显然想通了——与其闭门造车，不如开放共享，让整个AI生态协同发展。 Kimi K2基于混合

Kimi K2正式开源：杨植麟的战略抉择与技术创新

在DeepSeek引发的行业震荡余波未平之际，Kimi也带来了重大更新。昨日，Moonshot AI正式发布Kimi K2大语言模型，并选择了开源路线。杨植麟显然想通了——与其闭门造车，不如开放共享，让整个AI生态协同发展。

Kimi K2基于混合专家架构（MoE），总参数量达1万亿，激活参数32B，支持128K上下文长度。这一规模在开源模型中表现突出，尤其在代码生成、Agent任务和数学推理等高难度场景中，刷新了多项基准测试的最佳成绩（SOTA）。

核心技术创新

MuonClip优化器
K2在训练方法上实现了重要突破，采用自研的MuonClip优化器替代传统Adam。核心思路是通过qk-clip机制有效约束注意力logits的规模。实际效果显著：在15.5T token的训练过程中，损失峰值完全消除，成功解决了大规模模型训练中常见的“训练崩溃”难题。

大规模Agent数据合成
为提升模型的工具使用能力，单纯依靠人工标注效率低下。K2团队构建了覆盖数百个领域、数千个工具的合成数据管线，并利用另一大语言模型进行质量筛选。通过此机制生成的训练样本显著增强了模型的工具调用能力。

通用强化学习框架
另一项值得关注的创新是自评价机制（self-judging）。该机制在可验证任务（如代码、数学）与不可验证任务之间建立奖励关联，让模型自主充当裁判实现泛化。这一方法对提升模型在开放域问题上的表现极具价值。

性能表现

性能数据充分说明了Kimi K2的实力。在多个关键基准测试中，Kimi K2取得了令人瞩目的成绩：

SWE Bench Verified单次尝试准确率：65.8%
Tau2零售场景平均得分：70.6
LiveCodeBench v6 Pass@1：53.7%

这三个指标分别对应代码修复、实际任务执行和实时编程能力，正是当前大模型竞争最激烈且最具价值的应用方向。

开源与部署

本次发布了两套版本：

Kimi-K2-Base：基础预训练模型，适用于科研与定制化场景
Kimi-K2-Instruct：通用指令微调版，开箱即用，针对问答和Agent任务进行了优化

开源协议采用修改版MIT许可，支持商用。vLLM、SGlang等推理引擎已率先支持部署，同时Web端、App和API也已同步上线。感兴趣的开发者可直接下载使用。

来源：https://cloud.tencent.com.cn/developer/article/2695498

DeepSeek

上一篇Cloudflare新实验：爬虫收费将推高AI应用成本 下一篇Perplexity终极野心：一个域名暴露一切

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-27

Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍

坦白说，MCP这波热度来得有点突然。去年11月Anthropic推出的时候，没引起太大波澜；但最近几天，X上几乎所有人都在讨论MCP服务器，大有把它捧成AI应用碘伏者的架势。 MCP（模型上下文协议）是去年11月由Claude的母公司Anthropic推出的一项开放标准协议，目标是为大语言模型与外部

AI教程 · 2026-06-27

凯文凯利万字预言未来十年AI世界发展趋势

凯文·凯利授课现场 1、关于AI的未来图景感谢邀请，有机会跟嘉宾商学的企业家校友们面对面聊聊。大家这次访学行程很硬核——从拉斯维加斯CES到硅谷，接触了不少最新的AI技术和理论。所以今天的分享，想提供一个不太一样的视角：关于AI正在发生什么，以及接下来会发生什么。会用一种叫“情景规划”的方式来展开

AI教程 · 2026-06-27

从Manus到GO-1：AI逐步走进物理世界

2025年3月，中国AI领域投下的重磅冲击波，可不止一枚。Manus通用AI Agent以“全球首款执行级智能体”之姿闪亮登场，紧接着，GO-1通用具身基座大模型宣布开源，扬言要“重新定义人机交互边界”。这两件事，让不少人开始认真琢磨：当AI不再满足于云端聊天，开始伸手触碰物理世界，真正的智能革命，