游乐游手机版
首页/AI教程/文章详情

DeepSeek R2模型尚未发布 Kimi K2模型正式推出 VLLM与SGLang获首发支持

时间:2026-06-24 11:50
Kimi K2正式开源:杨植麟的战略抉择与技术创新 在DeepSeek引发的行业震荡余波未平之际,Kimi也带来了重大更新。昨日,Moonshot AI正式发布Kimi K2大语言模型,并选择了开源路线。杨植麟显然想通了——与其闭门造车,不如开放共享,让整个AI生态协同发展。 Kimi K2基于混合

Kimi K2正式开源:杨植麟的战略抉择与技术创新

在DeepSeek引发的行业震荡余波未平之际,Kimi也带来了重大更新。昨日,Moonshot AI正式发布Kimi K2大语言模型,并选择了开源路线。杨植麟显然想通了——与其闭门造车,不如开放共享,让整个AI生态协同发展。

Kimi K2基于混合专家架构(MoE),总参数量达1万亿,激活参数32B,支持128K上下文长度。这一规模在开源模型中表现突出,尤其在代码生成、Agent任务和数学推理等高难度场景中,刷新了多项基准测试的最佳成绩(SOTA)。

核心技术创新

MuonClip优化器
K2在训练方法上实现了重要突破,采用自研的MuonClip优化器替代传统Adam。核心思路是通过qk-clip机制有效约束注意力logits的规模。实际效果显著:在15.5T token的训练过程中,损失峰值完全消除,成功解决了大规模模型训练中常见的“训练崩溃”难题。

\

大规模Agent数据合成
为提升模型的工具使用能力,单纯依靠人工标注效率低下。K2团队构建了覆盖数百个领域、数千个工具的合成数据管线,并利用另一大语言模型进行质量筛选。通过此机制生成的训练样本显著增强了模型的工具调用能力。

\

通用强化学习框架
另一项值得关注的创新是自评价机制(self-judging)。该机制在可验证任务(如代码、数学)与不可验证任务之间建立奖励关联,让模型自主充当裁判实现泛化。这一方法对提升模型在开放域问题上的表现极具价值。

性能表现

\

性能数据充分说明了Kimi K2的实力。在多个关键基准测试中,Kimi K2取得了令人瞩目的成绩:

  • SWE Bench Verified单次尝试准确率:65.8%
  • Tau2零售场景平均得分:70.6
  • LiveCodeBench v6 Pass@1:53.7%

这三个指标分别对应代码修复、实际任务执行和实时编程能力,正是当前大模型竞争最激烈且最具价值的应用方向。

开源与部署

本次发布了两套版本:

  • Kimi-K2-Base:基础预训练模型,适用于科研与定制化场景
  • Kimi-K2-Instruct:通用指令微调版,开箱即用,针对问答和Agent任务进行了优化

开源协议采用修改版MIT许可,支持商用。vLLM、SGlang等推理引擎已率先支持部署,同时Web端、App和API也已同步上线。感兴趣的开发者可直接下载使用。

Image

Image

来源:https://cloud.tencent.com.cn/developer/article/2695498
上一篇Cloudflare新实验:爬虫收费将推高AI应用成本 下一篇Perplexity终极野心:一个域名暴露一切
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍
AI教程 · 2026-06-27

Claude MCP模型爆火 AI Agent圈万能插头让Cursor工作流效率提升10倍

坦白说,MCP这波热度来得有点突然。去年11月Anthropic推出的时候,没引起太大波澜;但最近几天,X上几乎所有人都在讨论MCP服务器,大有把它捧成AI应用碘伏者的架势。 MCP(模型上下文协议)是去年11月由Claude的母公司Anthropic推出的一项开放标准协议,目标是为大语言模型与外部

凯文凯利万字预言未来十年AI世界发展趋势
AI教程 · 2026-06-27

凯文凯利万字预言未来十年AI世界发展趋势

凯文·凯利授课现场 1、关于AI的未来图景 感谢邀请,有机会跟嘉宾商学的企业家校友们面对面聊聊。大家这次访学行程很硬核——从拉斯维加斯CES到硅谷,接触了不少最新的AI技术和理论。所以今天的分享,想提供一个不太一样的视角:关于AI正在发生什么,以及接下来会发生什么。会用一种叫“情景规划”的方式来展开

从Manus到GO-1:AI逐步走进物理世界
AI教程 · 2026-06-27

从Manus到GO-1:AI逐步走进物理世界

2025年3月,中国AI领域投下的重磅冲击波,可不止一枚。Manus通用AI Agent以“全球首款执行级智能体”之姿闪亮登场,紧接着,GO-1通用具身基座大模型宣布开源,扬言要“重新定义人机交互边界”。这两件事,让不少人开始认真琢磨:当AI不再满足于云端聊天,开始伸手触碰物理世界,真正的智能革命,

Manus AI是通用Agent革命还是精巧缝合怪
AI教程 · 2026-06-27

Manus AI是通用Agent革命还是精巧缝合怪

先说一个基本判断:昨天,Manus至少在中文媒体圈里刷屏了。 自媒体的反应相当狂热,“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样的说法遍地都是。从Benchmark来看,Manus的表现确实亮眼——在GAIA测试中,它超越了此前的各种Agent以及OpenAI的D

Ubuntu从零部署OpenClaw完整教程(本地模型与DeepSeek)
AI教程 · 2026-06-27

Ubuntu从零部署OpenClaw完整教程(本地模型与DeepSeek)

0 前言 OpenClaw(圈内常称“龙虾”)是一套开源、支持自托管的 AI 助手平台,原生兼容 Ollama 本地模型与 DeepSeek 等云端 API,让您在隐私保护与性能体验之间灵活切换——需要安全就用本地,追求强大则上云端。本文记录了我在 Ubuntu 系统上从零搭建 OpenClaw