首页 游戏 软件 资讯 排行榜 专题
首页
AI
Kimi 2.6 发布 性能对标Opus 4.6 刷新开源编程模型上限

Kimi 2.6 发布 性能对标Opus 4.6 刷新开源编程模型上限

热心网友
25
转载
2026-05-18

月之暗面正式上线并开源了新一代模型 Kimi K2.6。从最新公布的基准测试成绩来看,其代码能力已经追平甚至超越了GPT-5.4和Opus-4.6,表现相当亮眼。当然,与A厂最新发布的Mythos和Opus-4.7相比,仍存在一定差距。我们先来看一张开源与闭源模型的整体对比图,以便有个直观的印象。

具体到各项主流基准测试,Kimi K2.6 拿下了开源模型中的最佳成绩:HLE(含工具)54.0,SWE-Bench Pro 58.6,SWE-bench 多语言 76.7,BrowseComp 83.2,Toolathlon 50.0,Charxiv(含Python)86.7,Math Vision(含Python)93.2。

图片

目前,该模型已经上线 Kimi.com,用户可以在对话模式与智能体模式中直接体验。对于生产级的编程场景,则可以搭配 Kimi Code 使用。

长周期编程

Kimi K2.6 在长周期编程任务上的能力提升尤为显著。它能够稳定地跨语言(如 Rust、Go、Python)和跨任务类型(如前端开发、DevOps、性能优化)进行泛化,处理复杂、耗时的开发项目。

官方展示了两个颇具说服力的实测案例。

第一个案例是在 Mac(M3 Max)上本地部署 Qwen3.5-0.8B 模型,并用 Zig 语言实现推理优化。整个过程堪称一场“马拉松”:模型共调用工具超过4000次,持续执行超过12小时,经历了14次迭代优化。最终,成功将吞吐量从大约 15 tokens/sec 提升至约 193 tokens/sec,比 LM Studio 快了约20%。

第二个案例则更为硬核:自主重构一个有8年历史的开源金融撮合引擎 exchange-core。这次任务历时13小时,模型遍历了12种不同的优化策略,调用工具逾1000次,并精确修改了超过4000行代码。关键在于,模型并非盲目修改,而是先分析了CPU和内存火焰图,准确定位性能瓶颈后,重新设计了核心的线程拓扑结构(从4ME+2RE调整为2ME+1RE)。成果斐然:中等吞吐量提升了185%(从0.43 MT/s到1.24 MT/s),峰值吞吐量提升了133%(从1.23 MT/s到2.86 MT/s)。

前端生成

在强大的编程能力基础上,Kimi K2.6 在前端界面生成上也迈出了一大步。现在,仅凭简单的提示词,它就能直接生成完整的、带有视觉设计的前端界面。这包括了主视觉(Hero)区块、滚动触发的动态效果、WebGL着色器、GSAP+Framer Motion动画,甚至Three.js三维效果。

更值得一提的是,在图像和视频生成工具的配合下,模型还能生成与界面风格高度统一的配套视觉素材。此外,K2.6的能力已经延伸至轻量级的全栈开发,能够覆盖从用户认证、交互逻辑到数据库操作(如事务记录、会话管理)的完整开发链路。

为了系统评估这方面的能力,月之暗面建立了内部基准测试套件 Kimi Design Bench,分为视觉输入任务、落地页构建、全栈应用开发和创意编程四个类别。与 Google AI Studio 的对比结果显示,Kimi K2.6 在各个类别中均表现良好。

智能体集群

Kimi K2.6 的智能体集群架构在 K2.5 研究预览版的基础上实现了大幅扩展。其中,并发子智能体的数量从100个扩展到300个,协同步骤数也从1500步大幅提升至4000步。

这种规模的集群能够将不同能力的智能体进行组合与调度。例如,将广度搜索与深度研究叠加,或将大规模文档分析与长文写作融合,还能实现多格式内容的并行生成。这意味着,一次自主运行就能输出包含文档、网页、幻灯片、表格等多种形式的完整交付物。

集群还具备一项实用功能:能够将高质量的文件(如PDF、表格、PPT、Word文档)转化为可复用的“技能”。这个过程会保留原始文档的结构和格式特征,方便在后续任务中直接调用和复现。

持续自主运行

Kimi K2.6 为 OpenClaw、Hermes Agent 等智能体提供了底层支持,使其能够实现跨应用、全天候的持续自主运行。

官方分享了一个内部案例:月之暗面的 RL 基础设施团队将一个基于 K2.6 的智能体连续运行了5天。在此期间,该智能体自主处理了监控告警、事故响应和系统运维等一系列任务,完整覆盖了从告警触发到问题解决的全流程。

月之暗面内部的智能体评测套件 Claw Bench 涵盖了编程任务、即时通讯生态集成、信息研究与分析、定时任务管理和记忆调用五个领域。测试数据显示,K2.6 在所有指标上均明显优于 K2.5,尤其在无人监督的持续运行场景中,提升更为突出。

开放智能体生态

在 K2.6 强大的编排能力基础上,月之暗面进一步推出了 Claw Groups(研究预览版)。

Claw Groups 的核心特点是支持异构生态。这意味着,用户可以接入来自任意设备、运行任意模型的智能体。每个智能体都可以携带自己专属的工具、技能和持久化记忆上下文。无论这些智能体是部署在本地笔记本、移动设备还是云端实例,都能无缝接入同一个协作空间。

在这个集群中,K2.6 扮演着动态协调者的角色。它会根据各智能体的技能图谱和可用工具来分配任务,并在某个智能体执行失败或卡住时自动介入,或重新分配任务,或将任务拆解为子任务,从而管理从启动到验收的完整交付生命周期。

目前,月之暗面自身已经在使用 Claw Groups 进行内容生产和发布工作。例如,由 Demo Maker、Benchmark Maker、社媒智能体、视频制作智能体等专项智能体协作,完成端到端的内容生产流程,而 K2.6 则负责整体的统筹协调,确保各智能体之间能够高效共享中间成果。

来源:https://www.51cto.com/article/841256.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

上海电信Token套餐上线:1元享25万额度,话费账单直接支付
科技数码
上海电信Token套餐上线:1元享25万额度,话费账单直接支付

上海电信推出基于Token的算力计费服务,用户可按需购买,1元对应25万额度点,支持调用大模型并可通过话费支付。新用户可获免费体验包,融合套餐用户将享有Token会员权益。该服务通过标准化API支持超过30款主流大模型,便于开发集成。

热心网友
05.17
Minimax abab6.5与Kimi大模型全面对比评测
AI
Minimax abab6.5与Kimi大模型全面对比评测

在实际项目中选择国产大模型时,许多开发者发现MiniMax abab6 5与Kimi K2 5呈现出明显的“能力分化”。两者虽均定位为顶尖模型,但在不同任务场景下的实际表现差异显著。这背后反映了二者在底层架构设计、工程实现路径与优化重心上的根本不同。本文将抛开市场宣传,聚焦编程开发、长文本处理、AP

热心网友
05.17
Kimi AI视频生成风格全解析与创作指南
AI
Kimi AI视频生成风格全解析与创作指南

在视频创作中,找到与内容灵魂契合的视觉风格至关重要。许多创作者都曾面临困境:脑海中有绝佳的创意画面,但可用滤镜要么流于俗套,要么完全偏离预期。值得庆幸的是,当前主流的AI视频生成工具,如Kimi,正深度聚焦于风格化功能,内置了一系列极具辨识度的预设风格库。如果你正在寻找Kimi视频的具体风格选项,以

热心网友
05.17
AI付费率仅0.3% 张予彤解析Kimi技术人才与开源破局之路
科技数码
AI付费率仅0.3% 张予彤解析Kimi技术人才与开源破局之路

月之暗面总裁张予彤指出,全球仅0 3%用户为AI付费,智能规模化仍处黎明前夜。她强调Kimi通过提升Token效率、长上下文及Agent协作,以有限资源实现高效智能产出。开源与社区反馈是突破数据质量瓶颈的关键。AI时代更看重解决未知问题的通用能力、并行工程思维及原创力,鼓励在深度使用中形成认知。

热心网友
05.15
Kimi获20亿美元融资背后鲜为人知的挑战与机遇
业界动态
Kimi获20亿美元融资背后鲜为人知的挑战与机遇

近日,国内AI大模型领域的明星企业“月之暗面”(Kimi)宣布完成新一轮高达20亿美元的融资,公司估值一举突破200亿美元,成为行业瞩目的焦点。巨额资本的注入,标志着公司迈入全新发展阶段,同时也意味着其全球化征程将面临更复杂的挑战与机遇。 那么,这笔关键资金将投向何处?从战略规划来看,其布局主要聚焦

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现
web3.0
比特币巨量流出CEX 24小时超5740枚 市场抄底信号显现

过去24小时全球主要交易所比特币流向分化明显,整体净流出5740 82枚。其中CoinbasePro流出约5457枚,币安、Gemini分别流出1023枚和504枚;而OKX则逆势录得约530枚净流入。

热心网友
05.18
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解
游戏攻略
魔兽世界恶魔的气息任务全流程攻略与完成步骤详解

卡拉赞的“恶魔的气息”任务需向大法师奥图鲁斯领取,随后击败玛克扎尔王子并回提交还。任务奖励包括金币、经验与声望。

热心网友
05.18
魔力宝贝狗洞位置详解与前往路线指南
游戏攻略
魔力宝贝狗洞位置详解与前往路线指南

《魔力宝贝》中“狗洞”即“奇怪的洞窟”,位于亚留特村西南方向黄色传送石处,是12至20级玩家高效练级地点。前往路线为:从法兰城至伊尔村,向北进入哈巴鲁东边洞窟击败“熊男”,穿越后抵达亚留特村,再向西南探索即可找到入口。洞内怪物等级较高,建议携带“风地”属性水晶提升生存能力。

热心网友
05.18
贾跃亭获7000万美元融资 将推进多年造车计划
业界动态
贾跃亭获7000万美元融资 将推进多年造车计划

时隔七年,贾跃亭以CEO身份重掌法拉第未来(FF)帅印,并成功为公司注入了关键的发展动力。近期,FF累计完成了高达7000万美元的机构融资。这笔至关重要的资金,被贾跃亭定位为驱动公司机器人业务实现第一阶段战略目标的“核心粮草”。 随着资金与团队就位,贾跃亭的信心显著增强。他公开立下目标:将用两年时间

热心网友
05.18
原神修复水道任务攻略法沙利亚的狂想曲通关详解
游戏攻略
原神修复水道任务攻略法沙利亚的狂想曲通关详解

任务需修复两条水道。首先跟随指引找到NPC并进入幻境,使用号角对准壁画激活飞鸟幻影,触碰并跟随其路径即可修复第一条水道。第二条水道位于洞xue内,跟随萤火虫找到入口,重复使用号角并借助弹跳水母到达高处,跟随飞鸟完成修复。完成后可获得奖励并推进剧情。

热心网友
05.18