游乐游手机版
首页/科技数码/文章详情

Kimi最强开源模型K2发布:推理能力超越GPT-5

时间:2025-11-29 18:37
11月7日消息,日前,月之暗面宣布发布Kimi K2Thinking,这是Kimi 迄今能力最强的开源思考模型。目前,该模型已上线kimi com和最新版Kimi手机应用的常规对话模式。据了解,Ki

11月7日消息,月之暗面近日正式发布Kimi K2Thinking,堪称Kimi迄今为止能力最强的开源思考模型。

目前,该模型已在kimi.com网站和最新版Kimi手机应用的常规对话模式中上线。

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

据了解,Kimi K2Thinking原生具备"边思考、边使用工具"的能力,在"人类最终考验"、自主网络浏览能力评估、复杂信息收集推理等多项基准测试中表现达到业界顶尖水准,部分指标超越GPT-5。

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

在智能体搜索、智能体编程、内容创作和综合推理等方面也实现了全面提升。

据介绍,该模型无需人工干预,即可自主实现高达300轮的工具调用和持续稳定的多轮思考能力,从而帮助用户解决更复杂的问题。

"人类最终考验"是一项涵盖100多个专业领域的终极封闭式学术测试。

在允许使用搜索引擎、Python编程、网页浏览工具同等条件下,Kimi K2 Thinking在这项基准评估中取得了44.9%的顶尖成绩。

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

最新演示示例显示,Kimi K2 Thinking经过5轮搜索和推理,结合每轮搜索到的新信息层层深入,最终推导出了正确答案:

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

此外,在复杂搜索和浏览场景中,Kimi K2 Thinking模型同样表现出色。

BrowseComp是由OpenAI发布的一项专门评估AI智能体网络浏览能力的基准测试,其初衷是衡量AI智能体在信息过载环境中展现的坚持性与创造力,即能否像人类研究员一样"刨根问底"。

在这项极具挑战的任务上,人类参与者平均只能达到29.2%的成绩。

Kimi K2 Thinking在这项基准测试中展现出极强的钻研能力,以60.2%的成绩成为新的业界标杆。

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

在长期规划和自主搜索能力的驱动下,Kimi K2 Thinking可借助多达上百轮的"思考→搜索→浏览网页→思考→编程"动态循环,持续地提出并完善假设、验证证据、进行推理,并构建出逻辑一致的答案。

这种边主动搜索边持续思考的能力,使Kimi K2 Thinking能够将模糊且开放式的问題分解为清晰、可执行的子任务。

在最新示例中,Kimi K2 Thinking经过两轮搜索和思考,先根据股票回购的已知信息找到了这家制造快递的公司,然后在美国证券交易委员会的正规网站上找到了股票回购公告信息,得出了准确答案:

Kimi最强开源思考模型 Kimi K2 Thinking发布:推理等超过GPT-5

来源:https://m.mydrivers.com/newsview/1084993.html
上一篇2025 SEMA改装展揭秘:900匹猛兽到千匹途乐Y60改装实况 下一篇任天堂社长谈游戏改编电影:积极拓展影游联动新领域
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
经典燃油马自达MX-5终章将至,纯电能否续写操控传奇
科技数码 · 2026-07-01

经典燃油马自达MX-5终章将至,纯电能否续写操控传奇

在SUV持续升温与电动化转型的双重冲击下,马自达MX-5依然保持着旺盛的生命力。然而,这款经典双座敞篷跑车的燃油时代即将迎来终局。根据马自达澳大利亚分公司负责人维内什·宾迪透露,公司高层已确认全新一代MX-5正处于研发阶段,但这极有可能成为马自达品牌旗下最后一款搭载内燃机的跑车。 现款ND世代MX-

燃油马自达MX-5最后一代纯粹驾驶乐趣即将停产
科技数码 · 2026-07-01

燃油马自达MX-5最后一代纯粹驾驶乐趣即将停产

在跑车市场遭遇SUV热潮与电动化转型的双重冲击下,马自达MX-5这款经典敞篷跑车正站在一个关键的十字路口。据马自达澳大利亚分公司负责人维内什·宾迪透露,公司高层已确认全新一代MX-5正在研发中。但一个令人既期待又感慨的信号是——这很可能成为该系列最后一代搭载内燃机的车型。 现款ND世代MX-5自20

中车大连公司亮相第四届链博会彰显硬核实力
科技数码 · 2026-07-01

中车大连公司亮相第四届链博会彰显硬核实力

近期,一则引发社会广泛关注的新闻事件吸引了各界目光。其中,半岛晨报与39度视频的报道尤为突出,首席记者赵晖深入一线,为公众带来了第一手的现场实况。 事件发生在城市核心繁华区域,涉及多方利益,局面较为复杂。赵晖接到采访任务后,迅速抵达现场,与各方进行了深入交流与采访。凭借敏锐的新闻洞察力和扎实的采编能

全新宝马X5外观大改 取消分段式尾门 创新还是遗憾
科技数码 · 2026-07-01

全新宝马X5外观大改 取消分段式尾门 创新还是遗憾

宝马近期在美国纳什维尔举办了一场备受瞩目的经销商新品品鉴会,一次性展示了宝马、MINI、劳斯莱斯三大品牌的十余款重磅新车。其中,全新一代X5和X7的实车首次向经销商公开亮相,迅速引发了业内对下一代设计语言的热烈讨论。 据现场消息称,新款宝马X5的设计几乎属于推倒重来。车头部分直接移植了与第二代iX3

Syntec Optics获美军下一代AR眼镜光学订单
科技数码 · 2026-07-01

Syntec Optics获美军下一代AR眼镜光学订单

据6月30日消息,高精度光学器件制造商Syntec Optics近日获得一批美军采购订单,具体金额未对外公开。该公司计划对今年年初推出的防弹光学产品线进行模块化升级与产能扩充,目标是为下一代军用AR可穿戴设备提供定制化的光学解决方案。 此次定制的光学镜片,不仅要保护内部精密光学元件免受战场环境损伤,