游乐游手机版
首页/科技数码/文章详情

Kimi+K2.5发布,代码能力全面升级:全球最强开源视觉智能体

时间:2026-01-27 17:01
Kimi K2 5 登场 智能体基准评测全球 SOTA:在 HLE 全集(50 2%)和 BrowseComp(74 9%)两大基准测试中取得全球最佳成绩 视觉与代码能力开源 SOTA:在 MMM

全新的 Kimi K2.5 智能体正式亮相

在权威基准测试中展现全球顶尖水准:于 HLE 全集(50.2%)以及 BrowseComp(74.9%)两大核心评测集上,均取得了全球领先的最佳成绩

视觉与代码开源能力达到新高度:不仅在 MMMU Pro(78.5%)和 VideoMMMU(86.6%)等综合性视觉理解评测中表现卓越,更在 SWE-bench Verified(76.8%)等专业代码生成基准上,达到了开源模型中的最佳水平

融合审美在线与创意编程:能够轻松将对话、图片与视频内容,一键转化为兼具动感美学与视觉吸引力的高颜值作品

智能体蜂群功能(Beta 版):支持智能体自主驱动的大规模并行协作。最高可调度 100 个子智能体、完成超过 1500 次工具调用,处理速度相比单智能体模式提升高达 4.5 倍

K2.5 现已正式上线,支持智能对话与智能体双模式交互体验。

K2.5 智能体蜂群高级功能,现面向高阶用户开放测试申请

如需进行专业级代码项目开发,可搭配使用 Kimi Code 专属工具

应用接口平台
技术深度解析
模型权重及代码资源





来源:https://www.163.com/dy/article/KK9SN3B605566VQ3.html
上一篇QuestMobile:AI搜索用户达6.8亿,月活规模趋势解析 下一篇这位院士为何不愿出名?新华访谈揭示学者心声
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宇树验证具身智能新趋势核心战场不止于模型
科技数码 · 2026-07-01

宇树验证具身智能新趋势核心战场不止于模型

具身智能领域的竞争,正步入一个全新的发展阶段。近日,宇树科技正式发布了其WVLA2 0具身大模型,并公开展示了无需远程遥操的实机演示。这一举动向业界释放了一个明确信号:当前这场竞赛的核心壁垒,或许已不再是谁拥有更大的模型参数,而是谁的架构设计更为精巧、谁能更深度地实现软硬件一体化、谁能积累更海量的实

智元精灵G2机器人产线直播完成64828件成功率99.99%
科技数码 · 2026-07-01

智元精灵G2机器人产线直播完成64828件成功率99.99%

99 99%的任务成功率——这是智元机器人在6月23日至28日期间,将精灵G2机器人直接部署到真实的平板量产质检产线,并全程公开直播后,交出的最具说服力的答案。 让我们关注这场直播的硬核数据:连续64小时不间断作业,产线累计完成17625件产品检测,机器人累计执行64828次操作,任务成功率精确达到

纯电动Cayenne首秀保时捷驾驶中心全国路演
科技数码 · 2026-07-01

纯电动Cayenne首秀保时捷驾驶中心全国路演

保时捷正在加速推进其电动化转型战略。继纯电动Cayenne与Gen 3 Evo赛车在三亚街道赛共同亮相后,仅过了一周时间,这款全新纯电SUV便驶入中国专业赛道场景——这一次,地点换成了永久性专业赛道。 回顾2026年北京车展,保时捷首款纯电动Cayenne Turbo正式首发并公布了售价。新车提供两

AI工具能否成为高价志愿咨询纠纷的破局之道
科技数码 · 2026-07-01

AI工具能否成为高价志愿咨询纠纷的破局之道

广东高考成绩公布后,志愿填报这场“第二次大考”随即全面开启。对众多家庭而言,这或许比高考本身更令人心力交瘁——时间紧迫、信息庞杂、选项繁多,每一步都如履薄冰。教育部近日发布预警,严厉批评那些漫天要价的“志愿规划师”,直言其本质上就是忽悠。然而每年踩坑的案例仍屡见不鲜,网上信息真假混杂,不同机构给出的

头部企业全产业链布局锂电池回收循环
科技数码 · 2026-07-01

头部企业全产业链布局锂电池回收循环

近年来,伴随新能源汽车产业的爆发式增长,早期投入使用的动力电池正迎来集中退役高峰,锂电池回收行业因此进入一个至关重要的“窗口期”。这些退役电池中富含锂、钴等珍贵金属资源——尤其是被誉为“白色石油”的锂,正从地下矿藏逐渐转向我们身边的“城市矿山”,从“一次性使用”的线性消耗模式,迈向“循环再生”的可持