游乐游手机版
首页/业界动态/文章详情

小米迄今最强大模型Xiaomi MiMo-V2.5系列开启公测

时间:2026-04-25 14:09
小米MiMo-V2 5系列模型开启公测,Pro版与标准版即将全球开源 就在今天,小米正式宣布,其Xiaomi MiMo-V2 5系列模型已启动公测。更值得关注的是,该系列中的MiMo-V2 5-Pro和MiMo-V2 5模型即将面向全球开源,这无疑为开发者社区和行业应用注入了一股新的活力。 根据官方

小米MiMo-V2.5系列模型开启公测,Pro版与标准版即将全球开源

就在今天,小米正式宣布,其Xiaomi MiMo-V2.5系列模型已启动公测。更值得关注的是,该系列中的MiMo-V2.5-Pro和MiMo-V2.5模型即将面向全球开源,这无疑为开发者社区和行业应用注入了一股新的活力。

根据官方公告,此次发布的MiMo-V2.5系列阵容齐整,涵盖了MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个型号。这一代模型的核心提升点非常明确:推理能力更强、智能体(Agent)运行更稳、上下文处理长度显著增加,同时在指令遵循与模糊指令理解、全模态感知与理解等方面都有长足进步。伴随模型升级的,还有经过优化的Token Plan定价方案。


MiMo-V2.5-Pro:更强的智能体,更长的专注力

可以说,MiMo-V2.5-Pro代表了小米目前最强的模型实力。在通用智能体能力、复杂软件工程以及长程任务处理这些关键维度上,它已经具备了与全球顶尖Agent模型(如Claude Opus 4.6、GPT-5.4)同台竞技的资本,相较于上一代的MiMo-V2-Pro实现了全方位的跃升。

内部测试的结果相当惊人。当MiMo-V2.5-Pro搭配合适的运行框架时,它能够稳定完成单次涉及近千轮工具调用的超长任务链。在智能体场景下的指令遵循能力也有了质的飞跃——不仅能精准捕捉上下文中的隐性要求,还能在超长任务周期内始终保持逻辑的一致性。至此,这款模型已经可以以更高的置信度,去承担那些真正严肃、专业的复杂工作了。


显然,MiMo-V2.5-Pro就是为更高难度、更复杂的任务目标而生的。小米甚至将那些通常需要人类专家花费数天乃至数周才能完成的项目交给它,让它独立跑完全程,而最终交付的质量依然极高。以下是两个颇具说服力的案例:

用Rust实现完整的SysY编译器

这个任务直接源自北京大学《编译原理》课程的核心项目,要求模型使用Rust语言从零开始实现一个完整的SysY编译器,包括词法分析器、语法分析器、抽象语法树(AST)、Koopa IR中间代码生成、RISC-V汇编后端以及性能优化。作为参考,北大本科生完成该项目通常需要数周时间。然而,MiMo-V2.5-Pro仅用时4.3小时,经过672次工具调用就完成了全部工作,并在隐藏测试集上取得了233/233的满分成绩,其高效的生产力价值可见一斑。


它的工作方式并非盲目试错,而是展现了清晰的工程思维:先搭建完整的编译器流水线骨架,再逐层攻克各个模块——Koopa IR部分满分(110/110),RISC-V后端满分(103/103),性能优化部分同样满分(20/20)。首次编译就通过了137/233的测试点,高达59%的冷启动通过率意味着,在运行任何测试之前,其整体架构就已经基本正确。过程中也并非一帆风顺,在第512轮时,一次重构导致lv9/riscv相关测试回退了两个点,但模型能够自行诊断问题、恢复状态并继续推进。

开发一个视频编辑器

仅凭“构建一个视频编辑器Web应用”这样一句简单的指令,MiMo-V2.5-Pro便自主交付了一款功能可用的Web应用。这款应用具备了多轨道时间线、片段裁剪、交叉淡化、音频混合以及导出流程等核心功能。最终生成的代码量达到8,192行,整个过程历经1,868次工具调用,在11.5小时的自主工作中完成。

MiMo-V2.5:越级全模态Agent,百万级上下文

MiMo-V2.5则是为智能体场景而生的原生全模态大模型,它能同时处理视觉、听觉和文本信息,并将理解转化为实际行动。这一次,MiMo-V2.5带来了几个关键升级:

首先,其Agent能力已全面超越前代的MiMo-V2-Pro。在Claw-Eval等权威Agent评测中,MiMo-V2.5的表现已超过MiMo-V2-Pro的水平,能够胜任日常简单任务,同时API调用成本降低了约50%。

其次,在多模态感知能力上,它实现了对MiMo-V2-Omni的全面超越。在跨模态推理、视频理解、图表分析等能力上均有显著提升,在VideoMME、CharXiv、MMMU-Pro等评测中,其表现已逼近甚至超越了业界的顶级闭源模型。


MiMo-V2.5全系列:更高的Token效率

整个MiMo-V2.5系列都对Token效率进行了专项优化,旨在用更少的Token完成更多的工作。

具体来看,在达到相同的Agent基准榜单ClawEval分数的情况下:MiMo-V2.5-Pro相比Kimi K2.6节省了42%的Token消耗;而MiMo-V2.5相比Muse Spark则节省了高达50%的Token。

MiMo-V2.5全系列:如何搭配使用?

面对不同的任务需求,两款模型如何选择?这里有个简单的指南:MiMo-V2.5-Pro专为那些超长、高难度的Agent任务打造;而MiMo-V2.5则能覆盖绝大多数通用Agent场景。此外,MiMo-V2.5支持原生的全模态Agent能力,涵盖图像、音频与视频处理;同时,它具备更高的平均推理速度,能够更迅速地响应对时延敏感的任务。


Token Plan焕新升级

伴随着模型更新,小米也对Token Plan定价方案进行了一系列实质性的优化,旨在为用户提供更灵活、更实惠的选择:

Credits速率更新,更优惠
MiMo-V2.5:1x(消耗1 Token = 1 Credit)
MiMo-V2.5-Pro:2x(消耗1 Token = 2 Credits)
值得注意的是,原先1 Token = 4 Credits的计费方式已被取消。从现在起,Token Plan不再区分256k和1M上下文窗口的Credit倍率,计费方式更加简洁。

夜间专属优惠速率
北京时间每天00:00至08:00,所有模型的Credits消耗速率将在原有基础上再享受8折优惠。

自动续费享折扣
新增了「连续包月」订阅模式。老用户开通自动续费可享受次月7折优惠,新用户则可享受次月77折优惠,均限一次。同时新增「包年」订阅周期,一次订阅即可享受全年88折优惠,此优惠不再与首购或自动续费折扣叠加。

上线福利:Token Plan用户Credits全量重置
所有在截至北京时间4月22日22:00前已购买Token Plan的用户,其账户内的Credits额度将被全部重置清零,并重新开始计算。这相当于给现有用户送上了一份“重新开始”的礼物。


参考

来源:https://www.163.com/dy/article/KR6BJOID0511B8LM.html
上一篇三电机超1000马力、零百2秒内!腾势Z软顶敞篷超跑官图发布 下一篇鼎楷智影 - 鼎楷科技推出的一站式AI全流程视频制作平台
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿