游乐游手机版
首页/科技数码/文章详情

一月一更!小米发布MiMo-V2.5系列大模型,雷军:继续进步!

时间:2026-04-23 14:43
小米大模型“一月一更”:MiMo-V2 5系列发布,智能体赛道再提速 4月23日消息,距离3月18日那场一口气发布三款自研大模型的发布会,仅仅过去了36天。就在4月22日深夜,小米再度出手,正式推出了新一代的MiMo-V2 5系列大模型。这个系列阵容不小,涵盖了MiMo-V2 5、V2 5-Pro、

小米大模型“一月一更”:MiMo-V2.5系列发布,智能体赛道再提速

4月23日消息,距离3月18日那场一口气发布三款自研大模型的发布会,仅仅过去了36天。就在4月22日深夜,小米再度出手,正式推出了新一代的MiMo-V2.5系列大模型。这个系列阵容不小,涵盖了MiMo-V2.5、V2.5-Pro、V2.5-TTS Series和V2.5-ASR四款模型。

其中,旗舰型号MiMo-V2.5-Pro和通用型号MiMo-V2.5,将于近期面向全球开源。同时,小米也预告了V2.5-TTS Series和V2.5-ASR即将推出。这种“一月一更”的迭代节奏,业界称之为“小米速度”。它正清晰地表明,这家手机巨头在大模型赛道上,已经从“低调赶路者”加速蜕变为一位不容忽视的“高调竞争者”。

消息发布后,小米创始人雷军迅速转发了MiMo-V2.5-Pro的相关表现,并配文道:“继续进步!”

MiMo-V2.5系列:为智能体时代而生的全栈模型矩阵

那么,这次发布的V2.5系列究竟有何不同?简单来说,它延续并强化了小米“为Agent(智能体)时代打造”的核心思路,构建起一个覆盖旗舰推理、全模态交互与语音能力的全栈模型矩阵。

作为系列中的王牌,MiMo-V2.5-Pro被定位为“为长难Agent任务而生”。在通用智能体能力、复杂软件工程以及超长程任务处理这些关键维度上,它已经具备了与全球顶尖Agent模型如Claude Opus 4.6、GPT-5.4正面较量的实力,相比上一代的MiMo-V2-Pro,可谓实现了全方位的跃升。

根据内部测试数据,MiMo-V2.5-Pro在搭配合适的运行框架后,能够稳定完成单次涉及近千轮工具调用的超长任务。其在智能体场景下的指令遵循能力也显著提升,不仅能精准捕捉上下文中的隐性要求,还能在超长对话周期内始终保持逻辑的一致性。

而MiMo-V2.5则被定位为原生的全模态Agent模型,支持视觉、听觉、文本的一体化理解与转化。其Agent综合能力全面超越了前代V2-Pro,并支持高达100万Token的上下文窗口。与Pro版本相比,V2.5的平均推理速度更快,显然更适合那些对响应延迟敏感的通用Agent应用场景。

全方位跃升:性能、效率与成本的三重突破

相较于V2系列,MiMo-V2.5系列究竟实现了哪些突破?概括来看,主要体现在性能、效率和成本这三个核心维度。

首先看性能,尤其是长程任务能力,迎来了质变。V2.5-Pro在多项基准测试中表现亮眼。例如,在评估AI编程智能体(Coding Agent)的权威基准SWE-Bench Pro上,它取得了57.2分,与Claude Opus 4.6的57.3分几乎持平。

而在小米MiMo团队自研的评估套件MiMo Coding Bench上,MiMo-V2.5-Pro拿到了73.7分,与Claude Opus 4.6(77.1分)的差距进一步缩小。作为对比,上一代的MiMo-V2-Pro得分是71.5分。

技术博客中的一个案例更能说明问题:在一次实现完整SysY编译器的挑战中,V2.5-Pro仅用了4.3小时,经过672次工具调用,就完成了全部工作,并在隐藏测试集上获得了233/233的满分。要知道,北大本科生完成同类项目通常需要数周时间。另一个独立构建Web视频编辑器的任务中,V2.5-Pro历经1868次工具调用,自主构建了包含多轨道时间线、片段裁剪、交叉淡化等完整功能的应用,最终代码量高达8192行。

MiMo-V2.5在多模态理解方面同样进步显著。在全面评估AI智能体解决现实世界复杂问题能力的Claw-Eval多模态评测中,MiMo-V2.5取得了23.8分,相比V2-Omni的15.8分有了明显优化。

其次是效率,核心在于Token利用率的大幅提升。据介绍,MiMo-V2.5系列在Token效率上进行了深度优化。在达到相同Agent评测分数的前提下,V2.5-Pro相比Kimi K2.6能节省42%的Token,而V2.5相比Muse Spark更能节省50%的Token。这意味着什么?意味着开发者可以用更少的资源消耗完成同样的任务,使用成本得以显著降低。

最后是成本层面,小米同步对TokenPlan定价方案进行了一次重大调整。具体包括:取消了此前1Token=4Credits的计费方式,也不再区分256k和1M上下文窗口的Credit倍率;新增了“连续包月”和“包年”订阅模式,为用户提供更多选择;甚至还推出了每日凌晨至早上八点的八折夜间专属折扣。此外,V2.5的消耗倍率为1x,Pro版本为2x,定价策略显得更加清晰和亲民。

“小米速度”的背后:战略卡位与生态闭环

从3月18日V2系列发布,到4月22日V2.5系列上线,中间仅仅间隔36天。如此迅猛的迭代速度,其驱动力何在?

小米大模型团队负责人罗福莉曾坦言,“从Chat到Agent范式的转变发生得如此之快,甚至我们自己都几乎不敢相信”。在Agent成为行业公认的AI最重要落地方向的背景下,小米正在借势快速迭代模型能力,目标很明确:抢先卡位移动端智能体赛道。对于小米而言,大模型绝非追赶风口的噱头,而是其智能座舱、IoT设备与个人助手的底层能力支撑,是必须补齐的技术底盘。

雷军在今年3月宣布的未来三年在AI领域投入超600亿元的计划,无疑为这种快速迭代提供了充足的资金保障。巨额的投入,是技术狂奔的底气。

更值得关注的是,模型的快速迭代与终端落地正在形成双向加速的良性循环。就在昨天,小米官方宣布,小米澎湃OS 3 Beta版已向小米17系列等机型推送了名为“龙虾”的智能体Xiaomi miclaw,新增了人格体系、技能体系、跨设备同步等能力,支持80余项系统工具调用。更强的模型能力为终端AI体验提供了坚实支撑,而终端产生的海量真实使用数据,又反过来哺育和优化着模型的进化。

显而易见,在600亿AI投入的强力加持下,MiMo系列的“一月一更”或许才刚刚拉开序幕。对于这家已将AI提升至与汽车业务同等战略高度的科技巨头而言,速度,本身就是最核心的竞争力之一。

来源:https://www.techweb.com.cn/it/2026-04-23/2974658.shtml
上一篇海康机器人CEO贾永华:国内市场每3台移动机器人就有1台来自Hikrobot 下一篇关于光刻机!西方担心的事情发生:美国急了,日本难了,中国很稳
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。