游乐游手机版
首页/科技数码/文章详情

MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

时间:2026-02-14 19:30
2月13日,MiniMax加入国产大模型的春节档“上新”阵营。其最新发布的M2 5模型提升了智能体任务处理速度,媲美海外头部模型,而调用价格却远低于同等级产品。最新数据显示,M2 5优化了模型对复杂

2月13日,MiniMax正式加入国产大模型春节档的“上新”阵营。其最新发布的M2.5模型显著提升了智能体任务处理速度,在性能上媲美海外头部模型,而调用价格却远低于同级产品。

最新数据显示,M2.5优化了模型对复杂任务的拆解能力和思考过程中的token消耗,相较上一版本M2.1完成任务的速度提升了37%,从平均31.3分钟缩短至22.8分钟。这一耗时表现与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。



MiniMax M2.5在多项大模型基准测试中的表现。

在第三方评测中,M2.5同样展现出竞争力。根据BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价格仅为Opus 4.6的八分之一。

MiniMax公布的价格显示,在每秒输出100个token的情况下,连续工作一小时仅需1美元,而在每秒输出50个token的情况下,只需0.3美元。也就是说,1万美元可以让4个智能体连续工作一年。“M2.5为经济上近乎无限地构建和运营智能体提供了可能。”MiniMax在正式公告中写道。

M2.5上线后,在AI模型API聚合平台OpenRouter上日调用量超过1000亿token,跻身榜单前十。

海外市场也迅速给予反馈。硅谷风投公司Menlo Ventures合伙人Deedy Das评价称:“MiniMax M2.5超便宜,非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道:“目前,在可通过API使用的模型中,本质上是两强争霸——Opus代表最高能力上限,M2.5则以更低成本提供较高能力。”OpenHands特别提到,M2.5在需要长时间运行的任务上表现尤为出色,例如从零开始构建应用程序。

除编程能力外,M2.5在Word、PPT、Excel金融建模等办公高阶场景中,也取得显著的能力提升。据介绍,MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作,由他们提出需求、反馈问题、参与标准定义,并直接构建数据,将行业的隐性知识带入到模型的训练流程之中。

过去100多天的时间里,MiniMax保持近乎“每月一更”的节奏,陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看,相比Claude、GPT和Gemini等模型系列的进步速度,M2系列模型的性能提升速度更为显著。

谈及模型能力持续跃升的关键因素,MiniMax将其归因于大规模强化学习。团队围绕着Agent RL的框架和算法,搭建起完整的技术体系。

M2.5的发布,也成为国产大模型公司春节前争先恐后“交卷”的最新一例。此前2月12日,字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦,智谱则上线了旗舰级新模型GLM-5,同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度,支持处理超长文本,进一步激发外界对传闻中DeepSeek V4的期待。

DeepSeek在上一个春节引发全球震撼,一年之后,国产大模型以集体“上新”的形式引爆“AI春节档”,无疑令全球AI竞赛更加白热化。

文/南都N视频记者 杨柳

来源:https://www.163.com/dy/article/KLOG6HEE05129QAF.html
上一篇北航《自然·通讯》新突破:机器人实现人眼级视觉能力 下一篇千问再升级:3天免单AI购物如何推动县城新消费
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南
科技数码 · 2026-06-07

2026年实测排行 全能4K Live影像旗舰 国补各价位机型选购指南

国补政策一落地,身边不少朋友都开始在盘算换新机。学生党、年轻姑娘、还有那些天天拍短视频的创作者,成了这波购机主力。大家普遍头疼的是:手里预算就那么多,想要颜值、拍照、续航都兼顾,实在不容易。这次我们把vivo几款热门机型真机摸了个遍,结合实验室实测数据,从影像、做工、续航到补贴后到手价,一步步拆解。

SHEIN污染问题与环保管理框架全面解读
科技数码 · 2026-06-07

SHEIN污染问题与环保管理框架全面解读

SHEIN希音环保表现,关键要看这个框架 关注SHEIN希音的环保问题,其实是在探讨一个非常现实的话题:作为一家全球性的时尚零售商,它究竟如何应对服装行业长期面临的环境挑战——资源消耗、库存积压、碳排放、包装与纺织废弃物?如果能够把这些议题梳理清楚,那么对SHEIN希音的整体环保表现,心里也就大致有

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%
科技数码 · 2026-06-07

苹果美国上架官翻Apple Watch Series 11 2025款 便宜约15%

苹果官方翻新商店再次迎来新品上架。6月5日,据MacRumors报道,美国官网的官方翻新专区悄然上线了三款2025年9月发布的智能手表——Apple Watch Series 11、Apple Watch Ultra 3以及Apple Watch SE 3。这是该系列机型首次通过翻新渠道销售,折扣幅

飞牛fnOS上线OPPO一加相册互联功能
科技数码 · 2026-06-07

飞牛fnOS上线OPPO一加相册互联功能

近日,飞牛 fnOS 发布重要更新:ARM 设备上的飞牛相册迎来大幅升级,其中最受关注的亮点是正式支持 OPPO 和一加设备互联。值得一提的是,此前 X86 平台已实现该功能,此次更新为 ARM 用户补齐了这项实用功能。 具体来说,OPPO 与飞牛之间的互联打通了四个关键场景,每项体验都非常实在:

小米米家植萃系列智能香氛机首发229元支持澎湃智联
科技数码 · 2026-06-07

小米米家植萃系列智能香氛机首发229元支持澎湃智联

米家智能香氛机植萃系列现已正式开售。大家最关心的价格方面,官方建议零售价为299元,而首发优惠价直接降至229元,性价比十足。 这款香氛机的核心亮点在于选用了奇华顿Orpur高端精油,天然植物萃取,气味清新自然,不刺鼻也不显廉价。它提供三种香型:风铃草、红茶、薰衣草,分别对应清甜、醇厚、舒缓的不同风