游乐游手机版
首页/科技数码/文章详情

MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

时间:2026-02-14 19:30
2月13日,MiniMax加入国产大模型的春节档“上新”阵营。其最新发布的M2 5模型提升了智能体任务处理速度,媲美海外头部模型,而调用价格却远低于同等级产品。最新数据显示,M2 5优化了模型对复杂

2月13日,MiniMax正式加入国产大模型春节档的“上新”阵营。其最新发布的M2.5模型显著提升了智能体任务处理速度,在性能上媲美海外头部模型,而调用价格却远低于同级产品。

最新数据显示,M2.5优化了模型对复杂任务的拆解能力和思考过程中的token消耗,相较上一版本M2.1完成任务的速度提升了37%,从平均31.3分钟缩短至22.8分钟。这一耗时表现与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。



MiniMax M2.5在多项大模型基准测试中的表现。

在第三方评测中,M2.5同样展现出竞争力。根据BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价格仅为Opus 4.6的八分之一。

MiniMax公布的价格显示,在每秒输出100个token的情况下,连续工作一小时仅需1美元,而在每秒输出50个token的情况下,只需0.3美元。也就是说,1万美元可以让4个智能体连续工作一年。“M2.5为经济上近乎无限地构建和运营智能体提供了可能。”MiniMax在正式公告中写道。

M2.5上线后,在AI模型API聚合平台OpenRouter上日调用量超过1000亿token,跻身榜单前十。

海外市场也迅速给予反馈。硅谷风投公司Menlo Ventures合伙人Deedy Das评价称:“MiniMax M2.5超便宜,非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道:“目前,在可通过API使用的模型中,本质上是两强争霸——Opus代表最高能力上限,M2.5则以更低成本提供较高能力。”OpenHands特别提到,M2.5在需要长时间运行的任务上表现尤为出色,例如从零开始构建应用程序。

除编程能力外,M2.5在Word、PPT、Excel金融建模等办公高阶场景中,也取得显著的能力提升。据介绍,MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作,由他们提出需求、反馈问题、参与标准定义,并直接构建数据,将行业的隐性知识带入到模型的训练流程之中。

过去100多天的时间里,MiniMax保持近乎“每月一更”的节奏,陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看,相比Claude、GPT和Gemini等模型系列的进步速度,M2系列模型的性能提升速度更为显著。

谈及模型能力持续跃升的关键因素,MiniMax将其归因于大规模强化学习。团队围绕着Agent RL的框架和算法,搭建起完整的技术体系。

M2.5的发布,也成为国产大模型公司春节前争先恐后“交卷”的最新一例。此前2月12日,字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦,智谱则上线了旗舰级新模型GLM-5,同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度,支持处理超长文本,进一步激发外界对传闻中DeepSeek V4的期待。

DeepSeek在上一个春节引发全球震撼,一年之后,国产大模型以集体“上新”的形式引爆“AI春节档”,无疑令全球AI竞赛更加白热化。

文/南都N视频记者 杨柳

来源:https://www.163.com/dy/article/KLOG6HEE05129QAF.html
上一篇北航《自然·通讯》新突破:机器人实现人眼级视觉能力 下一篇千问再升级:3天免单AI购物如何推动县城新消费
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5