首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

热心网友
72
转载
2026-02-14

2月13日,MiniMax正式加入国产大模型春节档的“上新”阵营。其最新发布的M2.5模型显著提升了智能体任务处理速度,在性能上媲美海外头部模型,而调用价格却远低于同级产品。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

最新数据显示,M2.5优化了模型对复杂任务的拆解能力和思考过程中的token消耗,相较上一版本M2.1完成任务的速度提升了37%,从平均31.3分钟缩短至22.8分钟。这一耗时表现与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。



MiniMax M2.5在多项大模型基准测试中的表现。

在第三方评测中,M2.5同样展现出竞争力。根据BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价格仅为Opus 4.6的八分之一。

MiniMax公布的价格显示,在每秒输出100个token的情况下,连续工作一小时仅需1美元,而在每秒输出50个token的情况下,只需0.3美元。也就是说,1万美元可以让4个智能体连续工作一年。“M2.5为经济上近乎无限地构建和运营智能体提供了可能。”MiniMax在正式公告中写道。

M2.5上线后,在AI模型API聚合平台OpenRouter上日调用量超过1000亿token,跻身榜单前十。

海外市场也迅速给予反馈。硅谷风投公司Menlo Ventures合伙人Deedy Das评价称:“MiniMax M2.5超便宜,非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道:“目前,在可通过API使用的模型中,本质上是两强争霸——Opus代表最高能力上限,M2.5则以更低成本提供较高能力。”OpenHands特别提到,M2.5在需要长时间运行的任务上表现尤为出色,例如从零开始构建应用程序。

除编程能力外,M2.5在Word、PPT、Excel金融建模等办公高阶场景中,也取得显著的能力提升。据介绍,MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作,由他们提出需求、反馈问题、参与标准定义,并直接构建数据,将行业的隐性知识带入到模型的训练流程之中。

过去100多天的时间里,MiniMax保持近乎“每月一更”的节奏,陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看,相比Claude、GPT和Gemini等模型系列的进步速度,M2系列模型的性能提升速度更为显著。

谈及模型能力持续跃升的关键因素,MiniMax将其归因于大规模强化学习。团队围绕着Agent RL的框架和算法,搭建起完整的技术体系。

M2.5的发布,也成为国产大模型公司春节前争先恐后“交卷”的最新一例。此前2月12日,字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦,智谱则上线了旗舰级新模型GLM-5,同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度,支持处理超长文本,进一步激发外界对传闻中DeepSeek V4的期待。

DeepSeek在上一个春节引发全球震撼,一年之后,国产大模型以集体“上新”的形式引爆“AI春节档”,无疑令全球AI竞赛更加白热化。

文/南都N视频记者 杨柳

来源:https://www.163.com/dy/article/KLOG6HEE05129QAF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

B站推荐算法升级:不再“猜你喜欢”是好是坏?
科技数码
B站推荐算法升级:不再“猜你喜欢”是好是坏?

3月31日下午,哔哩哔哩弹幕网(B站)发文表示:从明天(4月1日)零点起,B站将下线猜你喜欢算法,不再根据你的喜好来推荐主页内容,并上线推荐新算法。3月5日晚间,B站公布了截至2025年财报。数据显

热心网友
03.31
B站明日起下线“猜你喜欢”算法,用户推荐机制变更
科技数码
B站明日起下线“猜你喜欢”算法,用户推荐机制变更

快科技3月31日消息,B站最新今日发布公告,4月1日0时起正式下线 "猜你喜欢 "推荐算法,不再根据你的喜好来推荐主页内容,并上线推荐新算法。B站称,欢迎大家明天来查看你的新主页。不过,很多网友都认为这

热心网友
03.31
AI时代,未来将是谁为谁打工?
科技数码
AI时代,未来将是谁为谁打工?

来源:北京日报AI风口,人人皆有所感。且看市面各类产品,主打交互的,谈天说地仿若知心好友;擅长功能的,写文画图生成视频样样堪称好手。“养龙虾”热了,老老少少排队装机,生怕错过头啖汤。都说人工智能是一

热心网友
03.31
硅谷AI创业无中文基础指南:核心策略与关键资源解析
科技数码
硅谷AI创业无中文基础指南:核心策略与关键资源解析

文 | 针探STI,作者 | 岳轻2026年的春天,对于大洋彼岸的硅谷来说,冷意下浮动着暗流。过去几周,几则看似孤立、实则暗流涌动的边角料新闻,正在悄然改变着全世界对“AI霸权”的陈旧认知。首先是2

热心网友
03.31
香港科技大学团队突破实时视频生成关键技术
科技数码
香港科技大学团队突破实时视频生成关键技术

这项由香港科技大学、京东探索研究院和香港大学联合开展的研究发表于2026年3月,论文编号为arXiv:2603 17051v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。制作一段

热心网友
03.31

最新APP

你说我猜
你说我猜
休闲益智 03-31
史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29

热门推荐

崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析
游戏资讯
崩坏星穹铁道3.4新增四星光锥怎么玩-崩坏星穹铁道3.4新增四星光锥玩法解析

角色与光锥适配深度解析 为队伍挑选合适的光锥,往往能起到画龙点睛的作用。今天,我们就来深入聊聊几款功能各异的光锥,看看它们如何与特定命途的角色产生化学反应。 酣战如始 1 属性与适配角色:作为同谐命途的光锥,其核心属性集中在速度与能量恢复上。这无疑是那些专注于辅助队友、提供团队增益角色的优质选择。

热心网友
03.31
什么是加密货币对冲?如何操作?有什么优势?
web3.0
什么是加密货币对冲?如何操作?有什么优势?

什么是对冲? 加密货币市场的价格变化,向来以快速剧烈著称。上午还在上涨的资产,下午就可能面临回调。在这种高波动的环境下,交易者们自然会寻求一种方法来保护自己的资金免受冲击。这种方法就是对冲——一种旨在降低风险、提升投资组合稳定性的核心策略。简单来说,对冲的核心逻辑在于:当你持有的主要加密货币资产价值

热心网友
03.31
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性
科技数码
荣耀平板 PC 化升级计划公布,将带来 PC 交互、PC 级应用支持等特性

荣耀平板PC化升级计划公布,将带来PC交互、PC级应用支持等特性 三月十号,荣耀的一场重磅发布会,揭开了其平板产品线战略升级的序幕。在荣耀Magic V6旗舰新品发布会后,荣耀终端股份有限公司全场景产品线的负责人,@荣耀潇哥,进一步分享了一项备受关注的“平板PC化升级计划”。 在分享中,@荣耀潇哥清

热心网友
03.31
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图
业界动态
5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图

5 分钟充好,9 分钟充饱,比亚迪闪充补上新能源转型最后一块拼图 “没有人比我们比亚迪更懂电池。”这句在发布会上掷地有声的口号,背后是实打实的技术突破。前不久的比亚迪“闪充中国改变世界”发布会上,王传福总裁正式揭晓了第二代刀片电池与配套的闪充技术,一组数据瞬间引爆了行业: 从10%到70%电量,只需

热心网友
03.31
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点
网络安全
OPPO K15 Pro核心配置公布:明日发布,抢先了解亮点

IT之家 3 月 31 日消息,OPPO K15 Pro 系列手机已官宣将于明日 14:30 正式发布。IT之家注意到,OPPO K15 Pro 手机已现身正式,并公布了核心配置信息,IT之家附如下

热心网友
03.31