首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

MiniMax新模型对标海外巨头,国产大模型开启“月更”时代

热心网友
66
转载
2026-02-14

2月13日,MiniMax正式加入国产大模型春节档的“上新”阵营。其最新发布的M2.5模型显著提升了智能体任务处理速度,在性能上媲美海外头部模型,而调用价格却远低于同级产品。

最新数据显示,M2.5优化了模型对复杂任务的拆解能力和思考过程中的token消耗,相较上一版本M2.1完成任务的速度提升了37%,从平均31.3分钟缩短至22.8分钟。这一耗时表现与Anthropic于2月初发布的Claude Opus 4.6模型的22.9分钟基本持平。



MiniMax M2.5在多项大模型基准测试中的表现。

在第三方评测中,M2.5同样展现出竞争力。根据BridgeBench的测试,M2.5在编程任务上的得分仅比Opus 4.6低0.4分,但调用价格仅为Opus 4.6的八分之一。

MiniMax公布的价格显示,在每秒输出100个token的情况下,连续工作一小时仅需1美元,而在每秒输出50个token的情况下,只需0.3美元。也就是说,1万美元可以让4个智能体连续工作一年。“M2.5为经济上近乎无限地构建和运营智能体提供了可能。”MiniMax在正式公告中写道。

M2.5上线后,在AI模型API聚合平台OpenRouter上日调用量超过1000亿token,跻身榜单前十。

海外市场也迅速给予反馈。硅谷风投公司Menlo Ventures合伙人Deedy Das评价称:“MiniMax M2.5超便宜,非常适合编程。”面向云端编程智能体的开放平台OpenHands在社交平台上写道:“目前,在可通过API使用的模型中,本质上是两强争霸——Opus代表最高能力上限,M2.5则以更低成本提供较高能力。”OpenHands特别提到,M2.5在需要长时间运行的任务上表现尤为出色,例如从零开始构建应用程序。

除编程能力外,M2.5在Word、PPT、Excel金融建模等办公高阶场景中,也取得显著的能力提升。据介绍,MiniMax前期与金融、法律、社会科学等领域的资深从业者展开了深度合作,由他们提出需求、反馈问题、参与标准定义,并直接构建数据,将行业的隐性知识带入到模型的训练流程之中。

过去100多天的时间里,MiniMax保持近乎“每月一更”的节奏,陆续推出M2、M2.1和M2.5版本。从编程领域代表性基准测试SWE-Bench Verified的成绩来看,相比Claude、GPT和Gemini等模型系列的进步速度,M2系列模型的性能提升速度更为显著。

谈及模型能力持续跃升的关键因素,MiniMax将其归因于大规模强化学习。团队围绕着Agent RL的框架和算法,搭建起完整的技术体系。

M2.5的发布,也成为国产大模型公司春节前争先恐后“交卷”的最新一例。此前2月12日,字节跳动最新视频生成模型Seedance2.0宣布接入旗下AI产品豆包和即梦,智谱则上线了旗舰级新模型GLM-5,同样主打编程等方面的能力。而DeepSeek则被发现已开始测试最高100万Token的上下文长度,支持处理超长文本,进一步激发外界对传闻中DeepSeek V4的期待。

DeepSeek在上一个春节引发全球震撼,一年之后,国产大模型以集体“上新”的形式引爆“AI春节档”,无疑令全球AI竞赛更加白热化。

文/南都N视频记者 杨柳

来源:https://www.163.com/dy/article/KLOG6HEE05129QAF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

具身智能研发框架Dexbotic重塑机器人开发流程
AI
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13
RMS-MoE模型通过检索记忆优化专家路由调度效率
AI
RMS-MoE模型通过检索记忆优化专家路由调度效率

随着大模型参数规模不断增长,混合专家(Mixture-of-Experts, MoE)架构因其稀疏激活特性,成为平衡模型性能与计算开销的主流方案。然而,在实际的Web级应用部署中,一个关键挑战日益凸显:传统MoE的路由机制通常是“无记忆”的。 试想,在搜索引擎、智能问答或多轮对话等高并发场景下,用户

热心网友
05.12
编程入门指南从零基础到理解核心概念
编程语言
编程入门指南从零基础到理解核心概念

编程十年的一点分享 在软件开发的路上走过十几年,从一个爱好者到以此为业,有些体会或许值得聊聊,就当是抛砖引玉吧。 最早接触编程,是从BASIC和C语言开始的。工作后,随着需要,陆续学习了dBase、Access这类桌面数据库的开发。真正以开发为职业,可以说始于FoxPro 5 0,之后技术栈随着项目

热心网友
05.07
编程初学者入门指南与核心思维解析
编程语言
编程初学者入门指南与核心思维解析

引言 编程,是一门实践科学。这意味着,学习它的最佳方式就是动手去敲代码。但这是否意味着,我们可以因此轻视理论的学习呢? 入门编程 如果你去各大技术社区提问“该如何入门编程”,五花八门的答案会瞬间涌来。 不过,仔细梳理一下,无外乎以下几种流派: 学院派 他们推荐从C语言入手,并辅以数据结构、操作系统等

热心网友
05.07
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”
科技数码
Agent 需要“油表”和“刹车”:一篇论文,扒光了 Agent 的“糊涂账”

想象一下这个场景: 你让 AI Agent 帮你修一个代码 Bug。它打开项目,读了 20 个文件,改了改,跑了一下测试,没过,又改,又跑,还是没过……来回折腾了十几轮,终于——还是没修好。 你关掉电脑,松了口气。然后收到了 API 账单。 上面的数字可能让你倒吸一口凉气——AI Agent 自主修

热心网友
05.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

燕云十六声天工地窟身如飞燕宝箱获取全攻略
游戏资讯
燕云十六声天工地窟身如飞燕宝箱获取全攻略

在《燕云十六声》的天工地窟中,“身如飞燕”宝箱的获取是一场对玩家综合探索能力的深度考验。想要成功开启它,不仅需要耐心与观察力,更需掌握系统性的探索策略。 掌握地窟地形与核心布局 进入天工地窟后,首要任务是进行全方位的地形勘察。建议玩家先熟悉主要通道、分支岔路以及所有可能被忽略的角落,建立完整的地图认

热心网友
05.18
2026年家装设计软件推荐:高人气实用工具精选指南
游戏资讯
2026年家装设计软件推荐:高人气实用工具精选指南

装修这件事,说多了都是泪。找施工队像开盲盒,预算表永远在“动态调整”,设计图看得眼花缭乱……投入大量时间和精力,最后的效果可能还是差强人意。说到底,信息不对称和过程不透明,是大多数装修烦恼的根源。 好在,如今有不少专业的数字化工具,能帮我们把控关键环节。今天就来聊聊五款定位清晰、实用性强的装修类应用

热心网友
05.18
燕云十六声山洞奇遇任务全流程攻略与解法详解
游戏资讯
燕云十六声山洞奇遇任务全流程攻略与解法详解

在《燕云十六声》的宏大江湖中,“不见山洞”无疑是一处引人入胜的秘境。这里不仅栖息着珍奇异兽、埋藏着稀世珍宝,更交织着无数待玩家发掘的隐秘故事与特殊事件。若想彻底揭开此地的所有秘密,掌握以下探索技巧至关重要。 进入不见山洞后,首要任务是保持专注,对环境进行细致勘察。洞内的景象暗藏玄机,绝非一目了然。一

热心网友
05.18
骷髅传奇神盾系统玩法详解与获取攻略
游戏资讯
骷髅传奇神盾系统玩法详解与获取攻略

在《骷髅传奇》中,神盾系统是决定角色战力的核心模块,远非一件普通装备可比。它更像是一位能够深度定制、伴随你征战四方的忠实伙伴。本文将为你全面解析神盾系统的获取、培养与实战运用,助你将其从基础配置打造为真正的战力引擎,在游戏中脱颖而出。 获取你的第一面神盾是旅程的起点。游戏内提供了多样化的获取途径:完

热心网友
05.18
和平精英孙悟空皮肤获取与实战技巧全解析
游戏资讯
和平精英孙悟空皮肤获取与实战技巧全解析

天成孙悟空这款限定皮肤,以其独特的视觉设计在战场上脱颖而出。它将中国古典神话中齐天大圣的经典形象,与游戏内的现代美学风格进行了深度结合。标志性的金色毛发、可化为武器的金箍棒特效,以及服饰上精致的云纹与神话元素,共同塑造了一个极具战场辨识度的英雄形象。这种高辨识度本身,在战术层面就具有独特价值——它能

热心网友
05.18