MiniMax M2:深耕多模态技术,全面优化赋能智能应用普及
近期,基础模型领域再度掀起火热浪潮,各大厂商频频推出新动作。仔细观察可以发现,这些厂商的策略大致分为两个方向。一部分厂商选择在模型的某个难点上实现技术突破,力求在该领域达到顶尖水准,以此在开发者群体中建立鲜明形象。但这种聚焦特定领域的策略,可能限制其作为基础模型供应商的广泛适用性。另一类厂商则追求全面发展,在多模态能力上齐头并进,逐步构建起完整的基础模型体系。
在全面发展的厂商阵营中,MiniMax凭借其全球领先的语音和视频模型脱颖而出。近日,该公司又发布了其基础模型体系的最新成员——MiniMax M2,进一步巩固了其在多模态模型领域的领先地位。
10月28日,MiniMax正式对外发布了MiniMax M2。这款模型专为编程和智能体应用场景设计,同时保持了轻量级和高灵敏度的特点。在通用能力的基础上,MiniMax M2进行了针对性优化,其上下文窗口达到当前主流模型的平均水平,最大输入和输出token总和为200k,最大输出token为128k。该模型还提供端到端的工具调用性能,充分满足了开发者的实际需求。
MiniMax M2被定位为“极具成本效益的模型”,以其全球领先的性价比和极致速度为主要亮点。该模型拥有2300亿总参数,但激活参数被控制在100亿以内,有效降低了计算成本。在权威测评榜单Artificial Analysis上,MiniMax M2在数学、科学和编程等多个核心领域表现出众,总排名位列全球前五。这表明,MiniMax M2在提升编程和智能体能力的同时,并未牺牲其综合性能。
更值得关注的是,MiniMax M2在保持高性能的同时,还大幅降低了使用成本。据MiniMax介绍,该模型在某些任务上的成本仅为Claude的8%。目前,MiniMax M2的API价格设定为每百万输入Token 0.3美元(约合2.1元人民币),输出1.2美元(约合8.4元人民币)。同时,该模型还提供每秒输出约100个Token的推理服务,且速度仍在不断提升。从价格和速度的综合性能来看,MiniMax M2已成为市场上最具性价比的模型之一。
为了吸引更多开发者体验,MiniMax在发布后宣布延长免费测试时间,用户在11月6日前可免费使用该模型。MiniMax在最新公告中表示:“我们目前在免费提供MiniMax Agent,直至服务器无法承受为止。”这一策略取得了显著效果,限时免费期间,开发者的调用量快速增长,MiniMax M2已成为OpenRouter上调用量排名前十的模型。
MiniMax M2的成本控制得益于模型技术的更新和工程能力的提升。在发布MiniMax M2的同时,MiniMax还宣布其Agent应用同步更新,并推出了安卓和iOS版本。这一策略与OpenAI发布Sora时相似,即模型从第一天起就以产品的形式呈现,因为模型和工程能力已经密不可分。用户在使用以Agent能力为核心的产品时,能够直接感受到模型能力的进步,这些技术变化不再仅仅停留在论文和技术报告中,而是成为了用户可感知的产品能力。
为了验证MiniMax M2的实际表现,我们进行了几组测试,包括写文章的速度、编程能力以及完成开发闭环的能力。在写文章测试中,我们要求MiniMax M2和Claude 4.1用同样的题目《AI智能体的未来》写一篇约800字的中文文章。结果显示,MiniMax M2几乎瞬间完成了文章生成,而Claude 4.1还在逐段生成。从内容结构和语言上看,MiniMax M2的表现也相当出色,给人一种“响应即结果”的流畅体验。
在编程能力测试中,我们选择了经典的Gilded Rose重构项目。该项目要求模型在不影响原有功能的情况下,优化代码结构并添加新功能。MiniMax M2在加载项目后,自动判断了语言版本并选择了Python实现。它首先解析了原始代码中的商品类型和逻辑关系,然后提出了采用策略模式重构的方案。在重构过程中,MiniMax M2同步修改了测试脚本和示例文件,确保数据初始化和边界条件与新架构一致。经过几轮调试后,所有测试均通过,展示了MiniMax M2在编程能力上的出色表现。
我们还测试了MiniMax M2的端到端开发能力。我们给它两个空文件:一个calc.py和一个测试文件test_calc.py,要求实现加法和除法功能,并处理除以零的错误。MiniMax M2先读取测试文件,然后编写代码。在第一次运行pytest报错后,它立即分析了错误原因并进行修复。整个过程不到一分钟,从空白文件到测试全绿,展示了MiniMax M2在独立开发方面的能力。
在网页交互任务测试中,我们采用“受控指令”的方式来评估MiniMax M2的three.js编程能力。我们明确规定了每一项功能,包括创建太阳与三颗行星的三维场景、实现自转与公转动画、显示轨道辅助线等。测评结果显示,MiniMax M2在第一次编程时完成了大部分功能,仅在“统一控制行星大小”方面需要新增一次对话进行修改。从运行日志来看,MiniMax M2的工作过程呈现出清晰的“生成—验证—修复”节奏,展示了其在代码生成和调试优化方面的能力。
随着Agent技术的兴起,关于“模型即Agent”还是应用本身需要更多工作的讨论日益激烈。MiniMax M2的出现为这些讨论提供了新的视角:在各个模态模型上都达到顶尖水平的公司,可能更能够将Agent能力更好地提供给所有人。目前,MiniMax的语音模型和视频模型均处于全球领先水平。这些模型的优势表现并非单纯的“噱头”创新,而是源于MiniMax在技术架构上的创新,如Speech模型的Flow-VAE架构和海螺02视频模型的NCR架构。
MiniMax在技术追求上显得与众不同。它宁愿花费更多时间,甚至显得“笨拙”一些,也要为技术的底层进步做出贡献,解决技术落地过程中的实际问题。在文本模型领域,MiniMax也走过类似的道路。从年初发布和开源的MiniMax 01系列开始,到后来的M1、今天的M2,模型在不断进化中。最终,MiniMax交出了它心目中这个阶段最能解决实际问题的Agent模型。它既是模型也是应用,是MiniMax“让每个人都拥有充沛的智能”过程中的重要一步。
目前,用户可以通过MiniMax Agent APP、API和各大规模模型平台使用MiniMax M2。而且,MiniMax宣布Agent和模型全球限时免费14天,用户可以尽情体验。
热门专题
最新APP
热门推荐
从零开始的数字资产入门指南 那天下午我盯着手机屏幕发愣,朋友刚发来一个数字资产平台的安装包。说实话,刚开始我对这些新兴平台总带着些
在数字迷宫中寻找路径 记得几年前刚接触数字资产时,我像个没头苍蝇似的在各个平台间乱转。那时候为了找个靠谱的交易通道,足足折腾了一个
库币KuCoin官网入口及平台介绍 对于数字资产爱好者来说,选择一个安全、可靠且功能丰富的交易平台至关重要。库币KuCoin作为全球知名的虚拟
MEXC VIP 等级费率体系详解 在数字货币交易的世界里,手续费是影响交易成本的重要因素。MEXC 作为一家知名的数字资产交易平台,其 VIP
数字资产交易平台“华山论剑”:币安与火币HTX的巅峰对决说起数字资产交易平台,那可真是百花齐放,各有千秋。但要说到全球范围内最受关注





