游乐游手机版
首页/AI热点日报/热点详情

MiniMax-01开源大模型 新架构开启Agent时代

类型:热点整理2026-06-29
全新模型架构,性能比肩 GPT-4o 此次发布的 MiniMax-01 系列,在技术路线上做出了一项重大突破:首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿,每次推理时激活的参数量为 459 亿。综合性能方面,它已能

全新模型架构,性能比肩 GPT-4o

此次发布的 MiniMax-01 系列,在技术路线上做出了一项重大突破:首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿,每次推理时激活的参数量为 459 亿。综合性能方面,它已能与海外顶尖模型正面竞争,并且能够高效处理全球最长的 400 万 token 上下文窗口,这一长度是 GPT-4o 的 32 倍,是 Claude-3.5-Sonnet 的 20 倍。

MiniMax-01开源:新架构开启Agent时代

超长上下文,开启 Agent 时代

2025 年将成为智能体(Agent)高速发展的关键年份。无论是单 Agent 系统所需的持续记忆能力,还是多 Agent 系统之间频繁的交互通信,都对上下文长度提出了越来越高的要求。MiniMax-01 率先迈出了关键一步,其架构将持续为构建复杂 Agent 所需的基础能力奠定坚实基础。

极致性价比,创新的底气

架构创新、效率优化、集群训推一体化设计,加之内部大量并发的算力复用,使得 MiniMax 能够以业内最低的价格区间提供文本与多模态理解 API。标准定价为:输入 token 1 元/百万 token,输出 token 8 元/百万 token。

开源与评测

MiniMax-01 系列模型已在 GitHub 上完全开源,后续还将持续迭代更新。基于业界主流文本及多模态理解评测标准,结果如下图所示——在大多数任务上,它已达到与海外公认最先进的两个模型 GPT-4o-1120 和 Claude-3.5-Sonnet-1022 持平的水平。

在长文本任务方面,对比的是此前长上下文能力最强的 Google Gemini。如图(c)所示,随着输入长度持续增加,MiniMax-Text-01 成为性能衰减最慢的模型,明显优于 Google Gemini

得益于架构创新,该模型在处理长输入时效率极高,计算复杂度接近线性。与其他全球顶尖模型的对比情况如下:

在架构设计上,每 8 层中有 7 层采用了基于 Lightning Attention 的线性注意力机制,仅保留 1 层传统 SoftMax 注意力。这不仅是业内首次将线性注意力机制扩展至商用级别,同时在 Scaling Law、与 MoE 的结合、结构设计、训练优化以及推理优化等方面均进行了系统性考量。由于是首次实现如此大规模的线性注意力模型,几乎重构了全部训练与推理系统——包括更高效的 MoE All-to-all 通讯优化、更长序列的处理优化,以及推理层面线性注意力的高效 Kernel 实现。

在绝大多数学术评测集上,MiniMax-01 均取得了比肩海外第一梯队的成绩:

在长上下文评测集上,表现显著领先:

在 400 万 token 的 Needle-In-A-Haystack(大海捞针)检索任务上,结果全绿:

除学术数据集外,团队还构建了一个基于真实数据的助手场景测试集。在该场景中,MiniMax-Text-01 的表现明显优于竞品,具体对比如下:

在多模态理解测试集中,MiniMax-VL-01 同样保持了较为领先的地位:

来源:https://www.53ai.com/news/OpenSourceLLM/2025011507365.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。