MiniMax-01开源大模型新架构开启Agent时代_AI热点日报

MiniMax-01开源大模型新架构开启Agent时代

类型：热点整理2026-06-29

全新模型架构，性能比肩 GPT-4o 此次发布的 MiniMax-01 系列，在技术路线上做出了一项重大突破：首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿，每次推理时激活的参数量为 459 亿。综合性能方面，它已能

全新模型架构，性能比肩 GPT-4o

此次发布的 MiniMax-01 系列，在技术路线上做出了一项重大突破：首次在大规模商用场景中部署线性注意力机制——传统 Transformer 架构从此不再是唯一选择。该模型总参数量高达 4560 亿，每次推理时激活的参数量为 459 亿。综合性能方面，它已能与海外顶尖模型正面竞争，并且能够高效处理全球最长的 400 万 token 上下文窗口，这一长度是 GPT-4o 的 32 倍，是 Claude-3.5-Sonnet 的 20 倍。

MiniMax-01开源：新架构开启Agent时代

超长上下文，开启 Agent 时代

2025 年将成为智能体（Agent）高速发展的关键年份。无论是单 Agent 系统所需的持续记忆能力，还是多 Agent 系统之间频繁的交互通信，都对上下文长度提出了越来越高的要求。MiniMax-01 率先迈出了关键一步，其架构将持续为构建复杂 Agent 所需的基础能力奠定坚实基础。

极致性价比，创新的底气

架构创新、效率优化、集群训推一体化设计，加之内部大量并发的算力复用，使得 MiniMax 能够以业内最低的价格区间提供文本与多模态理解 API。标准定价为：输入 token 1 元/百万 token，输出 token 8 元/百万 token。

开源与评测

MiniMax-01 系列模型已在 GitHub 上完全开源，后续还将持续迭代更新。基于业界主流文本及多模态理解评测标准，结果如下图所示——在大多数任务上，它已达到与海外公认最先进的两个模型 GPT-4o-1120 和 Claude-3.5-Sonnet-1022 持平的水平。

在长文本任务方面，对比的是此前长上下文能力最强的 Google Gemini。如图(c)所示，随着输入长度持续增加，MiniMax-Text-01 成为性能衰减最慢的模型，明显优于 Google Gemini。

得益于架构创新，该模型在处理长输入时效率极高，计算复杂度接近线性。与其他全球顶尖模型的对比情况如下：

在架构设计上，每 8 层中有 7 层采用了基于 Lightning Attention 的线性注意力机制，仅保留 1 层传统 SoftMax 注意力。这不仅是业内首次将线性注意力机制扩展至商用级别，同时在 Scaling Law、与 MoE 的结合、结构设计、训练优化以及推理优化等方面均进行了系统性考量。由于是首次实现如此大规模的线性注意力模型，几乎重构了全部训练与推理系统——包括更高效的 MoE All-to-all 通讯优化、更长序列的处理优化，以及推理层面线性注意力的高效 Kernel 实现。

在绝大多数学术评测集上，MiniMax-01 均取得了比肩海外第一梯队的成绩：

在长上下文评测集上，表现显著领先：

在 400 万 token 的 Needle-In-A-Haystack（大海捞针）检索任务上，结果全绿：

除学术数据集外，团队还构建了一个基于真实数据的助手场景测试集。在该场景中，MiniMax-Text-01 的表现明显优于竞品，具体对比如下：

在多模态理解测试集中，MiniMax-VL-01 同样保持了较为领先的地位：

来源：https://www.53ai.com/news/OpenSourceLLM/2025011507365.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。