MiniMax M3系列AI模型正式发布官方预告

时间：2026-05-28 09:53

MiniMax预告将推出M3系列AI模型。其前代M2系列采用解码器式Transformer架构与专家混合策略，以低激活参数实现高效能，并配备超长上下文窗口。论文重点介绍了“Forge”强化学习训练系统，能有效降低长轨迹训练成本。M2 7版本展现了“自我进化”雏形，模型可自主排查问题并修改代码，已能分担部分研发迭代工作。

上海稀宇科技有限公司（MiniMax）今日通过其官方X平台账号正式发布预告，宣布即将推出备受期待的MiniMax M3系列模型。这一消息迅速在人工智能与科技领域引发广泛关注。

官方推文同时附上了一篇于5月26日发布于预印本平台arxiv的研究论文，标题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。该论文全面、系统地阐述了其前代M2.x系列模型所采用的核心技术架构与设计理念。

论文揭示的核心亮点之一，是M2.x系列所秉持的“低激活、高智能”高效设计哲学。具体技术指标显示，该模型总参数量高达2299亿，但在处理每个词元（token）时，仅动态激活98亿参数。这种设计在确保模型具备强大性能表现的同时，显著优化了推理效率与计算成本。此外，模型支持高达192K的超长上下文窗口，其预训练阶段所使用的数据规模达到了惊人的29.2万亿词元。

模型架构与训练系统深度解析

在模型架构层面，M2系列采用了62层的纯解码器Transformer结构。其关键创新在于精细化的专家混合（MoE）策略：模型内部集成了多达256个细粒度专家网络，而为每个输入词元仅智能路由并激活其中的8个。这种机制在极大扩展模型总容量的同时，精准控制了单次推理的计算开销，实现了容量与效率的卓越平衡。

更值得关注的是其在训练系统层面的重大突破。MiniMax研发团队提出了名为“Forge”的强化学习系统，这是一个面向智能体训练的统一平台。其独特优势在于能够同时支持白盒与黑盒智能体的统一接入与训练，这极大地提升了平台在复杂场景下的灵活性与通用性。

Forge系统通过将训练流程、推理服务与智能体核心进行解耦设计，并结合窗口化FIFO调度、前缀树合并以及专用的推理加速技术，有效降低了长序列、多步决策轨迹的训练成本。这套完整的系统级解决方案，为开发更复杂、更强大的AI智能体提供了高效的工程基础。

“自我进化”能力的初步展现

在M2.7版本中，最具前瞻性的升级是论文中初步展现的“自我进化”能力。这标志着AI模型开始从被动的工具，转变为能够主动参与自身优化与开发流程的智能体。

根据论文描述，该模型已能够自主分析训练失败案例、阅读理解系统运行日志、并据此修改相关的脚手架与工具代码。在内部闭环测试中，系统成功实现了超过100轮的自主迭代与持续优化。

实际应用效果显著。数据显示，这套“自我进化”系统能够承担研发团队约30%至50%的日常代码迭代与优化工作量。在一个具体的内部编程脚手架优化任务中，该系统带来了约30%的性能提升。这意味着，AI正在逐步融入AI研发的闭环，形成“AI辅助开发AI”甚至“AI驱动AI进化”的新范式。这种模式很可能成为推动下一代大模型研发与演进的关键方向。

来源：https://www.163.com/dy/article/KTUQ0ILE0511B8LM.html

MiniMax