上海稀宇科技有限公司(MiniMax)今日通过其官方X平台账号正式发布预告,宣布即将推出备受期待的MiniMax M3系列模型。这一消息迅速在人工智能与科技领域引发广泛关注。
官方推文同时附上了一篇于5月26日发布于预印本平台arxiv的研究论文,标题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。该论文全面、系统地阐述了其前代M2.x系列模型所采用的核心技术架构与设计理念。

论文揭示的核心亮点之一,是M2.x系列所秉持的“低激活、高智能”高效设计哲学。具体技术指标显示,该模型总参数量高达2299亿,但在处理每个词元(token)时,仅动态激活98亿参数。这种设计在确保模型具备强大性能表现的同时,显著优化了推理效率与计算成本。此外,模型支持高达192K的超长上下文窗口,其预训练阶段所使用的数据规模达到了惊人的29.2万亿词元。
模型架构与训练系统深度解析
在模型架构层面,M2系列采用了62层的纯解码器Transformer结构。其关键创新在于精细化的专家混合(MoE)策略:模型内部集成了多达256个细粒度专家网络,而为每个输入词元仅智能路由并激活其中的8个。这种机制在极大扩展模型总容量的同时,精准控制了单次推理的计算开销,实现了容量与效率的卓越平衡。
更值得关注的是其在训练系统层面的重大突破。MiniMax研发团队提出了名为“Forge”的强化学习系统,这是一个面向智能体训练的统一平台。其独特优势在于能够同时支持白盒与黑盒智能体的统一接入与训练,这极大地提升了平台在复杂场景下的灵活性与通用性。
Forge系统通过将训练流程、推理服务与智能体核心进行解耦设计,并结合窗口化FIFO调度、前缀树合并以及专用的推理加速技术,有效降低了长序列、多步决策轨迹的训练成本。这套完整的系统级解决方案,为开发更复杂、更强大的AI智能体提供了高效的工程基础。
“自我进化”能力的初步展现
在M2.7版本中,最具前瞻性的升级是论文中初步展现的“自我进化”能力。这标志着AI模型开始从被动的工具,转变为能够主动参与自身优化与开发流程的智能体。
根据论文描述,该模型已能够自主分析训练失败案例、阅读理解系统运行日志、并据此修改相关的脚手架与工具代码。在内部闭环测试中,系统成功实现了超过100轮的自主迭代与持续优化。
实际应用效果显著。数据显示,这套“自我进化”系统能够承担研发团队约30%至50%的日常代码迭代与优化工作量。在一个具体的内部编程脚手架优化任务中,该系统带来了约30%的性能提升。这意味着,AI正在逐步融入AI研发的闭环,形成“AI辅助开发AI”甚至“AI驱动AI进化”的新范式。这种模式很可能成为推动下一代大模型研发与演进的关键方向。
