游乐游手机版
首页/科技数码/文章详情

MiniMax M3系列AI模型正式发布官方预告

时间:2026-05-28 09:53
MiniMax预告将推出M3系列AI模型。其前代M2系列采用解码器式Transformer架构与专家混合策略,以低激活参数实现高效能,并配备超长上下文窗口。论文重点介绍了“Forge”强化学习训练系统,能有效降低长轨迹训练成本。M2 7版本展现了“自我进化”雏形,模型可自主排查问题并修改代码,已能分担部分研发迭代工作。

上海稀宇科技有限公司(MiniMax)今日通过其官方X平台账号正式发布预告,宣布即将推出备受期待的MiniMax M3系列模型。这一消息迅速在人工智能与科技领域引发广泛关注。

官方推文同时附上了一篇于5月26日发布于预印本平台arxiv的研究论文,标题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。该论文全面、系统地阐述了其前代M2.x系列模型所采用的核心技术架构与设计理念。


论文揭示的核心亮点之一,是M2.x系列所秉持的“低激活、高智能”高效设计哲学。具体技术指标显示,该模型总参数量高达2299亿,但在处理每个词元(token)时,仅动态激活98亿参数。这种设计在确保模型具备强大性能表现的同时,显著优化了推理效率与计算成本。此外,模型支持高达192K的超长上下文窗口,其预训练阶段所使用的数据规模达到了惊人的29.2万亿词元。

模型架构与训练系统深度解析

在模型架构层面,M2系列采用了62层的纯解码器Transformer结构。其关键创新在于精细化的专家混合(MoE)策略:模型内部集成了多达256个细粒度专家网络,而为每个输入词元仅智能路由并激活其中的8个。这种机制在极大扩展模型总容量的同时,精准控制了单次推理的计算开销,实现了容量与效率的卓越平衡。

更值得关注的是其在训练系统层面的重大突破。MiniMax研发团队提出了名为“Forge”的强化学习系统,这是一个面向智能体训练的统一平台。其独特优势在于能够同时支持白盒与黑盒智能体的统一接入与训练,这极大地提升了平台在复杂场景下的灵活性与通用性。

Forge系统通过将训练流程、推理服务与智能体核心进行解耦设计,并结合窗口化FIFO调度、前缀树合并以及专用的推理加速技术,有效降低了长序列、多步决策轨迹的训练成本。这套完整的系统级解决方案,为开发更复杂、更强大的AI智能体提供了高效的工程基础。

“自我进化”能力的初步展现

在M2.7版本中,最具前瞻性的升级是论文中初步展现的“自我进化”能力。这标志着AI模型开始从被动的工具,转变为能够主动参与自身优化与开发流程的智能体。

根据论文描述,该模型已能够自主分析训练失败案例、阅读理解系统运行日志、并据此修改相关的脚手架与工具代码。在内部闭环测试中,系统成功实现了超过100轮的自主迭代与持续优化。

实际应用效果显著。数据显示,这套“自我进化”系统能够承担研发团队约30%至50%的日常代码迭代与优化工作量。在一个具体的内部编程脚手架优化任务中,该系统带来了约30%的性能提升。这意味着,AI正在逐步融入AI研发的闭环,形成“AI辅助开发AI”甚至“AI驱动AI进化”的新范式。这种模式很可能成为推动下一代大模型研发与演进的关键方向。

来源:https://www.163.com/dy/article/KTUQ0ILE0511B8LM.html
上一篇香港航天员入驻天宫空间站彰显国家航天成就 下一篇高考期间AI工具使用受限吗 豆包客服回应未获通知
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。