2026年6月1日,MiniMax正式发布了新一代大模型M3。此次发布有几个关键亮点:它不仅是国内首个将顶尖代码生成能力、1M超长上下文处理以及原生多模态理解与生成能力深度融合的开源大模型,更明确对标国际一线的闭源旗舰产品,目标直指行业顶尖水平。

先来看M3在底层技术上的核心突破。为了让智能体在复杂任务中处理更长的上下文,M3专门构建了一套自研的稀疏注意力机制——MSA。该机制通过更精细的KV分块策略和深度算子级优化,在计算效率上实现了跨越式提升。结果非常直观:整体推理速度比主流开源方案提升了4倍以上;在1M超长上下文场景下,单Token的计算开销降到了前代模型的十分之一,预填充和自回归解码阶段分别快了9倍和15倍。

M3之所以能取得如此出色的表现,还得益于原生百亿亿级交错结构化数据的联合训练。这种方式让模型的语义表征达到了高度统一和泛化,反映在基准测试上则是实打实的成绩。在SWE-Bench Pro等权威软件工程和多模态基准测试中,M3的性能已经全面超越了GPT-5.5和Gemini 3.1 Pro。更有意思的是极限任务验证环节的表现:M3不仅连续运行12小时独立复现了ICLR顶会论文的全部实验流程,还在零参考代码的条件下稳定运行了24小时,累计调用外部工具近2000次。它成功将Hopper架构上FP8精度矩阵乘法的硬件利用率从7.6%大幅提升至71.3%,并在开放式PostTrainBench评测中,全程自主完成了“数据准备→模型训练→效果迭代”的闭环优化——完全是独立作战。
和M3一同发布的,还有面向长周期协同开发场景深度定制的MiniMax Code智能体平台,以及高性价比的Token订阅计划和API接入服务。官方承诺在发布后10日内全面开源模型权重。客观来说,M3的发布不仅意味着国内在前沿多模态和超长上下文技术上终于有了自己的扛鼎之作,更重要的是,它以全栈开源的形式,重新定义了国产大模型生态的价值尺度和落地边界。
