近日,MiniMax 正式开源了其新一代原生多模态旗舰大模型 M3。与此同时,国产 GPU 厂商摩尔线程宣布,旗下旗舰级 AI 训推一体智算卡 MTT S5000 已率先完成对该模型的 Day-0 极速适配。这一进展被业内视为国产算力与国产大模型协同创新技术实力的又一次有力印证。

MiniMax M3 是国内首个同时具备百万级超长上下文、前沿编程能力以及原生多模态特性的开源大模型。该模型基于自研的 MSA 稀疏注意力架构,实现了高达 1M 级别的上下文窗口,并在多项国际权威评测中表现优异。从训练阶段起,M3 便实现了文本与视觉的深度融合,能够胜任智能体调用、代码开发、长文本处理等复杂任务,对硬件算力、显存带宽及软件适配能力提出了极高要求。
硬件与软件的全链路深度优化
针对 M3 模型的各项特性,摩尔线程从硬件、软件、框架三大维度完成了全链路细致优化。在硬件层面,MTT S5000 搭载了80GB 大容量显存与 1.6TB/s 的超高带宽,配合原生 FP8 加速能力,单卡稠密 AI 算力可达 1000 TFLOPS。这使得该显卡能够充分承载百万 Token 长序列的缓存与数据吞吐需求,完美适配超长上下文的运行场景。
在软件生态方面,依托 MUSA 架构及配套工具链,摩尔线程实现了模型新算子的快速迁移,并通过定制原生算子,在不损失精度的前提下有效降低了推理延迟、提升了吞吐效率。此外,该智算卡同步兼容 vLLM 与 SGLang 两大主流推理框架,为开发者提供了灵活多样的部署方案。
加速国产 AI 生态深度融合
目前,开发者可以借助官方提供的镜像,基于摩尔线程 MUSA 软件栈快速部署并体验 MiniMax M3。截至目前,摩尔线程已持续完成了多款国产主流大模型的 Day-0 适配,形成了从模型适配、部署到性能优化的完整技术体系。这一系列举措旨在持续推动国产 AI 软硬件生态的深度融合,加速大模型技术的落地与规模化应用。
