游乐游手机版
首页/科技数码/文章详情

MiniMax正式发布人工智能M3模型编程能力全面超越GPT-5.5

时间:2026-06-01 15:12
MiniMax发布了新一代通用模型M3,它采用了自研的稀疏注意力架构MSA,其编程能力超越了GPT-5 5,支持长达100万个token的超长上下文,并具备原生多模态能力,推理效率相比上代提升了约20倍,在代码生成、图像理解等任务上表现卓越。

在启动A股上市辅导后,MiniMax再度迎来重要进展。6月1日,该公司正式推出新一代通用大模型——MiniMax M3。M3采用自研的稀疏注意力架构MSA(MiniMax Sparse Attention),在编程与智能体(Agent)能力、超长上下文处理以及原生多模态等关键领域,均实现了代际级别的跨越式突破。就在两天前,MiniMax Group Inc.已在上海证监局完成辅导备案登记,拟首次公开发行股票并上市,行业分类为I65软件和信息技术服务业,辅导券商为中信证券。这意味着,继智谱之后,MiniMax成为又一家启动“A+H”双平台布局的AI公司。

MiniMax上新M3模型,编程能力超GPT-5.5

具体来看,M3同时具备三大核心能力:前沿的Coding编程能力、1M超长上下文窗口,以及原生多模态支持。据MiniMax介绍,它是目前开源模型中唯一能同时兼顾这三大特性的产品。这一定位本身就极具说服力——行业竞争日益激烈,能守住“全能”标签的模型已经屈指可数。

在架构层面,M3的自研稀疏注意力机制MSA是一大亮点。相比传统的全注意力机制,MSA能够大幅降低长上下文场景下的计算开销,同时将上下文窗口扩展至100万token。这意味着什么?简单来说,在处理长文档、复杂代码仓库或多轮任务协作时,模型能在单次推理中保持更完整的信息链路,避免因上下文过长而导致“断片”。根据MiniMax公布的数据,在100万上下文规模下,M3每个token的计算量仅为上一代模型的约1/20,推理效率提升十分显著。

事实上,采用新型注意力机制来降低Token消耗,已成为新一代模型发布时的标准动作。例如,DeepSeek最新推出的V4模型就采用了混合压缩注意力机制,能够在处理超长上下文时更高效地组织和检索信息,相比上一代模型仅需约27%的计算量和10%的缓存空间。换句话说,同样的任务,所需的Token和算力都大幅减少。行业趋势已经非常明确:谁的推理成本更低,谁就能在落地场景中抢占先机。

除了架构升级,MiniMax还在底层推理算子层面进行了进一步优化。通过重新设计数据读取与计算路径,相关性能相比主流开源方案提升了4倍以上。这背后反映出一个行业共识:随着Agent任务复杂度持续提升,“更长上下文、更稳定记忆、更低成本推理”正成为决定产品可用性的核心能力。简而言之,仅有强大的模型还不够,工程侧的软实力同样决定着能力的上限。

在大模型目前消耗Token最多的两大领域——编程与Agentic任务中,M3同样表现亮眼。在衡量Coding能力的SWE-Bench Pro基准上,M3直接超越了4月发布、主打编程能力的OpenAI新一代模型GPT-5.5,以及Gemini 3.1 Pro,距离Opus 4.7也仅差一步之遥。而在综合评估SVG生成性能的SVG-Bench基准上,M3甚至超过了Opus 4.7。此外,在面向自主Agent的端到端评测框架Claw-Eval中,M3获得了最高分。这些成绩放在一年前,几乎难以想象。

为了验证最新模型的超长上下文、编程和Agent能力,MiniMax还进行了一项相当硬核的测试:直接将一篇ICLR 2025 Outstanding Paper Award获奖论文提供给M3,让它独立复现。结果M3自主运行了近12小时,全程自主产出18次代码提交和23张实验图表,成功跑通了核心实验,验证了论文中提出的方法。这个案例充分展示了模型自主执行能力已经达到的高度。

多模态一直是MiniMax的核心战略方向,在M3上也得到了充分落地。据介绍,M3是一款从Step 0开始就进行多模态混合训练的模型。在重构整套数据管线后,MiniMax已将训练数据Token规模提升至100万亿量级。这意味着模型能力正从语言理解进一步向真实数字环境延伸。无论是办公自动化、企业软件操作,还是更复杂的生产力场景,AI进入实际执行层的速度都在显著加快。一句话总结:M3并非简单的“改参数”,而是从底层架构到工程优化再到场景能力的全面跃迁。

来源:https://www.163.com/dy/article/KUBIK0DF05129QAF.html
上一篇儿童衣物分洗概念引领小家电热,宁波商家借拼多多拓西部市场 下一篇中国生物制药贝莫苏拜单抗+安罗替尼一线非鳞非小细胞肺癌2026 ASCO III期数据
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
自研高精度大气风场探测系统为神舟返回提供精确气象保障
科技数码 · 2026-06-01

自研高精度大气风场探测系统为神舟返回提供精确气象保障

神舟二十二号飞船返回舱成功在东风着陆场着陆,这背后有一个关键亮点——我国自主研发的高精度大气风场探测系统,为飞船安全返回提供了精准的气象保障。可以说,落点预测能够如此精确,这套系统功不可没。 返回舱的返回阶段,在载人航天任务中风险最高、难度也最大,对着陆场的气象保障能力提出了极为严苛的要求。尤其当返

比亚迪方程豹布局轿车完善产品序列版图
科技数码 · 2026-06-01

比亚迪方程豹布局轿车完善产品序列版图

6月1日,方程豹官方发布了“方程S系列答网友问”第一期,核心聚焦一个问题——为何一个主打“个性越野”理念的品牌,会突然推出轿车产品? 方程豹官方说明明确表示:作为比亚迪旗下的个性化品牌,从创立之初就没有将自己局限于越野车品类。布局轿车,本质上是完善产品阵容、补齐品类版图的关键一步。事实上,早在202

印度一季度平板电脑销量增5% 联想重返第二
科技数码 · 2026-06-01

印度一季度平板电脑销量增5% 联想重返第二

2026年第一季度印度平板电脑市场同比增长5%,联想超越其他品牌重回第二,一加首次进入前五。本土制造规模同比猛涨61%,平均售价出现两位数百分比增长,市场高端化趋势明显。

黄仁勋宣布英伟达提供大脑宇树造身体合作开发人形机器人
科技数码 · 2026-06-01

黄仁勋宣布英伟达提供大脑宇树造身体合作开发人形机器人

英伟达与宇树科技联手推出人形机器人参考设计H2+,英伟达提供算力与AI平台,宇树负责运动控制与本体设计。该方案旨在加速人形机器人从实验室走向量产,并向行业输出可复用的基准方案,降低开发者试错成本。

NVIDIA进军PC处理器 RTX Spark现场跑3A达100FPS
科技数码 · 2026-06-01

NVIDIA进军PC处理器 RTX Spark现场跑3A达100FPS

近日,英伟达发布RTXSpark超级芯片,集成BlackwellGPU与二十核GraceCPU,最高一百二十八GB统一内存,人工智能算力达一千万亿次浮点运算。在1440p分辨率下运行3A游戏可达一百FPS,但官方未说明是否开启DLSS及帧生成技术。其统一内存架构可避免显存瓶颈,首批产品今秋上市。