游乐游手机版
首页/AI教程/文章详情

低预期上手MiniMax M3竟有意外惊喜

时间:2026-06-04 17:26
MiniMaxM3实测支持1M上下文、多模态及AgenticCoding,多模态可将讲座视频转为图文笔记,长文本处理能准确生成播客大纲与博客,还可分析代码库并复刻Agent工作台。TokenPlan运营调整已提供老用户补偿。M3技术实力过关,但需平衡商业与用户体验。

前段时间一直在处理其他事务,直到今天才真正抽出时间深度体验 MiniMax M3。说实话,最初并没有太高的期待——毕竟网络上众说纷纭,评价不一。作为老用户,我此前一直使用 M2.7 完成各类任务,整体体验还算顺手。

但实际上手之后,反而有了一些意外惊喜。M3 主打的三大核心亮点——1M 超长上下文、多模态融合能力以及 Agentic Coding 智能编程——在实机测试中都展现出了不错的效果。

\

关于口碑问题,更多集中在 Token Plan 商业策略调整方面。好在官方在前不久推出了老用户补偿方案,算是及时的补救措施。就当前的定位而言,继续使用 M2.7 处理日常任务,同时借助 M3 探索更多新玩法,不失为一个灵活的组合策略。先来看看实际测试表现,Token Plan 的问题后续再细聊。

M3 实际体验究竟如何?

让我们从几个真实的应用场景切入。

场景一:利用多模态能力,将讲座视频转化为图文笔记

过去使用 MiniMax M2.7 最大的缺憾便是缺乏多模态支持,导致部分工作流无法顺畅执行,必须额外配置一个多模态模型来补齐。M3 填补了这一短板后,整体适用性得到了显著提升。

在 MiniMax Code 中实际操作了一次:直接将一份 MP4 格式的讲座视频完整传入,指令要求从中截取关键的 PPT 画面并自动标注时间戳。

M3 会先调用其「视频理解」与「图片描述」模块,通览全部内容,再调用本地 ffmpeg 工具完成截图操作。截图完成后还会自动检查图片质量与表达效果,必要时自行校准修正。

\

一次执行通过,最终结果如下:

\

最终输出的图文笔记效果展示:

\

场景二:高效处理超长播客文本

近年来长视频播客越来越受欢迎。中文播客还好,通勤时戴上耳机就能听完;英文播客则没有那么轻松,尤其是 Lex Fridman 的节目,很多超过 4 个小时。好在他每次都会附带完整的 Transcript 文本。

不妨拿最近他与 VLC 作者、FFmpeg 维护者 JBK 的访谈来试试手。

\

先将 Lex 自带的视频章节信息移除,只保留时间戳和对话内容,然后向 M3 发出指令:「请帮我整理出主要讨论的话题,并生成带时间戳的目录大纲。再根据播客内容,转写一篇 4000 字左右的科技博客文章。」

\

对比 Lex 官方提供的原始时间戳大纲,M3 的章节拆分准确率相当高,在多个关键时间节点上几乎完全匹配,而且给出了更细粒度的子章节划分:

\

在没有刻意优化提示词的情况下,M3 生成的博客文章内容也相当直白实用。通读一遍即可快速抓住播客的核心要点,作为独立阅读材料完全够用。

\

如果计划在社交媒体上发布,还可以根据个人风格进一步调整提示词,或者搭配多模态功能生成一些配图。

场景三:调研并深入理解大型代码库

MiniMax M3 的另一大亮点是 1M 超长上下文窗口。不过仍建议将实际上下文控制在 200K~500K 以内,并在接近上下文窗口上限时主动切换对话。

在日常工作中真正需要跑满 1M 上下文的场景并不多见。最近发现一个很有价值的项目「Understand Anything」,可以在 Token Plan 配额比较充裕的时候,挑选一些感兴趣的代码仓库交给 Agent 进行自动化分析。

例如,将 PewDiePie 前两天开源的 Odysseus 完整交给 M3 来分析。首次分析确实耗时较长,跑了将近两个多小时。但分析完成后,会生成一个可交互的前端页面,帮助快速理解项目架构与核心逻辑。

\

在此基础上,如果还有疑问,可以继续在 Claude Code 中针对代码库提出具体问题。

\

这种深度理解分析会消耗较多 Token,比较适合在 Token Plan 空闲时段运行。

场景四:根据一张截图复刻一个 Agent 工作台

最后聊一个编程场景。目前我桌面上常驻着多种不同的 Agent:Claude Code、Codex、OpenClaw、Hermes,以及 Pi、OpenCode 等。一方面是尝鲜体验留下的代码资产,另一方面不同 Agent 确实各有所长。将不同 Agent 固化为特定的角色与分工,按需挑选合适的数字员工,甚至让它们协同合作,是一个颇具潜力的方向。

我一直希望将这些工具整合到一个类似斯坦福小镇风格的工作台中,但始终未能正式开工。

前阵子出现的 Marvis 有类似理念的雏形,不过它是一款商业化产品,并不能灵活接入和管理各类 Agent Gateway。

后来在 Claude Code 中将一张 Marvis 截图发给 M3,要求它复刻出一个可自定义接入的本地项目。首先在 Plan 模式下澄清若干需求:

\

随后 M3 全程自主完成 Coding 与搭建,期间未收到任何额外修改指令。

\

耗时 20 多分钟后,最终成果如下:

\

逐一点击测试,完成度相当高,所有按钮和菜单均可正常交互。配置好 API key 后,大模型也能顺利对话。

\

整体来看,除了 SVG 前端绘制得有些抽象之外,M3 在这个项目上的表现令人满意。后续可以使用不同的 gateway 或 API_SERVER 将其他 Agent 接入进来,配置角色与分工。说到底,UI 只是一个前端呈现——不管叫马厩、虾笼,还是套个三国武将的外壳,底层都是 Agent 通信与协作。如果有类似的开源项目也欢迎推荐。


从实测结果来看,M3 本次宣传的核心能力基本都得到了验证。综合来看,Agent 智能体、超长上下文、原生多模态能力三者组合,使得 M3 找到了自己的生态位。背后的技术细节已有不少文章详细讲解,这里不再赘述。

小结

最后聊聊 Token Plan。

对于习惯了 MiniMax 量大管饱风格的老用户而言,M3 的性价比确实不如之前的 M2.7。但商业运营终究需要算账,不可能一直补贴下去。虽然给老用户的迁移方案来得稍晚一些,但总归有了着落。

类似的问题,每个模型公司都会经历,这是迈向成熟的必经之路。MiniMax M3 的这次发布,既有技术上的高光时刻,也有运营上的失误与补救。这也说明,一个好的 AI 模型想要真正赢得用户认可,必须将技术、产品和商业三者都理顺,缺一不可。

M3 的技术实力是过关的。它通过新的 MSA 架构解决了长文本处理的效率与成本问题,同时在代码和多模态理解方面也表现不俗。虽然经历了一些风波,但最终给出了一个具有竞争力的定价与补偿方案。你可以根据实际需求测试 M3 的表现,也可以继续用 M2.7 养虾,都是不错的选择。

无论如何,MiniMax 依然坚持开源路线,为开发者提供了除少数几家闭源巨头之外,更具性价比的高性能选择。M3 的答卷已经交出,剩下的就看市场与开发者的反馈了。

来源:https://cloud.tencent.com.cn/developer/article/2682279
上一篇多模态预训练分子表示在药物发现中的应用研究 下一篇多GPU加速Python智能体随机变分推断层次贝叶斯价格弹性估计
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网