MiniMax大模型为何无法识别马嘉祺官方解释原因

时间：2026-05-14 22:50

最近，AI圈里出了件挺有意思的事儿。不少网友发现，MiniMax的大模型，好像就是认不准“马嘉祺”这三个字。一开始，大家还以为只是偶然的“小bug”，但经过多轮实测，情况变得有点耐人寻味了。无论是切换不同的接口，还是更换使用平台，这个问题都能稳定地复现出来。翻看网友们的测试截图，再结合实际的调用

最近，AI圈里出了件挺有意思的事儿。不少网友发现，MiniMax的大模型，好像就是认不准“马嘉祺”这三个字。

一开始，大家还以为只是偶然的“小bug”，但经过多轮实测，情况变得有点耐人寻味了。无论是切换不同的接口，还是更换使用平台，这个问题都能稳定地复现出来。

翻看网友们的测试截图，再结合实际的调用结果来看，模型其实“知道”马嘉祺这个人。它能检索到相关的背景资料，也能完整、准确地输出他的个人履历和经历。可偏偏一到要说出他名字的时候，模型就开始“犯迷糊”，要么文字错乱，要么随意改写。

简单概括就是：人物背景信息都对，人物也能对上号，唯独在识别和输出姓名这个环节上，频频掉链子。

这背后到底是什么原因呢？

今天，MiniMax官方微博发布长文，正式回应了M2系列模型无法正常说出“马嘉祺”的问题，并详细分享了完整的排查过程和技术层面的思考。

根据官方的说明，他们从多个技术维度进行了深入排查。这包括检查分词器版本是否对齐、分析embedding的统计分布、进行语义近邻检索，还对比了预训练模型与后训练模型在少量样本（few-shot）下的表现差异。此外，团队也统计了后训练数据中词汇的出现频次，并对整个词表中语言模型头部（lm_head）参数的变化幅度进行了排序扫描。

MiniMax大模型认不出马嘉祺！官方终于给出原因

最终，问题根源被定位了：在分词器中，“嘉祺”被合并成了一个独立的token（词元）。然而，这个特定的token在后训练数据中间出现的频率极低。正是这种极低的曝光度，导致模型在后训练过程中，逐渐“遗忘”了该如何生成这个token。

那么，如何修复呢？MiniMax给出的方案是，构造一份覆盖整个词表的合成数据。其核心思路很巧妙：通过一个简单的“复读”任务，为词表中的每一个token都建立一个生成频率的“底线保障”。这样一来，就能防止任何一个token因为长期“缺席”而出现能力退化。

此外，MiniMax也表示，未来会将“token覆盖度”作为后训练数据质量的一项常规监控指标。这种做法有助于在早期就发现那些潜在的、因token稀疏而引发的退化风险，从而避免类似问题再次在线上环境中间出现。

MiniMax大模型认不出马嘉祺！官方终于给出原因

来源：https://m.mydrivers.com/newsview/1121115.html

MiniMax

上一篇小米寻天N90增程SUV谍照曝光车头Logo清晰可见 下一篇如何快速将纸质书籍文字输入电脑

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-02

小米集团辟谣官微上线，定位官方辟谣平台

小米辟谣官微6月30日正式上线，作为集团官方辟谣阵地，用户可查询辟谣声明、反馈谣言线索。账号将主动澄清网络谣言，维护合法商誉，并致力于打造权威辟谣通道，保障公众知情权与合法权益。

业界动态 · 2026-07-02

小米官方辟谣账号上线持续维护合法商誉

6月30日，小米集团的一则动态引发热议：小米辟谣官方账号，正式上线了。简单来说，小米这次将澄清谣言的工作直接推到了前台——在中央网信办违法和不良信息举报中心的指导下，小米辟谣的全新阵地宣告成立。目前，这个辟谣账号已在微博开通。用户可以通过它核实与查阅小米官方的辟谣声明，也可以反馈任何涉及小米的谣言

业界动态 · 2026-07-02

特斯拉Cybercab无驾舱量产车在奥斯汀启动L4级公开道路测试

特斯拉Cybercab量产车在奥斯汀启动L4级公开测试，彻底取消方向盘等物理控制装置。安全监督员仅观察不干预。车辆专为Robotaxi设计，搭载HW4 0与FSDV14 3 3系统，续航672公里，支持无线充电，实现全程独立驾驶。

业界动态 · 2026-07-02

鸿蒙智行回应问界M5车内异味系第三方配件所致

6月30日，针对近期网络热议的“问界M5车内异味”事件，鸿蒙智行官方小助手在社区帖子下方发布了正式回应。官方表示，已对刘先生的这辆车进行了全面检测排查。工作人员上门核查后发现，涉事车辆内部加装了大量第三方配件，包括非原厂皮质、塑胶收纳摆件、脚托、抱枕、车衣等。在拆除所有加装配件后，工作人员严格依照国

业界动态 · 2026-07-02

闫闯直言20万买电车选400V太愚蠢

2026年6月30日，微博上一则关于电动汽车高压平台技术路线的争论迅速引爆热搜。坐拥超过475万粉丝的汽车领域博主闫闯，在归还体验了4天的理想i6时，专门花费6分多钟把电量充至满格，并掷地有声地留下一句：“一点不比加油慢。”随后他补充道：“还是那句话，都这时代了，20万+电车还买400V的绝对愚蠢。