5月19日,DeepSeek官方针对近期用户反馈的模型内容返回异常问题,发布了正式声明。官方明确指出,此次异常是由特定字符触发的模型幻觉现象所导致,与系统安全漏洞或用户隐私数据泄露无关。同时,官方表示将通过专项训练持续优化模型,以彻底解决此类问题,提升用户体验。
在声明中,DeepSeek技术团队详细解释了问题根源:当用户输入“
这一事件的起因可追溯到数日前。众多用户在社交媒体及技术社区反映,在使用DeepSeek网页版时遇到了一个奇特现象。当他们在新建的空白对话框中,仅输入“”或类似字符并发送后,模型并未请求澄清或报错,而是自动输出一系列结构完整、但与当前对话上下文完全无关的问答内容。这些生成内容范围广泛,涉及数学求解、物理概念阐释、线性代数、命理分析乃至教育理论等多个领域。
若仔细分析这些自动生成的回复,可发现其语言风格高度格式化,频繁出现“我们被问到……”或“需要询问……”等书面化、第三人称的引导句。令部分用户感到担忧的是,在测试中甚至出现了涉及个人生辰八字等敏感信息的生成内容。这引发了用户的疑虑:是否个人对话数据遭到泄露?或模型的训练数据发生了异常?
对此,DeepSeek技术团队从AI技术角度给出了专业解释——“模型幻觉”。在人工智能领域,“幻觉”特指模型生成看似合理、实则不正确或与输入无关信息的行为。具体到本次事件,特殊字符“”在模型复杂的内部推理机制中,可能被错误地识别为某种系统指令或分隔符,从而触发模型进入预设的“思维链”推理模式。
因此,当普通用户在前端界面无意中输入该字符时,模型误将其判定为内部指令。这导致了一种非预期行为:模型试图自动补全一个它“假设”存在、但用户并未实际提出的“问题”。随后,模型便从其庞大的预训练语料库中,依据概率分布,“创造性”地合成一段结构化的问答内容进行输出。需要强调的是,这并非调取了其他用户的实时对话记录,而是模型基于其固有训练数据所进行的一种惯性补全与生成。
有技术专家为验证此解释,在完全断网的本地部署环境中成功复现了相同现象。该实验从技术层面排除了“实时串扰其他用户会话”的可能性。因为在物理隔离的本地环境中,模型的输出完全依赖于其内置的权重与参数,这进一步证实了此次事件属于“模型幻觉”,而非“数据泄露”。
“模型幻觉”:大语言模型行业的共性挑战与风险应对
事实上,“模型幻觉”并非DeepSeek独有的问题,它是当前整个大语言模型(LLM)行业面临的核心技术挑战之一。根据上海申银万国证券研究所今年1月发布的行业分析报告,大模型的幻觉主要表现为无中生有、事实性错误、语境误解、逻辑谬误等多种形式。其成因复杂,涉及模型架构的固有局限、训练数据质量不均、奖励机制设计不完善以及上下文长度限制等多重因素。报告同时指出,通过引入RAG(检索增强生成)等工程化技术路径,预计到2026年,AI模型的幻觉问题将得到显著缓解,其在部分严肃应用场景下的可靠性正逐步提升。
然而,现实评测数据所揭示的挑战依然严峻。多项国际权威测评显示,不同大型语言模型的幻觉率存在显著差异。在通用任务中,主流模型的幻觉率通常介于20%至27%之间。但一旦进入法律咨询、医疗诊断等对事实准确性要求极高的高风险垂直领域,部分模型的幻觉率可能急剧攀升至69%至88%的水平。国内研究同样警示了这一风险,清华大学新闻与传播学院新媒体研究中心的一项评测发现,多个主流大模型的事实性幻觉率超过了19%。
更值得关注的是,AI幻觉正从一个技术缺陷,演变为一种潜在的系统性风险。今年4月初,《自然》(Nature)与《科学》(Science)等国际顶级学术期刊相继发表评论,警告大模型的“幻觉”缺陷正被有意或无意地系统性滥用。具体而言,这些工具被用于批量生成携带伪造数据、引用虚构“幽灵文献”的学术论文,这对全球科研诚信与学术生态构成了实质性的污染威胁。这提醒业界,治理模型幻觉不仅是优化用户体验的技术课题,更是关乎人工智能可信度与安全发展的关键议题。
