严防死守!美国AI三巨头封杀中国模型蒸馏
最近AI圈有个动向值得玩味。OpenAI、Anthropic和谷歌这几家巨头,正通过一个名为“前沿模型论坛”(FMF)的组织悄悄联手。这个论坛是2024年他们联合微软成立的,现在成员还包括亚马逊和Meta。他们共享信息的主要目的很明确:联手侦测并遏制中国AI企业的一种特定技术行为——“对抗性蒸馏”,以防自家最先进的模型成果被“借鉴”过去,从而在激烈的全球AI竞赛中保持优势。这种级别的同业合作相当罕见,背后折射出的,是美国整个AI行业对中国竞争对手日益加深的警惕。
何为“对抗性蒸馏”?
简单来说,“对抗性蒸馏”指的是第三方在未经授权的情况下,通过一系列技术手段,试图复制专有AI模型的核心能力。这可不是什么光明正大的技术交流。OpenAI已经公开证实参与了FMF内的相关信息共享,并且在一份提交给美国国会的备忘录中直接点名了中国企业深度求索(DeepSeek),指控其“搭便车”,利用美国公司的技术壮大自身。对于这些指控,Anthropic、谷歌以及FMF本身目前都保持了沉默,未予置评。
但沉默不代表没有行动。实际上,Anthropic从去年就开始“划清界限”,禁止中资企业使用其Claude模型。到了今年2月,更是直接点名了深度求索、月之暗面以及MiniMax这三家中国公司,明确指出它们涉嫌通过蒸馏技术非法提取模型能力。谷歌也在其最新的官方博客中表达了类似的担忧,称已经观察到模型提取攻击呈现上升趋势。
这里需要厘清一个概念:蒸馏技术本身并非洪水猛兽,它其实是AI行业内一种常用的技术手段。企业可以用它来训练出更高效、更轻量的小模型,或者在非竞争的前提下,供外部开发者安全地使用部分模型能力。问题关键在于应用的边界和意图。
来自中国公司的正面回应
面对美方企业的指控,处于风暴眼的深度求索其实早已在权威平台上作出了系统性的回应。2025年9月,由DeepSeek团队完成、梁文锋担任通讯作者的一篇关于DeepSeek-R1的研究论文,登上了国际顶级学术期刊《自然》(Nature)的封面。这篇论文意义非凡,它是全球首个经过独立同行评审的主流大语言模型研究。
论文中补充了大量详尽的技术细节,可以说是一次对“模型蒸馏”质疑的正面回应。整个评审过程历时7个月,经历了8位外部专家的严格审阅,产生的审稿文件厚达64页,其科学性与严谨性可见一斑。
那么,论文到底说了什么?DeepSeek明确澄清了几个关键点:
首先,其R1模型的基座模型DeepSeek-V3-Base,所使用的训练数据完全来源于普通的公开网页和电子书,不包含任何人为合成的数据。
其次,在预训练的“冷却”阶段,团队也并未故意掺入任何由OpenAI模型生成的合成数据,所有数据均通过网页抓取获得。当然,公司也坦诚了一个现实情况:互联网上的部分网页中,本身就可能包含了大量由OpenAI等模型生成的答案或内容,这使得基础模型可能在无意间间接受益于其他强大模型的知识。这是一个难以完全规避的客观现实。
此外,DeepSeek特别强调,DeepSeek-V3-Base所使用的数据截止时间是2024年7月。而当时,市面上各类先进的公开推理模型尚未发布,这从时间线上进一步降低了其模型有意或无意从现有推理模型中“蒸馏”知识的可能性。

