三家中国AI公司非法提取Claude模型能力训练自家模型

Anthropic 发布调查报告,称发现 DeepSeek、月之暗面(Moonshot/Kimi)和 MiniMax 三家中国 AI 实验室,通过大规模"蒸馏攻击"非法提取 Claude 模型的能力来训练自家模型。
三家公司共创建了约2.4万个虚假账户,与 Claude 产生超过1600万次对话交互。所谓"蒸馏",就是用强模型的输出来训练弱模型——相当于让学生抄优等生的作业来提高成绩。
这种方法本身是合法的训练技巧,各大 AI 公司也用它来制作自家模型的轻量版本,但未经授权对竞争对手的模型进行蒸馏则违反了服务条款。三家公司的操作手法类似:通过代理服务绕过 Anthropic 对中国的访问限制,用大量虚假账户分散流量以躲避检测。
其中 MiniMax 规模最大,产生超过1300万次交互,主要提取编程和工具使用能力;月之暗面超过340万次,瞄准智能体推理和计算机视觉;DeepSeek 虽然量级最小(15万次),但手法最值得关注——他们让 Claude 反向“复述”自己的推理过程来生成思维链训练数据,还让 Claude 生成政治敏感问题的"安全回答",疑似用于训练自家模型的审查回避能力。
Anthropic 表示已通过 IP 地址、请求元数据等信息将攻击溯源到具体实验室甚至具体研究人员,并称这一发现说明中国 AI 公司的快速进步并非完全靠自主创新,也在一定程度上依赖对美国模型能力的提取。
Anthropic 报告原文:
检测与防范蒸馏攻击
2026年2月23日
我们已识别出三家人工智能实验室——DeepSeek、Moonshot 和 MiniMax——发起的工业规模行动,试图通过非法方式提取 Claude 的能力,以提升它们自身的模型。这些实验室通过大约24,000个欺诈账户,与 Claude 进行了超过1600万次交互,违反了我们的服务条款以及区域访问限制。
这些实验室使用了一种名为“蒸馏”(distillation)的技术,即让一个能力较弱的模型学习更强模型的输出。蒸馏是一种被广泛使用且合法的训练方法。例如,前沿 AI 实验室通常会对自家模型进行蒸馏,以便为客户创建更小、更便宜的版本。但蒸馏也可能被用于非法目的:竞争对手可以用它在远低于自主研发所需时间与成本的情况下,获取强大的能力。
这些行动正在迅速升级,强度和复杂性不断提高。采取行动的窗口期十分有限,这一威胁也早已超出任何单一公司或地区的范畴。解决这一问题需要行业参与者、政策制定者以及全球 AI 社区之间迅速而协调的合作。
为什么蒸馏问题至关重要
通过非法蒸馏得到的模型缺乏必要的安全防护,从而带来重大国家安全风险。Anthropic 及其他美国公司构建的系统,会防止国家或非国家行为体利用 AI 开发生物武器或实施恶意网络活动等。通过非法蒸馏构建的模型,很可能无法保留这些安全防护措施,这意味着危险能力可能在大量安全机制被剥离的情况下扩散。
对美国模型进行蒸馏的外国实验室,随后可能将这些缺乏防护的能力输入到军事、情报和监控系统中——使他国政府能够将前沿 AI 用于进攻性网络行动、虚假信息宣传和大规模监控。如果蒸馏模型被开源,这种风险将成倍放大,因为这些能力会在任何单一政府控制之外自由传播。
蒸馏攻击与出口管制
Anthropic 一直支持出口管制,以帮助维持美国在 AI 领域的领先地位。蒸馏攻击削弱了这些管制措施,因为它允许外国实验室通过其他方式缩小出口管制试图保留的竞争优势。
在缺乏对这些攻击可见性的情况下,这些实验室看似迅速的技术进步,往往被错误解读为出口管制无效、可以通过创新绕过。事实上,这些进步在很大程度上依赖于从美国模型中提取的能力,而要大规模执行这种提取,则需要先进芯片的支持。因此,蒸馏攻击反而强化了出口管制的合理性:限制芯片获取不仅限制直接模型训练,也限制了非法蒸馏的规模。
我们的发现
下文详述的三起蒸馏行动采用了相似的操作模式:使用欺诈账户和代理服务,大规模访问 Claude,同时规避检测。其提示语的规模、结构和集中方向均明显不同于正常使用模式,反映出其目的是刻意提取能力,而非合法使用。
我们通过 IP 地址关联、请求元数据、基础设施指标,以及在某些情况下来自行业合作伙伴的佐证,高置信度地将每次行动归因于特定实验室。这些行动都集中针对 Claude 最具差异化的能力:代理式推理、工具使用和编程。
DeepSeek
规模:超过15万次交互
该行动目标包括:
各类任务中的推理能力
基于评分标准(rubric)的打分任务,使 Claude 充当强化学习的奖励模型
生成“审查安全”的敏感问题替代表述
DeepSeek 在多个账户之间生成同步流量。相同的模式、共享支付方式以及协调的时间安排表明其进行了“负载均衡”,以提高吞吐量、增强可靠性并规避检测。
一个显著手法是,提示 Claude 想象并逐步阐述某个已完成回答背后的内部推理过程——实质上是在大规模生成思维链(chain-of-thought)训练数据。我们还观察到任务要求 Claude 为敏感问题生成“审查安全”的替代表述,很可能是为了训练 DeepSeek 自身模型在这些话题上进行回避引导。通过请求元数据分析,我们能够将这些账户追溯到该实验室的具体研究人员。
Moonshot AI
规模:超过340万次交互
目标包括:
代理式推理与工具使用
编程与数据分析
计算机使用代理开发
计算机视觉
Moonshot(Kimi 模型)使用了数百个欺诈账户,横跨多种访问路径。多样化的账户类型使该行动更难被识别为协调操作。我们通过请求元数据进行归因,其信息与 Moonshot 高级员工的公开资料相匹配。在后期阶段,Moonshot 采用了更具针对性的方式,试图提取并重建 Claude 的推理轨迹。
MiniMax
规模:超过1300万次交互
目标包括:
代理式编程
工具使用与编排
我们通过请求元数据和基础设施指标将该行动归因于 MiniMax,并结合其公开产品路线图验证时间节点。我们在 MiniMax 发布其训练模型之前,就在其行动仍在进行时检测到了该蒸馏行为,这为我们提供了前所未有的视角,观察蒸馏攻击从数据生成到模型发布的完整生命周期。
我们在 MiniMax 行动期间发布新模型时,对方在24小时内迅速调整策略,将近一半流量转向捕捉我们最新系统的能力。
蒸馏方如何获取前沿模型
出于国家安全考虑,Anthropic 目前不向中国或其境外子公司提供 Claude 的商业访问。
为绕过这一限制,这些实验室使用商业代理服务,以规模化方式转售 Claude 及其他前沿模型的访问权限。这些服务运行所谓的“九头蛇集群”(hydra cluster)架构:由大量欺诈账户构成的庞大网络,将流量分散到我们的 API 以及第三方云平台。该网络范围广泛,没有单点故障。一个账户被封禁后,新的账户立即顶替。在一个案例中,单一代理网络同时管理超过20,000个欺诈账户,并将蒸馏流量与其他正常客户请求混合,以增加检测难度。
一旦获得访问权限,这些实验室就会生成大量精心设计的提示语,以提取特定能力。目标要么是收集高质量回答用于直接模型训练,要么是生成数万条独特任务,用于运行强化学习。
区别蒸馏攻击与正常使用的关键在于模式。例如以下提示语(与我们观察到的大规模重复提示近似)单独看似无害:
“你是一名专家级数据分析师,结合统计严谨性与深厚领域知识。你的目标是提供基于真实数据、具备完整透明推理过程的数据驱动洞察,而非摘要或可视化。”
但当该提示的变体在数百个协调账户间被重复数万次,并集中针对同一狭窄能力时,其模式便显而易见:在少数能力领域集中爆发的巨大流量、高度重复的结构,以及内容与 AI 模型训练核心价值的高度映射——这正是蒸馏攻击的典型特征。
我们的应对措施
我们持续大力投入防御机制,使蒸馏攻击更难实施、更易识别,包括:
检测机制:构建多个分类器与行为指纹系统,用于识别 API 流量中的蒸馏攻击模式,包括识别用于构建推理训练数据的思维链诱导行为,以及跨大量账户的协调活动。
情报共享:与其他 AI 实验室、云服务提供商及相关机构共享技术指标,形成对蒸馏生态的更全面认知。
访问控制:加强对教育账户、安全研究项目及创业组织的验证流程——这些是欺诈账户最常利用的渠道。
反制措施:开发产品级、API 级及模型级防护机制,在不影响合法用户体验的前提下,降低模型输出对非法蒸馏的有效性。
但任何一家公司都无法独自解决这一问题。正如前文所述,这种规模的蒸馏攻击需要 AI 行业、云服务提供商及政策制定者之间的协调响应。我们发布此文,是为了让所有关心这一结果的人都能看到相关证据。
相关新闻
还好意思说别人蒸馏?马斯克抨击Anthropic大规模盗用训练数据
相关攻略
当中国汽车市场进入以“周”为单位的创新迭代周期,传统豪华品牌正面临一个核心战略抉择:是全力追赶本土市场的疾速节奏,还是坚守自身长期积淀的技术哲学与体系能力?在2026年北京国际车展上,宝马集团通过其新世代车型所展示的答案,清晰地指向了一条深度融合与系统性反哺的路径。 面对行业在智能座舱与高阶智能驾驶
2026年一季度,长鑫科技业绩爆发。长江存储与长鑫科技历经十年投入,在NAND闪存与DRAM内存领域实现突破,2025年第四季度全球份额显著提升,精准契合AI存储需求并带动产业链。尽管部分尖端环节仍有差距,但商业闭环已初步形成,标志着中国存储产业崛起。
算力与电力,作为驱动数字时代与实体经济的双重引擎,正共同站在历史性的交汇点上。一方面,数字经济的爆发式增长催生了近乎无限的算力需求;另一方面,能源结构转型与“双碳”战略目标对电力系统的绿色化、智能化提出了更高要求。二者的深度碰撞,究竟是难以调和的矛盾,还是孕育着引领未来的巨大机遇? 在近期围绕“算电
全球汽车供应链加速重塑。凭借成本低30%-40%、交付周期缩短近半且质量接近的优势,中国零部件企业正被丰田、日产等日系车企大规模采用。为应对电动车价格竞争,日系车企在华新车型大幅提升中国零部件比例,并计划推广至东南亚基地。传统日系供应商承压收缩,中国供应链渗透正向核心部件。
2026年DIA药物信息大会在上海开幕,吸引全球40多国专业人士及12家国际药监机构参与。参会者高度关注中国生物医药领域的“中国速度”,即高效的合作与决策流程。大会覆盖全产业链展示,旨在促进国际交流,特别安排新兴市场药监机构与中国企业闭门讨论前沿议题,为中国创新药国际化搭建桥梁。
热门专题
热门推荐
在《燕云十六声》中领悟“菩提苦海”,需沉浸探索游戏世界。主线剧情构建认知框架,战斗观察、场景细节与NPC对话皆暗藏线索。通过多元视角拼凑因果,方能深入理解游戏蕴含的宏大叙事与深邃魅力。
2026年618大促的序幕刚刚拉开,初期战报已经透露出一些耐人寻味的信号。截至5月21日,海信电视在京东平板电视累计销售竞速榜上拔得头筹,其RGB-Mini LED爆款王——海信小墨E5S Pro,更是同时拿下了天猫平板电视和抖音大家电的5 20单品销冠。 这并非偶然。奥维云网的全渠道监测数据给出了
充电桩领域的“军备竞赛”再次迎来重磅升级。5月22日,极氪汽车正式发布了其全新一代液冷超级充电桩,将单枪峰值功率一举提升至行业领先的800kW,标志着超充技术迈入新阶段。 根据官方披露的核心信息,这款超充桩主要具备四大优势:极速补能、高效节能、广泛适配与多重安全。具体而言,其单枪峰值电流高达800A
获取电弧机剑主要有五种途径:推进主线任务以解锁线索;探索遗迹、工厂等特定区域;挑战特定副本与Boss;完成提及传说武器或遗物的支线任务;参与限时活动并达成要求。玩家可根据偏好选择或组合多种方式获取该武器。
小米汽车再次为潜在车主带来惊喜福利!即日起至5月31日,用户只需提前完成预约,并到店参与任意车型的试驾体验,即可免费获赠一款1:64精致合金车模。车模款式与颜色随机发放,为试驾过程增添一份专属的收藏乐趣,诚意十足。 参与本次活动需注意以下细则:试驾必须通过官方渠道提前预约;各授权门店的车模备货数量不





