OpenAI、谷歌、Anthropic联手指控中国AI企业「蒸馏」:技术剽窃还是行业霸凌

4月7号那天,AI圈发生了一件挺少见的事。

OpenAI、Anthropic、Google——这三家平时互相掐得死去活来的公司,居然站到了同一条战壕里。

通过一个叫「前沿模型论坛」的组织统一发声,矛头直指三家中国AI企业:深度求索(DeepSeek)、稀宇科技(MiniMax)、月之暗面(Moonshot)。

指控内容:利用「对抗性蒸馏」技术,窃取美国大模型的能力。

先搞清楚「蒸馏」是什么

知识蒸馏本身是一个正经的机器学习技术。简单说就是:用一个大模型(教师模型)的输出来训练一个小模型(学生模型),让小模型学到大模型的部分能力。

这个技术在学术界用了很多年,完全合法合规。你用GPT-4的API生成一批高质量数据,拿去训练自己的小模型——这在技术上就是蒸馏。

但美方指控的是「对抗性蒸馏」,意思是:不是正常使用API,而是通过大量虚假账号、自动化脚本,系统性地从模型中「榨取」能力。

数据有多夸张

Anthropic的调查报告里给了一组数据:相关方利用约24000个虚假账号,对Claude发起了超过1600万次异常交互。

1600万次。

如果这个数字是真的,那确实不是「正常使用API」能解释的。这更像是一种有组织的、工业化的数据采集行为。

OpenAI更早动手——2026年2月就向美国国会递交了专项备忘录,点名DeepSeek。Google随后跟进,称自己也检测到了大量异常攻击行为。

三家共享风控和监测数据,口径统一,火力拉满。

技术维权还是行业霸凌?

这件事有两种完全不同的解读方式。

第一种:这是正当的知识产权保护。如果中国企业确实通过非正常手段大规模提取模型能力,那这就是技术剽窃,应该被追究。API的使用条款里明确禁止用输出数据训练竞品模型,违反条款就是违反条款。

第二种:这是新型技术封锁的借口。美方三巨头联手发难的时间点很微妙——恰好是DeepSeek V4发布前夕,也是中国AI企业在全球市场份额快速增长的时期。用「蒸馏」指控来打压竞争对手,在商业竞争中并不罕见。

我个人倾向于认为,真相在两者之间。

几个值得思考的问题

第一,「蒸馏」的边界在哪里?用API生成数据来训练模型,这件事几乎所有AI公司都在做。区别只在于规模和方式。24000个虚假账号确实过分了,但如果是用正常账号、正常调用量来做同样的事情呢?

第二,谁来定义「异常」?1600万次交互听起来很多,但对于一个大型AI公司的研发团队来说,这个量级并不离谱。关键是这些交互的模式——是不是明显在做系统性的数据采集?这个判断标准,目前完全由美方企业自己定义。

第三,开源模型怎么算?DeepSeek V4是开源的。如果一个开源模型的能力「碰巧」和某个闭源模型很像,你怎么证明它是蒸馏来的,而不是独立研发的?在技术上,这几乎无法证明。

更大的背景

这件事不能脱离中美科技竞争的大背景来看。

芯片禁令、实体清单、出口管制——美方已经在硬件层面对中国AI产业进行了系统性的限制。现在又在软件层面开辟新战场,用「蒸馏」指控来限制中国企业获取模型能力。

从美方的角度看,这是保护知识产权。从中方的角度看,这是技术霸凌。

两种叙事都有道理,也都有漏洞。

我的看法

作为一个写过不少代码、也用过不少API的人,我对「蒸馏」这件事的态度是:技术本身无罪,但方式很重要。

如果真的用了24000个虚假账号去薅,那确实不体面。但如果因此就把所有中国AI企业的技术进步都归结为「偷来的」,那也太小看中国的AI研发能力了。

DeepSeek V4的稀疏注意力架构、昇腾适配、MoE优化——这些东西不是蒸馏能蒸出来的。

这场争论短期内不会有结论。但它提醒我们一件事:在AI这个赛道上,技术竞争和地缘政治已经深度绑定了。

作为开发者,我们能做的就是:写好自己的代码,用好合规的工具,别被叙事带着走。