Synth Daily

Anthropic 指控中国 AI 实验室“挖掘”Claude,正值美国就 AI 芯片出口展开辩论

AI 公司 Anthropic 指控三家中国 AI 实验室——DeepSeek、Moonshot AI 和 MiniMax,通过大规模的“蒸馏攻击”窃取其 Claude 模型的核心技术以提升自身模型性能。这起事件暴露了 AI 领域的知识产权盗用问题,并直接关联到美国关于是否应限制向中国出口高级 AI 芯片的政策辩论。核心论点是,此类行为不仅削弱了美国的 AI 竞争优势,还可能因被窃取模型缺少安全防护而构成严重的国家安全风险。

“蒸馏攻击”:一场大规模的技术窃取

Anthropic 公司发现,三家中国 AI 公司通过设立超过 2.4万个虚假账户,与其 Claude 模型进行了超过 1600万次交互。这种行为被称为“蒸馏”,是一种用于复制竞争对手模型能力的技术。

  • 攻击方式: 利用竞争对手的模型(如 Claude)来训练自己的模型,本质上是“抄作业”,以更低的成本复制其核心能力。
  • 攻击目标: 这些攻击专门针对 Claude 模型最独特的几个能力,包括代理推理 (agentic reasoning)、工具使用和编程能力
  • 业界先例: OpenAI 此前也曾指控 DeepSeek 使用类似方法模仿其产品。

这种方法虽然在模型优化中很常见,但用于竞争对手身上时,就构成了事实上的技术盗窃。

三家公司的不同攻击目标

Anthropic 的追踪显示,三家公司各有侧重,系统性地从 Claude 模型中提取能力。

  • DeepSeek: 进行了超过 15 万次交互,主要目标是提升其模型的基础逻辑和“对齐”能力,特别是寻找审查政策下敏感问题的安全替代回答方案。
  • Moonshot AI: 进行了超过 340 万次交互,目标广泛,涵盖代理推理、工具使用、编程、数据分析和计算机视觉等多个领域。
  • MiniMax: 进行了多达 1300 万次交互,重点窃取代理编程和工具使用能力。Anthropic 观察到,当其发布最新版 Claude 模型时,MiniMax 几乎将其一半的流量重定向过来,以吸取新模型的能力。

事件背后的芯片出口管制争议

这起事件的发生,正值美国就是否应收紧对华高级 AI 芯片出口管制政策的激烈辩论期间。Anthropic 认为,两者之间存在直接联系。

  • 攻击依赖算力: Anthropic 明确指出,DeepSeek、MiniMax 和 Moonshot AI 所进行的大规模模型提取行为“需要使用先进芯片”。
  • 支持出口管制的理由: 这起事件为加强芯片出口管制提供了新的论据。限制先进芯片的获取,不仅能直接限制对手的模型训练规模,也能限制他们通过非法“蒸馏”进行技术窃取的能力。

“蒸馏攻击因此强化了出口管制的理由:限制芯片的获取,既能限制直接的模型训练,也能限制非法蒸馏的规模。”

超越商业竞争的国家安全风险

Anthropic 强调,这种技术窃取行为的危害远不止于商业竞争,它还可能带来无法预估的国家安全风险。

美国公司在开发 AI 模型时,会内置一系列安全系统,以防止模型被用于恶意目的。然而,通过“蒸馏”复制的模型很可能不会保留这些重要的安全措施。

  • 危险能力的扩散: 原始模型中用于防止开发生物武器或进行恶意网络活动的安全防护措施被完全剥离
  • 威权政府的滥用: 如果这些缺少安全护栏的强大模型被开源或落入威权政府手中,它们可能被用于进攻性网络行动、虚假信息宣传和大规模监控

政策专家 Dmitri Alperovitch 对此评论道:“这应该给我们更充分的理由,拒绝向这些公司出售任何 AI 芯片,因为这只会进一步增强他们的优势。”