中国多家 AI 公司正通过“蒸馏攻击”大规模获取美国前沿模型的能力。这种行为通过利用模型输出来训练新模型,规避了高昂的研发成本,并可能助力军事应用,威胁美国的领先地位。为此,专家建议通过政府制裁和企业技术升级来提高攻击门槛,维护 AI 领域的安全与竞争优势。
什么是“蒸馏攻击”?
“蒸馏攻击”是一种通过利用“老师”模型(如 Claude 或 GPT-4)的输出来训练“学生”模型的行为。这就像通过反复品尝米其林餐厅的菜肴来反推其秘制食谱,从而避开数亿美金的研发投入、算力成本和数据清洗工作。
- 合法用途: 蒸馏通常用于将大模型缩小以适配手机端,或降低推理成本。
- 恶意动机: 攻击者旨在窃取前沿能力,在违反服务协议的同时跳过独立研发过程。
攻击现状与规模
Anthropic、OpenAI 和谷歌均发现了中国企业大规模窃取能力的证据:
- DeepSeek、月之暗面(Moonshot)和 MiniMax 被指参与其中。
- 仅 MiniMax 一家公司就通过约 2.4 万个虚假账号产生了 1300 万次交互,目标是 Claude 的逻辑推理、工具调用和编程能力。
- 攻击者使用代理服务(Proxy Services)和“九头蛇集群”架构,通过成千上万个账户分散流量,混淆正常请求与窃取行为。
核心威胁:不止是经济竞争
这种行为不仅侵蚀了美国公司的商业利益,还带来了严重的连锁反应:
- 军事风险: 报告显示,中国军方正寻求将 DeepSeek 等模型集成到指挥、控制和情报系统中;俄罗斯也在利用中国模型支持在乌克兰的军事行动。
- 研发不对称: 美国公司需投入巨资(如 OpenAI 和 Anthropic 自 2024 年以来投入约 180 亿美元),而攻击者通过蒸馏可以低成本甚至零成本提供同等能力的模型。
- 安全底线竞赛: 蒸馏出的模型往往会剥离原有的安全防护措施。如果这成为常态,开发者可能会为了市场份额而忽视安全投入,导致更具破坏性的 AI 工具泛滥。
“蒸馏攻击并不只是转移了当下的技术,它还改善了攻击者研发下一代技术的基础位置。”
应对策略与建议
目前的检测手段尚未能阻止这种结构性问题,必须采取更严厉的措施:
1. 美国政府层面:
- 列入实体清单: 限制相关公司获取受出口管制的物项。
- 根据《保护美国知识产权法》(PAIP Act)实施制裁: 对涉及窃取商业秘密的实体和高管进行资产冻结、金融限制和旅行限制。
2. AI 企业层面:
- 实施 KYC(了解你的客户): 对高并发或企业级 API 客户进行身份验证,打击虚假账号。
- 技术行为分析: 识别“思维链提取”或大规模数据清洗等典型的蒸馏模式,并进行限流。
- 民事诉讼: 针对提供窃取便利的代理服务商提起法律诉讼,提高其违法成本。
战略总结
AI 系统的研发正进入“自我加速”阶段(用 AI 研发 AI)。谁能保持领先,谁就能获得复利效应带来的巨大优势。如果美国不能通过制裁和技术手段提高蒸馏攻击的门槛,这种技术上的“搭便车”行为将缩短双方的代差,直接改变未来的战略格局。