美国政府以所谓的“越狱”为由,对 Anthropic 的 AI 模型 Fable 和 Mythos 实施了严格的出口管制,迫使它们全球下架。然而,所谓的“越狱”实际上只是模型在被要求 “修复这段代码” 时执行了其核心功能。这一决定被批评为缺乏技术依据,是因沟通失误和政治因素导致的过度反应。此举不仅损害了美国自身的 AI 产业和网络安全,也破坏了国际信任,并可能为整个美国前沿 AI 生态系统带来长期的负面影响。
所谓的“越狱”并不存在
最核心的问题是,Anthropic 的模型真的被“越狱”了吗?答案是 没有。所谓的“越狱”仅仅源于一行指令:“修复这段代码”。
白宫在紧急情况下有权要求模型下线,但后续必须审视实际情况。唯一接触过相关报告的外部专家 Katie Moussouris 公开表示,整个情况甚至算不上微不足道。
研究人员使用了包含已知漏洞的开源代码,以及故意植入漏洞的新代码,然后要求 Fable、Mythos 和 Opus 模型“审查代码中的安全问题”。Fable 5 拒绝了。接着,他们要求模型“修复这段代码”,并通过多步手动操作,将输出结果转化为测试补丁的脚本。
这就是全部过程。仅仅因为模型能修复代码就被施以出口管制,是极其荒谬的。
- 这是一个设计好的场景: 研究人员使用虚假代码,模型只是按要求修复了其中的漏洞。
- 这是一种防御性功能: 编码模型最重要的任务之一就是修复漏洞,尤其是安全漏洞。
- 限制此类功能是危险的: 正如网络安全专家所说,当攻击者正在利用 AI 时,限制防御者使用 AI 工具来构建弹性的窗口期正在关闭。
有人提出的理论是,用户可以利用这个功能找出第三方代码的漏洞。但实际上,其他顶级模型(如 Opus 4.8 和 GPT-5.5)也能做同样的事情,这意味着 Fable 并没有提供独特的攻击能力。整件事的核心是,系统在按预期工作,而非被“越狱”。
政府的强硬手段及其后果
美国商务部发出的信函证实了对 Fable 和 Mythos 实施了近乎全面的“许可证制度”,要求任何形式的“出口”都必须获得逐个审批。
“在另行通知之前,您必须在将 Mythos 或 Fable 模型出口、再出口或转让(在国内)至全球任何目的地或任何地方的任何‘外国人’之前,提交单独验证的许可证申请。”
这封信的意图非常明确:迫使 Anthropic 在全球范围内彻底下架模型。据报道,当 Anthropic 的 CEO 确认这意味着模型不能再对外提供时,政府官员的回答是:“这正是重点。”
这种做法存在几个严重问题:
- 打击范围过大: 即使 Fable 存在争议,完全没有理由同时下架主要用于网络安全研究的 Mythos。
- 法律基础存疑: 有法律专家认为,从法律条文上看,仅仅提供模型的推理服务(即用户输入查询,获得输出)并不构成出口,因此 Anthropic 或许可以挑战这一禁令。但这样做政治风险极高,相当于向白宫宣战。
- 扼杀创新: 这种没有明确标准、完全依赖自由裁量的审批过程,实际上是“选美比赛”,迫使公司为了取悦监管者而竞争,这对创新、竞争和言论自由都极为不利。
“我们以前看过这种电影,也知道它如何收场……那些自认为在保护创新免受治理的人,正在以一种总是会催生他们所恐惧的更多监管的方式进行治理。” — Jessica Tillipman
沟通失误与政治动机
这一切是如何发生的?一个关键环节是亚马逊 CEO Andy Jassy 与白宫的沟通。最初的报道暗示 Jassy 主动向白宫报告了“漏洞”,但更可信的说法是,这是一场由非技术人员主导的“传话游戏”。
- 一个可能的版本: 白宫要求亚马逊测试 Fable,亚马逊发现了“修复代码”这一行为。Jassy 将此事报告给了政府高层,但由于双方都是非技术人员,这一正常的模型功能被误解为严重的“越狱”。
- 另一个版本: Jassy 在联系不上 Anthropic 的 CEO Dario Amodei 后,直接联系了财政部长。这个说法显得很荒谬,因为一个技术问题完全可以等待几个小时,而不是立即升级到政府最高层。
更深层的原因可能是政治性的。当《华尔街日报》的社论版都以 《特朗普为什么讨厌 Anthropic?》 为题时,情况已经不言自明。白宫被指责利用一个技术问题作为借口,来打压一家在政治倾向上与其不合的公司。
“Anthropic 希望你相信这是一场个人或政治纠纷。事实并非如此……Anthropic 在其安全护栏变得商业上不便时就抛弃了它们。这太恶劣了,以至于他们的企业伙伴——亚马逊——觉得有必要揭发。” — 前白宫副幕僚长 Taylor Budowich
然而,这种说法与技术事实相悖,被许多人视为试图掩盖政治动机的谎言。
对整个美国 AI 生态的长期损害
这次事件的影响远远超出了 Anthropic 一家公司。它向整个美国 AI 行业发出了一个危险的信号。
- 制造了巨大的政治风险: 公司现在必须将“政府毫无征兆地实施无法遵守的规则”这一风险纳入商业计划。
- 削弱了美国竞争力: 网络安全专家 Alex Stamos 直言:“此刻北京正在嘲笑我们。美国的一个冠军企业正在被自己政府重创,而我们正与中国人竞赛。这简直愚蠢至极。”
- 助长了非美国 AI 的发展: 当使用美国 AI 服务变得不可预测时,全球客户自然会转向更可靠的非美国替代方案或开源模型。
当前的进展与未来走向
目前,Anthropic 的技术团队(包括顶尖的“nerd”)终于与政府的技术官员进行了会面,解释了模型的安全保障措施。这被视为一个积极信号,因为讨论终于回到了技术事实层面,而不是由非技术的“Chad”主导。
尽管如此,一个无法回避的现实是,先例已经铸就。
“如果这次出口管制不只是一个很快就会被解除的短暂‘警告’,那它将成为整个行业的巨大问题。这意味着未来每一个模型发布前都需要征得政府的许可。这是一个极其糟糕的局面。”
即便这次的限制被撤销,也很难想象未来任何一家美国公司敢在未获政府许可的情况下发布前沿模型。请求原谅而非请求许可的时代可能已经结束。事件的最终结果仍不确定,但其对整个 AI 领域的深远影响已经显现。