Synth Daily

特朗普签署行政命令,要求在前沿模型发布前进行 AI 测试

一项新的行政命令要求,前沿人工智能模型在发布前必须接受为期 30 天的保密评估。尽管该框架被描述为“自愿”,但它实际上建立了一个变相的许可或事前审查制度。此举引发了多重担忧,包括评估过程由国家安全局(NSA)等情报机构主导、规则过度保密、存在行政权力被滥用的风险,以及可能被用来挑选行业内的赢家和输家。尽管存在这些严重缺陷,但与“什么都不做”相比,这仍被视为一个必要的步骤,同时凸显了 AI 监管最终应由国会立法而非依赖行政命令的紧迫性。

一个变相的许可制度

这项行政命令的核心是建立了一个所谓的“自愿框架”,要求 AI 公司在向“其他可信合作伙伴”发布模型前的 30 天内,将其提交给政府进行保密的网络安全能力评估。

Make no mistake. This is a de facto mandatory governmental licensing, preclearance and permitting requirement. Welcome to The Prior Restraint Era. (别搞错了。这实际上就是一个强制性的政府许可、预先批准或许可要求。欢迎来到“事前限制时代”。)

尽管表面上是自愿的,但任何希望与联邦政府开展业务或避免负面后果的前沿 AI 实验室,实际上都别无选择,只能参与。这一要求将行政部门置于一个强大的守门人位置。

  • 从 90 天到 30 天: 该命令与早期草案的主要区别在于,审查窗口从“最多 90 天”缩短为“最多 30 天”。这是一个让步,因为 90 天对于科技行业来说太长了,但并未改变其核心性质。
  • 实质上的强制性: 如果你想和联邦政府做生意,就必须遵守。此外,对总统说“不”的后果是任何公司都难以承担的。

主要担忧与风险

该行政命令的实施细节引发了专家们的广泛担忧,主要集中在透明度、权责划分和滥用可能性上。

  • 规则将被保密: 评估过程的基准和细节将被列为机密。这引发了严重的透明度问题。批评者指出,如果连触发审查的门槛都是机密的,那么实验室的研究人员自己都不知道他们正在训练的模型是否受到监管

  • 情报机构主导而非民间机构: 这项工作似乎由国家安全局(NSA)等情报机构主导,而不是像国家标准与技术研究院(NIST)下的 AI 安全研究所(CAISI)这样的民间机构。

    NSA is a spy agency not an eval shop. (NSA 是一个间谍机构,不是一个评估商店。) 让间谍机构在模型发布前进行审查,可能会破坏欧洲和其他地区对美国 AI 模型的信任

  • 挑选赢家和输家: 政府可以在 30 天的审查期内,甚至之后,决定谁可以获得模型的早期访问权限,或无限期推迟模型的发布。这赋予了行政部门挑选行业赢家和输家的巨大权力

  • 权力滥用的风险: 这种依赖行政命令的治理方式,为未来的政府滥用权力打开了大门。政策的稳定性完全取决于当权者,而不是稳固的法律。许多人认为,AI 政策必须基于国会通过的法律,而不是“一人之治”。

政治博弈与立场变化

这项行政命令的签署标志着白宫内部安全倡导派的胜利,以及“无论如何都不能监管”派别的失败。此前曾成功游说推迟该命令的 David Sacks 等人,如今正试图挽回颜面。

Sacks 声称,将审查期从 90 天缩短到 30 天是“改变游戏规则的”,并强调该命令“明确禁止”建立新的许可制度——这恰恰是该命令实际上正在做的事情。

I think the Sacks faction literally does not understand the difference between actual rules and actions versus meaningless vibes and gestures, or does not care. (我认为 Sacks 派系根本不明白实际规则和行动与毫无意义的姿态和手势之间的区别,或者他们根本不在乎。)

这种立场上的突然转变,被认为是试图将一次失败重新包装成胜利的政治操作。

结论:一个有缺陷但必要的步骤

尽管这项行政命令存在严重缺陷,并且可能导向危险的监管方向,但许多观察家认为,它仍然优于完全不作为。

if the The Offer Was Nothing as the alternative, yeah, you have to do it. (如果另一个选项是“什么都不做”,那么,是的,你必须这样做。)

真正的解决方案在于国会采取行动,将这些规则法制化,以避免行政权力的滥用,并提供一个更稳定、透明的框架。

未来需要关注什么?

  • 透明度: 政府会透露多少关于测试内容和模型分类的信息?结果会公开吗?
  • 适用范围: 哪些模型会被认定为需要审查?是仅限于像 Mythos 这样的重大飞跃,还是包括增量更新?
  • 实际执行: 政府是否会真的利用这项权力来阻止模型发布或控制访问权限?
  • 国会行动: 是否会有任何将此行政命令法制化的尝试?
  • 主导机构: 最终由谁来负责运行这个项目?是 NSA 还是 CAISI 这样的民间机构?NSA 的角色越重,担忧就越大。