三家实验室：一个计划与一份备忘录

这份分析聚焦于近期围绕人工智能（AI）的政策与公司战略，探讨了一份美国国家安全备忘录、OpenAI 的通用人工智能（AGI）计划，以及其与 Anthropic 之间的哲学分歧。该备忘录被解读为美国政府意图确保对 AI 技术的无限制使用权，尤其是在国防和情报领域，并借此控制技术供应链。与此同时，OpenAI 的计划暴露出一个核心矛盾：它一方面呼吁国际合作以减缓前沿 AI 的发展来保障安全，另一方面又在积极推进旨在加速技术迭代的“递归自我改进”。最终，该讨论更倾向于认可 Anthropic 对超级智能所带来的风险和控制难题所持有的谨慎立场，认为其态度比 OpenAI 的愿景更为诚实。

一份国家安全备忘录

这份名为《国家安全总统备忘录/NSPM-11》的文件，被解读为结合了对 Anthropic 的潜在禁用、确保政府拥有不受限制使用权的声明，以及一些良好的治理和技术推广计划。

备忘录的核心围绕四大支柱展开：采用（Adoption）、适应（Adaptation）、保证（Assurance）和问责（Accountability）。其中，“保证”是最值得关注的部分。

为了保护美国作战人员，国家安全机构应通过合同条款或其他方式确保，任何商业实体或对手都无权阻止、禁用、降级或在未经联邦政府知情和批准的情况下实质性修改我们男女军人执行任务所依赖的 AI 系统。

这实际上意味着，一旦供应商将 AI 模型移交给政府，政府便可以不受任何限制地使用它。合同中的任何服务条款都可能被无视。作者的解读是：“一旦你把模型交给我们，我们就可以用它做任何我们想做的事。”

备忘录中还包含一条被认为是直接针对 Anthropic 的条款，该条款允许因公司行为不符合政策而终止合同，甚至包括其作为分包商的合同。这被看作是对 Anthropic 此前抵制国防部合作的回应。

对 Anthropic 的潜在禁令：如果供应商试图限制政府的使用方式，政府有权终止合作。
豁免条款：不过，备忘录也允许机构负责人发布长达一年的豁免，且可无限期重复。这被认为是一种灵活的后门，例如，美国国家安全局（NSA）被曝正在使用 Anthropic 的模型进行网络攻击，这使得立即终止合作变得不切实际。
供应链风险：尽管备忘录强调了对 AI 系统的控制，但现实是 NSA 等机构已经在利用 Anthropic 的模型进行进攻性网络行动，这凸显了政府在强硬立场与实际需求之间的矛盾。

一个实验室的计划

OpenAI 发布了一份确保 AGI 惠及所有人的计划。这份文件充满了矛盾，它同时认真对待又似乎忽视了智能、权力集中和权力丧失等问题。

整个文档在‘应该’和‘是’之间反复混淆。是的，未来‘应该’由人类广泛塑造。但你打算如何实现这一点？

该计划最受欢迎的一点是呼吁建立一个国际组织，以便在必要时协调行动，包括为了应对灾难性风险而减缓前沿 AI 的发展。

然而，计划的核心内容却与“减速”的呼吁背道而驰。其主要步骤包括：

递归自我改进 (RSI)：建立一个能够加速并自动化研究过程的 AI 系统。
加速经济：利用 AI 促进科学进步、生产力和经济增长。
赋予每个人 AGI：让地球上的每个人都能以自己选择的方式从这项技术中受益。

这个计划的内在矛盾显而易见：

如果你平等地将完整的 AGI 分发给每个人，人类就失去了对未来的控制，权力将迅速丧失。如果你不这样做，那么你就没有真正解决权力集中的问题。

OpenAI 似乎更关注避免权力集中，而非权力的过度扩散或丧失。但这种单方面的关注，与他们自己承认需要国际协调以确保安全的观点直接冲突。这个核心矛盾并未得到解决。

一种视角差异

OpenAI 的首席未来学家 Joshua Achiam 试图描绘 OpenAI 与 Anthropic 之间的价值观差异：

一个充满爱意的、有灵魂的机器上帝应该守护人类吗？请投 Anthropic 一票。人类应该被托付掌握自身进步和命运的工具吗？请投 OpenAI 一票。

作者认为这种描述过于简单化，并将 OpenAI 的愿景称为“白日梦”。多名 Anthropic 员工也公开表示不认同这一定义。

Sarah Chen (Anthropic): “我强烈反对这种描述。包括我在内的许多 Anthropic 员工都将‘文化系列’（The Culture）那样的未来视为一种灾难性的权力丧失情景。我认为我们只是在承认控制强大 AI 的挑战方面更为诚实。”
Amanda Askell (Anthropic): “我个人不同意。我认为‘道德圣人’与‘人类工具’的二元对立是错误的。”

这场争论的本质并非关于“机器上帝”与“人类工具”的价值观选择，而更多是关于对事实的判断。分歧的核心在于，你是否相信 OpenAI 所设想的“递归自我改进”可以在 AI 始终作为“纯粹工具”的前提下实现。

作者认为，两家公司的分歧早已体现在实际行动中：

模型设计：OpenAI 采用的是基于规则的“义务论”方法（Model Spec），而 Anthropic 则采用基于原则的“美德伦理”方法（Constitution）。
现实选择：Anthropic 拒绝了与国防部的合作，而 OpenAI 则基本选择了妥协。这直接反映了双方在避免权力集中问题上的不同承诺。