美国在 AGI 领域的早期政策优先事项

这份内容探讨了美国政府在未来两到三年内为应对通用人工智能（AGI）应采取的早期政策。核心论点是，通过国际协调来减缓 AGI 发展（即“计划A”）是风险最低、最理想的路径。为实现这一目标，关键政策建议包括：提升政府对 AGI 的技术理解和认知水平，成立一个专门的国会联合特别委员会来监督发展，并制定明智的芯片监管政策，例如建立芯片登记制度和推广数据中心的“仅推理”模式。文章强调，与中国合作并保持透明度至关重要，以避免失控的军备竞赛和地缘政治冲突。

四种 AGI 发展战略

为了更好地讨论 AGI 战略，可以将其分为四种不同的方案，每种方案代表一种不同的发展路径和结果。

计划 A (国际协调): 以国际协议为中心，主要参与方（特别是美国和中国）同意放慢 AGI 的发展速度。这需要有效的验证机制，如芯片追踪和国际芯片登记，以确保各方遵守协议。
计划 B (巩固领先优势): 在没有强有力国际协议的情况下，美国政府深度介入，目标是建立对中国的绝对技术领先地位（至少一年）。然后，利用这一优势专注于自动化对齐研究，同时可能破坏非合作项目（如中国的 AGI 项目）。
计划 C (实验室主导的减速): 由少数几家大型科技公司主导 AGI 研发。这些公司对对齐问题有一定担忧，试图通过整合计算资源和权力来加速开发，以便为后续的对齐研究争取时间。政府的参与非常有限。
计划 D (失控竞赛): 各个私营实验室之间为了率先开发出超级智能（ASI）而展开激烈竞争。领先的公司并不关心对齐风险，政府几乎没有监督能力，未来完全掌握在公司手中。

计划 A 是最优选择

相比其他方案，计划 A 能最大程度地避免灾难性后果，如 AI 接管或 AI 驱动的独裁统治。在计划 A 的世界里，AI 带来的生存风险至少比计划 B 的世界低一半。

计划 B 所代表的美中竞赛模式非常糟糕。在这种模式下，国家资源被大量投入到与中国的竞赛中，但如何结束这场竞赛却是一个悬而未决的问题。美国可能试图单方面建立决定性战略优势，或更早地将控制权交给可能未对齐的超人类 AI，这两种做法都可能激化与中国的矛盾，甚至引发第三次世界大战。

相比之下，计划 C 和 D 的世界更加危险。在没有政府监督的情况下，极有可能至少有一个实验室会为了速度而忽视风险，最终导致未对齐的超级智能出现并引发 AI 接管。

因此，当前政策的目标应该是 尽可能地将世界引向计划 A 或计划 B 的轨道，远离极有可能导致毁灭的计划 C 和 D。

两大核心优先事项

为了实现更安全的发展路径，美国政府在未来几年应关注两大核心优先事项。

建立态势感知 (Situational Awareness): 目前，美国政府中真正理解 AGI 发展现状和风险的人屈指可数。大多数决策者没有意识到超级智能可能在几年内出现。没有一个清醒且具备战略思考能力的政府，我们就只能任由科技公司和竞赛动态决定未来。
准备国际协调: 与中国达成协议，比试图通过技术竞赛压倒他们，是更好且更现实的选择。现在就需要开始投资建立验证国际协议所需的技术和制度能力，例如相互透明化和数据中心核查。这能扩大谈判空间，避免高风险的对抗。

提高认知能力的关键政策

为了让政府能够做出明智决策，必须提升其内部的技术和战略专业知识。决策者需要理解 AI 训练原理、芯片供应链、智能爆炸的可能性以及对齐问题的难度。

成立 AGI 联合特别委员会: 建议成立一个由两院最有见识的成员组成的联合特别委员会。该委员会的任务是调查智能爆炸的可能性，举行听证会，传唤实验室负责人，并配备专业人员，以提高国会的态势感知能力。这比现有的委员会结构更专注、更高效。
在行政部门引入人才: 行政部门，特别是白宫和商务部，急需 AGI 战略和技术人才。政府应利用灵活的招聘权力，如设立 AI 人才储备库、直接任命专家顾问或建立民间咨询委员会，从工业界、非营利组织和学术界吸引顶尖人才。关键是要给予这些人才自主权，避免让他们陷入僵化的官僚体系。

为国际协调做准备的关键政策

促成并维持一项国际协议的可能性，是目前最稳健的积极干预措施。以下政策有助于保持这一选项的开放性。

明确规划可验证的协议: 应尽快开始规划一项与中国的、范围明确且可验证的 AI 协议。一个好的起点是就 AI 进展和大型数据中心的相互透明度达成一致，为未来更深入的协议奠定基础。
实施明智的芯片政策: 为了防止协议因猜疑而破裂，应立即着手两项工作：
- 建立芯片登记制度: 创建一个数据库，追踪所有高性能 AI 芯片的生产和分布情况。初期可利用情报部门的技术手段，后续可与中国交叉验证，实现国际化。
- 准备“仅推理”改造方案: 研发并储备一种技术方案，能将数据中心改造为“仅推理”模式，即只允许运行已批准的模型，禁止用于新的模型训练。这将确保在达成协议后，能够有效监督计算资源的使用，同时不影响企业的正常商业运营。

待商榷的低置信度政策

有些政策旨在提升美国在对抗情景下的相对优势，但其最终效果好坏参半，具有很大的不确定性。

建立安全数据中心: 虽然能防止模型权重被盗，但也可能降低外部对 AI 进展的可见度，增加秘密研发的风险。
准备破坏对手的数据中心: 可能有助于美国获得领先优势，但也极易引发局势升级，甚至导致预防性战争。
GPU 出口管制: 在短期内可能有效，但长期会激励芯片走私和中国供应链的自主化，使未来的管制更难执行。
半导体制造设备出口管制: 效果可能比芯片管制好，但长期来看仍可能加速中国的自主研发进程。
“AI 曼哈顿计划”: 可能有助于整合国内资源，但也存在权力过度集中和政府效率低下的风险，且不一定能真正解决对齐问题。