美国在 AGI 领域的早期政策优先事项
这份内容探讨了美国政府在未来两到三年内为应对通用人工智能(AGI)应采取的早期政策。核心论点是,通过国际协调来减缓 AGI 发展(即“计划A”)是风险最低、最理想的路径。为实现这一目标,关键政策建议包括:提升政府对 AGI 的技术理解和认知水平,成立一个专门的国会联合特别委员会来监督发展,并制定明智的芯片监管政策,例如建立芯片登记制度和推广数据中心的“仅推理”模式。文章强调,与中国合作并保持透明度至关重要,以避免失控的军备竞赛和地缘政治冲突。
四种 AGI 发展战略
为了更好地讨论 AGI 战略,可以将其分为四种不同的方案,每种方案代表一种不同的发展路径和结果。
计划 A (国际协调): 以国际协议为中心,主要参与方(特别是美国和中国)同意放慢 AGI 的发展速度。这需要有效的验证机制,如芯片追踪和国际芯片登记,以确保各方遵守协议。
计划 B (巩固领先优势): 在没有强有力国际协议的情况下,美国政府深度介入,目标是建立对中国的绝对技术领先地位(至少一年)。然后,利用这一优势专注于自动化对齐研究,同时可能破坏非合作项目(如中国的 AGI 项目)。
计划 C (实验室主导的减速): 由少数几家大型科技公司主导 AGI 研发。这些公司对对齐问题有一定担忧,试图通过整合计算资源和权力来加速开发,以便为后续的对齐研究争取时间。政府的参与非常有限。
计划 D (失控竞赛): 各个私营实验室之间为了率先开发出超级智能(ASI)而展开激烈竞争。领先的公司并不关心对齐风险,政府几乎没有监督能力,未来完全掌握在公司手中。
计划 A 是最优选择
相比其他方案,计划 A 能最大程度地避免灾难性后果,如 AI 接管或 AI 驱动的独裁统治。在计划 A 的世界里,AI 带来的生存风险至少比计划 B 的世界低一半。
计划 B 所代表的美中竞赛模式非常糟糕。在这种模式下,国家资源被大量投入到与中国的竞赛中,但如何结束这场竞赛却是一个悬而未决的问题。美国可能试图单方面建立决定性战略优势,或更早地将控制权交给可能未对齐的超人类 AI,这两种做法都可能激化与中国的矛盾,甚至引发第三次世界大战。
相比之下,计划 C 和 D 的世界更加危险。在没有政府监督的情况下,极有可能至少有一个实验室会为了速度而忽视风险,最终导致未对齐的超级智能出现并引发 AI 接管。
因此,当前政策的目标应该是 尽可能地将世界引向计划 A 或计划 B 的轨道,远离极有可能导致毁灭的计划 C 和 D。
两大核心优先事项
为了实现更安全的发展路径,美国政府在未来几年应关注两大核心优先事项。
建立态势感知 (Situational Awareness): 目前,美国政府中真正理解 AGI 发展现状和风险的人屈指可数。大多数决策者没有意识到超级智能可能在几年内出现。没有一个清醒且具备战略思考能力的政府,我们就只能任由科技公司和竞赛动态决定未来。
准备国际协调: 与中国达成协议,比试图通过技术竞赛压倒他们,是更好且更现实的选择。现在就需要开始投资建立验证国际协议所需的技术和制度能力,例如相互透明化和数据中心核查。这能扩大谈判空间,避免高风险的对抗。
提高认知能力的关键政策
为了让政府能够做出明智决策,必须提升其内部的技术和战略专业知识。决策者需要理解 AI 训练原理、芯片供应链、智能爆炸的可能性以及对齐问题的难度。
成立 AGI 联合特别委员会:
建议成立一个由两院最有见识的成员组成的联合特别委员会。该委员会的任务是调查智能爆炸的可能性,举行听证会,传唤实验室负责人,并配备专业人员,以提高国会的态势感知能力。这比现有的委员会结构更专注、更高效。
在行政部门引入人才:
行政部门,特别是白宫和商务部,急需 AGI 战略和技术人才。政府应利用灵活的招聘权力,如设立 AI 人才储备库、直接任命专家顾问或建立民间咨询委员会,从工业界、非营利组织和学术界吸引顶尖人才。关键是要给予这些人才自主权,避免让他们陷入僵化的官僚体系。
为国际协调做准备的关键政策
促成并维持一项国际协议的可能性,是目前最稳健的积极干预措施。以下政策有助于保持这一选项的开放性。
明确规划可验证的协议:
应尽快开始规划一项与中国的、范围明确且可验证的 AI 协议。一个好的起点是就 AI 进展和大型数据中心的相互透明度达成一致,为未来更深入的协议奠定基础。
实施明智的芯片政策:
为了防止协议因猜疑而破裂,应立即着手两项工作:
- 建立芯片登记制度: 创建一个数据库,追踪所有高性能 AI 芯片的生产和分布情况。初期可利用情报部门的技术手段,后续可与中国交叉验证,实现国际化。
- 准备“仅推理”改造方案: 研发并储备一种技术方案,能将数据中心改造为“仅推理”模式,即只允许运行已批准的模型,禁止用于新的模型训练。这将确保在达成协议后,能够有效监督计算资源的使用,同时不影响企业的正常商业运营。
待商榷的低置信度政策
有些政策旨在提升美国在对抗情景下的相对优势,但其最终效果好坏参半,具有很大的不确定性。
- 建立安全数据中心: 虽然能防止模型权重被盗,但也可能降低外部对 AI 进展的可见度,增加秘密研发的风险。
- 准备破坏对手的数据中心: 可能有助于美国获得领先优势,但也极易引发局势升级,甚至导致预防性战争。
- GPU 出口管制: 在短期内可能有效,但长期会激励芯片走私和中国供应链的自主化,使未来的管制更难执行。
- 半导体制造设备出口管制: 效果可能比芯片管制好,但长期来看仍可能加速中国的自主研发进程。
- “AI 曼哈顿计划”: 可能有助于整合国内资源,但也存在权力过度集中和政府效率低下的风险,且不一定能真正解决对齐问题。