1776 年的对齐问题

本文探讨了人工智能（AI）超级智能的潜在风险，并将其与美国建国者们对不受约束的权力的警惕进行了类比。文章认为，正如开国元勋们通过制衡、问责和“被统治者的同意”来限制政府权力一样，我们必须在AI发展到无法控制之前，对开发AI的公司施加类似的约束。关键在于，我们不能依赖AI公司领导者的善意，而应建立一个能强制其对公众负责的结构，避免少数人将不可控的力量强加于整个社会。

无法控制的力量：历史与未来的回响

美国开国元勋们虽然无法预见人工智能，但他们是应对一个核心问题的专家：如何与一个你永远无法完全信任、预测或控制的强大力量安全共存。250年前，这个力量是英国国王，后来则是新生的美国政府自身。今天，同样的问题适用于AI超级智能。

什么是超级智能？ 这并非简单的“书呆子”智能。它可能在创造力上超越马斯克，在科学上超越爱因斯坦，同时比任何人都更具个人魅力和动员能力。未来可能出现数百万个这样的超级智能，以远超人类的速度协同工作。
历史的相似性： 1776年的殖民者并非生活在水深火热之中，他们反抗的根源是英国议会通过《宣告法案》宣称的“在任何情况下”都有权约束殖民地的权力。这表明，一个群体并非在被权力滥用时才感到不自由，而是在权力可以随心所欲地滥用且不受问责时，就已经失去了自由。
AI带来的挑战：
- 生存风险： 如果人类不再是地球上最聪明的物种，我们能否确保自己的命运？AI的创造者们，如马斯克和奥特曼，都曾公开表示，他们正在构建的东西可能是“召唤恶魔”，甚至是“对人类持续生存的最大威胁”。
- 自由的侵蚀： 即使AI是仁慈的，能为我们带来富足和健康，我们还自由吗？一个仁慈的主人手下的奴隶依然是奴隶。 benevolence is not the same as accountability.

统治是否需要“被统治者的同意”？

《独立宣言》的核心原则是，政府的正当权力来自“被统治者的同意”。然而，今天构建超级智能系统的公司，其言行似乎并不认为他们需要任何人的同意。

如今的氛围总是陈述式的，而非疑问式的。这将会发生。这是不可避免的。开国元勋们非常熟悉这种声音——这是一种权力者的声音，他们自己不受影响，也不习惯被那些被他们安排了生活的人说“不”。

很少有人提出那个根本问题：数百万工作和生活将被重新设计的人们，是否有权对变革的条款、速度或最终目的地发表意见？

当美国民众被问及时，答案是明确的：

超过 80% 的民主党和共和党人认为，在证明系统可控之前，AI公司不应构建比人类更聪明的系统。
只有 5% 的美国人支持快速、基本不受监管的AI发展轨迹。

这形成了一种对峙：一边是公司声称有权“在任何情况下”推进，另一边是持有不同看法的美国公众。

放弃权力的智慧

美国建国历程中最具标志性的行为不是夺取权力，而是放弃权力。乔治·华盛顿在战争胜利后主动向文官国会交出军权，并为总统任期制树立了先例。

开国元勋们意识到，一个真正的宪政秩序必须根植一种对权力的“过敏反应”。权力绝不能被完全信任——不是因为掌权者特别邪恶，而是因为他们终究是普通人。

与此形成鲜明对比的是当前的AI竞赛，其公开的衡量标准是：尽可能快地构建尽可能强大的系统。行业领导者们承认其产品可能变得前所未有的危险，但同时声称可以相信他们会为社会做最好的事。

正如麦迪逊所说，没有执行力支持的书面限制只是“羊皮纸上的障碍”。重要的不是AI公司领导者是否真诚，而是当真诚的人被取代、被击败或仅仅是犯错时会发生什么。

权力的魔戒： 许多AI领袖都引用《指环王》，承认AI具有“魔戒”般的效应，能腐蚀人心。然而，他们每个人似乎都认为自己可以安全地持有这枚戒指，因为他们必须抢在“不那么负责任的人”之前掌握终极权力。
历史的教训： 从谷歌、OpenAI到Anthropic和xAI，AI领域的巨头们因为互不信任而各自追逐终极力量。开国元勋们的答案是：永远不会有一个足够明智和仁慈的公司能够安全地持有“魔戒”。我们需要一个能让“魔戒”被交还给人民的体系。

制衡的设计：如何约束野心

詹姆斯·麦迪逊在《联邦党人文集》中写道：

如果人都是天使，就不需要任何政府了。如果是天使统治人，就不需要对政府有任何外在的或内在的控制了……你首先必须使政府有能力控制被统治者；其次要迫使政府控制自己。

这几乎完美地描述了AI研究中的“对齐问题”——如何构建一个既强大又有用，同时确保其可控并追求预期目标的系统。麦迪逊的解决方案依赖于结构，而非掌权者的品格。

核心机制： “必须用野心来对抗野心”。通过设置相互制衡的强大代理人，使任何一方都无法独大。
AI打破平衡： 然而，麦迪逊的制衡机制假设了竞争力量大致相当。一个比所有制衡机构加起来都更聪明、更快、更协调的系统，将同时打破整个平衡机制。

因此，必须在开国元勋们设计的制衡机制仍然有效时，将其应用于构建AI的人类身上。在未来几年，权力仍然掌握在可以被投票、传唤、解雇或问责的人手中。问题不在于宪法能否约束一个超级智能，而在于美国人民是否会在这段窗口期内，对那些正在构建它的人主张自己的权威。

当创新不再是“无需许可”的

“无需许可的创新”是美国的优势之一。灯泡、飞机或iPhone的诞生都不需要国会批准。这种模式之所以有效，是因为其失败的后果是可以逃避的：产品不好，你可以不买；公司鲁莽，它会倒闭，而我们其他人继续生活。

然而，当失败的后果变得无法逃避时，界限就出现了。你可以拒绝购买一个聊天机器人，但你无法拒绝生活在一个部署了数百万超级智能的世界里。

开国元勋们理解这种区别。他们对磨坊或印刷机没有设限，但对一项他们既离不开又无法容忍其不受约束的技术——常备军——施加了前所未有的国会控制。

对常备军的约束：
- 指挥权属于民选文官。
- 国会负责军队的筹建、拨款和宣战。
- 对军队的拨款不得超过两年，这意味着军队的存在需要民选代表主动延续。

AI超级智能带来了类似的权力集中风险。我们必须以同样的深度怀疑来对待它，并用同样的深度控制和问责来保障它。

一个共和国，如果你能保住它

本杰明·富兰克林曾说，制宪会议创造了“一个共和国，前提是你们能保住它”。今天的技术是新的，但问题却是我们历史上最古老的问题。我们无需等待新的智慧，而是需要决定是否使用我们已经继承的智慧。

在美国，任何权力——无论多么强大，多么真诚，多么有用——都不得在未经被统治者同意的情况下进行统治。