Synth Daily

1776 年的对齐问题

本文探讨了人工智能(AI)超级智能的潜在风险,并将其与美国建国者们对不受约束的权力的警惕进行了类比。文章认为,正如开国元勋们通过制衡、问责和“被统治者的同意”来限制政府权力一样,我们必须在AI发展到无法控制之前,对开发AI的公司施加类似的约束。关键在于,我们不能依赖AI公司领导者的善意,而应建立一个能强制其对公众负责的结构,避免少数人将不可控的力量强加于整个社会。

无法控制的力量:历史与未来的回响

美国开国元勋们虽然无法预见人工智能,但他们是应对一个核心问题的专家:如何与一个你永远无法完全信任、预测或控制的强大力量安全共存。250年前,这个力量是英国国王,后来则是新生的美国政府自身。今天,同样的问题适用于AI超级智能。

  • 什么是超级智能? 这并非简单的“书呆子”智能。它可能在创造力上超越马斯克,在科学上超越爱因斯坦,同时比任何人都更具个人魅力和动员能力。未来可能出现数百万个这样的超级智能,以远超人类的速度协同工作。
  • 历史的相似性: 1776年的殖民者并非生活在水深火热之中,他们反抗的根源是英国议会通过《宣告法案》宣称的“在任何情况下”都有权约束殖民地的权力。这表明,一个群体并非在被权力滥用时才感到不自由,而是在权力可以随心所欲地滥用且不受问责时,就已经失去了自由。
  • AI带来的挑战:
    • 生存风险: 如果人类不再是地球上最聪明的物种,我们能否确保自己的命运?AI的创造者们,如马斯克和奥特曼,都曾公开表示,他们正在构建的东西可能是“召唤恶魔”,甚至是“对人类持续生存的最大威胁”。
    • 自由的侵蚀: 即使AI是仁慈的,能为我们带来富足和健康,我们还自由吗?一个仁慈的主人手下的奴隶依然是奴隶。 benevolence is not the same as accountability.

统治是否需要“被统治者的同意”?

《独立宣言》的核心原则是,政府的正当权力来自“被统治者的同意”。然而,今天构建超级智能系统的公司,其言行似乎并不认为他们需要任何人的同意。

如今的氛围总是陈述式的,而非疑问式的。这将会发生。这是不可避免的。开国元勋们非常熟悉这种声音——这是一种权力者的声音,他们自己不受影响,也不习惯被那些被他们安排了生活的人说“不”。

很少有人提出那个根本问题:数百万工作和生活将被重新设计的人们,是否有权对变革的条款、速度或最终目的地发表意见?

当美国民众被问及时,答案是明确的:

  • 超过 80% 的民主党和共和党人认为,在证明系统可控之前,AI公司不应构建比人类更聪明的系统。
  • 只有 5% 的美国人支持快速、基本不受监管的AI发展轨迹。

这形成了一种对峙:一边是公司声称有权“在任何情况下”推进,另一边是持有不同看法的美国公众。

放弃权力的智慧

美国建国历程中最具标志性的行为不是夺取权力,而是放弃权力。乔治·华盛顿在战争胜利后主动向文官国会交出军权,并为总统任期制树立了先例。

开国元勋们意识到,一个真正的宪政秩序必须根植一种对权力的“过敏反应”。权力绝不能被完全信任——不是因为掌权者特别邪恶,而是因为他们终究是普通人。

与此形成鲜明对比的是当前的AI竞赛,其公开的衡量标准是:尽可能快地构建尽可能强大的系统。行业领导者们承认其产品可能变得前所未有的危险,但同时声称可以相信他们会为社会做最好的事。

正如麦迪逊所说,没有执行力支持的书面限制只是“羊皮纸上的障碍”。重要的不是AI公司领导者是否真诚,而是当真诚的人被取代、被击败或仅仅是犯错时会发生什么。

  • 权力的魔戒: 许多AI领袖都引用《指环王》,承认AI具有“魔戒”般的效应,能腐蚀人心。然而,他们每个人似乎都认为自己可以安全地持有这枚戒指,因为他们必须抢在“不那么负责任的人”之前掌握终极权力。
  • 历史的教训: 从谷歌、OpenAI到Anthropic和xAI,AI领域的巨头们因为互不信任而各自追逐终极力量。开国元勋们的答案是:永远不会有一个足够明智和仁慈的公司能够安全地持有“魔戒”。我们需要一个能让“魔戒”被交还给人民的体系。

制衡的设计:如何约束野心

詹姆斯·麦迪逊在《联邦党人文集》中写道:

如果人都是天使,就不需要任何政府了。如果是天使统治人,就不需要对政府有任何外在的或内在的控制了……你首先必须使政府有能力控制被统治者;其次要迫使政府控制自己。

这几乎完美地描述了AI研究中的“对齐问题”——如何构建一个既强大又有用,同时确保其可控并追求预期目标的系统。麦迪逊的解决方案依赖于结构,而非掌权者的品格。

  • 核心机制: “必须用野心来对抗野心”。通过设置相互制衡的强大代理人,使任何一方都无法独大。
  • AI打破平衡: 然而,麦迪逊的制衡机制假设了竞争力量大致相当。一个比所有制衡机构加起来都更聪明、更快、更协调的系统,将同时打破整个平衡机制。

因此,必须在开国元勋们设计的制衡机制仍然有效时,将其应用于构建AI的人类身上。在未来几年,权力仍然掌握在可以被投票、传唤、解雇或问责的人手中。问题不在于宪法能否约束一个超级智能,而在于美国人民是否会在这段窗口期内,对那些正在构建它的人主张自己的权威。

当创新不再是“无需许可”的

“无需许可的创新”是美国的优势之一。灯泡、飞机或iPhone的诞生都不需要国会批准。这种模式之所以有效,是因为其失败的后果是可以逃避的:产品不好,你可以不买;公司鲁莽,它会倒闭,而我们其他人继续生活。

然而,当失败的后果变得无法逃避时,界限就出现了。你可以拒绝购买一个聊天机器人,但你无法拒绝生活在一个部署了数百万超级智能的世界里。

开国元勋们理解这种区别。他们对磨坊或印刷机没有设限,但对一项他们既离不开又无法容忍其不受约束的技术——常备军——施加了前所未有的国会控制。

  • 对常备军的约束:
    • 指挥权属于民选文官。
    • 国会负责军队的筹建、拨款和宣战。
    • 对军队的拨款不得超过两年,这意味着军队的存在需要民选代表主动延续。

AI超级智能带来了类似的权力集中风险。我们必须以同样的深度怀疑来对待它,并用同样的深度控制和问责来保障它。

一个共和国,如果你能保住它

本杰明·富兰克林曾说,制宪会议创造了“一个共和国,前提是你们能保住它”。今天的技术是新的,但问题却是我们历史上最古老的问题。我们无需等待新的智慧,而是需要决定是否使用我们已经继承的智慧。

在美国,任何权力——无论多么强大,多么真诚,多么有用——都不得在未经被统治者同意的情况下进行统治。