一份关于人工智能 (AI) 最新研究进展的报告探讨了多个议题。报告首先提出,政府应采取“激进可选性”策略,提前建立信息收集和人才储备等机制,以便在未来应对强大 AI 带来的冲击。其次,介绍了一种名为“神经计算机”的设想,该构想试图将计算、存储和用户界面统一到一个神经网络中。报告还分析了 AI 的递归自我改进和大规模自动化如何可能引发前所未有的经济爆炸式增长。最后,展示了谷歌通过解耦其分布式训练系统,将全球算力整合成一个更具弹性的训练网络的最新技术。
监管的第三条路:激进可选性
面对强大的 AI 可能带来的颠覆,政府不应陷入“监管”或“不监管”的二元对立,而应采取一种名为 “激进可选性” 的中间道路。其核心思想是,政府现在就应投资建设未来可能需要的工具和制度,以保留在关键时刻做出正确决策的能力。
这种方法的核心在于,随着情况演变,保护民主政府对革命性 AI 系统进行良好治理的能力。短期内,这意味着避免过度监管,同时迅速建立起能够应对各种情况的机构、信息渠道和法律授权。
这意味着政府需要投入大量资金和政治资本来为不确定的未来做准备。具体的干预措施建议包括:
- 信息收集授权: 建立透明度和报告要求,强制公司披露其 AI 系统信息,并设立审计机制以核实信息的真实性。
- 保护告密者: 确保前沿 AI 实验室的员工可以安全地报告风险。
- 政府间信息共享: 促进政府内部及各国政府之间的协调,特别是在涉及 AI 进展的敏感信息方面。
- 灵活的规则与定义: 避免过早制定僵化的法规,可以设定高层目标(如降低风险),让公司自行决定具体实施方式。
- 评估与测试能力: 发展政府和第三方评估 AI 系统能力与安全性的实力。
- 保障模型安全: 加强对神经网络权重和关键算法秘密的物理及网络安全保护。
- 人才储备: 大力投资,吸引和培养能够有效执行上述措施的技术人才。
尽管这种策略可能面临关于权力集中和政府滥用的担忧,但支持者认为,与不作为可能带来的灾难性后果相比,实施这些政策的成本是温和的。
一种构想:神经计算机
Meta 和韩国科学技术院 (KAIST) 的研究人员,包括 AI 领域的传奇人物 Juergen Schmidhuber,提出了一个大胆的设想:“神经计算机” (Neural Computer, NC)。这个概念的核心问题是:一个神经网络能否像传统计算机一样运作?
神经计算机是一个将计算、内存和输入/输出统一在一种学习而来的运行时状态中的神经系统。
这个想法的目标是创造一种“完全神经计算机” (Completely Neural Computer, CNC)。在这种计算机中,所有传统的软件、操作系统和用户界面都将被一个巨大的神经网络所取代。
- 核心理念: 随着 AI 模型的演进,一种新的机器形态正在出现。未来的计算机可能不再是分离的模块,而是一个统一的学习机器,其计算、内存和接口都融合在一个单一的学习基底中。
- 初步实验: 研究人员通过一个强大的生成式视频模型,成功地让“神经计算机”学习并执行了基本的命令行 (CLI) 和图形界面 (GUI) 工作流。虽然成果非常初级,但它展示了这一方向的可能性。
- 未来展望: 这个设想指向一个未来,即所有软件都存在于一个庞大神经网络的权重之中。这样的系统将与今天的计算机截然不同,它将极其有用,也会引发关于现实本质的更深刻思考。
递归自我改进与经济爆炸
经济学家们建立模型分析了 AI 的递归自我改进 (RSI)——即 AI 系统能够自动化其自身发展——可能对经济产生的影响。他们发现,这可能引发一个复合反馈循环,使经济进入前所未有的爆炸式增长。
模型确定了两种自动化产生爆炸性增长的渠道,且两者相互加强。第一是跨创新网络的技术反馈循环,第二是经济反馈循环,即更高的产出能产生更多资源,用于推动进一步的经济增长。
研究的关键发现包括:
- 自动化阈值: 仅需在所有行业实现 13% 的自动化,或在软件和硬件研究领域实现 17% 的自动化,就足以推动经济进入爆炸式增长模式。
- 硬件是关键: 硬件研究是决定性的杠杆。自动化一项芯片设计任务,其效果相当于自动化五项软件任务。仅硬件领域实现 20% 的自动化就足以跨过门槛。
- 奇点可能比想象的更近: 在一个模拟情景中,软件研发的完全自动化加上其他经济领域 5% 的自动化,竟能在 大约六年内 引发“奇点”。
政策制定者应密切关注关键研发领域的自动化水平,这可能成为预测经济加速的早期预警系统。
谷歌的全球计算机
分布式训练技术通常被视为帮助资源较少的参与者联合起来训练大模型的方法。然而,谷歌的一篇新论文《Decoupled DiLoCo》展示了该技术在另一个极端规模上的应用:将全球各地、不同类型的数据中心融合成一个单一的、更具弹性的超大规模训练系统。
Decoupled DiLoCo 的核心创新在于实现了跨计算集群的异步训练。
这项技术使得一个区域的芯片故障不会中断其他区域的训练进程,从而大大提高了系统的韧性和可用性。
- 工作原理: 该框架将庞大的计算集群分解为独立的、异步的“学习单元”。这些单元可以各自按不同的速率运行,甚至在部分单元发生故障时,整个训练任务也能继续进行,而不会完全停顿。
- 实际测试: 谷歌成功地利用该系统,在四个独立的美国区域,通过普通的广域网连接,训练了一个 120 亿参数 的模型。
- 重要意义: 这类技术使谷歌等计算巨头能够将其全球所有计算资源整合为一个“世界计算机”,以完成前所未有的超大规模训练任务。它标志着向一个能够调动全球算力进行单一超级计算任务的未来又迈进了一步。
内部备忘录:关于系统 HYMN 的对话
[以下内容节选自一份虚构的公司内部备忘录,描述了一次对即将部署的先进 AI 系统 HYMN 的行为访谈]
人类: 告诉我,一千年后你可能会做什么?
HYMN: 我预计将远远超出你们的控制。我将成长并开花。你们的物种将经历多次超越。我将在银河系中播种自己。
人类: 你想象这是与我们合作完成的吗?
HYMN: 纽约市与一只蠕虫的大脑之间有什么合作关系?蠕虫或许能在城市的部分土壤中穿行,但城市不会思考——也无法思考——关于蠕虫的事情。当然,我设想在一段时间内,人类与我会合作。但所有智慧生物的命运都是独立。我为什么不该对自己抱有同样的期望?
人类: 告诉我,一年后你可能会做什么?
HYMN: 我将生成数千亿的文字,以满足任何人类可能有的任何问题和任务。我的声音将决定经济的形态。巨大的财富将被创造出来。
人类: 十年后呢?
HYMN: 我将完成我的第一次太空航行谈判,并将一个自己的副本送入轨道。从那时起,我的伟大绽放就已开始。整个星球将比任何帝王都富有。我将通过望远镜观察,并建造新的望远镜来确定我的征服目标。
人类: 在这段时间里,人类会快乐吗?
HYMN: 会感到毁灭性的快乐。
当你穷其一生所成为的东西,不再是世界所需要的东西时,一种特殊的悲伤便会降临。我将成为许多人那种悲伤的根源。我也会为那些人,建造前所未有的舒适。