新范式救不了你

宣称大型语言模型（LLM）永远无法实现通用人工智能（AGI）、需要“新范式”的说法，并不能证明 AGI 风险遥不可及。即使需要重大突破，根据现有技术演进速度推算，新范式也可能在未来 3 到 5 年内出现。目前，LLM 仍在从规模扩张中持续受益，即便遇到瓶颈，实验室也能迅速转向已有新思路。因此，预测 AI 进展最好的方法，仍然是直接外推当前 LLM 的规模扩张趋势。

“新范式”离我们有多远？

一种流行的观点认为，实现 AGI 需要一个全新的技术范式，因此不必为当前的 AI 发展感到担忧。但这个逻辑的关键问题在于：我们到底需要一个“多新”的范式？

我们可以将现代 AI 的发展看作一个“进化树”：

1950年代: 神经网络
1967年: 多层感知机
2010年: 现代深度学习
2017年: Transformer 和 LLM
2022年: RLHF 和聊天机器人

AGI 几乎肯定会使用神经网络，因为它与人脑的运作方式相似。它也很可能会基于深度学习。即使是像 Yann LeCun 和 Gary Marcus 这样的怀疑论者，也只是认为我们在 LLM/Transformer 这一步走错了方向，而不是认为整个深度学习框架都错了。

那么，AGI 和当前 LLM 的“共同祖先”到底有多近？这才是决定问题远近的关键。

按规律推算，新范式并不遥远

即便我们承认 AGI 需要一次堪比 Transformer 甚至深度学习本身那样重大的范式革命，根据林迪定律（Lindy's Law）的推算，这个时间也并不会太长。

下一次 Transformer 级别的突破： 有 25% 的可能性在 3 年内发生。
下一次深度学习级别的突破： 有 25% 的可能性在 5 年内发生。

这个推论意味着，即使 AGI 的实现依赖于一次全新的范式转变，其风险窗口期仍然可能落在 2020 年代末到 2030 年代初。这与那些认为仅靠 LLM 就能实现 AGI 的人的预测时间表惊人地一致。因此，“需要新范式”并不能成为将 AGI 风险无限期推迟的借口。

新范式不会造成严重延迟

有人可能会说，从新范式诞生到它能发挥最大效用，中间还有很长的时间。例如，从 Transformer 的发明到 ChatGPT 的成功商业化，花了五年时间。

但这忽略了一个关键事实：那五年时间主要花在了提升计算规模上，而我们现在已经具备了这种规模。

如果一个新范式在 2030 年被发明出来，任何一个前沿实验室都可以迅速为其提供训练人类大脑规模模型所需的计算资源。

此外，AI 研究人员的数量正以前所未有的速度增长，这可能会让技术进步比林迪定律预测的还要快。

真正重要的是规模扩张趋势

过去，新范式的出现往往是因为旧范式在“将规模转化为成果”的效率上走到了尽头。

然而，LLM 目前似乎仍能有效地将规模转化为能力。只要这一趋势持续，前沿实验室就不会冒险去追求一个全新的范式。如果规模扩张真的撞了墙，实验室也只会经历几个月的混乱，然后迅速从早已准备好的各种新范式提案中挑选一个，继续推进。

最好的预测未来 AI 进展的方法，就是外推当前 LLM 的规模扩张趋势。即使 LLM 本身无法直接通向 AGI，这种方法也可能有效。因为新范式要么会很快出现，要么只会在 LLM 停止工作的地方接力，并以同样的速度继续前进。