GPT-5:逆袭DeepSeek时刻

尽管 GPT-5 的发布被普遍视为一次失败,但它实际上推出了多款顶尖模型。这次发布因过度炒作,且技术飞跃不及预期,导致了所谓的“反向 DeepSeek 时刻”——即公众对人工智能(AI)的进步,特别是通用人工智能(AGI)的进展产生了错误的悲观印象。这种误解可能导致政府、企业和个人在关键决策上犯下严重错误。事实上,AI 技术仍在飞速发展,AGI 的到来依然是一个需要认真准备的现实可能性。

“反向 DeepSeek 时刻”的诞生

早先,DeepSeek 模型的发布曾引发“DeepSeek 时刻”,市场因误判而过度恐慌,认为中国 AI 技术已“迎头赶上”。如今,GPT-5 的发布正经历一个恰好相反的过程,即“反向 DeepSeek 时刻”,多种因素共同作用,导致外界严重低估了其真实进展。

  • 对 DeepSeek 的高估源于:

      • 关于成本的错误传闻(“六百万美元模型”)。
      • 一个设计精良、思路清晰的应用使其迅速流行。
      • 跳过了安全测试等步骤,给人以快速迭代的假象。
      • 对“中国发展势头”的夸大叙事。
  • 对 GPT-5 的低估源于:

      • 糟糕的初次发布体验,如速率限制和功能缺失。
      • 不恰当的命名,"GPT-5" 这个名字本身就拉高了人们的期望值。
      • 发布时机不佳,紧随其他重要模型之后,显得技术增量不大。
      • 公众将 GPT-5 与其前身直接比较,却忽略了从 GPT-4 到 GPT-4o 及 o3 之间已有的巨大进步。

华盛顿的决策者们正在形成一个非常错误的印象,即 AI 发展停滞,尤其是 AGI 进展缓慢,这可能导致一些非常糟糕的决定。

尽管发布过程一团糟,但 GPT-5 系列模型(如 GPT-5-Thinking 和 GPT-5-Pro)在其各自类别中显然是当前最先进的。OpenAI 的模型使用量在发布后不降反升,这证明了其价值。

AI 仍在飞速进步,并未“撞墙”

认为 AI 发展放缓的观点是站不住脚的。许多专家指出,过去一年 AI 的进步速度甚至超过了从 GPT-3 到 GPT-4 的飞跃。

“从 2024 年 4 月的 gpt-4-turbo 到 2025 年 4 月的 o3,前沿模型在性能和实用性上的飞跃,比从 gpt-3 到 gpt-4 的飞跃还要大。因 gpt-5 而声称进展放缓的人是在自欺欺人。”

很多人忘记了过去的模型有多么“糟糕”。例如,初版 GPT-4 甚至无法完成一些现在看来很简单的任务,比如生成一个像样的 SVG 代码。我们之所以感觉 GPT-5 的进步不大,是因为此前的 GPT-4o 和 o3 等模型已经实现了大部分近期技术突破

“我们等了 GPT-5 两年,结果只得到一个迭代更新”——这种说法是完全错误的。如果你把它和六个月前的 o3 相比,它确实是迭代更新,但说两年没有进展是荒谬的。

商业化与 AGI 研发并不矛盾

有人认为,OpenAI 近期更像一家消费品公司,而非专注于 AGI 的研究机构,这表明他们对短期内实现 AGI 缺乏信心。这种看法是片面的。

Sam Altman 解释说,在面临 GPU 资源紧张时,公司选择优化模型以降低推理成本,从而更好地服务广大用户。这是一种务实的商业策略。

“我们可以去制造另一个巨大的模型……然后让很多想用它的人失望。所以我们说,让我们做一个非常智能、非常有用的模型,但同时也要努力优化推理成本。”

OpenAI 的本质是多家公司的集合体:它既是前沿 AI 实验室,也是消费品公司和企业服务提供商。为现有客户提供更低成本、更高效的服务,与继续投入资源研发更昂贵、更智能的 AGI 模型(如内部使用的 Pro 模型)并不冲突。

“将公司‘正在做生意’作为他们不再研发 AGI 的论据是疯狂的。为什么你会认为 AI 的商业化盈利能力会降低 AGI 即将到来的可能性,而不是增加它呢?”

错误认知带来的巨大风险

对 AI 进展的错误认知,最危险的后果是可能误导政府的政策制定。如果决策者认为 AGI 的风险已不存在,他们可能会将重心完全转移到商业竞争上,而忽视了必要的安全准备。

“老实说,‘既然 GPT-5 失败了,现在该怎么办’这种想法在华盛顿圈子里渗透得如此之广,实在令人着迷。”

这种错误的叙事可能导致灾难性的后果,使我们在真正重要的议题上准备不足。

我们必须清楚地认识到三点:

    • 美国在 AI 领域仍然遥遥领先,并持续快速创新。
    • AGI 仍有很大可能到来,我们必须为此做好规划。
    • 对关键技术的出口管制依然至关重要,不能因为错误的判断而放松警惕。