Synth Daily

AI 正在放缓

当前的生成式人工智能(AI)正陷入一个由资本、债务和宣传共同推动的巨大泡沫。为了支撑现有数据中心、芯片采购和算力承诺的扩张,AI 行业需要在未来几年内实现数万亿美元的年收入。然而,现实是 AI 需求增长已经开始放缓,企业正逐渐意识到其成本高昂、效果不稳且投资回报(ROI)难以证明。行业试图通过 token 计费和“智能体”(agent)等叙事来刺激消费,但缺乏可持续的商业模式。一旦收入增长无法跟上基础设施的投入,这场 AI 泡沫可能会迅速破裂。

万亿级的豪赌

为了让当前的 AI 泡沫不破裂,行业需要以惊人的速度持续增长,这并非夸张,而是基于行业自己公布的承诺和数据。

  • 天价的基础设施: 计划中的数据中心建设将耗资 9.5 万亿到 15 万亿美元。为了给这些项目融资,银行每年需要发行数千亿乃至上万亿美元的债务,这远超目前的承受能力。
  • 头部的巨额投入:
    • Anthropic 已做出超过 3750 亿美元的算力和芯片承诺,要兑现这些承诺,公司需要在 2029 年前实现 每年 1740 亿美元的收入
    • OpenAI 预计到 2030 年将烧掉至少 8520 亿美元,并已做出超过 7700 亿美元的算力承诺。
  • 收入与支出的巨大鸿沟: 目前,AI 算力需求的绝大部分(70%-90%)都来自 OpenAI 和 Anthropic 这两家每年亏损数十亿甚至上百亿美元的公司。除了它们,市场上几乎没有其他主要的 AI 算力买家。

为了让这些投入合理化,到 2030 年,生成式 AI 和 AI 算力必须产生超过 2 万亿美元的年收入。否则,无论是数据中心投资还是 OpenAI 与 Anthropic 的算力承诺,都将变得毫无意义。

需求放缓的迹象

就在 AI 行业最需要加速增长时,现实却恰恰相反——需求正在放缓,企业开始对成本变得谨慎。

你无法精确衡量 AI 任务的成本,也无法衡量其投资回报。许多公司“做 AI”仅仅是因为其他人都在做,但当账单真的来临时,情况变了。

  • 企业开始设限:
    • Uber 在一个季度内就用完了全年的 token 预算,现在开始限制员工每月 1500 美元的支出。
    • T-Mobile 曾临时设定每月 2000 美元的限额。
    • Brex 将工程师的 token 支出限制在每周 500 美元,非工程师更是低至每周 5 美元。

根据毕马威(KPMG)的调查,只有 26% 的公司对其 AI 成本有全面的了解。大多数公司在账单出来之前,都不知道自己花了多少钱。这绝不是一种可持续的收入模式。

如果 AI 发展顺利,公司应该在大肆宣传它们的 token 支出带来了多少惊人的新功能和产品。但现实是,我们只看到了大量粗制滥造、毫无用处且不安全的“铲子软件”(shovelware)。

催促消费的“智能体”叙事

为了维持增长,AI 公司正变得越来越急切。它们开始推广“智能体循环”(agent loops)的概念,鼓励用户创建能自动执行任务、不断消耗 token 的程序。

这本质上是让一个本身就容易产生幻觉和犯错的模型,在没有用户干预的情况下进行“推理”和行动。

这表明 AI 公司对其用户和客户的完全蔑视。他们不在乎模型会出错,也不在乎成本有多高。你必须燃烧更多的 token,否则他们的商业模式就会崩溃。

这就像一段虐待关系,你试图向别人解释,那个花光你的钱、把事情搞得一团糟的家伙,其实私下里非常棒。

一个需要真实产品的循环骗局

目前的 AI 经济是一个自我循环的系统,但它缺少了最关键的一环。

  • AI 实验室向云服务商(微软、谷歌等)支付巨额费用购买算力。
  • 云服务商将这些钱再投资回 AI 实验室。
  • 这个循环刺激了对英伟达(NVIDIA)GPU 的需求。
  • 英伟达再将利润投资回 AI 实验室或算力供应商。

这个计划的问题在于,它最终需要一个诚实的交易——即来自真实客户的、基于可靠产品的、可持续的需求。

“效率”或“成本降低”等概念与 AI 行业宏大的扩张叙事背道而驰。如果 OpenAI 或 Anthropic 追求盈利或可持续性,就意味着算力需求减少,整个循环就会中断。

然而,真实的需求并未出现。当企业从免费或高额补贴的试用转向按 token 计费时,它们很快就开始质疑:“这真的值得吗?” AI 实验室并没有什么秘密武器能突然变出惊人的投资回报,也没有魔法能同时降低成本并维持算力支出。从现在开始,情况只会变得更糟。