AI 正在放缓

当前的生成式人工智能（AI）正陷入一个由资本、债务和宣传共同推动的巨大泡沫。为了支撑现有数据中心、芯片采购和算力承诺的扩张，AI 行业需要在未来几年内实现数万亿美元的年收入。然而，现实是 AI 需求增长已经开始放缓，企业正逐渐意识到其成本高昂、效果不稳且投资回报（ROI）难以证明。行业试图通过 token 计费和“智能体”（agent）等叙事来刺激消费，但缺乏可持续的商业模式。一旦收入增长无法跟上基础设施的投入，这场 AI 泡沫可能会迅速破裂。

万亿级的豪赌

为了让当前的 AI 泡沫不破裂，行业需要以惊人的速度持续增长，这并非夸张，而是基于行业自己公布的承诺和数据。

天价的基础设施： 计划中的数据中心建设将耗资 9.5 万亿到 15 万亿美元。为了给这些项目融资，银行每年需要发行数千亿乃至上万亿美元的债务，这远超目前的承受能力。
头部的巨额投入：
- Anthropic 已做出超过 3750 亿美元的算力和芯片承诺，要兑现这些承诺，公司需要在 2029 年前实现 每年 1740 亿美元的收入。
- OpenAI 预计到 2030 年将烧掉至少 8520 亿美元，并已做出超过 7700 亿美元的算力承诺。
收入与支出的巨大鸿沟： 目前，AI 算力需求的绝大部分（70%-90%）都来自 OpenAI 和 Anthropic 这两家每年亏损数十亿甚至上百亿美元的公司。除了它们，市场上几乎没有其他主要的 AI 算力买家。

为了让这些投入合理化，到 2030 年，生成式 AI 和 AI 算力必须产生超过 2 万亿美元的年收入。否则，无论是数据中心投资还是 OpenAI 与 Anthropic 的算力承诺，都将变得毫无意义。

需求放缓的迹象

就在 AI 行业最需要加速增长时，现实却恰恰相反——需求正在放缓，企业开始对成本变得谨慎。

你无法精确衡量 AI 任务的成本，也无法衡量其投资回报。许多公司“做 AI”仅仅是因为其他人都在做，但当账单真的来临时，情况变了。

企业开始设限：
- Uber 在一个季度内就用完了全年的 token 预算，现在开始限制员工每月 1500 美元的支出。
- T-Mobile 曾临时设定每月 2000 美元的限额。
- Brex 将工程师的 token 支出限制在每周 500 美元，非工程师更是低至每周 5 美元。

根据毕马威（KPMG）的调查，只有 26% 的公司对其 AI 成本有全面的了解。大多数公司在账单出来之前，都不知道自己花了多少钱。这绝不是一种可持续的收入模式。

如果 AI 发展顺利，公司应该在大肆宣传它们的 token 支出带来了多少惊人的新功能和产品。但现实是，我们只看到了大量粗制滥造、毫无用处且不安全的“铲子软件”（shovelware）。

催促消费的“智能体”叙事

为了维持增长，AI 公司正变得越来越急切。它们开始推广“智能体循环”（agent loops）的概念，鼓励用户创建能自动执行任务、不断消耗 token 的程序。

这本质上是让一个本身就容易产生幻觉和犯错的模型，在没有用户干预的情况下进行“推理”和行动。

这表明 AI 公司对其用户和客户的完全蔑视。他们不在乎模型会出错，也不在乎成本有多高。你必须燃烧更多的 token，否则他们的商业模式就会崩溃。

这就像一段虐待关系，你试图向别人解释，那个花光你的钱、把事情搞得一团糟的家伙，其实私下里非常棒。

一个需要真实产品的循环骗局

目前的 AI 经济是一个自我循环的系统，但它缺少了最关键的一环。

AI 实验室向云服务商（微软、谷歌等）支付巨额费用购买算力。
云服务商将这些钱再投资回 AI 实验室。
这个循环刺激了对英伟达（NVIDIA）GPU 的需求。
英伟达再将利润投资回 AI 实验室或算力供应商。

这个计划的问题在于，它最终需要一个诚实的交易——即来自真实客户的、基于可靠产品的、可持续的需求。

“效率”或“成本降低”等概念与 AI 行业宏大的扩张叙事背道而驰。如果 OpenAI 或 Anthropic 追求盈利或可持续性，就意味着算力需求减少，整个循环就会中断。

然而，真实的需求并未出现。当企业从免费或高额补贴的试用转向按 token 计费时，它们很快就开始质疑：“这真的值得吗？” AI 实验室并没有什么秘密武器能突然变出惊人的投资回报，也没有魔法能同时降低成本并维持算力支出。从现在开始，情况只会变得更糟。