科技公司能学会爱上更便宜的 AI 模型吗？

人工智能行业长期以来遵循“越大越强”的逻辑，但不断攀升的推理成本正迫使用户重新评估更小、更便宜的模型。这一转变预示着，未来大部分AI工作负载可能会转移到成本效益更高的替代方案上，这可能对依赖高端模型销售的OpenAI和Anthropic等大型AI公司的收入模式和市场前景构成严峻挑战。

观念转变：从追求最强到追求够用

过去，人工智能领域的竞赛规则很简单：越大、越强的模型就是赢家。然而，随着模型使用成本持续增加，这一基本假设开始动摇。

用户正面临前所未有的成本压力，迫使他们开始关注并测试那些过去被忽视的更小、更便宜的模型。这种以成本为导向的选择是新的趋势，其最终影响尚不明确，但很可能对整个行业产生深远的影响。

Coinbase 联合创始人 Brian Armstrong 对此提出了一个清晰的预测，他认为大部分AI任务将很快转向更经济的选择。

需求的智能几乎是无限的，但未来12到18个月内，80%的工作负载将转向便宜99%的模型。只有那20%对智能要求最高的任务，才会继续使用最新一代的模型。

如果这一预测成真，将彻底改变人工智能行业的经济格局。过去，企业为了追求最高质量而默认选择最先进的模型。现在，如果更便宜的模型能在不影响质量的前提下完成同样的工作，将意味着巨大的成本节约。

这种成本节约对大型AI实验室来说并非好消息。

初步测试表明，通过合理的系统设计，使用更便宜的模型完全可以不牺牲质量。法律AI工具 Harvey 的一个案例就证明了这一点。

该公司与推理平台 Fireworks AI 合作，通过结合使用昂贵模型和廉价模型，成功将 推理成本降低了三倍。他们的策略是：

Harvey的联合创始人Gabe Pereyra表示：“质量永远是第一位的……然而，质量的定义正在演变——从为所有事情都使用最强大的模型，转变为使用能最有效获得正确答案的最佳模型。”

这场变革的核心并非开源模型与专有模型之争，而是 大型模型与小型模型 的较量。

无论是从 GPT-4 切换到其他厂商的廉价模型，还是切换到 GPT-3.5-Turbo，目的都是一样的：用更低的成本完成任务。关键在于模型的大小和效率，而不是它的来源。

这个转变似乎是理所当然的，但它与此前主导行业的 “规模优先” 策略背道而驰。过去，由于有投资者的巨额补贴，用户几乎没有动力去选择最先进模型以外的任何选项。

如今，随着 代币（token）价格上涨和补贴放缓，企业用户第一次真正感受到了成本压力。如果事实证明，大多数应用场景都能通过更小的模型高效运行，那么对最昂贵、最前沿模型的巨大需求可能会受到抑制，从而引发一个新问题：我们该如何证明训练那些尖端模型的巨大成本是合理的？