Synth Daily

科技公司能学会爱上更便宜的 AI 模型吗?

人工智能行业长期以来遵循“越大越强”的逻辑,但不断攀升的推理成本正迫使用户重新评估更小、更便宜的模型。这一转变预示着,未来大部分AI工作负载可能会转移到成本效益更高的替代方案上,这可能对依赖高端模型销售的OpenAI和Anthropic等大型AI公司的收入模式和市场前景构成严峻挑战。

观念转变:从追求最强到追求够用

过去,人工智能领域的竞赛规则很简单:越大、越强的模型就是赢家。然而,随着模型使用成本持续增加,这一基本假设开始动摇。

用户正面临前所未有的成本压力,迫使他们开始关注并测试那些过去被忽视的更小、更便宜的模型。这种以成本为导向的选择是新的趋势,其最终影响尚不明确,但很可能对整个行业产生深远的影响。

一个关键预测:80/20 法则

Coinbase 联合创始人 Brian Armstrong 对此提出了一个清晰的预测,他认为大部分AI任务将很快转向更经济的选择。

需求的智能几乎是无限的,但未来12到18个月内,80%的工作负载将转向便宜99%的模型。只有那20%对智能要求最高的任务,才会继续使用最新一代的模型。

如果这一预测成真,将彻底改变人工智能行业的经济格局。过去,企业为了追求最高质量而默认选择最先进的模型。现在,如果更便宜的模型能在不影响质量的前提下完成同样的工作,将意味着巨大的成本节约。

对大型 AI 公司的财务冲击

这种成本节约对大型AI实验室来说并非好消息。

  • 收入转移: 客户省下的钱,很大部分本应流入 OpenAIAnthropic 等公司的口袋。
  • 市场前景: 在这些公司正准备进行首次公开募股(IPO)的关键时刻,收入模式的动摇可能会给其估值和市场信心带来沉重打击。

实践中的证据:成本与质量的平衡

初步测试表明,通过合理的系统设计,使用更便宜的模型完全可以不牺牲质量。法律AI工具 Harvey 的一个案例就证明了这一点。

该公司与推理平台 Fireworks AI 合作,通过结合使用昂贵模型和廉价模型,成功将 推理成本降低了三倍。他们的策略是:

  • 将大部分任务交给更经济的模型处理。
  • 只在最复杂、最关键的任务上才调用昂贵的高端模型。

Harvey的联合创始人Gabe Pereyra表示:“质量永远是第一位的……然而,质量的定义正在演变——从为所有事情都使用最强大的模型,转变为使用能最有效获得正确答案的最佳模型。”

真正的分界线:大与小的较量

这场变革的核心并非开源模型与专有模型之争,而是 大型模型与小型模型 的较量。

无论是从 GPT-4 切换到其他厂商的廉价模型,还是切换到 GPT-3.5-Turbo,目的都是一样的:用更低的成本完成任务。关键在于模型的大小和效率,而不是它的来源。

趋势背后的驱动力

这个转变似乎是理所当然的,但它与此前主导行业的 “规模优先” 策略背道而驰。过去,由于有投资者的巨额补贴,用户几乎没有动力去选择最先进模型以外的任何选项。

如今,随着 代币(token)价格上涨和补贴放缓,企业用户第一次真正感受到了成本压力。如果事实证明,大多数应用场景都能通过更小的模型高效运行,那么对最昂贵、最前沿模型的巨大需求可能会受到抑制,从而引发一个新问题:我们该如何证明训练那些尖端模型的巨大成本是合理的?