Synth Daily

开源权重模型令人难以承受的廉价性

低价开源模型与昂贵的“前沿”模型之间存在巨大的价格鸿沟。后者因自身高昂的成本,似乎正通过制造稀缺性高端品牌化来维持高价。一种担忧是,这些公司可能会利用对中国的安全顾虑来推动监管,以限制来自开源社区的竞争。最终,真正的进步可能依赖于回归“真正的开源”,即不仅开放模型权重,也完全公开训练数据和流程。

令人震惊的价格差距

DeepSeek V4 这类廉价模型与 Anthropic 和 OpenAI 的“前沿”模型并列比较,会发现一个惊人的事实:仅从 token 用量来看,价格差异接近 50倍

这引发了一个核心问题:像 Anthropic 和 OpenAI 这样的公司,似乎已经陷入了自身高成本的困境。他们真的能将价格降低20到50倍,来与 DeepSeek 或小米的 Mimo 竞争吗?

廉价背后的原因

这些低价模型的成本为何如此之低?存在几种可能性:

  • 开源优势: 作为开源权重模型,它们得到了成百上千人的压力测试,在不同硬件上的运行经验帮助优化并降低了成本。
  • 亏本策略: 它们可能被用作“亏本领先者”(loss leaders),目的是通过低价抢占市场,压低整体价格水平。

如何为同质化产品维持高价?

当产品变得普遍时,维持高价的策略通常不是依靠技术本身,而是依靠市场手段。

你制造稀缺性。你销售奢侈品和高端品牌。

这正是 OpenAI 和 Anthropic 正在做的事情。他们通过更高的门槛来限制对其“前沿”模型的访问,将其塑造成一种类似于奢侈品的身份象征,专为少数富裕用户服务,而非广泛普及其技术。

利用“中国恐惧”打压竞争?

一个日益增长的担忧是,高成本公司可能会利用政治手段来消除竞争。

最简单的方法之一就是煽动恐惧,并推动政府出面限制竞争对手的准入。随着时间的推移,这种担忧似乎越来越可能成为现实。这些公司是否会利用对中国的安全顾虑,来推动对开源权重模型的禁令?

呼吁真正的开源竞争

美国曾是开源运动的坚定支持者。现在,人们期望美国能重新引领这一潮流,通过真正的开源竞争来证明其未来潜力。然而,现状并不乐观:

  • Meta 的 Llama 系列没有新的发布。
  • OpenAI 上次发布开源权重模型是在2025年。
  • Anthropic 据了解从未发布过任何开源权重模型。

真正的突破在于“真开源”(True Open Source)模型,即不仅开放模型权重,还将用于训练的数据管线完全开源。像艾伦人工智能研究所(AllenAI)的 OLMO 模型就是这一理念的实践者,其受欢迎程度日益增加。美国国家科学基金会(NSF)与英伟达的合作,也旨在支持 AllenAI 开发一个完全开放的人工智能,这预示着未来的发展方向。