Synth Daily

这家初创公司要点燃美国版DeepSeek时刻

初创公司 Prime Intellect 正在通过一种名为“分布式强化学习”的新方法训练其前沿大语言模型 INTELLECT-3。这种技术允许在全球范围内利用分散的硬件资源来构建和优化 AI,旨在打破当前由大型科技公司主导的封闭模式。其核心目标是推动 AI 的民主化,为当前中美在开放与封闭模型之间的对立提供一个更加开放和去中心化的新选择。

AI 世界的新格局:打破中美二元对立

当前的人工智能领域正面临一种分化:一边是美国的封闭模型,另一边是中国的开放模型。Prime Intellect 的首席执行官 Vincent Weisser 认为,他们的技术提供了一条新出路。

  • 目标: 推动 AI 民主化,让更多人能够为自己构建和修改先进的 AI。
  • 方式: 采用一种去中心化的方法,不依赖于任何大型科技公司。
  • 愿景: 创造一种不局限于特定国家或公司的、真正全球化的 AI 构建方式。

“在开放的前沿模型方面,美国几乎已经没有选择了……这正是我们试图改变的事情之一。”

关键技术:开放的强化学习

提升 AI 模型性能不再仅仅是增加训练数据和计算能力。当今的前沿模型使用强化学习 (Reinforcement Learning) 在预训练后进一步提升自身能力,例如学习数学或玩数独。

然而,强化学习通常由大型 AI 公司闭门进行,技术门槛很高。Prime Intellect 正在改变这一现状。

  • 主要瓶颈: Weisser 指出,“这些强化学习环境现在是真正扩展能力的主要瓶颈。”
  • 解决方案: 公司创建了一个框架,允许任何人创建针对特定任务的强化学习环境。
  • 潜在价值: 这使得初创公司和开发者也能进行自己的强化学习,从而创造出有价值的新软件产品,例如用于各种任务的专业化智能体

这一想法也得到了特斯拉前 AI 负责人 Andrej Karpathy 的认可,他称之为“一项伟大的努力和想法”。

从理念到实践:分布式模型的演进

Prime Intellect 已经证明,分布式方法可以挑战传统的 AI 构建方式。通过将计算任务分散,然后将结果组合成一个单一、更强大的模型,他们取得了一系列进展:

  • INTELLECT-1: 一款通过分布式硬件训练的 100 亿参数模型。
  • INTELLECT-2: 一款更大、能力更强的模型,通过分布式强化学习获得了推理能力。
  • INTELLECT-3: 目前正在训练的最新前沿模型。

时代背景:开源 AI 的浪潮

过去几年,AI 格局发生了巨大变化。Meta 的 Llama 模型开启了开源 AI 时代,但后续发展未能满足市场期待。与此同时,以 DeepSeek 为代表的中国公司凭借其强大的低成本模型震惊了世界。

  • 中国模型的崛起: 像阿里巴巴的 Qwen、月之暗面的 Kimi 和 DeepSeek 的 R1 等模型,因其易于修改和调整而广受欢迎。
  • 市场反应: 面对 DeepSeek 的成功,OpenAI 推出了多年来的首个开源模型,但中国模型的势头依然强劲。

在这样的背景下,Prime Intellect 的分布式、去中心化方案为市场提供了一个全新的、更具包容性的选择。