OpenAI 与博通合作,推出了其首款名为 Jalapeño 的自研 AI 芯片。该芯片专为 AI 推理任务设计,旨在降低运行成本并减少对英伟达 GPU 的依赖。尽管仍在测试中,但初步结果显示其能效表现优越。此举是 OpenAI 全栈优化策略的一部分,目标是通过整合芯片、模型和数据中心等各个层面,最终为用户提供更快、更可靠、更实惠的 AI 服务。
专为 AI 推理而生
这款名为 Jalapeño 的芯片是 OpenAI 与 博通 (Broadcom) 合作设计和制造的。它的核心目标是处理 AI 推理,即在接收到用户指令后运行已训练好的 AI 模型。
- 特定用途: 该芯片特别强调了在运行实时编码模型等任务时,能够显著降低运营成本。
- 分工明确: 对于性能要求更高的任务,如模型预训练,可能仍需依赖英伟达的硬件。然而,即使只是小幅降低推理成本,也能对公司的整体财务状况产生积极影响。
- AI 辅助设计: OpenAI 透露,公司自己的 AI 模型也参与了这款芯片的开发过程。
“我们对工作负载有深刻的理解,”OpenAI 总裁 Greg Brockman 解释道,“我们一直在寻找那些未被充分满足的特定工作负载,并思考如何构建一些东西来加速可能性的边界。”
降低成本与依赖
长期以来,外界一直猜测 OpenAI 会通过自研芯片来减少对英伟达 GPU 的严重依赖。推出 Jalapeño 证实了这一策略。
- 行业趋势: 谷歌和亚马逊等科技巨头也已开发了自家的定制芯片(通常称为“AI 加速器”),以加速机器学习任务并控制成本。
- 经济考量: 优化推理系统是未来 AI 经济学的关键。对于 OpenAI 而言,控制这一环节的成本至关重要。
全栈优化的愿景
开发芯片不仅仅是为了硬件本身,更是 OpenAI 全栈优化战略的关键一步。该公司希望从最底层的硬件到最上层的用户体验,实现全面的控制和协同。
“OpenAI 不仅在开发前沿模型或基于模型构建产品,它还在设计其底层的基础设施:芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。”
通过控制整个技术栈,OpenAI 能够围绕一个共同目标进行优化:
- 使模型运行更快
- 提升服务可靠性
- 让用户使用成本更实惠