OpenAI 推出其首款定制芯片，由博通打造

OpenAI 与博通合作，推出了其首款名为 Jalapeño 的自研 AI 芯片。该芯片专为 AI 推理任务设计，旨在降低运行成本并减少对英伟达 GPU 的依赖。尽管仍在测试中，但初步结果显示其能效表现优越。此举是 OpenAI 全栈优化策略的一部分，目标是通过整合芯片、模型和数据中心等各个层面，最终为用户提供更快、更可靠、更实惠的 AI 服务。

专为 AI 推理而生

这款名为 Jalapeño 的芯片是 OpenAI 与 博通 (Broadcom) 合作设计和制造的。它的核心目标是处理 AI 推理，即在接收到用户指令后运行已训练好的 AI 模型。

特定用途: 该芯片特别强调了在运行实时编码模型等任务时，能够显著降低运营成本。
分工明确: 对于性能要求更高的任务，如模型预训练，可能仍需依赖英伟达的硬件。然而，即使只是小幅降低推理成本，也能对公司的整体财务状况产生积极影响。
AI 辅助设计: OpenAI 透露，公司自己的 AI 模型也参与了这款芯片的开发过程。

“我们对工作负载有深刻的理解，”OpenAI 总裁 Greg Brockman 解释道，“我们一直在寻找那些未被充分满足的特定工作负载，并思考如何构建一些东西来加速可能性的边界。”

降低成本与依赖

长期以来，外界一直猜测 OpenAI 会通过自研芯片来减少对英伟达 GPU 的严重依赖。推出 Jalapeño 证实了这一策略。

行业趋势: 谷歌和亚马逊等科技巨头也已开发了自家的定制芯片（通常称为“AI 加速器”），以加速机器学习任务并控制成本。
经济考量: 优化推理系统是未来 AI 经济学的关键。对于 OpenAI 而言，控制这一环节的成本至关重要。

全栈优化的愿景

开发芯片不仅仅是为了硬件本身，更是 OpenAI 全栈优化战略的关键一步。该公司希望从最底层的硬件到最上层的用户体验，实现全面的控制和协同。

“OpenAI 不仅在开发前沿模型或基于模型构建产品，它还在设计其底层的基础设施：芯片架构、内核、内存系统、网络、调度、部署系统和产品体验。”

通过控制整个技术栈，OpenAI 能够围绕一个共同目标进行优化：

使模型运行更快
提升服务可靠性
让用户使用成本更实惠