OpenAI 发布了自 2019 年以来的首批新开源模型,gpt-oss-120b 和 gpt-oss-20b,标志着其在开放策略上迈出重要一步。这些模型是“开放权重”而非完全“开源”,意味着用户可以下载和修改模型学习到的数值,但无法获取训练代码和数据。尽管不支持图像或语音等多模态输入,新模型在推理和工具使用等核心能力上与 OpenAI 的专有系统相当,此举旨在让更多人能够接触和利用先进的 AI 技术,与 Meta 近期减少开源模型的趋势形成对比。
“开放权重”与“开源”有何不同?
理解 OpenAI 此举的关键在于区分“开放权重”和“开源”。它们服务于完全不同的目的。
- 开放权重 (Open-Weight): 提供模型训练后学到的数值,即权重。用户可以利用这些权重直接使用模型,或针对特定应用进行微调和构建。它介于完全封闭的商业模型和完全开放的开源模型之间。
- 开源 (Open-Source): 不仅包括权重,还可能包括用于训练过程的代码和数据。这允许竞争对手进行技术逆向工程,也是 OpenAI 可能不选择完全开源的原因之一。对普通用户而言,除非拥有强大的计算资源(如 GPU 集群),否则实际用处有限。
宾夕法尼亚大学工程与计算机科学教授 Benjamin C. Lee 指出:“开放权重模型让你可以在不投入巨大基础设施成本的情况下,使用经过数月训练的成果。对于那些只想从一个强大模型开始,然后构建特定应用的人来说,这非常有用。”
两款新模型的具体情况
此次发布的两款模型在参数规模和硬件要求上有所不同。
- gpt-oss-120b: 一个拥有 1170 亿参数的模型,需要更强大的硬件来运行。OpenAI 推荐使用单个 80GB GPU 以实现高效使用。
- gpt-oss-20b: 一个拥有 210 亿参数的模型,对硬件要求更低。任何配备 16GB 内存的现代计算机都可以运行,甚至可以在本地计算机上离线使用。
此外,这些模型通过 Apache 2.0 许可证提供,给予用户极大的灵活性来根据自身需求进行修改。
性能与核心能力
尽管不是商业发布,但新模型在许多方面都可与 OpenAI 的专有系统相媲美。
核心能力:
- 支持链式思考 (chain-of-thought),能够将复杂问题分解为更小的步骤来解决。
- 懂得使用工具,例如在需要时调用网络或 Python 等编程语言来获取额外帮助。
主要限制:
- 它们不支持多模态输入,意味着无法处理图像、视频和语音。如需这些功能,仍需使用 OpenAI 的云端商业模型。
在竞赛级别的编程测试中,gpt-oss-120b 的得分仅略低于 OpenAI 最先进的推理模型 o3。
行业背景与意义
OpenAI 此次发布正值 Meta 公司暗示将减少向公众发布开源模型之际,这使得 OpenAI 的举动在科技爱好者圈子中显得尤为突出。
“可以说,开放权重模型让那些没有大规模数据中心和大量 GPU 的人,也能民主化地访问最大、最强的模型。”
此举降低了使用先进 AI 的门槛,让更多开发者和研究人员能够在顶尖模型的基础上进行创新,而无需承担高昂的基础设施成本。