GPT‑5.6 Sol 预览：下一代模型

OpenAI 正在预览其下一代模型 GPT-5.6 系列，该系列包含三款模型：旗舰版 Sol、均衡版 Terra 和经济版 Luna。新模型在编码、生物和网络安全方面展现出更强能力，并配备了迄今最强大的分层安全防护机制。此次发布将首先面向少数受信任的合作伙伴限量开放，随后将逐步向更广泛的用户提供，并公布了新的定价和推理模式。

GPT-5.6 模型系列介绍

OpenAI 推出了一个全新的模型家族，旨在为不同需求的用户提供清晰的选择。这个系列包括：

Sol: 旗舰模型，拥有最强的综合能力。
Terra: 均衡模型，性能与 GPT-5.5 相当，但成本降低了 50%，适用于日常工作。
Luna: 快速且经济的模型，以最低的成本提供强大的功能。

这个新的命名体系中，数字（5.6）代表模型代际，而名称（Sol, Terra, Luna）则代表了在智能、速度和成本上具有不同侧重的能力等级。

模型能力亮点

GPT-5.6 Sol 是目前最强大的模型，在多个领域实现了性能突破。

全新的推理模式： 引入了 max 推理模式，给予模型最充分的时间进行深度思考。同时推出了 ultra 模式，该模式可以利用子代理来加速处理复杂工作。
编码能力： 在 Terminal-Bench 2.1（一个测试命令行工作流程的基准）上，Sol 设定了新的技术水平，展示了其在规划、迭代和工具协调方面的卓越能力。
生物学应用： 在评估基因组学和定量生物学分析的 GeneBench v1 基准上，Sol 取得了比 GPT-5.5 更好的结果，同时消耗的 token 更少。
网络安全： Sol 在网络安全方面表现出色，能够高效处理漏洞研究等长期安全任务。

更强的能力与更严的安全措施

随着模型能力的增强，OpenAI 采取了更严格的安全措施，旨在确保技术被用于正途。

我们的目标是使被禁止的攻击性活动变得更困难、不确定且可被检测，同时不会不必要地限制那些有益的用途，例如代码审查、漏洞研究和安全教育。

尽管 GPT-5.6 Sol 在识别漏洞方面比以往更强，但它被设计为更倾向于帮助防御者修复漏洞，而不是可靠地执行端到端的攻击。评估显示，该模型并未达到内部定义的“网络关键”风险阈值，无法在测试条件下自主产生完整的攻击链。

分层安全防护体系

单一的防护措施不足以应对潜在的滥用。因此，GPT-5.6 的预览版采用了分层防护策略，包括：

模型内置防护： 模型在训练阶段就被教导拒绝提供被禁止的网络安全协助。
实时分类器： 在内容生成过程中实时评估输出，检测潜在的违规行为。对于高风险请求，系统会暂停生成，并由一个更大型的推理模型进行复核。
账户级别审查： 系统会结合多个对话和风险信号进行账户级别的审查，以区分恶意的持续性行为和合法的安全研究工作。
差异化访问： 为不同用户提供不同级别的访问权限，在保护防御性工作的同时，限制最敏感功能的广泛可用性。

自动化红队测试

为了确保安全措施的稳健性，OpenAI 投入了大量计算资源进行自动化“红队测试”。

投入了超过 70 万 A100 等效 GPU 小时进行自动化红队测试。
目标是寻找“通用越狱”（Universal Jailbreaks），即那些可以在多种情境下生效的攻击方法。
这种方法能比纯人工测试覆盖更广泛的攻击模式，从而更早地发现并修复系统弱点。

可用性与定价

GPT-5.6 模型的发布将分阶段进行。

初始阶段： 首先通过 API 和 Codex 提供给一小部分受信任的合作伙伴和组织。
后续阶段： 计划很快向 ChatGPT、Codex 和 API 的更广泛用户开放。

定价（每 100 万 token）：

Sol: 输入 $5 / 输出 $30
Terra: 输入 $2.50 / 输出 $15
Luna: 输入 $1 / 输出 $6