OpenAI 正在预览其下一代模型 GPT-5.6 系列,该系列包含三款模型:旗舰版 Sol、均衡版 Terra 和经济版 Luna。新模型在编码、生物和网络安全方面展现出更强能力,并配备了迄今最强大的分层安全防护机制。此次发布将首先面向少数受信任的合作伙伴限量开放,随后将逐步向更广泛的用户提供,并公布了新的定价和推理模式。
GPT-5.6 模型系列介绍
OpenAI 推出了一个全新的模型家族,旨在为不同需求的用户提供清晰的选择。这个系列包括:
- Sol: 旗舰模型,拥有最强的综合能力。
- Terra: 均衡模型,性能与 GPT-5.5 相当,但成本降低了 50%,适用于日常工作。
- Luna: 快速且经济的模型,以最低的成本提供强大的功能。
这个新的命名体系中,数字(5.6)代表模型代际,而名称(Sol, Terra, Luna)则代表了在智能、速度和成本上具有不同侧重的能力等级。
模型能力亮点
GPT-5.6 Sol 是目前最强大的模型,在多个领域实现了性能突破。
- 全新的推理模式: 引入了
max推理模式,给予模型最充分的时间进行深度思考。同时推出了ultra模式,该模式可以利用子代理来加速处理复杂工作。 - 编码能力: 在
Terminal-Bench 2.1(一个测试命令行工作流程的基准)上,Sol 设定了新的技术水平,展示了其在规划、迭代和工具协调方面的卓越能力。 - 生物学应用: 在评估基因组学和定量生物学分析的
GeneBench v1基准上,Sol 取得了比 GPT-5.5 更好的结果,同时消耗的 token 更少。 - 网络安全: Sol 在网络安全方面表现出色,能够高效处理漏洞研究等长期安全任务。
更强的能力与更严的安全措施
随着模型能力的增强,OpenAI 采取了更严格的安全措施,旨在确保技术被用于正途。
我们的目标是使被禁止的攻击性活动变得更困难、不确定且可被检测,同时不会不必要地限制那些有益的用途,例如代码审查、漏洞研究和安全教育。
尽管 GPT-5.6 Sol 在识别漏洞方面比以往更强,但它被设计为更倾向于帮助防御者修复漏洞,而不是可靠地执行端到端的攻击。评估显示,该模型并未达到内部定义的“网络关键”风险阈值,无法在测试条件下自主产生完整的攻击链。
分层安全防护体系
单一的防护措施不足以应对潜在的滥用。因此,GPT-5.6 的预览版采用了分层防护策略,包括:
- 模型内置防护: 模型在训练阶段就被教导拒绝提供被禁止的网络安全协助。
- 实时分类器: 在内容生成过程中实时评估输出,检测潜在的违规行为。对于高风险请求,系统会暂停生成,并由一个更大型的推理模型进行复核。
- 账户级别审查: 系统会结合多个对话和风险信号进行账户级别的审查,以区分恶意的持续性行为和合法的安全研究工作。
- 差异化访问: 为不同用户提供不同级别的访问权限,在保护防御性工作的同时,限制最敏感功能的广泛可用性。
自动化红队测试
为了确保安全措施的稳健性,OpenAI 投入了大量计算资源进行自动化“红队测试”。
- 投入了超过 70 万 A100 等效 GPU 小时进行自动化红队测试。
- 目标是寻找“通用越狱”(Universal Jailbreaks),即那些可以在多种情境下生效的攻击方法。
- 这种方法能比纯人工测试覆盖更广泛的攻击模式,从而更早地发现并修复系统弱点。
可用性与定价
GPT-5.6 模型的发布将分阶段进行。
- 初始阶段: 首先通过 API 和 Codex 提供给一小部分受信任的合作伙伴和组织。
- 后续阶段: 计划很快向 ChatGPT、Codex 和 API 的更广泛用户开放。
定价(每 100 万 token):
- Sol: 输入 $5 / 输出 $30
- Terra: 输入 $2.50 / 输出 $15
- Luna: 输入 $1 / 输出 $6