Synth Daily

GPT‑5.6 Sol 预览:下一代模型

OpenAI 正在预览其下一代模型 GPT-5.6 系列,该系列包含三款模型:旗舰版 Sol、均衡版 Terra 和经济版 Luna。新模型在编码、生物和网络安全方面展现出更强能力,并配备了迄今最强大的分层安全防护机制。此次发布将首先面向少数受信任的合作伙伴限量开放,随后将逐步向更广泛的用户提供,并公布了新的定价和推理模式。

GPT-5.6 模型系列介绍

OpenAI 推出了一个全新的模型家族,旨在为不同需求的用户提供清晰的选择。这个系列包括:

  • Sol: 旗舰模型,拥有最强的综合能力。
  • Terra: 均衡模型,性能与 GPT-5.5 相当,但成本降低了 50%,适用于日常工作。
  • Luna: 快速且经济的模型,以最低的成本提供强大的功能。

这个新的命名体系中,数字(5.6)代表模型代际,而名称(Sol, Terra, Luna)则代表了在智能、速度和成本上具有不同侧重的能力等级。

模型能力亮点

GPT-5.6 Sol 是目前最强大的模型,在多个领域实现了性能突破。

  • 全新的推理模式: 引入了 max 推理模式,给予模型最充分的时间进行深度思考。同时推出了 ultra 模式,该模式可以利用子代理来加速处理复杂工作。
  • 编码能力:Terminal-Bench 2.1(一个测试命令行工作流程的基准)上,Sol 设定了新的技术水平,展示了其在规划、迭代和工具协调方面的卓越能力。
  • 生物学应用: 在评估基因组学和定量生物学分析的 GeneBench v1 基准上,Sol 取得了比 GPT-5.5 更好的结果,同时消耗的 token 更少。
  • 网络安全: Sol 在网络安全方面表现出色,能够高效处理漏洞研究等长期安全任务。

更强的能力与更严的安全措施

随着模型能力的增强,OpenAI 采取了更严格的安全措施,旨在确保技术被用于正途。

我们的目标是使被禁止的攻击性活动变得更困难、不确定且可被检测,同时不会不必要地限制那些有益的用途,例如代码审查、漏洞研究和安全教育。

尽管 GPT-5.6 Sol 在识别漏洞方面比以往更强,但它被设计为更倾向于帮助防御者修复漏洞,而不是可靠地执行端到端的攻击。评估显示,该模型并未达到内部定义的“网络关键”风险阈值,无法在测试条件下自主产生完整的攻击链。

分层安全防护体系

单一的防护措施不足以应对潜在的滥用。因此,GPT-5.6 的预览版采用了分层防护策略,包括:

  • 模型内置防护: 模型在训练阶段就被教导拒绝提供被禁止的网络安全协助。
  • 实时分类器: 在内容生成过程中实时评估输出,检测潜在的违规行为。对于高风险请求,系统会暂停生成,并由一个更大型的推理模型进行复核。
  • 账户级别审查: 系统会结合多个对话和风险信号进行账户级别的审查,以区分恶意的持续性行为和合法的安全研究工作。
  • 差异化访问: 为不同用户提供不同级别的访问权限,在保护防御性工作的同时,限制最敏感功能的广泛可用性。

自动化红队测试

为了确保安全措施的稳健性,OpenAI 投入了大量计算资源进行自动化“红队测试”。

  • 投入了超过 70 万 A100 等效 GPU 小时进行自动化红队测试。
  • 目标是寻找“通用越狱”(Universal Jailbreaks),即那些可以在多种情境下生效的攻击方法。
  • 这种方法能比纯人工测试覆盖更广泛的攻击模式,从而更早地发现并修复系统弱点。

可用性与定价

GPT-5.6 模型的发布将分阶段进行。

  • 初始阶段: 首先通过 API 和 Codex 提供给一小部分受信任的合作伙伴和组织。
  • 后续阶段: 计划很快向 ChatGPT、Codex 和 API 的更广泛用户开放。

定价(每 100 万 token):

  • Sol: 输入 $5 / 输出 $30
  • Terra: 输入 $2.50 / 输出 $15
  • Luna: 输入 $1 / 输出 $6