Synth Daily

Gemini 3 深度思考

谷歌发布了升级版的 Gemini 3 Deep Think,一个专为解决科学、研究和工程领域复杂难题而设计的专业推理模式。该模型已在多个学术基准测试中取得金牌级表现,并被研究人员用于发现逻辑漏洞和优化实验流程等实际应用。目前,更新后的 Deep Think 已向 Google AI Ultra 订阅用户开放,并首次通过 Gemini API 向部分研究人员和企业提供早期访问。

专为解决复杂难题而设计

Gemini 3 Deep Think 旨在突破智能的边界,专为应对现代科研和工程挑战而构建。它与科学家及研究人员紧密合作开发,用于处理那些规则不明确、没有唯一正确答案且数据混乱或不完整的难题。

Deep Think 将深厚的科学知识与日常工程实用性相结合,超越了抽象理论,推动了实际应用。

在科研与工程中的实际应用

早期的测试者已经将 Deep Think 应用于多个前沿领域:

  • 数学研究: 罗格斯大学的数学家利用它成功识别出一篇已通过人类同行评审的论文中一个 细微的逻辑漏洞
  • 材料科学: 杜克大学的实验室使用它来优化复杂晶体的生长方法,以发现潜在的 新型半导体材料
  • 工程设计: 谷歌平台的研发负责人用它来 加速物理组件的设计过程

此外,Deep Think 能够将一张草图转化为可用于 3D 打印的实体模型文件,展示了其在实际工程建模中的能力。

在顶级学术基准测试中表现卓越

升级后的 Deep Think 在多个严格的学术基准测试中达到了新的高度:

  • 国际奥林匹克竞赛: 在 2025 年国际数学、物理和化学奥林匹克竞赛中均达到 金牌水平
  • Humanity's Last Exam: 在这项旨在测试前沿模型极限的基准测试中,创下了 48.4% 的新标准(不使用工具)。
  • ARC-AGI-2: 经 ARC 奖基金会验证,取得了 84.6% 的高分
  • Codeforces: 在一个由竞赛编程挑战组成的基准测试中,获得了 3455 的 Elo 等级分

如何使用 Deep Think

目前,可以通过以下两种方式访问升级后的 Deep Think:

  • Google AI Ultra 订阅用户: 可在 Gemini 应用中直接使用。
  • 研究人员、工程师和企业: 可以申请通过 Gemini API 进行早期访问和测试。