Synth Daily

Gemini 携手 Deep Think 闯进国际数学奥林匹克金牌行列

Google DeepMind 的 Gemini Deep Think 模型在 2025 年国际数学奥林匹克竞赛(IMO)中取得了金牌级别的成绩,通过端到端的自然语言处理,在比赛时限内解决了六个问题中的五个。这一成就主要归功于其“深度思考”模式,该模式利用并行思维和强化学习技术,标志着人工智能在高级数学推理领域取得了重大突破。未来,该技术计划向公众推出,预示着 AI 将成为辅助科学研究的重要工具。

数学奥赛的突破性表现

一个高级版本的 Gemini Deep Think 模型在 2025 年国际数学奥林匹克竞赛中表现出色,达到了金牌标准。

  • 总分: 获得 35 分(满分 42 分)。
  • 解题数量: 完美解决了六道题中的五道。
  • 成就: 达到 金牌级别 的表现。

国际数学奥林匹克(IMO)主席 Gregor Dolinar 教授确认:“Google DeepMind 取得了令人向往的里程碑,获得了 35 分——这是一个金牌分数。他们的解决方案在很多方面都令人惊叹,清晰、精确且易于理解。”

这项成就相较于去年有了显著的进步。2024 年的系统需要专家将问题从自然语言手动翻译成特定代码,并且需要数天时间进行计算。而今年的模型则完全不同:

  • 端到端处理: 直接从自然语言问题描述生成严谨的数学证明。
  • 时效性: 所有解题过程均在 4.5 小时 的比赛时限内完成。

“深度思考”模式的运作方式

这次的成功得益于 Gemini 的一个增强推理模式,即 “深度思考”(Deep Think)模式,它融合了最新的研究技术。

  • 并行思维: 与传统的线性思维不同,该模式能同时探索和组合多种可能的解题路径,然后给出最终答案。
  • 强化学习: 模型通过新颖的强化学习技术进行训练,使其能更好地利用多步骤推理和解决问题的能力。
  • 高质量数据: 为 Gemini 提供了大量高质量的数学问题解决方案作为训练语料,并加入了解决 IMO 难题的通用技巧。

人工智能与数学的未来

Google DeepMind 计划先将该模型的某个版本提供给数学家等受信任的测试人员,然后逐步推广给 Google AI Ultra 的订阅用户。

这仅仅是 AI 助力数学研究的开端。通过训练系统进行更灵活、更直观的推理,我们正在接近创造出能够解决更复杂和前沿数学问题的 AI。未来的目标是开发出能将 自然语言的流畅性形式语言的严谨性 相结合的智能体,使其成为数学家、科学家和工程师的宝贵工具,从而推动人类知识的边界。