最新的人工智能模型,如 OpenAI 的 GPT 5.2,正在独立解决过去悬而未决的高难度数学问题,特别是著名数学家保罗·爱多士 (Paul Erdős) 提出的难题。这一进展得到了顶尖数学家陶哲轩 (Terence Tao) 的认可,他认为 AI 尤其擅长系统性地攻克大量“长尾”问题。随着 Lean 等形式化工具的普及和 AI 辅助的兴起,数学家们正开始正式接纳这些工具,标志着 AI 在推动数学研究前沿方面进入了一个新阶段。
AI 的意外数学突破
软件工程师 Neel Somani 在测试 OpenAI 的新模型时,偶然发现它在 15 分钟内解决了一道复杂的数学难题。这标志着大型语言模型在数学推理能力上的一次飞跃。
- 强大的推理链: 在解题过程中,AI 能够引用多种复杂的数学公理和定理,例如勒让德公式和伯特兰-切比雪夫定理。
- 超越人类的方案: AI 最终给出的证明,比哈佛数学家在 2013 年提出的一个相似方案 更加完整。
- 新模型的进步: Somani 认为,GPT 5.2 在数学推理方面的能力明显优于之前的版本,正在不断推动 AI 能力的边界。
攻克爱多士难题
匈牙利数学家保罗·爱多士留下了 1000 多个未解的数学猜想,这些难题已成为检验 AI 数学能力的试验场。近期,AI 在解决这些问题上取得了显著的成果。
自圣诞节以来,爱多士问题网站上已有 15 个问题 的状态从“开放”更新为“已解决”,其中 11 个解答明确提到了 AI 模型 的参与。
顶尖数学家的观点
著名数学家陶哲轩 (Terence Tao) 对此进展有更细致的看法。他统计发现,AI 在 8 个爱多士问题上取得了有意义的自主进展,并在另外 6 个问题中通过定位和借鉴已有研究成果推动了解决。
陶哲轩推测,AI 系统的可扩展性使其“更适合系统性地应用于‘长尾’的、较为晦涩的爱多士问题,其中许多问题的解法其实相当直接。”
他认为,这意味着许多较为简单的爱多士问题,现在更有可能通过纯粹的 AI 方法而不是人类或人机混合的方式来解决。
形式化工具与专业采纳
推动这一趋势的另一个关键因素是 数学形式化 的兴起。这是一个将数学推理变得更易于验证的 laborious 过程,而新的 AI 工具大大简化了这项工作。
- 关键工具: 开源的证明辅助工具 Lean 已被广泛使用,而像 Harmonic 的 Aristotle 这样的 AI 产品则旨在将大部分形式化工作自动化。
- 真正的证据: Harmonic 的创始人认为,比解决几个难题更重要的是,世界顶尖的数学家和计算机科学教授开始认真对待并使用这些 AI 工具。
“这些人需要维护自己的声誉,所以当他们说自己在使用 Aristotle 或 ChatGPT 时,这就是真正的证据。”
这表明,AI 辅助数学研究不再仅仅是实验,而是正在成为一个被学术界严肃采纳的实用方法。