OpenAI斩获全球顶级数学竞赛金牌，这背后有何深意？

OpenAI 的一个实验性人工智能模型，在国际数学奥林匹克竞赛（IMO）中达到了金牌水平，解决了六道题中的五道。这一成就被视为 AI 在通用智能领域取得的重大进展，因为它展示了模型进行长期、创造性推理的能力，而不仅仅是执行特定任务。尽管该成果令人瞩目，但也有人对其训练方式和实际应用价值提出疑问，并且该模型短期内不会向公众开放。

一个重大的里程碑

OpenAI 的最新实验模型在一项极其困难的数学考试中表现出色，达到了一个重要的里程碑。

成就: 在被誉为全球最负盛名的国际数学奥林匹克竞赛 (IMO) 中，该模型解决了六道题中的五道。
标准: 这一成绩达到了竞赛的金牌水平，并且是在与人类参赛者完全相同的考试条件下完成的。
背景: IMO 自 1959 年开始举办，以其极高的难度而闻名，许多著名数学家都曾是该竞赛的获奖者。

OpenAI 首席执行官山姆·奥特曼称，这是“过去十年来人工智能发展程度的一个重要标志”。

不只是“数学好”，更是“通用智能”的进步

这次突破的关键意义在于，它展示的并非一个专门为数学设计的系统，而是一个通用模型的推理能力。

与谷歌 DeepMind 专门用于解决几何问题的 AlphaGeometry 不同，OpenAI 的模型是一个通用大语言模型 (LLM)。奥特曼强调：“这是一个正在做数学的 LLM，而不是一个特定的形式化数学系统；这是我们迈向通用智能的主要推动力的一部分。”

研究人员指出，该模型在考试中展现了新的能力。

“与过去的基准测试相比，IMO 问题需要一种全新水平的长期而持续的创造性思维。这个模型会进行长时间的思考。”

发展速度与现实疑问

这项成就凸显了人工智能技术发展的惊人速度。就在去年，人工智能实验室还在使用“小学数学”来评估模型能力。而一些专家曾预测，人工智能还需要数年时间才能解决类似水平的数学难题。

然而，成就公布后也伴随着一些质疑。知名的 AI 批评者加里·马库斯在承认其表现“确实令人印象深刻”的同时，也提出了一些关键问题：

模型是如何训练的？
其“通用智能”的范围有多广？
对普通大众有何实际用途？
解决每个问题的成本是多少？

此外，马库斯还指出，IMO 官方尚未独立验证这些结果。对于公众而言，奥特曼表示，具备“金牌级别能力”的模型在“数月内”还不会开放使用。