OpenAI斩获全球顶级数学竞赛金牌,这背后有何深意?
OpenAI 的一个实验性人工智能模型,在国际数学奥林匹克竞赛(IMO)中达到了金牌水平,解决了六道题中的五道。这一成就被视为 AI 在通用智能领域取得的重大进展,因为它展示了模型进行长期、创造性推理的能力,而不仅仅是执行特定任务。尽管该成果令人瞩目,但也有人对其训练方式和实际应用价值提出疑问,并且该模型短期内不会向公众开放。
一个重大的里程碑
OpenAI 的最新实验模型在一项极其困难的数学考试中表现出色,达到了一个重要的里程碑。
- 成就: 在被誉为全球最负盛名的国际数学奥林匹克竞赛 (IMO) 中,该模型解决了六道题中的五道。
- 标准: 这一成绩达到了竞赛的金牌水平,并且是在与人类参赛者完全相同的考试条件下完成的。
- 背景: IMO 自 1959 年开始举办,以其极高的难度而闻名,许多著名数学家都曾是该竞赛的获奖者。
OpenAI 首席执行官山姆·奥特曼称,这是“过去十年来人工智能发展程度的一个重要标志”。
不只是“数学好”,更是“通用智能”的进步
这次突破的关键意义在于,它展示的并非一个专门为数学设计的系统,而是一个通用模型的推理能力。
与谷歌 DeepMind 专门用于解决几何问题的 AlphaGeometry 不同,OpenAI 的模型是一个通用大语言模型 (LLM)。奥特曼强调:“这是一个正在做数学的 LLM,而不是一个特定的形式化数学系统;这是我们迈向通用智能的主要推动力的一部分。”
研究人员指出,该模型在考试中展现了新的能力。
“与过去的基准测试相比,IMO 问题需要一种全新水平的长期而持续的创造性思维。这个模型会进行长时间的思考。”
发展速度与现实疑问
这项成就凸显了人工智能技术发展的惊人速度。就在去年,人工智能实验室还在使用“小学数学”来评估模型能力。而一些专家曾预测,人工智能还需要数年时间才能解决类似水平的数学难题。
然而,成就公布后也伴随着一些质疑。知名的 AI 批评者加里·马库斯在承认其表现“确实令人印象深刻”的同时,也提出了一些关键问题:
- 模型是如何训练的?
- 其“通用智能”的范围有多广?
- 对普通大众有何实际用途?
- 解决每个问题的成本是多少?
此外,马库斯还指出,IMO 官方尚未独立验证这些结果。对于公众而言,奥特曼表示,具备“金牌级别能力”的模型在“数月内”还不会开放使用。