OpenAI和Google数学大比拼,难分高下
OpenAI 和 Google DeepMind 的 AI 模型在国际数学奥林匹克竞赛(IMO)中都取得了金牌级别的成绩,这展示了 AI 在推理能力上的显著进步。然而,这一成就伴随着两家公司之间的争议,谷歌指责 OpenAI 的宣布方式不合规。最终,这起事件不仅凸显了 AI 技术的飞速发展,也揭示了 AI 巨头之间日益激烈的竞争格局。
AI 在顶级数学竞赛中取得突破
OpenAI 和 Google DeepMind 的 AI 模型在 2025 年国际数学奥林匹克竞赛(IMO)中均获得了金牌分数。IMO 是世界上历史最悠久、难度最高的全球性高中数学竞赛之一。
- 成就: 两家公司的 AI 模型在六道题目中都正确回答了五道。
- 意义: 这一表现超过了大多数人类顶尖学生,标志着 AI 在复杂推理领域取得了重大进展。
- 背景: AI 公司正在激烈争夺行业领先的公众形象,这对于吸引顶尖 AI 人才至关重要。像 IMO 这样的基准测试,在研究人员社区中具有很高的分量。
从“形式化”到“非形式化”的飞跃
今年的成就与去年相比,代表了一次技术上的重要跨越。
- 去年的系统: 谷歌去年获得了银牌,但使用的是“形式化”系统,需要人类将问题翻译成机器可读的格式。
- 今年的系统: 两家公司都使用了“非形式化”系统,能够直接理解用自然语言提出的问题,并生成基于证明的答案,无需任何人工翻译。
研究人员称,这一金牌表现代表了 AI 推理模型在非确定性领域的突破。AI 通常擅长处理有直接答案的问题(如简单数学或编码),但在解决方案更模糊的任务上表现不佳。
宣布方式引发的争议
尽管取得了相似的成就,但谷歌对 OpenAI 的做法提出了质疑,双方在社交媒体上展开了辩论。
谷歌的观点:
- 谷歌与 IMO 官方合作,经过了官方评分和认可后才宣布结果,流程更严谨。
- 指责 OpenAI 过早宣布,且其模型未经 IMO 官方评估。
- 谷歌高级研究员表示,他们等待宣布是为了尊重参加比赛的学生。
OpenAI 的回应:
- OpenAI 表示,他们聘请了三位了解评分系统的前 IMO 奖牌得主作为第三方评估员。
- 他们并不知道谷歌与 IMO 正在进行一项非形式化测试。
- 在 IMO 告知后,他们遵守了等到学生颁奖典礼结束再宣布的要求。
竞争白热化,差距正在缩小
这场争论的背后,是一个更重要的事实:各大 AI 实验室的技术都在迅速进步,彼此之间的差距正在缩小。
尽管谷歌的流程更官方、更严谨,但这场辩论可能忽略了更宏大的图景:来自多家顶尖 AI 实验室的模型正在快速进步。
曾经,OpenAI 在行业中拥有显著的领先优势。但现在看来,竞争比任何公司愿意承认的都更加激烈。随着 OpenAI 预计在未来几个月发布 GPT-5,该公司无疑希望再次证明其行业领导地位。