OpenAI和Google数学大比拼，难分高下

OpenAI 和 Google DeepMind 的 AI 模型在国际数学奥林匹克竞赛（IMO）中都取得了金牌级别的成绩，这展示了 AI 在推理能力上的显著进步。然而，这一成就伴随着两家公司之间的争议，谷歌指责 OpenAI 的宣布方式不合规。最终，这起事件不仅凸显了 AI 技术的飞速发展，也揭示了 AI 巨头之间日益激烈的竞争格局。

AI 在顶级数学竞赛中取得突破

OpenAI 和 Google DeepMind 的 AI 模型在 2025 年国际数学奥林匹克竞赛（IMO）中均获得了金牌分数。IMO 是世界上历史最悠久、难度最高的全球性高中数学竞赛之一。

成就: 两家公司的 AI 模型在六道题目中都正确回答了五道。
意义: 这一表现超过了大多数人类顶尖学生，标志着 AI 在复杂推理领域取得了重大进展。
背景: AI 公司正在激烈争夺行业领先的公众形象，这对于吸引顶尖 AI 人才至关重要。像 IMO 这样的基准测试，在研究人员社区中具有很高的分量。

从“形式化”到“非形式化”的飞跃

今年的成就与去年相比，代表了一次技术上的重要跨越。

去年的系统: 谷歌去年获得了银牌，但使用的是“形式化”系统，需要人类将问题翻译成机器可读的格式。
今年的系统: 两家公司都使用了“非形式化”系统，能够直接理解用自然语言提出的问题，并生成基于证明的答案，无需任何人工翻译。

研究人员称，这一金牌表现代表了 AI 推理模型在非确定性领域的突破。AI 通常擅长处理有直接答案的问题（如简单数学或编码），但在解决方案更模糊的任务上表现不佳。

宣布方式引发的争议

尽管取得了相似的成就，但谷歌对 OpenAI 的做法提出了质疑，双方在社交媒体上展开了辩论。

谷歌的观点:

谷歌与 IMO 官方合作，经过了官方评分和认可后才宣布结果，流程更严谨。
指责 OpenAI 过早宣布，且其模型未经 IMO 官方评估。
谷歌高级研究员表示，他们等待宣布是为了尊重参加比赛的学生。

OpenAI 的回应:

OpenAI 表示，他们聘请了三位了解评分系统的前 IMO 奖牌得主作为第三方评估员。
他们并不知道谷歌与 IMO 正在进行一项非形式化测试。
在 IMO 告知后，他们遵守了等到学生颁奖典礼结束再宣布的要求。

竞争白热化，差距正在缩小

这场争论的背后，是一个更重要的事实：各大 AI 实验室的技术都在迅速进步，彼此之间的差距正在缩小。

尽管谷歌的流程更官方、更严谨，但这场辩论可能忽略了更宏大的图景：来自多家顶尖 AI 实验室的模型正在快速进步。

曾经，OpenAI 在行业中拥有显著的领先优势。但现在看来，竞争比任何公司愿意承认的都更加激烈。随着 OpenAI 预计在未来几个月发布 GPT-5，该公司无疑希望再次证明其行业领导地位。