OpenAI 系统在全球顶级编程大赛中战胜人类和谷歌

7 0 0

在2025年的国际大学生程序设计竞赛（ICPC）世界总决赛上，OpenAI的系统表现出色，成功解决了比赛中所有12个编程问题，超越了人类选手和谷歌的DeepMind模型。根据OpenAI的说法，该系统若以人类团队身份参赛，毫无疑问会夺得第一名。

图源备注:图片由AI生成，图片授权服务商Midjourney

OpenAI表示，该系统在比赛中遵循与学生相同的规则。它在标准的PDF格式中获取问题集，并在五个小时的时间限制内提交解决方案。所有的提交都是直接发送给官方评审，评审与人类参赛队伍的解答并行进行评估。公司强调，比赛期间没有对系统进行特别调整。

这一消息发布不久后，谷歌DeepMind声称其升级版的Gemini2.5DeepThink系统在同一比赛中达到了金牌水平，成功解决了12个问题中的10个，其中包括人类队伍未能解决的C问题。不过，Gemini在另外两个问题上未能取得成功。相较之下，OpenAI的系统以完美的12/12成绩超越了DeepMind的表现。

OpenAI解释称，该系统是由多个通用推理模型组成的集成体，这些模型并没有特别针对ICPC进行训练。它使用了GPT-5和一个内部实验性推理模型。GPT-5为12个问题中的11个提供了正确答案，而实验性模型负责选择最终提交的答案。最后一个也是最难的问题是由实验模型独立解决的，这个问题经过了九次提交才最终被接受。与此对比，表现最佳的人类团队仅解决了11个问题。

OpenAI强调，这一胜利证明了更复杂的模型在深度推理和长时间计算能力方面的潜力。GPT-5承担了大部分工作，突显了它作为当前公众可用的最强大AI模型之一的地位。公司将这一成就视为持续进步的结果。这些模型已经在国际数学奥林匹克和国际信息学奥林匹克等重要学术比赛中获得了金级成绩。项目参与者穆斯塔法・罗哈尼贾德表示，ICPC的表现是这一成功系列的恰当总结，并指出系统的多功能性。他还补充说，下一步将是开发能够发现新知识的系统，这被认为是一个真正的里程碑。