剛剛，OpenAI拿下IOI金牌，僅次于前五名人類選手！參賽推理模型才奪得IMO金牌

2025-08-12 09:14:00

在全球頂級編程賽事之一 ——2025 年國際信息學(xué)奧林匹克（IOI）中，OpenAI 的推理模型取得了足以摘得金牌的高分，并在 AI 參賽者中排名第一！

一覺醒來，OpenAI 的大模型又完成了一項(xiàng)壯舉！

在全球頂級編程賽事之一 ——2025 年國際信息學(xué)奧林匹克（IOI）中，OpenAI 的推理模型取得了足以摘得金牌的高分，并在 AI 參賽者中排名第一！

IOI 2025（即第 37 屆國際信息學(xué)奧林匹克）在玻利維亞的蘇克雷舉行，7 月 27 日正式開幕，并已于 8 月 3 日落下了帷幕。在此次賽事中，中國隊(duì)大獲全勝，全員金牌奪冠。

而就在不久前，OpenAI 剛剛在 IMO（國際數(shù)學(xué)奧林匹克競賽）2025 中拿到了金牌級別的成績。

在比賽中，OpenAI 參加了 IOI 的在線 AI 賽道，在 330 位人類參賽者中，所用推理模型的得分只落后于 5 位人類選手，拿下了 AI 參賽者中的 No 1。

與人類選手一樣，OpenAI 遵守了 5 小時(shí)答題時(shí)間和 50 次提交的限制。

同樣地，OpenAI 沒有使用互聯(lián)網(wǎng)或 RAG（檢索增強(qiáng)生成），僅能訪問一個(gè)基礎(chǔ)的終端工具。

OpenAI 使用了一組通用推理模型，并且沒有針對 IOI 進(jìn)行專門的訓(xùn)練。唯一的輔助策略是選擇要提交的解答，并與 IOI API 建立連接。

相較于去年 IOI 的表現(xiàn)，OpenAI 今年的這一成績實(shí)現(xiàn)了巨大飛躍。

去年，OpenAI 僅差一點(diǎn)就拿到了銅牌，并且當(dāng)時(shí)依賴一個(gè)更加人工定制的測試策略。短短一年的時(shí)間，OpenAI 的成績就從第 49 百分位躍升到第 98 百分位！

過去幾周，OpenAI 在 AtCoder 世界總決賽、IMO 和 IOI 上都取得非常好的成績，展示了最新研究方法帶來的巨大進(jìn)步，這些讓人非常興奮。OpenAI 正努力構(gòu)建更聰明、更強(qiáng)大的模型，未來將盡快將它們帶入主流產(chǎn)品中。

下圖為備戰(zhàn) IOI 2025 的團(tuán)隊(duì)成員以及長期推動 OpenAI 競技編程的團(tuán)隊(duì)成員。

OpenAI 聯(lián)合創(chuàng)始人、總裁 Greg Brockma 盛贊了此次 IOI 中自家模型「金牌級的表現(xiàn)」。

OpenAI 專注于多步推理、自博弈和多智能體 AI 的研究科學(xué)家 Noam Brown 表示，「重要的啟示是：我們在 IMO 上取得金牌的模型就是最好的競賽編程模型。」

他分享了更多的細(xì)節(jié)：在 IMO 結(jié)束后，他們對 IMO 金牌模型進(jìn)行了全面評測，發(fā)現(xiàn)它不僅在競賽數(shù)學(xué)方面表現(xiàn)最佳，在包括編程在內(nèi)的許多其他領(lǐng)域也是最強(qiáng)的模型。

所以，團(tuán)隊(duì)決定直接使用完全相同的 IMO 金牌模型，不做任何改動，將它應(yīng)用到 IOI 競賽系統(tǒng)中。

IOI 比賽中的輔助策略包括：先從幾個(gè)不同的模型中采樣解答，然后再用另一個(gè)模型結(jié)合啟發(fā)式方法來篩選要提交的解答。最終獲得了金牌，在所有參賽選手中排名第 6。

事實(shí)證明，在 OpenAI 采樣的所有模型中，IMO 金牌模型的表現(xiàn)確實(shí)是最好的。

對于此次 OpenAI 在 IOI 賽事中取得金牌，網(wǎng)友感嘆到：沒有專門訓(xùn)練就取得了這樣的成績，很了不起，這意味著通用推理能力正變得非常強(qiáng)大。

對于這個(gè)模型的「真身」，大家也是各種猜測。

也許正如下面這位網(wǎng)友所言，大家現(xiàn)在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 奪金推理模型的相同（或更強(qiáng)）技術(shù)的公開版本！看起來將會是又一次全方位的重大飛躍。

所以，OpenAI，別光顧著自夸，趕緊發(fā)布吧。

責(zé)任編輯：張燕妮來源：機(jī)器之心