剛剛,OpenAI拿下IOI金牌,僅次于前五名人類選手!參賽推理模型才奪得IMO金牌
一覺醒來,OpenAI 的大模型又完成了一項(xiàng)壯舉!
在全球頂級編程賽事之一 ——2025 年國際信息學(xué)奧林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 參賽者中排名第一!
IOI 2025(即第 37 屆國際信息學(xué)奧林匹克)在玻利維亞的蘇克雷舉行,7 月 27 日正式開幕,并已于 8 月 3 日落下了帷幕。在此次賽事中,中國隊(duì)大獲全勝,全員金牌奪冠。
而就在不久前,OpenAI 剛剛在 IMO(國際數(shù)學(xué)奧林匹克競賽)2025 中拿到了金牌級別的成績。

在比賽中,OpenAI 參加了 IOI 的在線 AI 賽道,在 330 位人類參賽者中,所用推理模型的得分只落后于 5 位人類選手,拿下了 AI 參賽者中的 No 1。
與人類選手一樣,OpenAI 遵守了 5 小時(shí)答題時(shí)間和 50 次提交的限制。
同樣地,OpenAI 沒有使用互聯(lián)網(wǎng)或 RAG(檢索增強(qiáng)生成),僅能訪問一個(gè)基礎(chǔ)的終端工具。

OpenAI 使用了一組通用推理模型,并且沒有針對 IOI 進(jìn)行專門的訓(xùn)練。唯一的輔助策略是選擇要提交的解答,并與 IOI API 建立連接。
相較于去年 IOI 的表現(xiàn),OpenAI 今年的這一成績實(shí)現(xiàn)了巨大飛躍。
去年,OpenAI 僅差一點(diǎn)就拿到了銅牌,并且當(dāng)時(shí)依賴一個(gè)更加人工定制的測試策略。短短一年的時(shí)間,OpenAI 的成績就從第 49 百分位躍升到第 98 百分位!
過去幾周,OpenAI 在 AtCoder 世界總決賽、IMO 和 IOI 上都取得非常好的成績,展示了最新研究方法帶來的巨大進(jìn)步,這些讓人非常興奮。OpenAI 正努力構(gòu)建更聰明、更強(qiáng)大的模型,未來將盡快將它們帶入主流產(chǎn)品中。
下圖為備戰(zhàn) IOI 2025 的團(tuán)隊(duì)成員以及長期推動 OpenAI 競技編程的團(tuán)隊(duì)成員。

OpenAI 聯(lián)合創(chuàng)始人、總裁 Greg Brockma 盛贊了此次 IOI 中自家模型「金牌級的表現(xiàn)」。

OpenAI 專注于多步推理、自博弈和多智能體 AI 的研究科學(xué)家 Noam Brown 表示,「重要的啟示是:我們在 IMO 上取得金牌的模型就是最好的競賽編程模型。」
他分享了更多的細(xì)節(jié):在 IMO 結(jié)束后,他們對 IMO 金牌模型進(jìn)行了全面評測,發(fā)現(xiàn)它不僅在競賽數(shù)學(xué)方面表現(xiàn)最佳,在包括編程在內(nèi)的許多其他領(lǐng)域也是最強(qiáng)的模型。
所以,團(tuán)隊(duì)決定直接使用完全相同的 IMO 金牌模型,不做任何改動,將它應(yīng)用到 IOI 競賽系統(tǒng)中。
IOI 比賽中的輔助策略包括:先從幾個(gè)不同的模型中采樣解答,然后再用另一個(gè)模型結(jié)合啟發(fā)式方法來篩選要提交的解答。最終獲得了金牌,在所有參賽選手中排名第 6。
事實(shí)證明,在 OpenAI 采樣的所有模型中,IMO 金牌模型的表現(xiàn)確實(shí)是最好的。


對于此次 OpenAI 在 IOI 賽事中取得金牌,網(wǎng)友感嘆到:沒有專門訓(xùn)練就取得了這樣的成績,很了不起,這意味著通用推理能力正變得非常強(qiáng)大。

對于這個(gè)模型的「真身」,大家也是各種猜測。

也許正如下面這位網(wǎng)友所言,大家現(xiàn)在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 奪金推理模型的相同(或更強(qiáng))技術(shù)的公開版本!看起來將會是又一次全方位的重大飛躍。

所以,OpenAI,別光顧著自夸,趕緊發(fā)布吧。






































