人類擊敗OpenAI守住編程冠軍!10小時激戰兩次反超,AI最后關頭功虧一簣
10小時激戰!人類最后關頭實現超越,獲得編程總決賽冠軍~
而原本始終保持領先優勢的OpenAI,最終屈居第二。

在剛剛落幕的AtCoder世界巡回總決賽上,12名決賽選手兩天時間里展開角逐。
結果過程還挺緊張刺激,尤其前兩名的爭奪上。
OpenAI 在大部分比賽中都排名第一,本以為就這樣了。人類開始反超,結果還剩1小時20分鐘的時候,OpenAI又重新領先。不過還是沒有堅持到最后。

OpenAI總裁Greg Brockman發來賀電,中間還夾帶私貨:OpenAI位居第二。

此時獲得冠軍的人類表示要累死了。
因為過去三天我估計只睡了10個小時,現在都快撐不住了。

網友:你看,模型就不會這樣。

好好,到底還是人類機靈啊~~
10小時激戰:人類兩次反超鎖定勝局
AtCoder是一個全球性質的日本編程競賽網站,任何人都可以隨時參加,挑戰歷年的5000道真題。
如果排名優異(前12名),將有機會前往日本參與一年一度的世界巡回總決賽。

它有兩種類型的競賽:算法類和啟發式,OpenAI參與的是后者,與12位優異人類同臺競技。每位選手都有個這樣的介紹卡片。

算法類,參賽者需要提交一個程序,快速準確地解決給定的問題,誰答對的多誰就勝。
啟發式是2021年才開始評級、2024年才開始競賽的類別。在這類比賽中,參賽者比拼的是他們能在規定時間(10小時內)找到最優解。
比如,考慮一條追蹤100個點返回的路徑。那么最右邊這個方法將獲得最高分。

比賽期間你可以提交任何編程語言,并且支持重復提交,不過兩次提交之間至少要間隔5分鐘。不過提交一次錯誤答案就要扣時間。
此次比賽全程直播。OpenAI參賽的模型叫做OpenAI-AHC,從提交的記錄來看,前期發揮得都很不錯。
前六個小時提交的回答,全都是得分點,第一次提交就有31萬得分。


比賽還剩下三個小時的時候,OpenAI依然是穩居第一。

但是在后半程開始出現失誤,好幾道題出現「執行時間超出限制」的情況,導致零分。

反觀Psycho,就顯得十分穩定,全是綠燈。

尤其他第一次提交,就獲得了六百多萬的得分。

于是就在還剩兩小時四十分鐘的時候,他直接完成了反超。

而且相差的分數還不小。

后面正如Greg所說,還剩下一個多小時的時候,OpenAIAHC再次反超。

這種局勢一直穩定在還剩46分鐘時,就在Psycho提交之后,再次回到了第一的位置,結果就直接穩定到最后了。

By the way,OpenAI的提交次數已經是人類的好幾倍了。隨便拎出個人類選手,提交次數一頁就可以瀏覽完。

結果一出,不少人想起之前幾次人機大戰的比賽。

網友表示:看來這是人類最后一次勝利。

冠軍還曾效力OpenAI,訓練AI戰勝人類
值得一提的是,這位來自波蘭的Psycho,與OpenAI和Greg是有點淵源在的。
從他個人介紹來看,他是個游戲設計者,也是個職業競技程序員。
但以前在OpenAI待過,于是順藤摸瓜找到了當時2019年的一篇文章。

當時OpenAI Five在Dota 2游戲里擊敗世界冠軍,成為首個電競比賽中戰勝人類的AI系統。
而他所在團隊利用強化學習進行大規模訓練,就在OpenAI Five持續訓練10個月后,終于戰勝了世界冠軍。
當時這篇論文也還有Greg Brockman參與。
六年之前,他在OpenAI訓練AI,要AI戰勝人類。
六年之后,他站在了人類選手這一邊,挑戰自己老東家的大模型,結果挑戰成功了。
Interesting~
此次對于Greg的祝賀,他回應道,謝謝你讓我的生活更有趣,現在我回去準備退休了。

順便說一嘴,今年這場比賽還是由OpenAI贊助的。
第一名可以獲得50萬日元,差不多兩萬四人民幣。第二名能獲得九千六百多元。

嗯看來,OpenAI這一波,還是有實際的收獲的(Doge)。
10小時賽程回放:https://www.youtube.com/live/TG3ChQH61vE
































