精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

陶哲軒回應OpenAI新模型IMO奪金!GPT-5測試版也曝光了

人工智能 新聞
IMO被公認為全球最頂尖的數學競賽,每年只有不到8%的參賽者能夠獲得金牌。而現在,一個AI模型做到了。

OpenAI最新模型曝光了,在2025年國際數學奧林匹克競賽(IMO)上達到了金牌水平!

IMO被公認為全球最頂尖的數學競賽,每年只有不到8%的參賽者能夠獲得金牌。而現在,一個AI模型做到了。

新模型最終成績:新模型在總共6道題中成功解決了5道,獲得35分(滿分42分),超過了今年的金牌線。

圖片

OpenAI員工Alexander Wei還透露,GPT-5即將發布,但IMO金牌模型是一個實驗性研究,在幾個月內都沒有計劃發布。

他特別強調,這次成功并非依靠針對特定任務的狹隘方法,而是在通用強化學習和測試時計算擴展方面取得了新突破。

圖片

與此同時,第三方機構的開源代碼中被發現GPT-5-reasoning-alpha-2025-07-13的字樣。

圖片

這段代碼被挖出來后很快就被刪除或隱藏,結合OpenAI在新模型發布前會找第三方機構進行安全測試的慣例——

種種跡象表明,GPT-5離我們不遠了。

35分斬獲金牌,解題過程完全模擬人類考試

具體來看OpenAI的實驗性新模型,這次評測可不是隨便做個題那么簡單。

OpenAI團隊讓模型在與人類選手完全相同的條件下參加考試:兩場各4.5小時的考試,不能使用任何工具或聯網,只能閱讀官方題目陳述,然后用自然語言寫出證明過程。

圖片

最終成績出來了:模型在6道題中成功解決了5道,獲得35分(滿分42分),穩穩超過了今年的金牌線。

今年IMO的金牌分數線正好是35分,這個成績放在人類選手中也是妥妥的金牌水平。今年約600名參賽者中,只有5人拿到了滿分。

更讓人印象深刻的是評分過程的嚴謹性。每道題的解答都由三位前IMO獎牌獲得者獨立評分,只有在三人達成一致意見后才確定最終分數。

這次突破的意義不止于成績,正如研究團隊所說,IMO問題需要的是一種全新水平的持續創造性思維。

從推理時間跨度來看,AI的進步速度簡直讓人瞠目結舌:從GSM8K(頂尖人類約需0.1分鐘)到MATH基準測試(約1分鐘),再到AIME(約10分鐘),現在終于攻克了IMO(約100分鐘)這個需要長時間深度思考的難題。

更重要的是,IMO的答案是難以驗證的多頁證明,這與之前那些有明確正確答案的數學題完全不同。OpenAI團隊表示,他們突破了傳統強化學習中依賴明確可驗證獎勵的范式,創造出了能夠像人類數學家一樣構建精巧論證的模型。

圖片

唯一沒能攻克的是第六題——這道被參賽者稱為“最終Boss”的組合數學難題:

有一個2025×2025的單位正方形網格。瑪蒂爾達希望在網格上放置一些矩形塊,這些塊的大小可能不同,使得每個塊的每一條邊都位于網格線上,并且每個單位正方形最多被一個塊覆蓋。求瑪蒂爾達需要放置的最小塊數,使得網格的每一行和每一列都恰好有一個單位正方形未被任何塊覆蓋。

圖片

去年IMO題目中,谷歌用Alphaproof和AlphaGeometry完成了四道題,未完成的兩道也屬于組合數學。

不過這一次,DeepMind研究員Archit Sharma在OpenAI宣布后回復:“恭喜!搶在我們前面宣布了——第6題是新的基準了嗎?”

但這條推文很快就被刪除了。

這個小插曲引發了網友們的各種猜測:莫非Google的模型也達到了類似水平。

圖片

如果感興趣的話,還可以進一步查看OpenAI公開的AI解題過程,鏈接在文末獲取。

圖片

引發圈內熱議,陶哲軒發表長評

OpenAI模型斬獲IMO金牌的消息一出,AI圈炸開了鍋。不過,在一片贊嘆聲中,也出現了一些不同的聲音。

其中最受關注的,當屬數學界頂尖學者陶哲軒的表態,他在社交媒體上針對此事發表了長篇評論。

陶哲軒指出,雖然多家AI公司都聲稱在IMO題目上取得了好成績,但由于缺乏統一的測試環境和標準,很難進行公平比較。

人們很容易將當前AI的能力視為一個單一的量化指標——要么能搞定某件事,要么就完全不行。但其實不是這樣,AI到底有多厲害,這得看給它多少資源、多少輔助手段以及不同的結果呈現方式,種種因素影響下,AI能力能差出好幾個量級。

圖片

他特別強調:“在沒有預先公布方法論的情況下,不會對任何自我報告的AI競賽表現發表評論。”

圖片

陶哲軒用生動的比喻列舉了多項AI可能采取的措施:

給學生幾天時間來完成每道題,而非用四個半小時解答三道題。(稍微延伸一下:給學生的時間仍只有四個半小時,但領隊將他們放入某種昂貴且耗能巨大的時間加速裝置,在這段時間里,學生們會經歷數月甚至數年的時光。)

考試開始前,領隊將題目改寫成學生更易理解的形式。

領隊讓學生可以無限制使用計算器、計算機代數軟件、形式化證明輔助工具、教科書,或者擁有上網搜索的權限

領隊讓6名學生組成的團隊共同攻關同一道題,就各自的部分進展和遇到的瓶頸進行交流。

領隊給學生提示可行的解題方向,若發現有學生在明知不太可能成功的方向上耗費過多時間,便會進行干預。

團隊的6名學生都提交了解答,但領隊只挑選出“最佳”解答提交給競賽,其余的則棄之不用。

若團隊中沒有任何一名學生得出令人滿意的解答,領隊就完全不提交任何解答,悄無聲息地退出競賽,且無人知曉他們曾參與過。

而這些措施均改變了競賽形式從而影響題目難度。

圖片

與此同時,數學競賽評測平臺MathArena發布了獨立評測結果。

在他們的測試中,即使是表現最好的Gemini 2.5 Pro也只獲得了13分(31%),遠低于銅牌線19分。

圖片

測試使用了best-of-32的選擇策略,即對于每個模型的解答,首先生成32份回應,隨后借助“大語言模型評審系統”對這些回應進行評估,兩兩比對選出更優答案。

每份最終的模型答案生成成本至少為3美元,其中Grok-4模型每份答案的成本超過20美元,但即便如此,仍然沒有任何模型能達到獲獎牌的水平。

MathArena團隊也同步更新了OpenAI宣布實驗模型拿到IMO金牌的消息:

無法驗證這些結果是如何實現,期待該模型的發布以及使用MathArena基準進行獨立評估。

圖片

雖然OpenAI模型拿金牌的方法論未公開,但也有不少網友表示,不看過程,結果同樣具有意義。

圖片

OpenAI團隊對自己的成果充滿信心。

參與此項目的研究員Alexander Wei回憶說:“2021年,我的博士導師讓我預測2025年7月AI在數學上的進展,我當時預測MATH基準測試能達到30%(還覺得其他人都太樂觀了)。結果現在我們拿到了IMO金牌。”

圖片

OpenAI新模型解題過程:
https://github.com/aw31/openai-imo-2025-proofs/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-21 11:48:54

OpenAIIMOLLM

2025-09-04 09:04:13

2024-12-09 09:35:00

AI數據訓練

2025-10-13 02:00:00

2025-08-13 09:10:40

2025-07-21 09:04:00

OpenAI谷歌模型

2025-07-24 16:30:48

陶哲軒金牌AI

2025-08-11 08:09:17

2024-07-29 13:28:52

2025-10-20 08:57:00

2023-10-04 08:07:06

CopilotGitHub

2024-08-08 13:40:00

2025-10-11 15:44:23

陶哲軒

2025-11-06 09:02:00

2023-06-19 09:57:23

GPT-4技術

2023-12-16 12:47:59

2025-09-09 09:01:00

2024-02-26 08:30:00

2025-11-06 08:59:00

2023-06-08 07:58:29

點贊
收藏

51CTO技術棧公眾號

国产大陆精品国产| 综合激情视频| 欧美综合色免费| 自拍偷拍一区二区三区| 精品人妻一区二区三区四区不卡 | 日本中文字幕久久| 日韩一区三区| 亚洲国产精品电影| 污视频网站观看| а√在线天堂官网| 久久精品人人爽人人爽| 3d动漫啪啪精品一区二区免费 | 中文人妻一区二区三区| 国产亚洲人成a在线v网站 | 一级全黄裸体免费视频| 天天影视欧美综合在线观看| 亚洲激情久久久| 亚洲a级黄色片| 忘忧草在线日韩www影院| 亚洲欧洲三级电影| 欧美aaaaa喷水| av网站免费播放| 老司机精品视频导航| 91av免费观看91av精品在线| 国产色无码精品视频国产| 国产精品xxxav免费视频| 在线看国产一区二区| 免费看毛片的网址| 影院在线观看全集免费观看| 欧美国产综合色视频| 精品国产乱码久久久久久蜜柚| 一级特黄特色的免费大片视频| 久久av一区二区三区| 欧美激情久久久久| 免费网站看av| 亚洲欧美色图| yellow中文字幕久久| 波多野结衣 在线| 欧美三级电影在线| 亚洲成avwww人| 男生和女生一起差差差视频| 国精品产品一区| 91福利视频在线| 99热成人精品热久久66| 精精国产xxxx视频在线播放| 亚洲国产人成综合网站| 黄色三级中文字幕| 青春草在线视频| 自拍偷自拍亚洲精品播放| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 欧美一区二视频在线免费观看| 精品国产一区三区| 青春草视频在线观看| 亚洲欧美成人一区二区三区| 亚洲一区免费看| 日本视频在线观看| 最新国产精品久久精品| 日本黄色播放器| fc2ppv国产精品久久| 亚洲视频资源在线| 久久久久久久久久久久久国产| 菠萝菠萝蜜在线视频免费观看| 综合色中文字幕| 国产911在线观看| 日本天码aⅴ片在线电影网站| 亚洲欧洲综合另类在线| 天堂а√在线中文在线| 超免费在线视频| 五月天婷婷综合| 亚洲中文字幕无码中文字| 亚洲精品动漫| 欧美日韩久久不卡| 一级日本黄色片| 蜜臀av一区| 亚洲一区二区久久久| 国产精品www爽爽爽| 久久久久免费av| 欧美黑人巨大xxx极品| 欧美成人精品欧美一级乱黄| 天堂午夜影视日韩欧美一区二区| 国产精品极品美女在线观看免费| 老熟妇一区二区三区啪啪| 激情六月婷婷综合| 国产98在线|日韩| 久久伊伊香蕉| 亚洲色图都市小说| 精品视频在线观看一区| 欧美va在线观看| 日韩欧美成人一区二区| 成人网站免费观看| 色综合天天爱| 91国语精品自产拍在线观看性色| 91丨九色丨海角社区| 国产精品一区二区x88av| 久久综合色一本| 黄网站视频在线观看| 午夜视频久久久久久| 色www免费视频| 女同另类激情重口| 日韩在线视频国产| 久久精品一二区| 国产尤物一区二区在线| 久久青青草综合| a级网站在线播放| 色综合天天天天做夜夜夜夜做| 五月激情五月婷婷| 伊甸园亚洲一区| 欧美成人亚洲成人日韩成人| 日韩黄色片网站| 国产99一区视频免费| 日韩高清三级| 精品丝袜在线| 日韩欧美www| 少妇高潮一区二区三区喷水| 美女视频一区免费观看| 国产精品99久久久久久久| 日韩免费啪啪| 日本精品一区二区三区四区的功能| wwwxxx色| 99久久99久久精品国产片桃花| 奇米成人av国产一区二区三区| 精品国产av一区二区三区| 日本一区二区久久| 国产精品沙发午睡系列| 一区二区三区在线资源| 色妞一区二区三区| 69亚洲精品久久久蜜桃小说| 不卡在线观看av| 日本免费成人网| 亚洲狼人在线| 色吧影院999| 亚洲图片欧美日韩| 久久影院午夜片一区| 99久久免费观看| 99综合99| 麻豆国产精品va在线观看不卡 | 精品视频免费看| 丰满圆润老女人hd| 免费视频一区| 激情视频在线观看一区二区三区| 羞羞的视频在线看| 欧美一级免费大片| 欧美黄色aaa| 国产乱码精品1区2区3区| 欧美一级黄色录像片| 中文字幕第315页| av片哪里在线观看| 色狠狠av一区二区三区| 亚洲综合自拍网| 国产一区导航| 久久久com| 超碰一区二区| 国产亚洲激情视频在线| 波多野结衣在线观看视频| 久久尤物电影视频在线观看| 超碰影院在线观看| 不卡一区2区| 国产日本欧美一区| 福利在线视频网站| 日韩免费电影网站| 黄色小说在线观看视频| 本田岬高潮一区二区三区| 国产极品尤物在线| 色狠狠久久av综合| 日韩av免费看| 香蕉视频在线播放| 欧美一区二区成人| 国产一级理论片| 99久久久久免费精品国产 | 国产在线精品日韩| 亚洲欧洲高清| 一区二区三区美女xx视频| 中文字幕第2页| 一区二区三区在线观看视频| 欧产日产国产精品98| 亚洲综合欧美| 一区在线电影| 136福利精品导航| 欧美一级电影久久| 在线观看免费网站黄| 欧美一级欧美三级在线观看 | 欧美体内she精视频| 极品色av影院| 不卡视频在线观看| 91色国产在线| 亚洲手机在线| 日韩视频在线播放| 日韩三级网址| 青青久久av北条麻妃海外网| 黄a在线观看| 日韩hd视频在线观看| 亚洲天堂男人网| 亚洲国产精品人人做人人爽| 69视频在线观看免费| 国产成人精品亚洲777人妖| 久久久久久久中文| 97人人精品| 久久久一本精品99久久精品66 | 希岛爱理中文字幕| www.日本不卡| а 天堂 在线| 肉色丝袜一区二区| 青青青青草视频| 香蕉视频官网在线观看日本一区二区| 久久精品国产第一区二区三区最新章节 | 91爱视频在线| 哥也色在线视频| 国产亚洲精品日韩| 国产91免费在线观看| 欧美日韩精品一区二区天天拍小说| 久久精品免费av| 中文字幕中文乱码欧美一区二区| 国产网站无遮挡| 国产美女av一区二区三区| 丝袜制服一区二区三区| 国产亚洲毛片| 韩日视频在线观看| 91精品电影| 亚洲精品在线视频观看| 亚州综合一区| 国产欧美亚洲日本| 亚洲精品v亚洲精品v日韩精品| 国产精品视频一区国模私拍 | 日本中文字幕在线看| 日韩精品免费综合视频在线播放| 国产乱码精品一区二区| 欧美主播一区二区三区| 亚洲精品午夜国产va久久成人| 一区二区三区蜜桃| 午夜精品福利在线视频| 国产精品欧美极品| 影音先锋制服丝袜| 久久亚洲一区二区三区明星换脸| 无码人妻一区二区三区在线| 国产一区二区三区av电影| 香蕉视频999| 蜜桃91丨九色丨蝌蚪91桃色| 五月婷婷之综合激情| 久久蜜桃精品| 老头吃奶性行交视频| 性色一区二区三区| 99热成人精品热久久66| 久久久精品网| 在线免费视频a| 日本欧美一区二区三区乱码| 老司机午夜av| 日本va欧美va精品发布| wwww.国产| 日韩国产欧美在线播放| 亚洲欧美另类动漫| 久久国内精品视频| 在线看免费毛片| 国产精品一区不卡| 亚洲天堂2024| 93久久精品日日躁夜夜躁欧美| 在线观看日韩精品视频| 久久久久久久久久久久久久久99 | 亚洲日本青草视频在线怡红院 | 亚洲精品网址| 青草全福视在线| 国产精品a久久久久| 日日摸日日碰夜夜爽无码| 亚洲一区久久| 一区二区三区韩国| 韩国女主播成人在线| 手机看片国产精品| 91香蕉视频污| 日本免费www| 亚洲精品国产高清久久伦理二区| 久久久久久久久久99| 欧美性猛交xxxx偷拍洗澡| 日本熟妇一区二区三区| 337p亚洲精品色噜噜| 亚洲欧美另类一区| 亚洲欧美日韩区| 免费av不卡| 欧美精品videos另类日本| 韩日成人影院| 成人免费在线视频网站| 久久aimee| 日韩资源av在线| 欧美一区不卡| 中国丰满人妻videoshd| 久久国产精品72免费观看| 美女伦理水蜜桃4| 国产欧美日韩麻豆91| 青青草偷拍视频| 色婷婷av一区二区三区之一色屋| 国产乱色精品成人免费视频| 亚洲国产精品一区二区久| 福利在线观看| 久久久在线视频| 国产精品诱惑| 精品欧美一区二区久久久伦| 四虎国产精品免费观看| 日韩欧美国产综合在线| 国内精品自线一区二区三区视频| 免费成人蒂法网站| 日韩美女啊v在线免费观看| 久久一区二区三区视频| 欧美一区二区三区在线看| 男女污污视频在线观看| 欧美日韩高清在线观看| 亚洲成av在线| 九色91国产| 欧美激情日韩| 黄大色黄女片18第一次| 91在线一区二区| 久久这里只有精品国产| 欧美日韩精品久久久| 桃花色综合影院| 欧美黑人巨大xxx极品| 亚州精品国产| 色噜噜狠狠色综合网| 国产精品视频久久一区| 波多野结衣三级视频| 自拍偷拍亚洲综合| 嫩草影院一区二区三区| 日韩精品中文字| 国产嫩草在线视频| 91超碰在线电影| 99久久夜色精品国产亚洲狼| 热久久精品免费视频| 99精品视频在线免费观看| 青青草精品在线视频| 欧美精品在线一区二区| av在线电影网| 国产不卡av在线免费观看| 久久97精品| 国产精品自拍片| 成人sese在线| 国产精品111| 日韩欧美色综合| 怡红院av在线| 91嫩草国产在线观看| 欧美在线视屏| 亚洲欧美日韩一二三区| 日韩理论片在线| 国产精品视频无码| 久久精品国产久精国产一老狼| 国产福利亚洲| 亚洲一卡二卡区| 久久99久久久久| 国产免费一区二区三区四区| 欧美日韩在线亚洲一区蜜芽| seseavlu视频在线| 国产日本欧美视频| 久久久久美女| aaaaa黄色片| 亚洲www啪成人一区二区麻豆 | 97se亚洲国产综合自在线不卡| 国产午夜激情视频| 亚洲国产欧美一区二区丝袜黑人 | 国产一区二区三区免费在线观看| 午夜国产福利一区二区| 日韩一区二区不卡| 蜜臀av在线播放| 国产一区二区三区四区五区加勒比| 在线播放日韩| 国产熟女高潮一区二区三区| 狠狠久久亚洲欧美专区| 国模吧精品人体gogo| 国产精品一区二区三区免费视频| 91亚洲自偷观看高清| 男插女视频网站| 婷婷久久综合九色综合绿巨人| 日韩资源在线| 国产日韩av高清| 欧美日韩国产亚洲一区| 久久人人爽人人人人片| 在线观看欧美日本| 国产乱色在线观看| 国产伦精品一区二区三毛| 香蕉久久国产| 国产精品夜夜夜爽阿娇| 欧美成人r级一区二区三区| 亚洲色图官网| 中文字幕中文字幕在线中心一区| 国产成人av电影在线观看| 国语对白永久免费| 色综合伊人色综合网| 91在线一区| 日韩中文字幕免费在线| 亚洲乱码国产乱码精品精98午夜 | 色婷婷综合成人av| 精品国产亚洲一区二区在线观看 | 亚洲国产欧美一区| 草民电影神马电影一区二区| av一区二区三区免费观看| 91丨porny丨国产| 国产又粗又猛又爽又黄的视频一| 高清欧美性猛交xxxx| 日韩电影二区| 性久久久久久久久久久| 欧美高清视频一二三区| 精品极品在线| 300部国产真实乱| 中文字幕第一区二区| 天天干,夜夜操| 91在线免费观看网站|