精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

內幕曝光:OpenAI模型坦承不會第六題,三人倆月拿下IMO金牌!

人工智能 新聞
OpenAI在短短兩個月內,讓AI從掙扎于小學數學題躍升至國際數學奧林匹克(IMO)金牌水平,背后是通用AI技術的突破。

OpenAI的ChatGPT真能拿到國際奧數IMO金牌?還是OpenAI的自嗨?背后到底有何隱情?

OpenAI的IMO金牌核心團隊Alexander Wei、Noam Brown與Sheryl Hsu做客紅杉Training Data播客,分享了如何在兩月內讓AI斬獲IMO金牌??。

比如說,OpenAI內部并非所有人都持樂觀態度。某位研究員甚至打賭模型不會贏,賠率高達2:1,不過最終因為「不想影響士氣」而放棄了賭局。

比賽當天凌晨1-5點,Noam Brown忙里偷閑,小憩了一番,而Alexander Wei瘋狂檢查模型生成的證明??。

他們這次還解釋了是如何決定AI是不是拿到了金牌。為了評分,他們雇用了外部的IMO獎牌獲得者。每份證明都由三名獎牌獲得者進行評分,他們對正確性達成了一致意見 。就這樣,他們認為AI的確有能力拿到IMO金牌。

他們還透露證明像「外星語言」般獨特,可讀性不高。雖有有能力優化,但為了透明,他們選擇發布了原始輸出。

圖片

如果你只想快速了解精華,先看下方要點;想讀幕后故事,請繼續往下。

要點速讀

在短短兩個月內,這支OpenAI僅三人的精銳團隊就實現了整個AI領域多年未竟的目標——在國際數學奧林匹克競賽難題上達到金牌級水平。

這是通往ASI道路上最重要的里程碑之一。

這次突破之所以特別引人注目,不僅僅是因為AI的數學能力,更在于其背后的架構。這是一種通用技術,用于擴展測試時間計算,并處理那些遠遠超出競賽數學范疇的難以驗證的任務。

就在一年前,AI還只能進行短暫的數學推理,僅僅持續十分之一分鐘。而現在,已有AI系統能夠持續推理長達100分鐘。

而超級智能的期望是,隨著我們將推理時間擴展到數千甚至數十萬小時,我們或許能夠開始解決人類在數學、科學等眾多領域中那些最偉大的未解難題。

團隊還介紹了他們的獨特方法:在難以驗證的任務上,不用形式化驗證工具,而使用通用強化學習技術。

新模型展現出驚人的自省能力——主動承認無法解答第六題,同時揭示了解決競賽題與取得真正數學研究突破之間的懸殊差距。

IMO 2025第六題是本次競賽難度最大的題目,大意如下:

考慮一個2025x2025的單位正方形網格。馬蒂爾達希望在這個網格上放置一些矩形瓷磚,這些瓷磚的大小可能各不相同,但每塊瓷磚的每一邊都必須與網格線對齊,并且每個單位正方形最多被一塊瓷磚覆蓋。

確定馬蒂爾達需要放置的最小瓷磚數量,以確保網格的每一行和每一列都有且僅有一個單位正方形沒有被任何瓷磚覆蓋。

關鍵亮點如下:

(1)通用技術勝過專用方案。

(2)小團隊也能創造大成果:核心團隊僅由3名研究人員組成,在最后2個月沖刺完成工作。

(3)自我意識提升AI可靠性:面對最難的題目時,模型能承認自己無法解決,而不是輸出看似合理但錯誤的答案。 

(4)測試時計算擴展助力深入推理:突破的關鍵在于將推理計算時間從幾秒延長到幾小時,使模型能更深入思考復雜問題。  

(5)競賽是進步的起點,而非終點。

圖片

Sheryl Hsu(第一排中間女子)分享的OpenAI合照

兩個月的奇跡

國際數學奧林匹克(IMO)是全球高中生數學頂尖賽事,難題之難讓人類選手也要苦練多年。

即便是天才數學家陶哲軒,10歲時第一次參加IMO,獲得了銅牌。約兩年后,第二次參加IMO,他才獲得了金牌。

可OpenAI的這支小隊卻只用了兩個月!

他們的秘密武器是什么?

在紅杉資本的播客《Training Data》中,主持人Sonya Huang揭秘了真相:

他們用了一種叫做「多智能體系統」的技術。

簡單說,就是讓多個AI「助手」同時工作,像一個超級團隊分工協作。

這種方法讓他們的模型能在短時間內解決復雜問題。

圖片

AI在數學上真令人嘆為觀止!

就在幾年前,AI模型還在為解決小學數學問題而掙扎。

在2024年,GSM8K還被當作評估模型的標準。

圖片

GSM8K,即小學數學8K,是一個包含8,500個高質量、語言多樣的小學數學應用題的數據集。目前,此數據集的成績已經飽和:Claude 3 準確率已達95%

但在數學領域,這只是短暫現象。隨后,AI數學基準測試出現了美國數學邀請賽AIME,接著美國奧數USAMO。

圖片

去年的開源模型數學排行榜

現在,國際數學奧林匹克競賽金牌也被AI拿下。

AI以驚人的速度突破了所有的數學基準。

AI或覺醒自我意識

敢說自己「沒答案」

有時,AI會「胡思亂想」,編造錯誤答案,同時「理直氣壯」,自信過頭。

這屬于推理模型的「幻覺」問題。

但OpenAI的模型很特別——它能在解不出題時果斷說「我不知道」。

比如在IMO第6題上,模型選擇不冒險,而是承認自己的局限。

新模型顯著減少了「幻覺」問題。

OpenAI研究員Noam Brown認為AI開始向自我意識推理轉變:

過去,數學家們需要仔細檢查模型的解題過程,因為早期系統常常會悄無聲息地弄錯不等式或插入錯誤步驟,導致「幻覺」答案。

在缺乏有效證明時,新更新的IMO模型傾向于說「我不確定」,這大大減少了隱藏錯誤

這一點讓篤信AGI的網友Causal Coder激動地評論:「這比拿金牌還重要!」

為什么?因為這避免了「幻覺」(hallucination),讓AI更可靠。

圖片

《自然》雜志的研究也支持這一觀點:減少錯誤輸出是AI進步的關鍵。

圖片

這不僅在數學競賽中閃耀,還可能幫我們在未來科學計算中少走彎路。

數學讓人謙卑,AI任重道遠

盡管這次的進步令人興奮,但距離千禧難題還很遠。

若按IMO題需要1.5小時思考估算,千禧級別需將思考時間放大上千倍,仍任重道遠。

GSM8K是小學數學,好學生幾秒鐘搞定。現在AI從幾秒鐘進步到IMO級別——天才學生平均每題1.5小時(IMO三題4.5小時)。而研究數學需要這些奧賽天才長大后花1500小時。所以,從1.5小時到數千小時,還有千倍差距。

在千禧問題上,整個領域的專家畢生努力,還沒多少進展。數學的深度讓人謙卑:從1.5小時到數十萬小時的人類思考,還有很長的路。

圖片

目前,7大千禧難題只有龐加萊猜想得到了解決

不止是數學

通向通用智能

這次的突破是為了開發通用的推理技術,而不是局限于數學。

他們在短短一年多的時間里,將推理時間從O(0.1分鐘)擴展到了O(100分鐘)。

除了讓長推理以及在難以驗證的任務上取得進步之外,這還涉及到擴展并行計算,涉及到多智能體。

圖片

在多智能體強化學習(MARL)實驗中,兩個對立的智能體團隊展開對抗

他們通過巧妙設計「獎勵函數」,讓AI能處理難以驗證的難題,相同方法也適用于物理奧林匹克競賽,不過模型還無法進行實驗部分的操作。

在擴展思考時間、處理難以驗證的任務以及并行計算上,他們所采用的技術都是通用技術。他們計劃在其他系統中使用,或者已經在使用了。

從基礎設施的角度來說,這次基本上使用的是和其他項目相同的基礎設施。

并沒有什么專門為IMO定制。

他們稱此次方法接下來會整合進更多OpenAI模型,全面提升推理能力,從而構建更強大的模型,不斷改進Agent、ChatGPT以及其他一切。

但全球部署仍需時間。

挑戰與夢想:路還長

千年難題如黎曼猜想,人類中的天才一生都難解,AI還需更多突破。

但團隊不氣餒,他們甚至想讓AI學會自己提出新問題——這比解題更酷!

Noam Brown表示,語言模型現在正迅速地一個個克服障礙:

接下來的挑戰將是生成新問題,比如創作IMO級別的數學難題「需要專業的數學家...但我看不到任何根本性的障礙。」

紅杉的Sonya笑稱:「從0.1分鐘到100分鐘的推理擴展,已經是巨大進步,未來可期!」

這對我們意味著什么?

這個故事不僅炫酷,還很實用。想象一下,未來AI能幫你解決家庭預算、設計新游戲,甚至提出科學新想法! 對于普通人,這意味著更智能的生活助手正在路上。對AI開發者來說,這是個啟發:合作和創意能帶來意想不到的成果。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-07-21 11:48:54

OpenAIIMOLLM

2025-08-12 09:14:00

2025-07-21 09:04:00

OpenAI谷歌模型

2025-08-12 09:46:18

2025-07-24 16:30:48

陶哲軒金牌AI

2025-07-22 11:53:05

2025-02-08 13:00:00

2025-07-21 14:27:44

IMOOpenAIAI

2025-08-04 08:40:00

2025-07-21 09:00:00

2025-07-22 10:27:27

2025-04-01 09:23:00

2025-08-11 14:13:36

OpenAIGPT-5人工智能

2025-10-31 15:55:12

Sora模型AI

2025-07-25 15:02:23

AI模型系統

2020-10-05 21:47:30

AI 數據人工智能

2013-07-19 09:50:56

OpenStackVMware

2025-11-13 15:29:48

Nature模型AI

2025-07-21 09:19:36

2009-12-25 18:04:52

Linux版本選擇
點贊
收藏

51CTO技術棧公眾號

亚洲欧美www| 精品久久久久久久久久久久久久| 91成人免费观看| 日本三级视频在线| 国产亚洲一区二区三区啪| 欧美放荡的少妇| 蜜桃传媒一区二区三区| 在线免费观看黄| 成人av在线资源网站| 国产精品高清在线观看| 久久综合色综合| 日韩影院二区| 日韩激情第一页| www.色.com| 欧美亚洲韩国| 亚洲成人在线观看视频| 五月天久久狠狠| 少妇人妻精品一区二区三区| 麻豆视频一区二区| 97精品一区二区三区| 天堂网avav| 禁断一区二区三区在线| 精品不卡在线视频| 欧美又黄又嫩大片a级| 日韩一区二区三区在线免费观看| 亚洲午夜羞羞片| 免费在线观看污污视频| 九色蝌蚪在线| av午夜精品一区二区三区| 国产女同一区二区| 久久99国产综合精品免费| 欧美日韩国产探花| 精品久久久999| 免费视频91蜜桃| 亚洲性视频大全| 精品不卡在线视频| 日批视频免费看| 国产精品一区三区在线观看| 欧美在线视频全部完| 黄色动漫在线免费看| caoporn视频在线| 亚洲宅男天堂在线观看无病毒| 亚洲综合网中心| av网页在线| 国产视频不卡一区| 欧美一区二视频在线免费观看| 欧美视频一二区| 成人一级视频在线观看| 99高清视频有精品视频| 精品久久久久久亚洲综合网站| 国产一区在线看| 91久久精品一区| 91欧美日韩麻豆精品| 麻豆成人91精品二区三区| 国产精品久久久久久av| 亚洲婷婷久久综合| 日本不卡不码高清免费观看| 国产精品99久久久久久人 | 黄色一级片免费的| 国产一区影院| 在线播放中文一区| 美女被艹视频网站| 亚洲不卡在线| 亚洲成人精品视频在线观看| 国产精品久久久久久亚洲色 | 原纱央莉成人av片| 色天天综合久久久久综合片| 国产性生交xxxxx免费| 国产福利一区二区三区在线播放| 在线播放亚洲一区| 在线观看一区二区三区四区| 国产一区丝袜| 亚洲图片制服诱惑| 五月天婷婷丁香网| 欧美在线日韩| 欧美在线免费视频| 中文字幕人妻丝袜乱一区三区| 毛片av一区二区| 99久久精品免费看国产一区二区三区| 免费观看成年人视频| 97超碰欧美中文字幕| 色噜噜狠狠一区二区三区| 国产日产一区二区| 亚洲成人动漫在线观看| 99久久激情视频| 精品网站999| 日韩高清av一区二区三区| 欧美人与禽zoz0善交| 亚州av乱码久久精品蜜桃| 欧美激情啊啊啊| 亚洲 欧美 日韩 在线| 久久成人麻豆午夜电影| 国产日本一区二区三区| 国产福利电影在线| 亚洲综合自拍偷拍| 欧美少妇性生活视频| 国产精品麻豆| 亚洲男人的天堂网站| 天天综合天天做| 在线欧美不卡| 国产自摸综合网| 亚洲 欧美 精品| 日韩美女视频19| 一女被多男玩喷潮视频| 国产aa精品| 亚洲系列中文字幕| 久久久久久久久久综合| 麻豆一区二区在线| 久久久久久久久四区三区| 成人在线影视| 91久久线看在观草草青青| 337p日本欧洲亚洲大胆张筱雨| 加勒比久久综合| 91av福利视频| 性做久久久久久久久久| 国产精品欧美久久久久一区二区| 免费在线观看亚洲视频| 蜜桃精品视频| 精品国产欧美成人夜夜嗨| 91玉足脚交嫩脚丫在线播放| 成人免费毛片高清视频| 中文字幕第50页| 不卡亚洲精品| 亚洲天堂男人的天堂| 日产精品久久久久久久| 国产精品一区二区在线看| 香蕉久久免费影视| 日韩三区免费| 亚洲免费一在线| 九九热精品视频在线| 丁香网亚洲国际| 久久久国产精华液999999| 成人看片网页| 亚洲人成电影在线观看天堂色| 日本视频www| 成人午夜伦理影院| 污污污污污污www网站免费| 婷婷久久综合九色综合99蜜桃| 亚洲色图欧美制服丝袜另类第一页| 亚洲国产精一区二区三区性色| 国产盗摄一区二区三区| 欧美日韩dvd| 日韩精品成人| 欧美成人精品影院| www.97av.com| 亚洲夂夂婷婷色拍ww47| 稀缺呦国内精品呦| 国产一区亚洲| 国产视频一区二区三区四区| 77thz桃花论族在线观看| 欧美精品一区二区久久婷婷| 日本少妇xxxx动漫| 99精品欧美一区| 亚洲自偷自拍熟女另类| 久久99影视| 国产精品91在线| 免费大片黄在线| 91精品中文字幕一区二区三区| 日韩在线观看免| 国产精品综合二区| www.成年人视频| 日韩中文av| 国产精品av在线播放| 在线免费观看黄色网址| 欧美一区二区视频在线观看2022 | 狠狠色狠狠色综合日日五| 国产高清自拍视频| 视频在线观看91| 亚洲永久激情精品| 久久久久久亚洲精品美女| 欧美日韩成人在线播放| 手机看片福利在线| 在线亚洲精品福利网址导航| 欧美xxxooo| 成人在线一区二区三区| 日韩免费毛片视频| 国产精品91一区二区三区| 91久久极品少妇xxxxⅹ软件| 97在线视频免费观看完整版| 亚洲欧美一区二区激情| 国产精品福利电影| 亚洲一二三区在线观看| 亚洲无人区码一码二码三码的含义| 激情综合色丁香一区二区| www.xxx麻豆| 色综合综合色| 97久久天天综合色天天综合色hd | 91精品视频在线免费观看| 黄色的视频在线观看| 亚洲欧美日韩久久久久久| 国产精品亚洲lv粉色| 黄色成人av在线| 99精品中文字幕| 成人动漫一区二区| 日日噜噜夜夜狠狠| 亚洲麻豆av| 9999在线观看| 亚洲调教一区| 不卡视频一区二区三区| 日韩网站中文字幕| 久久久久一本一区二区青青蜜月| av大全在线免费看| 亚洲国产精品va在线看黑人 | 久久精品这里有| 中文字幕一区二区三区四区不卡 | 国产一级不卡毛片| 亚洲女同一区| 日韩一本精品| 天堂成人娱乐在线视频免费播放网站 | 国产成人亚洲一区二区三区| 2019最新中文字幕| 午夜在线激情影院| 爱福利视频一区| 日av在线播放| 亚洲福利视频在线| 99热这里只有精| 欧美日韩一区二区三区四区| 国产无套丰满白嫩对白| 亚洲一区免费视频| 搜索黄色一级片| 国产精品久久久一本精品| 久久久久亚洲av成人无码电影| 成人国产精品免费观看动漫| 九九热视频免费| 美女网站在线免费欧美精品| 国产精品动漫网站| 亚洲精一区二区三区| 欧美高清中文字幕| 中文字幕午夜精品一区二区三区 | 日本精品在线| 在线观看亚洲区| 国产一二三在线观看| 亚洲精品在线视频| 日韩一区二区三区中文字幕| 亚洲国产精品一区二区久| www.xxxx国产| 日韩欧美电影一二三| 国产福利第一视频| 日韩欧美在线1卡| 国产成人免费看一级大黄| 欧美一区二区免费| 国产wwwxxx| 欧美成人精品二区三区99精品| 国产熟女一区二区丰满| 91精品久久久久久久91蜜桃| 国产精品久久久久久无人区| 欧美卡1卡2卡| 国产高清在线观看视频| 日韩欧美国产综合一区 | 91丨精品丨国产| 成人国产精品久久久| 国产高清亚洲| 91久久极品少妇xxxxⅹ软件| 好吊妞视频这里有精品 | 国产精品自拍视频| 九九热这里有精品| 成人精品视频久久久久| 国产日韩在线观看视频| 99久久无色码| 欧美黑白配在线| 美女精品国产| 久久资源中文字幕| 四虎免费在线观看视频| 国产精品xvideos88| 免费看欧美黑人毛片| 国产精品久久久久久模特| 国内外免费激情视频| 美女高潮久久久| 久久发布国产伦子伦精品| 国产成人午夜精品5599| 国产精品福利导航| 国产亚洲短视频| 欧美精品久久久久久久久46p| 亚洲精品日韩一| 天天爽夜夜爽夜夜爽精品| 欧美性做爰猛烈叫床潮| 99久久国产热无码精品免费| 亚洲精品国产综合久久| 成人三级黄色免费网站| 色综合久久精品亚洲国产| 午夜激情电影在线播放| 国产精品一区二区3区| 中文字幕亚洲在线观看| 免费成人深夜夜行视频| 99精品视频在线观看播放| 日本wwwcom| 奇米一区二区三区| 88av在线播放| 中文字幕欧美日韩一区| 免费无遮挡无码永久在线观看视频| 欧美色视频日本版| 国产又粗又猛视频| 精品视频—区二区三区免费| 日本成人在线播放| 26uuu亚洲伊人春色| 精品国产18久久久久久二百| 麻豆蜜桃91| 伊人久久大香线蕉av超碰演员| 亚欧在线免费观看| 成人黄色小视频在线观看| 亚洲欧洲综合网| 欧美日韩亚洲91| a视频免费在线观看| 亚洲天堂一区二区三区| 美女网站视频在线| 国产在线精品播放| 竹菊久久久久久久| 无码人妻少妇伦在线电影| 免费在线成人网| 国精产品一区一区三区免费视频| 亚洲码国产岛国毛片在线| 国产偷人爽久久久久久老妇app| 亚洲国产精品久久久久秋霞不卡 | 日本免费一区视频| www.久久色.com| 亚洲四虎影院| 免费国产在线精品一区二区三区| 欧美精品国产| 欧美视频国产视频| 欧美国产精品久久| 婷婷激情五月网| 亚洲精品一区二区三区影院| 超碰人人在线| 国产在线视频91| 不卡中文字幕| 日本va中文字幕| 91麻豆国产自产在线观看| 久久久久久久中文字幕| 91麻豆精品国产91久久久久久久久| 黄色av网址在线免费观看| 欧美在线性爱视频| 卡通动漫精品一区二区三区| 国产精品又粗又长| 懂色av噜噜一区二区三区av| 国产97免费视频| 日韩午夜三级在线| a级片国产精品自在拍在线播放| 国产一区二区色| 99精品视频在线| 奇米视频7777| 亚洲素人一区二区| 在线观看亚洲一区二区| 自拍偷拍亚洲在线| 黄色成人小视频| 亚洲永久激情精品| 国产一区二区看久久| 91插插插插插插| 精品福利二区三区| 免费一二一二在线视频| 九九九九九精品| 六月婷婷一区| 国产高清一区二区三区四区| 欧洲视频一区二区| 在线视频1区2区| 99国产视频| 国产日韩欧美三区| 黄色片网站免费| 91黄色激情网站| 日本激情在线观看| 91九色偷拍| 一本一本久久| 波多野结衣av在线观看| 欧美日韩免费一区二区三区 | 亚洲在线观看免费| 人妻少妇一区二区三区| 欧美亚洲一级片| 日本精品黄色| 老女人性生活视频| 欧美日韩国产黄| 337p日本欧洲亚洲大胆鲁鲁| 亚洲一区二区三区视频| 亚洲国产美女| 色欲狠狠躁天天躁无码中文字幕 | 欧美亚洲动漫另类| 黄在线免费看| 黄色99视频| 蜜臀av亚洲一区中文字幕| 久久久久亚洲av成人片| 日韩高清不卡av| 日韩专区视频| 大西瓜av在线| 亚洲国产成人自拍| 亚洲精品一区二区口爆| 国产suv精品一区二区三区88区| 91精品国产福利在线观看麻豆| 一级黄色电影片| 欧美天堂一区二区三区| 色婷婷av在线| 天堂资源在线亚洲资源| 国产成人a级片| 日本中文字幕久久| 欧美日韩xxx| 国产亚洲一卡2卡3卡4卡新区| 日本wwwwwww| 欧美在线免费视屏| av蜜臀在线| 伊人久久婷婷色综合98网| 91麻豆国产福利在线观看| 国产三级在线观看视频| 国产成人aa精品一区在线播放|