精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

o3被曝「無視」前成果?華人博士生實名指控,謝賽寧等大牛激烈爭辯

人工智能 新聞
o3和o4-mini視覺推理突破,竟未引用他人成果?一名華盛頓大學博士生發出質疑,OpenAI研究人員對此回應:不存在。

在視覺感知方面,o3和o4-mini在思維鏈中進行圖像推理, 代表了一個重要突破。

華盛頓大學計算機科學博士生施惟佳站出來表示,o3和o4-mini可能用到了她之前的研究Visual Sketchpad 。

圖片

圖片

論文鏈接:https://visualsketchpad.github.io/

這項發表于24年研究中,曾提出通過可視化輔助增強模型推理。一時間,這一猜測如同一石激起千層浪。

更猛烈的炮火來自滑鐵盧大學CS助理教授、谷歌DeepMind高級研究科學家陳文虎。

他表示,「OpenAI既不承認也不引用任何相關工作。這真可悲。」

圖片

領導OpenAI感知團隊的華人科學家Jiahui Yu表示:「確實不知道,但看起來很酷。」

圖片

OpenAI的內部員工Brandon McKinzie表示,一眼看上去,與我們研究的有很大不同。而且o3和o4-mini行為都是自發的表現。

圖片

隨后,這引發了關于o3視覺推理能力的大討論。

但OpenAI陷入爭議的不止是視覺推理,在數學基準測試中被爆出「作弊」!

視覺推理大辯論

首先登場的是Brandon McKinzie。

他瞥過一眼Visual Sketchpad,認為OpenAI的技術與之完全不同:

與我們之前做的事情完全不同,值得注意的是,o3和o4-mini中的行為完全是由大規模強化學習(RL)產生的。

我們只是給它們提供了訪問Python和操作圖像的能力,其余的都交給了模型自己去處理。

但華盛頓大學的博士生胡雨石(Yushi Hu),對此并不完全認同。

模型又是如何學會操作圖像的?

他猜測到OpenAI可能使用了SFT數據,和謝賽寧V*論文或可視化草稿本論文類似。

圖片

此時,另一個華人AI大牛謝賽寧加入了辯論。

他提出了「用圖思考」的更深入的思考。

圖片

謝賽寧:識別已死,視覺永生

關于「用圖思考」的概念,謝賽寧有5點進一步的思考。

圖片

1. 零樣本工具使用有局限性。

不能僅僅調用一個物體檢測器就實現視覺搜索。

這也是為什么像VisProg、ViperGPT、Visual-sketchpad這樣的方式難以泛化或擴展的原因。

它們更像是「外掛式工具調用」,而不是系統性能力。

謝賽寧在V*項目中就專注于這一點,但兩年前他還沒有意識到強化學習(RL)會變得這么強大,因此只能依靠監督微調(SFT)來訓練檢測頭。

這種方式雖然能跑通,但速度慢,訓練過程也頗為痛苦。

圖片

論文鏈接:https://arxiv.org/abs/2312.14135

2. 視覺搜索必須是多模態大模型的原生組件,且要端到端整合。 

3. 如果所使用的工具本身是簡單、低層次的——比如基礎的Python圖像處理函數,而不是像Faster R-CNN 這樣的大模型——它們就可以直接被整合進端到端系統。

一旦強化學習規模化,這些簡單工具就能變成「視覺基元」(visual primitives),模型可以自由組合它們,從而構建出可擴展的視覺能力。

4. 大家應該繼續發掘這些視覺基元。 

它們絕不僅僅是圖像處理函數,也應該包括對視頻、三維數據的處理方式,未來的視覺系統需要構建在更廣泛的「感知基礎件」之上。

5. 謝賽寧認為大多數傳統的視覺識別模型已經「過時」了。 

正如Ross Girshick所說,它們本質上就是「解析器」(parsers)。但視覺本身沒有死,反而比以往任何時候都更有生命力、更令人興奮。

圖片

視覺識別模型已過時

此外,謝賽寧爆出了更大的消息:為OpenAI新模型「用圖思考」奠定基礎的Bowen Cheng、Ji Lin,的確與他討論過多模態基礎相關話題。

圖片

而謝賽寧的V*從GPT-4V的55%性能躍升至o3的95.7%。

看到一個艱難的基準測試被解決,他感到一種深深的滿足感:

這意味著視覺搜索,正成為多模態模型推理的一個基本組成部分,就像視覺對人類的意義一樣。

然而,他認為不要只是緊跟OpenAI的步伐。

學術界需要向前推進,構建那些不僅僅是眼下相關的東西,而是能夠塑造未來的事物——

也許還能夠啟發像OpenAI這樣的偉大公司。

V*證明學術界可以做到。

謝賽寧的推文停留在轉發微軟VP Nando de Freitas的推文:

強化學習并非一切……  

類似的說法只是宣傳。

圖片

這就是對OpenAI的Brandon McKinzie的「一切能力都從RL訓練涌現」的一種委婉的反駁。

o3數學成績僅為10%,評測結果再陷爭議

除了圖像推理,o3在數學基準的成績單,也受到了外界質疑。

去年12月,OpenAI官宣o3時,聲稱模型在FrontierMath基準測試中正確率超25%。

當時,業內其他頂尖模型的得分普遍低于2%,o3的表現無疑令人矚目。

圖片

然而,這一亮眼的成績似乎只是OpenAI內部測試的「理想狀態」。

OpenAI首席研究官Mark Chen在直播中稱,「為o3配置激進的測試時計算(test-time compute)后,我們能把成績提高到25%以上。」

顯然,25%得分來自一個計算資源更強大的o3版本,也就是上周發布的滿血版。

針對滿血o3,創建FrontierMath基準的研究機構Epoch AI,發布了獨立測試結果:o3得分僅為10%,遠低于OpenAI聲稱最高成績25%。

圖片

這并不意味著,OpenAI故意造假。

OpenAI去年12月公布的基準測試中,也給出了一個與Epoch實測一致的「下界得分」。

Epoch補充說,測試結果的差異可能源于以下原因:

  • OpenAI內部測試使用了更強大的框架,投入了更多測試時計算
  • 測試所采用的FrontierMath數據集版本不同:OpenAI可能使用的是290題的frontiermath?2025?02?28?private;Epoch使用的是180題的frontiermath?2024?11?26。

與此同時,ARC Prize基金會在X上發帖證實,預發布版o3與公開版并非同一模型,后者「專門為聊天/產品場景調校」。

他們還指出,目前發布的各檔o3計算級別(compute tiers),都比跑基準時用的版本小。

圖片

一般而言,算力檔位越高,基準成績也會越好。

此外,OpenAI技術團隊成員Wenda Zhou在上周一次直播中坦言,相較于去年12月,經過優化后的o3更適合現實世界的用例,更側重于真實使用場景與推理速度。因此,它在基準測試上可能會出現一些「偏差」。

這樣的成績落差,引起了不少網友質疑。

但嚴格來說,問題并不在于o3的實際表現。OpenAI旗下的其他模型,如o3?mini?high和o4?mini,在FrontierMath上的表現都優于o3。

圖片

而且,奧特曼表示,計劃在未來幾周推出更強大的o3?pro。

這意味著,o3的基準測試爭議更多地是「面子問題」,而非OpenAI技術短板。

圖片

不過,這再次提醒我們:AI基準測試的結果不能只看表面,尤其當數據來自一家急于推廣服務的公司時。

基準測試,權威性何在?

其實,o3的風波并非是孤例。

科技大廠競相推出新模型吸引眼球,「基準測試爭議」在AI行業已屢見不鮮。

今年1月,Epoch還曾因在o3發布后,才披露得到了OpenAI資金支持而飽受批評。

甚至,許多為FrontierMath貢獻題目的學者,包括陶哲軒等大牛在內,直到消息公開后才得知OpenAI的介入,瞬間引發全網關于基準測試公平性質疑。

圖片

還有前段時間,Grok 3發布之后,其基準測試遭到OpenAI研究員譴責——用基于64個樣本進行多數投票刷分。

圖片

還有最近一次的烏龍,Meta用「特供版」Llama 4去刷分登上了Chatbot Arena榜單TOP 2。

有趣的是,在最新榜單中,Llama 4排名跌至32位,不滾動屏幕根本找不到它。

圖片

總而言之,基準測試「水分」已成為一個不可忽視的問題,關鍵在于每個人理性看待AI成績單。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-05-26 15:03:54

芯片技術

2025-05-28 00:00:00

2021-02-20 21:04:53

人工智能機器學習技術

2021-07-19 15:02:48

機器人人工智能算法

2024-02-28 09:38:43

2025-11-17 08:40:00

3DAI視覺

2025-05-26 03:11:00

2025-05-26 08:39:00

2023-07-31 09:54:12

2023-07-30 15:22:47

2025-07-09 15:00:24

AIprompt工具

2025-11-19 08:59:15

2025-01-20 12:09:18

2024-03-04 07:00:00

地圖虛擬智能

2025-03-31 09:35:00

GPT-4oAI模型

2022-04-08 07:54:40

人工智能核算結果Python

2024-01-02 09:30:13

模型AI

2024-07-26 11:45:35

2024-12-23 13:50:00

數據訓練模型

2025-04-08 09:10:00

模型訓練AI
點贊
收藏

51CTO技術棧公眾號

久久久久国产一区| 91免费在线视频| a级在线观看视频| 国产精欧美一区二区三区蓝颜男同| 99re成人精品视频| 国产精品99蜜臀久久不卡二区| 欧美激情视频二区| 久久伊人精品| 欧美日韩国产精品| 日本三级中国三级99人妇网站| 亚洲中文字幕一区二区| 欧美三区视频| 亚洲人高潮女人毛茸茸| 天天综合成人网| 女海盗2成人h版中文字幕| 欧美激情一区三区| 成人做爰66片免费看网站| 免费黄色av片| 欧美激情在线| 神马国产精品影院av| 麻豆av免费看| 国产精品久久久久久久久免费高清 | 51vv免费精品视频一区二区| 色婷婷精品大在线视频| 国产小视频免费| 成年在线电影| 91麻豆国产在线观看| 亚洲影院高清在线| 国产主播第一页| 亚洲一本视频| 久久亚洲私人国产精品va| 干b视频在线观看| 一区二区三区四区视频免费观看| 欧美视频在线一区二区三区| 浮妇高潮喷白浆视频| a在线免费观看| 欧美激情一区二区三区全黄| 激情久久av| 成 人 免费 黄 色| 狠狠色丁香久久婷婷综合丁香| 热re91久久精品国99热蜜臀| 国产精品自拍视频一区| 亚洲破处大片| 久久久精品电影| 在线观看亚洲大片短视频| 亚洲精品亚洲人成在线| 精品国产百合女同互慰| 老女人性生活视频| 97色婷婷成人综合在线观看| 91成人免费网站| 男人天堂999| 性欧美18xxxhd| 精品国产老师黑色丝袜高跟鞋| 国产精品视频二| a视频在线免费看| 亚洲色大成网站www久久九九| 色一情一乱一伦一区二区三区| 日韩黄色影片| xfplay精品久久| 久久精品中文字幕一区二区三区| 日本人妻丰满熟妇久久久久久| 国产91高潮流白浆在线麻豆| 99re国产视频| 亚洲第一页综合| 成人动漫在线一区| 精品在线视频一区二区| 午夜av免费在线观看| 91在线精品一区二区三区| 麻豆成人小视频| 欧美捆绑视频| 国产欧美一区二区三区在线看蜜臀| 欧美性大战久久久久| 男人天堂网在线观看| 国产午夜精品在线观看| 亚洲va久久久噜噜噜久久狠狠| 91美女视频在线| 中文字幕日本不卡| 国产一级大片免费看| 波多野在线观看| 欧美色视频日本版| 亚洲 欧美 另类人妖| 在线日韩三级| 欧美精品一区二区在线播放| 北岛玲一区二区| 精品国产一区二区三区小蝌蚪 | 99中文字幕| 五月色婷婷综合| 国产亚洲一区二区三区四区| 在线观看成人一级片| 日韩另类在线| 色综合欧美在线视频区| 999精彩视频| 日韩三级精品| 亚洲欧美日本另类| 欧美第一页在线观看| 在线国产欧美| 国产精品h片在线播放| aa视频在线免费观看| 99精品欧美一区二区三区综合在线| 欧美一级二级三级九九九| 好操啊在线观看免费视频| 亚洲成人精品一区二区| 超碰影院在线观看| 日韩一区网站| 亚洲天堂男人天堂女人天堂| 97成人资源站| 伊人影院久久| 国产在线视频2019最新视频| 男人天堂网在线视频| 国产精品欧美一区喷水| 你真棒插曲来救救我在线观看| 韩日一区二区| 亚洲精品第一国产综合精品| 182在线观看视频| 国产精品久久久久久模特| 91在线中文字幕| 国产特黄在线| 精品国产乱码久久久久久天美| 性欧美videossex精品| 国产精品白丝av嫩草影院| 日韩在线观看免费高清完整版| 日本中文在线播放| 国产福利一区二区三区在线视频| 亚洲不卡1区| √天堂8资源中文在线| 91麻豆精品国产无毒不卡在线观看| 亚洲区免费视频| 亚洲激情另类| 99在线视频首页| 操你啦在线视频| 欧美日韩国产大片| 极品久久久久久久| 久久久久中文| 久久偷窥视频| av免费不卡国产观看| 欧美另类变人与禽xxxxx| 一区二区视频观看| 欧美日韩国产探花| 成人精品视频99在线观看免费| 天堂√在线中文官网在线| 亚洲人吸女人奶水| 一级黄色香蕉视频| 全国精品免费看| 91av在线免费观看视频| www国产一区| 亚洲欧美乱综合| 成人免费在线观看视频网站| 中文精品一区二区| 欧美巨乳在线观看| 国产福利小视频| 成人免费在线视频观看| 九色91popny| 加勒比久久综合| 日本精品视频在线播放| 免费一级毛片在线观看| 岛国视频午夜一区免费在线观看| 国产人妖在线观看| 欧美福利网址| 3d精品h动漫啪啪一区二区| 思思99re6国产在线播放| 欧美影院午夜播放| 欧美老女人性生活视频| 日韩av二区在线播放| 欧美日韩精品一区| 国模冰冰炮一区二区| 国产丝袜一区二区三区| 性无码专区无码| 久久久久久久免费视频了| 国产精品专区在线| 免费看日本一区二区| 欧美在线观看日本一区| 三级理论午夜在线观看| 色综合天天性综合| 9.1成人看片免费版| 免费观看成人av| 一区二区视频在线免费| 日本午夜精品久久久久| 久久视频国产精品免费视频在线| 国产精品久久久久久久久久久久久久久久久久 | 日韩一区国产二区欧美三区| 欧美黄色免费在线观看| 国产99久久久久| 人人妻人人澡人人爽欧美一区 | 亚洲欧洲一区| 久久五月天婷婷| 粉嫩一区二区三区| 中文字幕亚洲欧美一区二区三区 | 欧美电影影音先锋| 视频国产一区二区| 99久久免费精品| 国产精品久久久久9999小说| 色狮一区二区三区四区视频| 亚洲一区中文字幕| av在线小说| 亚洲精品美女久久| 亚洲免费视频二区| 一区二区三区四区在线播放| 精品一区二区视频在线观看| 日韩成人av影视| 天天综合色天天综合色hd| 成人午夜888| 欧美精品videosex极品1| 国产二区视频在线观看| 日韩一区二区三区三四区视频在线观看| 国产一卡二卡在线| 国产蜜臀av在线一区二区三区| 91精产国品一二三产区别沈先生| 欧美91大片| 天天综合狠狠精品| 都市激情亚洲| 国产精品你懂得| 免费在线看污片| 日韩精品极品视频免费观看| 国产三级伦理片| 欧美色视频日本高清在线观看| 肉色超薄丝袜脚交69xx图片| 97久久久精品综合88久久| 亚洲老女人av| 免费在线亚洲欧美| 国产盗摄视频在线观看| 国产精品一区高清| 国产精品久久久久久久小唯西川 | 国产精品高清在线| 先锋成人av| 亚洲午夜未满十八勿入免费观看全集| 人妻偷人精品一区二区三区| 欧美二区三区的天堂| 久久99精品波多结衣一区| 亚洲婷婷综合色高清在线| 亚欧洲乱码视频| 97久久精品人人爽人人爽蜜臀| 精品国产鲁一鲁一区二区三区| 久久亚洲色图| 日韩xxxx视频| 欧美激情偷拍| 久久综合亚洲精品| 国产大片一区| 日本一区免费观看| 日韩黄色网络| 国产成人免费观看| 丁香婷婷成人| 成人永久免费| 日韩精品久久久久久久软件91| 国产精品久久久久久一区二区| 国产在线精彩视频| 97涩涩爰在线观看亚洲| 少妇视频在线| 欧美成人久久久| 免费在线观看黄色网| 亚洲精选在线观看| 无码精品在线观看| 亚洲成人精品视频| 性一交一乱一透一a级| 91精品国产综合久久久久| 国产乱码一区二区| 51精品视频一区二区三区| 一级黄色大片网站| 欧美日韩国产综合久久| 最近中文字幕免费观看| 欧美在线视频不卡| 国产精品福利电影| 7878成人国产在线观看| 91成品人影院| 9191久久久久久久久久久| 乱子伦一区二区三区| 欧美三区在线视频| 亚洲一区二区视频在线播放| 欧美精品丝袜久久久中文字幕| 亚洲一区二区三区高清视频| 日韩午夜激情av| 黑人操亚洲女人| 亚洲国产精品女人久久久| 人妻va精品va欧美va| 欧美mv和日韩mv的网站| 婷婷av一区二区三区| 亚洲乱码av中文一区二区| 欧美少妇另类| 在线观看国产精品91| 18videosex性欧美麻豆| 欧美人与性动交a欧美精品| a级日韩大片| 日韩一区二区影院| 国产内射老熟女aaaa∵| 日韩女优毛片在线| 国产成人精品一区二区无码呦| 精品蜜桃在线看| 天天射天天色天天干| 中文字幕精品一区二区精品| 毛片网站在线免费观看| 九九视频直播综合网| 高清在线视频不卡| 国产一区二区在线播放| 日韩在线观看中文字幕| 极品尤物一区二区三区| 波多野结衣在线播放一区| 日本福利视频在线观看| 亚洲一区一卡| 红桃视频 国产| 99re在线视频这里只有精品| 三级黄色录像视频| 亚洲一区二区三区自拍| 国产精品21p| 日韩午夜精品视频| 麻豆国产在线播放| 久久综合亚洲社区| 国产乱码午夜在线视频| 国产精品久久久久久久久免费看| 国产精品视频一区视频二区| 国产伦精品一区二区三区视频免费 | 欧美在线激情| 欧美日韩日本国产亚洲在线| 国产免费毛卡片| 精品一区二区国语对白| 潘金莲一级淫片aaaaaaa| 欧美国产成人精品| 亚洲精品77777| 5858s免费视频成人| 男人的天堂在线免费视频| 大胆人体色综合| 99热播精品免费| 5566av亚洲| 欧美精品尤物在线观看 | av黄色在线免费观看| 一区二区三区中文在线观看| 一本大道伊人av久久综合| 亚洲女人被黑人巨大进入| 在线看一级片| 国产精品一区=区| 亚洲制服一区| 无罩大乳的熟妇正在播放| 蜜臀av亚洲一区中文字幕| 六月婷婷七月丁香| 亚洲网友自拍偷拍| av观看在线免费| 日韩中文字幕精品| 黄色软件视频在线观看| 国产伦精品一区二区三区视频黑人| 无码一区二区三区视频| 我看黄色一级片| 国产色91在线| 欧美h在线观看| 亚洲成人av资源网| 免费污视频在线| 高清不卡日本v二区在线| 性欧美欧美巨大69| 五月天激情视频在线观看| 成人爱爱电影网址| 国产精品不卡av| 欧美mv日韩mv国产网站app| 亚洲精品一线| 99电影网电视剧在线观看| 久久精品一区二区不卡| 成人亚洲精品777777大片| 国产日韩av一区二区| 99成人精品视频| 亚洲视频免费一区| 中文在线免费二区三区| 4444kk亚洲人成电影在线| 欧美~级网站不卡| 九九久久久久久| 日韩理论在线观看| a在线观看免费| 久久99久久99精品中文字幕 | 欧美日韩亚洲综合在线| 黄色在线播放| 国产精品高清网站| 91精品国产乱码久久久久久久| 成年网站免费在线观看| 日韩毛片精品高清免费| 99免费在线视频| 97国产精品视频| 任你躁在线精品免费| 精品久久久久久久免费人妻| 欧美国产精品中文字幕| 中文字幕91爱爱| www.日韩欧美| 香蕉免费一区二区三区在线观看 | 国产av一区二区三区传媒| 亚洲一区二区三区视频在线播放| 性感美女视频一二三| 欧美在线日韩在线| 精品国产精品| 国产激情在线观看视频| 亚洲日本在线天堂| 亚洲国产中文字幕在线| 欧美一级高清免费| 四季av一区二区凹凸精品| 中文字幕在线视频一区二区| 亚洲午夜激情av| 成人影视在线播放| 91欧美精品成人综合在线观看| 欧美日本久久| 无码人妻丰满熟妇啪啪网站| 91国产免费观看| 黄色免费网站在线| 精品福利影视| 精品一区精品二区高清| 国产成人亚洲精品自产在线 | 国产精品爽爽爽| 亚洲午夜精品一区 二区 三区|