精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌等揭露「AI任務疑難」:存在局限的ImageNet等基準,就像無法代表「整個世界」的博物館

新聞 人工智能
近日,由加州大學伯克利分校、華盛頓大學和谷歌研究院合著的論文《AI and the Everything in the Whole Wide World Benchmark》指出ImageNet等基準定義的模糊任務在促進智能理解上的局限性,就像用有限的博物館來代表整個世界一樣。

 

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

在日常生活中,我們需要一些「標準」來衡量個人的行為。

而在科研工作中,研究人員也需要一些「基準」來評估模型的性能。

因此,不管是普遍的「標準」還是特定的「基準」,它們都有一定的參考意義。

然而,如果有一天我們發現這些「參照物」與實際生活漸行漸遠時,它們該往何處去?

近日,由加州大學伯克利分校、華盛頓大學和谷歌研究院合著的論文《AI and the Everything in the Whole Wide World Benchmark》指出ImageNet等基準定義的模糊任務在促進智能理解上的局限性,就像用有限的博物館來代表整個世界一樣。

論文地址:https://openreview.net/pdf?id=j6NxpQbREA1

在這篇論文中,研究人員闡述了機器學習(ML)對通用任務框架(CTF)的過度依賴,因為這個框架不恰當地演變成我們今天所理解的這些聲稱評估「通用能力」的基準。值得注意的是,研究團隊并不否認這些基準的實用性,而是希望指出將其作為框架存在的固有缺陷。

1. 展示「整個世界」的博物館 VS ImageNet

這篇論文最能引起共鳴的一點就是用故事書作為引子,且將情節貫穿全文,使得論文的研究內容更為直白易懂。

這本書就是1974年出版的《Grover and the Everything In the Whole Wide World Museum》,書中的主人公Grover參觀了一家聲稱展示「整個世界」的博物館。

該博物館的每個展廳都陳列著不同類別的東西,有些類別是隨意和主觀的,比如「你在墻上看到的東西( Things You Find On a Wall )」和「房間里能讓你撓癢癢的東西( The Things that Can Tickle You Room )」;有些類別則非常具體的,例如「胡蘿卜屋( The Carrot Room )」,而另一些則含糊不清,如「高大的廳堂( The Tall Hall )」。

當Grover認為自己已經參觀完博物館的一切時,他來到寫著「其他東西(Everything Else)」的大門前。打開門后,卻發現自己置身于外面的世界。

作為兒童故事,Grover的經歷是荒誕的。然而,在實際的研究中,例如人工智能尤其是ML領域,也存在類似的固有錯誤邏輯,其中許多流行的基準依賴于固有的錯誤假設。

這篇論文的研究人員認為,在諸如「視覺理解」或「語言理解」之類的模糊任務中,作為衡量一般能力進展的基準,與有限的博物館在代表「整個世界的一切」方面一樣無效,且這兩個謬論的原因是相似的,即本質上是基于特定的、有限的且局限于上下文的環境。

GLUE或ImageNet之類的基準測試常常被提議為驗證任何給定模型性能的基本通用任務的定義。其結果是,通過這些基準數據集證明合理的結論往往遠遠超越了它們最初設計的任務,甚至超出了最初的開發目標。

盡管作為邁向「通用目標」的標志,這些基準存在明顯的局限性。事實上,這些基準的開發、使用和采用表明了一個結構有效性的問題,其中涉及的基準——由于它們在特定數據、度量和實踐中的實例化——不可能捕獲任何具有代表性的關于它們的普遍適用性的結論。

論文的作者們認為測量通用能力的目標(即通用對象識別、通用語言理解或領域獨立推理等目標)不能充分體現在數據定義的基準中。研究人員注意到,當前的趨勢不恰當地擴展了CTF范式,以將其應用于與現實世界目標或背景不同的抽象表現任務。

從歷史上看,CTF的開發正是為了引入實用導向和嚴格范圍的人工智能任務,即自動語音識別(ASR)或機器翻譯(MT),其中所需的驗證是基準是否準確地反映了計算機在現實環境中所要求的實際任務。這一波定義不明確的「通用」目標則完全顛覆了其引入的意圖。

與其把Grover的經歷當成兒童故事來看,倒不如說這是一則深刻的寓言故事。當Grover打開「其他東西」的大門時,卻發現自己置身于博物館外的大千世界。故事的結尾或許已經預示了這個研究的結論,ImageNet之類的基準定義必然不能代表適應所有現實世界模糊任務的「通用目標」。

因此,這篇論文確實有許多值得討論和深思的地方。ImageNet存在不足,那其他基準定義就是完美無缺的嗎?除了ImageNet,目前在通用對象識別上還有更好的參照基準嗎?該如何看待以及解決基準定義越來越「不基準」這個問題?

外行看熱鬧,內行看門道,這么頭疼的問題就應該交給專業人士。

 

2. OpenReview官方怎么評

 

迎面向我們走來的是第一位評委,該評委發出了“反對CV和NLP的“通用”基準中令人信服的觀點!(A compelling argument against "general" monolithic benchmarks in vision and NLP)”的贊嘆,因為他覺得這篇論文史料詳實,觀點明確,分析到位,著實令人信服。

論文的研究人員先在文中鋪墊了大量的背景知識,向讀者展現了通用人工智能和基準測試的相關研究,并分析了ML的基準測試何時開始作為評估范圍狹窄的任務性能的標準化方法。最后,結論就水到渠成了:通用語言理解和通用對象識別的基準本質上是有缺陷的,因為它們應用于狹窄的范圍。

最后,這位評委真誠地希望計算機視覺和NLP社區能認真對待這篇論文,因為他認為該論文對在這兩個領域取得更有意義的進展做出了寶貴的貢獻,而不僅僅是追求最先進的技術。

但美中不足的是,既然發現了ImageNet基準存在局限性,那有什么辦法可以減少對這些通用標準的過度依賴?看來論文的研究人員也還沒找到這個問題的答案。

而第二位評委對這篇論文的評價是:通用人工智能基準的謬論(The Fallacy of Benchmarks for General Artificial Intelligence )。因為這篇論文的受眾主要是AI領域的研究人員,所以作者在前文回顧了通用AI的相關基準,一下拉近了與讀者的距離。此外,引用Grover的故事也使得該論文有趣易懂。

即使這篇論文的開頭存在表述問題,未能無縫銜接主題,但瑕不掩瑜,評委二號高度贊揚了這篇論文為ML領域的研究指明了方向。

接著,評委三號也帶著他的觀點款款走來:好論文!但改一下結構就更好了(Well argued paper, with some reorganization suggested)。這位評委指出,這篇論文最大的亮點是觀點獨特且論據充足。但也發出了和第一位評委相同的疑惑:所以,有什么解決方案可以減少對通用標準的過度依賴?

不同于前三位評委的「慷慨」,第四位評委只給出了5分的評價,認為這篇論文只是:當前基準測試的簡史(History of the benchmarks we use today)。從這個評語不難看出,這位評委覺得這篇論文列舉了很多基準測試且強調了它們的局限性,但作者團隊并沒有采取任何立場。

最后,評委五號不見其人,先聞其聲:很棒!但還有上升空間(Great, but improvements needed)。第五位評委認為這篇論文在梳理和總結相關工作的方面做得非常好,同時有大量的研究支撐文中的論點,希望這篇論文能引起相關領域研究人員的重視。

正因為對這篇論文寄予了極高的期望,因此評委只給出了6分的評價,同時羅列了非常詳細的修改建議,希望論文的作者能加以改進。

 

3. Reddit網友怎么說

 

看完五大評審的官方評論,總結起來基本就是:論文不錯,觀點新穎,論據充分,要是能提出解決方案就更好了。此外,有三位評委都不約而同地希望這篇論文能引起相關領域的重視。

Reddit上關于這篇文章的討論熱度也不小,我們來看看神通廣大的網友怎么說。

某位網友一針見血地指出,雖然ImageNet等基準測試像「有限的博物館」一樣存在不足,但卻是目前我們訓練模型最有力的工具。

確實,就像上述評委提到的,ImageNet是有局限性,但是否有更好的解決方案?因此,有熱心網友為論文的作者修改了摘要:沒有任何數據集能夠捕捉所有細節的全部復雜性,就像沒有博物館可以包含整個世界中所有的事物一樣。

一些網友則認為論文不錯,尤其是「芝麻街」故事情節的插入加深了他們對該論文的理解。

這些網友覺得,用「無法展示一切的博物館」類比「ImageNet在一些模糊任務上的局限性」非常恰當。

大概論文的作者們也沒想到,寫個文章還能為一本書代言,有網友調侃:宇宙萬物的答案就隱藏在這本「芝麻街」故事書中。

更多網友表示贊同論文作者的觀點,畢竟相比解決問題,發現問題太容易了。(狗頭)

所以,解決方案究竟在哪?

就算博物館「無法展示一切」,也沒有人能否定其價值。同理,ImageNet這類基準定義的存在意義也不容置喙。不斷發現問題并解決問題,歷史的車輪才會滾滾向前(狗頭)。

 

 

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2023-04-03 09:41:39

技術數字博物館

2021-08-26 16:34:45

智能博物館物聯網

2011-05-05 17:13:10

Google Art

2017-05-19 12:33:23

2013-10-22 09:10:30

微軟WindowsXP

2019-12-18 14:52:19

.com域名互聯網

2012-08-10 11:06:21

筆記本

2016-06-17 17:55:27

Google Home惡意軟件勒索軟件

2017-11-24 11:14:00

2010-08-13 16:49:20

網絡監控系統博物館D-Link

2012-11-28 10:45:39

投影機NEC

2011-11-10 16:12:31

掃描儀用戶體驗

2024-11-08 10:47:32

2024-01-26 10:19:00

AI模型

2012-07-24 10:02:38

2013-02-18 09:16:33

計算機博物館古董計算機

2019-12-26 15:43:45

區塊鏈技術智能
點贊
收藏

51CTO技術棧公眾號

av免费在线网站| 一区二区精品视频在线观看| 日韩在线你懂的| 日本乱人伦aⅴ精品| 亚洲午夜精品久久| 丰满人妻妇伦又伦精品国产| 欧美亚洲一级| 日韩中文综合网| 精品无码av一区二区三区| 欧美成a人片在线观看久| 亚洲色图欧美在线| 欧美黑人xxxxx| 亚洲av无码国产精品永久一区| 美女日韩在线中文字幕| 久久国产精品久久久久久| 精品人伦一区二区三电影| 精品视频国内| 欧美综合天天夜夜久久| 日本手机在线视频| av免费在线观| 国产精品国产自产拍高清av| 国产一区免费在线| 国产高中女学生第一次| 日韩精品电影一区亚洲| 97在线精品视频| 欧美日韩人妻精品一区二区三区| 欧美日韩一区二区综合| 亚洲精品久久久久久下一站| 三级网站免费看| 欧美videos粗暴| 色综合久久中文综合久久牛| 欧美午夜小视频| 性爱视频在线播放| 国产精品久久久久久久久久久免费看| 麻豆成人在线播放| 欧美综合视频在线| 国产成人综合网| 成人精品在线视频| 亚洲一卡二卡在线观看| 秋霞av亚洲一区二区三| 欧洲成人性视频| 激情五月色婷婷| 亚洲黄色一区| 欧美黑人又粗大| 久久免费公开视频| 伊人成综合网| 久久国产精品99国产精| 欧美成人777| 午夜激情久久| 日韩在线欧美在线国产在线| 欧美黄色高清视频| 热久久天天拍国产| 视频直播国产精品| 国产黄色录像片| 国产精品91一区二区三区| 色噜噜狠狠色综合网图区| 特级西西人体高清大胆| 日韩一区二区在线| 日韩视频在线免费| 国产一二三四区| 欧美 亚欧 日韩视频在线 | wwwww亚洲| 一级精品视频在线观看宜春院| 国产在线无码精品| 午夜伦理大片视频在线观看| 亚洲国产视频在线| 日本人体一区二区| 成人影院大全| 在线观看一区二区视频| 91丨九色丨蝌蚪| 日韩一区二区三区在线看| 亚洲精品在线免费观看视频| chinese麻豆新拍video| 日韩精品免费一区二区夜夜嗨 | 欧洲精品二区| 午夜精品久久久久| 成年人免费在线播放| 香蕉成人影院| 欧美精品三级日韩久久| 自拍视频第一页| 日韩有码中文字幕在线| 色噜噜狠狠色综合网图区| 国产精品成人免费观看| 香蕉久久国产| 成人国产精品久久久| 午夜精品久久久久久久99热黄桃 | 欧美一级片在线看| 欧美图片自拍偷拍| 国产精品手机在线播放| 久久精品99无色码中文字幕 | 精品美女在线观看视频在线观看 | 中文字幕在线不卡| 国产精品videossex国产高清| 丁香六月综合| 91精品在线免费观看| 真人bbbbbbbbb毛片| 久久影视一区| 午夜精品在线视频| 亚洲在线观看av| 97aⅴ精品视频一二三区| 亚洲高清视频一区二区| 97久久人人超碰caoprom| 色琪琪一区二区三区亚洲区| 乱码一区二区三区| 日韩精品第一区| 97免费中文视频在线观看| 一本久道久久综合无码中文| av中文一区二区三区| 亚洲成人网上| 一区二区三区四区日本视频| 欧美一区二区三区精品| 欧美人妻一区二区三区| 亚洲视频综合| 91免费精品国偷自产在线| 欧美欧美欧美| 亚洲一区二区三区自拍| 制服丝袜中文字幕第一页| 久久最新网址| 性欧美长视频免费观看不卡| 国产男女无套免费网站| 日本一区二区三区视频视频| 久久综合色视频| 日韩成人在线看| 精品国产一区二区三区久久久狼 | 黑人精品欧美一区二区蜜桃| 欧美精品一区二区三区在线四季| 波多野结衣中文字幕久久| 91精品国产欧美一区二区18| 国产中文字幕久久| 日韩av网站免费在线| 精品免费视频123区| 欧美aaa免费| 91精品蜜臀在线一区尤物| 99精品欧美一区二区| 久久国产精品久久久久久电车| 国产高清在线精品一区二区三区| 黄色片免费在线观看| 精品视频在线免费观看| 在线国产视频一区| 久久精品电影| 欧美黑人xxxxx| 人人视频精品| 亚洲女成人图区| 亚洲欧美偷拍一区| 91偷拍与自偷拍精品| 成人av一级片| 欧美日韩xxxx| 国产成人精品av| youjizz在线播放| 欧美亚洲自拍偷拍| 国产精品国产三级国产专业不| 日韩**一区毛片| 无遮挡亚洲一区| 欧美黄页免费| 播播国产欧美激情| 国产wwwwwww| 亚洲第一成年网| 青青草视频播放| 另类国产ts人妖高潮视频| 日本一区二区高清视频| 日韩制服诱惑| 波霸ol色综合久久| 草草视频在线播放| 午夜精品久久久久久久蜜桃app| 黄色污在线观看| 奶水喷射视频一区| 亚洲精品国产精品国自产观看| 狠狠久久综合| 欧美国产乱视频| 天天干天天操av| 欧美在线高清视频| 欧美一区二区三区爽爽爽| 成人免费高清在线观看| 黄色免费福利视频| 色一区二区三区四区| 91久久国产自产拍夜夜嗨| 蜜桃视频www网站在线观看| 亚洲欧洲日产国产网站| 91福利在线观看视频| 一区二区三区高清在线| 人妻无码中文久久久久专区| 视频一区二区欧美| 亚洲成人动漫在线| 偷拍亚洲精品| 国产欧美一区二区三区久久| 国产美女一区视频| 亚洲区在线播放| 国产精品一区二区黑人巨大| 午夜av区久久| 日本一级片免费| 91在线观看视频| 青青草久久伊人| 亚洲一区二区三区免费在线观看| 亚洲一区影院| 任你弄精品视频免费观看| 国产精品自拍网| av免费不卡| 久久夜色撩人精品| 欧美一区二区少妇| 欧美成人一区二区三区片免费| 久久精品视频7| 亚洲免费在线观看| 九九九视频在线观看| 不卡一区二区中文字幕| 99日在线视频| 日韩vs国产vs欧美| 青青青免费在线| 欧美电影一区| 欧美一级日本a级v片| 91免费精品国偷自产在线在线| 国产精品黄视频| 午夜久久中文| 韩国视频理论视频久久| 污污视频在线| 色妞久久福利网| 黄色av免费在线看| 亚洲精品短视频| 亚洲精品久久久久久久久久久久久久| 欧美性猛交xxxxxxxx| 国产精品视频123| 亚洲妇熟xx妇色黄| 午夜精品福利在线视频| 国产精品区一区二区三区| 亚洲中文字幕无码av| 丰满亚洲少妇av| 999热精品视频| 另类专区欧美蜜桃臀第一页| 色一情一乱一伦一区二区三区日本| 亚洲免费黄色| 国产人妻777人伦精品hd| 国产精品激情电影| 成人免费看片视频在线观看| 99成人在线视频| 亚洲国产精品毛片| 国产亚洲精品美女久久久久久久久久| 久久久综合香蕉尹人综合网| 激情小说亚洲图片| 国产精品免费观看高清| 亚洲图色一区二区三区| 91福利视频导航| 一区二区三区四区视频免费观看| 91在线精品播放| 欧美一区在线观看视频| 亚洲aa中文字幕| 日韩国产在线不卡视频| 91免费在线观看网站| 日韩免费高清视频网站| 97超碰最新| 国产精品白丝一区二区三区| 国产欧美日韩在线播放| 女仆av观看一区| 欧美精品中文字幕一区二区| 免费短视频成人日韩| 日韩av电影免费观看| 成人在线免费观看网站| 亚洲国内在线| 中文字幕一区二区三区欧美日韩 | 成人小视频免费观看| 69亚洲乱人伦| 91麻豆国产福利在线观看| 国产又粗又猛又爽又黄av| 国产精品免费看片| 男女性高潮免费网站| 亚洲国产美女搞黄色| 在线看成人av| 欧美综合一区二区| 99久久久国产精品无码网爆| 日韩精品影音先锋| 日本在线一二三| 最好看的2019的中文字幕视频| 麻豆传媒在线免费看| 久久天天躁狠狠躁夜夜爽蜜月| 好吊日av在线| 日本亚洲精品在线观看| 亚洲一区二区av| 古典武侠综合av第一页| 久久99蜜桃| 日本老太婆做爰视频| 模特精品在线| 美女被艹视频网站| 26uuu国产一区二区三区| 亚洲女人久久久| 亚洲图片欧美一区| 在线免费一区二区| 日韩免费在线观看| 免费a级毛片在线观看| 久久久精品电影| sese综合| 波多野结衣一区二区三区在线观看 | 欧美日韩精品| 91看片就是不一样| 国产一区二区三区四区五区美女 | 黄色美女一级片| 国产亚洲欧美日韩精品| 色女人在线视频| 国产精品第8页| 超碰成人在线观看| 亚洲精品在线免费| 亚洲毛片视频| 久久精品一二三四| 国产校园另类小说区| 在线免费观看毛片| 欧美日韩一区二区三区四区| 天堂网在线中文| 欧美大码xxxx| 91国内外精品自在线播放| 精品久久久久久中文字幕动漫| 性欧美69xoxoxoxo| 男人的天堂日韩| 菠萝蜜视频在线观看一区| 91久久久久久久久久久久久久| 粉嫩av一区二区三区免费野| 精品毛片一区二区三区| 在线亚洲午夜片av大片| 亚洲深夜视频| 国产chinese精品一区二区| 欧美a级成人淫片免费看| 免费午夜视频在线观看| 99久久免费精品高清特色大片| 色老板免费视频| 欧美日韩三级在线| 久久经典视频| 欧美一区视频在线| 久久夜色精品国产噜噜av小说| 99re8这里只有精品| 久久99在线观看| 男人的天堂av网| 欧美在线一区二区| 免费在线视频一级不卡| 2023亚洲男人天堂| 日本亚洲不卡| 国产精品免费入口| 91亚洲国产成人精品一区二三| 毛片a片免费观看| 日韩欧美第一区| 色yeye免费人成网站在线观看| 亚洲综合精品伊人久久| 亚洲欧洲日韩| 日本黄色一级网站| 一区二区三区 在线观看视频| 精品人妻一区二区三区麻豆91| 久久午夜a级毛片| 精品久久免费| 国产一级不卡视频| 成人免费va视频| 狠狠躁夜夜躁人人爽天天高潮| 亚洲国产第一页| 蜜臀久久精品| 欧美亚洲丝袜| 日精品一区二区| 波多野结衣喷潮| 91精品久久久久久蜜臀| 深夜国产在线播放| 国产女主播一区二区三区| 亚洲影视在线| 亚洲精品色午夜无码专区日韩| 欧美日韩精品专区| a级在线观看| 成人综合色站| 亚洲专区一区二区三区| 一区二区三区伦理片| 3d动漫精品啪啪1区2区免费| 在线观看三级视频| 久久riav| 美洲天堂一区二卡三卡四卡视频| 91插插插插插插| 亚洲福利在线观看| 日韩一区二区三区在线免费观看| 亚洲国产精品综合| 国产福利91精品一区二区三区| 久久青青草视频| 日韩在线免费视频观看| 加勒比久久高清| 97公开免费视频| 尤物视频一区二区| 日韩大片b站免费观看直播| 国产精品久久不能| 欧美激情无毛| 最近中文字幕免费| 日韩一级成人av| 亚洲欧美se| 日韩人妻精品一区二区三区| 成年人国产精品| 亚洲一级片免费看| 97在线日本国产| 97视频热人人精品免费| 国产不卡一二三| 欧美日韩dvd在线观看| 川上优av中文字幕一区二区| 亚洲欧美日韩精品综合在线观看| 成人免费精品视频| 伊人网av在线| 97在线观看视频| 一区二区三区网站| 亚洲自拍偷拍图| 精品国产乱码久久久久久浪潮| 精品123区| 男女激情无遮挡| 亚洲精品中文在线观看| 国产黄在线看|