精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CV未來在這68張圖上?Google Brain深扒ImageNet:頂級模型全都預(yù)測失敗

人工智能 新聞
ImageNet的標(biāo)簽問題一直為人詬病,最近Google Brain全面分析了基準(zhǔn)內(nèi)遺留的歷史問題,并找出了所有頂級模型全都預(yù)測失敗的68張圖片,或許未來CV想取得突破,先得攻破這68關(guān)!

過去的十年里,ImageNet基本就是計(jì)算機(jī)視覺領(lǐng)域的「晴雨表」,看準(zhǔn)確率有沒有提升,就知道有沒有新技術(shù)問世。

「刷榜」一直是模型創(chuàng)新的原動力,把模型Top-1準(zhǔn)確率推動到90%+,比人類還高。

圖片

但I(xiàn)mageNet數(shù)據(jù)集是否真的像我們想象中的那么有用?

很多論文都曾對ImageNet發(fā)出質(zhì)疑,比如數(shù)據(jù)的覆蓋度、偏見問題、標(biāo)簽是否完善等等。

其中最重要的是,模型90%的準(zhǔn)確率是否真的準(zhǔn)確?

最近Google Brain團(tuán)隊(duì)和加州大學(xué)伯克利分校的研究人員重新審視了幾個sota模型的預(yù)測結(jié)果,發(fā)現(xiàn)模型真正的準(zhǔn)確率還可能被低估了!

論文鏈接:https://arxiv.org/pdf/2205.04596.pdf

研究人員通過對一些頂級模型所犯的每一個錯誤進(jìn)行人工審查和分類,以便深入了解基準(zhǔn)數(shù)據(jù)集的長尾錯誤。

其中主要關(guān)注ImageNet的多標(biāo)簽子集評估,最好的模型已經(jīng)能達(dá)到97%的Top-1的準(zhǔn)確率。

圖片


這項(xiàng)研究的分析結(jié)果顯示,將近一半的所謂的預(yù)測錯誤根本就不是錯誤,并且還在圖片中發(fā)現(xiàn)了新的多標(biāo)簽,也就是說,如果沒有人工審查過預(yù)測結(jié)果,這些模型的性能可能都是被「低估」的!

不熟練的眾包數(shù)據(jù)標(biāo)注員往往會把數(shù)據(jù)標(biāo)注錯誤,在很大程度上也影響了模型準(zhǔn)確率的真實(shí)性。

為了校準(zhǔn)ImageNet數(shù)據(jù)集,促進(jìn)未來的良性進(jìn)展,研究人員在文中提供了一個更新版的多標(biāo)簽評估集,并把sota模型預(yù)測存在明顯錯誤的68個例子組合為一個新數(shù)據(jù)集ImageNet-Major,以方便未來CV研究者攻克這些bad case

還上「技術(shù)債」

從文章的標(biāo)題「什么時候面團(tuán)成了百吉餅?」就可以看出作者主要關(guān)注ImageNet里的標(biāo)簽問題,這也屬于是歷史遺留問題了。

下圖是一個非常典型的標(biāo)簽歧義例子,圖片里的標(biāo)簽為「面團(tuán)」,模型的預(yù)測結(jié)果為「百吉餅」,錯了嗎?

圖片

這個模型理論上來說并沒有預(yù)測錯誤,因?yàn)槊鎴F(tuán)正在烤,馬上就要成百吉餅了,所以既是面團(tuán)又是百吉餅。

可以見得模型實(shí)際上已經(jīng)能夠預(yù)測到這個面團(tuán)「即將成為」百吉餅,但在準(zhǔn)確率上卻沒有拿到這一分。

實(shí)際上,以標(biāo)準(zhǔn)ImageNet數(shù)據(jù)集的分類任務(wù)作為評價標(biāo)準(zhǔn),缺乏多標(biāo)簽、標(biāo)簽噪聲、未指定的類別等問題都在所難免。

圖片

 從負(fù)責(zé)識別此類對象的眾包標(biāo)注員的角度來看,這是一個語義甚至是哲學(xué)上的難題,只能通過多標(biāo)簽來解決,所以在ImageNet的衍生數(shù)據(jù)集中主要改善的就是標(biāo)簽問題。

距ImageNet成立已經(jīng)過了16年,當(dāng)時的標(biāo)注人員、模型開發(fā)者對數(shù)據(jù)的理解肯定不如今天豐富,而ImageNet又是早期的大容量、標(biāo)注相對良好的數(shù)據(jù)集,所以ImageNet很自然而然地成了CV刷榜的標(biāo)準(zhǔn)。

但標(biāo)注數(shù)據(jù)的預(yù)算顯然不如開發(fā)模型來的多,所以標(biāo)簽問題的改善也成了一種技術(shù)債。

為了找出ImageNet中剩下的錯誤,研究人員使用了一個具有 30 億參數(shù)的標(biāo)準(zhǔn)ViT-3B模型(能夠達(dá)到 89.5% 的準(zhǔn)確度),其中JFT-3B作為預(yù)訓(xùn)練模型,并在ImageNet-1K上進(jìn)行了微調(diào)。

使用ImageNet2012_multilabel的數(shù)據(jù)集作為測試集的情況下,ViT-3B初步達(dá)到的準(zhǔn)確率為96.3%,其中模型明顯錯誤預(yù)測了676個圖像,然后對這些例子進(jìn)行深入研究。

在重新標(biāo)注數(shù)據(jù)時,作者沒有選擇眾包,而是組建了一個5名專家評審組成的小組進(jìn)行標(biāo)注,因?yàn)檫@類標(biāo)注錯誤對于非專業(yè)人員來說很難識別出來。

比如圖(a),普通的標(biāo)注人員可能寫一個「桌子」就過了,但實(shí)際上圖片里還有很多其他物體,比如屏幕、顯示器、馬克杯等等。

圖片

 圖(b)的主體為兩個人,但標(biāo)簽為picket fence(柵欄),顯然也是不完善的,可能的標(biāo)簽還有領(lǐng)結(jié)、制服等等。

圖(c)也是一個明顯的例子,如果只標(biāo)出來「非洲象」,那象牙可能就被忽視掉了。

圖(d)的標(biāo)簽為lakeshore(湖岸),但標(biāo)注成seashore(海濱)實(shí)際上也沒毛病。

為了增加標(biāo)注效率,研究者還開發(fā)了一個專用的工具,能夠同時顯示模型預(yù)測的類別、預(yù)測分?jǐn)?shù)、標(biāo)簽和圖像。

圖片

 在某些情況下,專家組之間可能還存在標(biāo)簽的爭議,這時候就把圖片放到谷歌搜索里來輔助標(biāo)注。

比如說有一個例子里,模型的預(yù)測結(jié)果里包含出租車,但圖片里面除了「一點(diǎn)黃色」之外根本沒有出租車的牌子。

這張圖片的標(biāo)注主要是通過谷歌圖片搜索發(fā)現(xiàn)圖像的背景是一個標(biāo)志性的橋梁,然后研究人員定位到了圖片所在的城市,對該城市中的出租車圖像進(jìn)行檢索后,認(rèn)可了這張圖片里確實(shí)包含出租車而非一輛普通的汽車。并且從車牌的設(shè)計(jì)上進(jìn)行對比,也驗(yàn)證了模型的預(yù)測是正確的。

在對研究的幾個階段發(fā)現(xiàn)的錯誤進(jìn)行初步審查后,作者首先根據(jù)錯誤的嚴(yán)重程度將其分為兩類:

1. 主要錯誤(Major):人類能夠理解標(biāo)簽的含義,并且模型的預(yù)測和標(biāo)簽完全不沾邊;

2. 次要錯誤(Minor):標(biāo)簽的可能是錯誤的或者不完善導(dǎo)致的預(yù)測錯誤。需要專家審查數(shù)據(jù)后進(jìn)行糾正。

圖片

 對于ViT-3B模型犯的155個主要錯誤,研究人員又找了其他三個模型共同預(yù)測來提高預(yù)測結(jié)果的多樣性。

四個模型全都預(yù)測失敗的主要錯誤有68個,然后分析了所有模型對這些例子的預(yù)測,并驗(yàn)證了它們沒有一個是正確的新的多標(biāo)簽,即每個模型的預(yù)測結(jié)果確實(shí)都是主要錯誤。

這68個例子有幾個共同特點(diǎn),首先就是不同方式訓(xùn)練的sota模型都在這個子集上犯了錯誤、并且專家評審也認(rèn)為預(yù)測結(jié)果完全和正確不沾邊。

68張圖像的數(shù)據(jù)集也足夠小,方便后續(xù)研究者進(jìn)行人工評估,如果未來攻克了這68個例子,那CV模型也許會取得新突破。

通過分析數(shù)據(jù),研究者又將預(yù)測錯誤劃分為四種類型:

1. 細(xì)粒度錯誤,其中預(yù)測的類別跟真實(shí)標(biāo)簽相似,但不完全相同;

2. 具有詞表外(OOV)的細(xì)粒度,其中模型識別其類別正確但在 ImageNet 中不存在該對象的類別;

3. 虛假相關(guān)性,其中預(yù)測的標(biāo)簽是從圖像的上下文中讀取的;

4. 非原型,其中標(biāo)簽中的對象與預(yù)測標(biāo)簽相似、但并非完全一致。

圖片

 在審查了原始 676 個錯誤后,研究人員發(fā)現(xiàn)其中298 個應(yīng)該是正確的,或者可以確定原始標(biāo)簽是錯誤或有問題的。

圖片

 總的來說,通過文章的研究結(jié)果可以得出四個結(jié)論:

1. 當(dāng)一個大型、高精度模型做出其他模型沒有的新預(yù)測時,大概其中50%都是正確的新多標(biāo)簽;

2. 更高精度的模型在類別和錯誤嚴(yán)重性之間沒有表現(xiàn)出明顯的相關(guān)性;

3. 如今SOTA模型在人工評估的多標(biāo)簽子集上的表現(xiàn)在很大程度上匹配或超過了最佳專家人類的表現(xiàn);

4. 有噪音的訓(xùn)練數(shù)據(jù)和未指定的類別可能是限制有效衡量圖像分類改進(jìn)的一個因素。

或許圖像標(biāo)簽問題還得等待自然語言處理技術(shù)來解決?

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2020-01-16 15:13:40

AI預(yù)測天氣預(yù)報(bào)

2021-03-16 15:41:08

人臉識別人工智能數(shù)據(jù)

2014-07-21 09:18:26

谷歌Google Brai

2021-05-13 16:45:10

人工智能自然語言技術(shù)

2019-01-30 10:40:46

Google Brai人工智能機(jī)器學(xué)習(xí)

2023-04-21 15:49:13

谷歌DeepMind

2015-05-05 14:07:53

GMGC

2021-12-08 08:37:38

SQLIBM計(jì)算機(jī)

2017-11-03 13:30:41

深度學(xué)習(xí)TensorFlowGoogle Brai

2015-07-15 09:42:20

GoogleFacebook蘋果

2025-10-29 09:12:25

2020-06-02 07:00:00

會話安全黑客攻擊

2017-04-26 13:10:50

CNNImageNet深度學(xué)習(xí)

2025-06-30 09:37:39

2013-01-29 09:43:33

JavaJVMJava社區(qū)

2015-08-17 16:04:45

騰訊云熱門手游

2020-07-02 08:33:43

X86JVM項(xiàng)目

2025-09-24 09:02:42

2010-01-22 11:11:35

FirefoxGoogle

2013-02-22 10:07:30

GoogleGoogle GlasGoogle眼鏡
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

国产精品欧美日韩一区二区| 亚洲一级黄色片| 福利在线一区二区| 日本韩国一区| 久久精品国产久精国产| 久久久女人电视剧免费播放下载 | 一区二区不卡在线| 草草视频在线播放| 久热精品在线| 欧美俄罗斯乱妇| 久操视频在线观看免费| 亚洲一区二区三区四区电影 | 久久久精品一区| 手机在线看片日韩| www.久久爱.com| 色一情一伦一子一伦一区| 久久久久久久久影视| 可以在线观看的av网站| 国产精品亚洲一区二区三区妖精| 日产日韩在线亚洲欧美| 豆国产97在线 | 亚洲| 色呦哟—国产精品| 亚洲深夜福利网站| 国产性生活毛片| 精品视频在线观看免费观看| 欧美在线制服丝袜| 国产精品50p| 欧美hdxxxxx| 亚洲精品日日夜夜| 亚洲精品中文字幕在线| 日韩三级电影网| caoporen国产精品视频| 91精品国产综合久久久久久丝袜 | 欧美少妇网站| 亚洲一区av在线| 热久久最新网址| 免费在线你懂的| 欧美国产日韩a欧美在线观看 | 91麻豆精品国产91久久久平台| 日韩精品免费综合视频在线播放| 制服.丝袜.亚洲.中文.综合懂| 日韩一级特黄| 欧美欧美欧美欧美| 国产精品自拍视频在线| 国产日韩另类视频一区| 色综合天天综合色综合av| www.射射射| 98色花堂精品视频在线观看 | 秋霞精品一区二区三区| 国产亚洲在线观看| 97婷婷大伊香蕉精品视频| 日韩av女优在线观看| 亚洲黄色三级| 欧美一区三区三区高中清蜜桃| 日韩污视频在线观看| 亚洲精品护士| 欧美怡春院一区二区三区| 综合激情网五月| 亚洲欧美日韩视频二区| 国产成人涩涩涩视频在线观看| 一级一片免费看| 日韩高清不卡一区二区| 国产日韩av在线播放| 91精品国自产| 国产成人一级电影| 国产精品一区视频| 日本成人一区二区三区| 国产婷婷精品av在线| 亚洲高清在线观看一区| 欧美jizzhd欧美| 中文字幕日韩欧美一区二区三区| 三上悠亚免费在线观看| 波多一区二区| 色婷婷久久久综合中文字幕| 国产精品视频中文字幕| 日韩精品免费视频一区二区三区| 精品国产免费人成电影在线观看四季| 久草免费资源站| 蜜桃tv一区二区三区| 最新的欧美黄色| 久久精品99久久久久久| 国产精品毛片| 国产在线拍偷自揄拍精品| 精品乱子伦一区二区| 久久综合五月天婷婷伊人| 色综合久久av| 国产美女一区视频| 欧美中文字幕不卡| 香蕉视频污视频| 成人a'v在线播放| 欧美激情第1页| 免费黄色小视频在线观看| 国产一区激情在线| 蜜桃999成人看片在线观看| 黄色网在线免费看| 欧美视频一区二区三区…| 亚洲黄色av片| 亚洲最好看的视频| 欧美二区在线播放| 国产女优在线播放| 99久久伊人网影院| 天堂v在线视频| 日韩福利一区| 精品国产一区二区亚洲人成毛片| avhd101老司机| 日韩一级在线| 成人网在线观看| 欧美视频综合| 亚洲综合在线五月| 亚洲免费av一区| 嫩草影视亚洲| 91精品国产乱码久久久久久久久| 国产又粗又猛又黄又爽无遮挡| 91麻豆文化传媒在线观看| 免费看日本黄色| 亚洲天堂网站| 中文字幕亚洲字幕| 中文字幕第四页| 成人福利视频网站| 法国空姐在线观看免费| 久久青草视频| 国产婷婷色综合av蜜臀av| 国产精品成人网站| 国产乱码精品一区二区三| 亚洲国产日韩美| 中文在线а√在线8| 亚洲国产日韩欧美在线动漫| 五月天丁香激情| 激情久久久久久久久久久久久久久久| 欧美一区二区三区精美影视 | 色婷婷综合久久久| 玖草视频在线观看| 最新国产乱人伦偷精品免费网站| 91视频免费进入| 免费在线毛片网站| 欧美裸体bbwbbwbbw| 国产馆在线观看| 日韩av网站免费在线| 日韩电影免费观看高清完整| 人人视频精品| 亚洲人成77777在线观看网| 久久久精品福利| 久久男人中文字幕资源站| av观看免费在线| 久久爱www成人| 国产精品video| 国产精品一区二区三区四区色| 欧美性猛交xxxxx水多| 日本黄色网址大全| 久久不射网站| 日韩欧美视频一区二区| 欧美aaa级| 欧美xxxx做受欧美| 成人毛片在线免费观看| 午夜国产精品影院在线观看| www.五月天色| 久久一区二区三区喷水| 91精品在线观看视频| 国产传媒在线播放| 精品美女一区二区三区| 久久久午夜影院| 国产日韩欧美一区二区三区乱码| 国产一区二区视频播放| 久久电影在线| 国产精品h在线观看| 色影院视频在线| 欧美xxx久久| 亚洲免费在线观看av| 国产丝袜在线精品| 99九九99九九九99九他书对| 亚洲午夜黄色| 欧美亚洲另类久久综合| 中文幕av一区二区三区佐山爱| 欧美肥婆姓交大片| 国产亚洲依依| 欧美一区二区三区男人的天堂| 日韩精品久久久久久久| 国产日韩欧美精品一区| 91丝袜超薄交口足| 国产精品日韩精品欧美精品| 亚洲精品一区二区三区四区五区 | 国产污视频在线看| 久久免费看少妇高潮| 制服丝袜中文字幕第一页 | 中文字幕成人在线视频| 欧美日韩国产精品一区二区亚洲| 欧美国产一二三区| 国产精品日本一区二区不卡视频| 97精品国产97久久久久久| youjizz在线播放| 亚洲精品一区二区三区四区高清 | 欧美日韩综合精品| 精品视频在线观看免费观看| 国产91久久婷婷一区二区| 91三级在线| 亚洲香蕉成人av网站在线观看| 在线看免费毛片| 亚洲电影在线一区二区三区| 精品视频免费观看| 精品国产乱码久久久久久樱花| 欧美重口另类videos人妖| 2020国产在线视频| 在线性视频日韩欧美| 欧美在线 | 亚洲| 欧美精选在线播放| 亚洲天堂男人av| 亚洲国产综合视频在线观看| 中文国语毛片高清视频| 91美女在线观看| 精品久久久久久无码人妻| 久久99精品国产91久久来源| 日韩精品视频久久| 一区免费视频| 三级在线免费观看| 色婷婷亚洲mv天堂mv在影片| 欧美精品久久| 老牛影视av一区二区在线观看| 成人av在线天堂| yy6080久久伦理一区二区| 91av在线看| 欧美人与牲禽动交com| 日韩视频欧美视频| aaa在线免费观看| 亚洲欧洲日产国产网站| 天堂av电影在线观看| 精品不卡在线视频| 亚洲欧美激情在线观看| 欧美一级理论片| 国产美女www爽爽爽视频| 欧美猛男超大videosgay| 中国精品一区二区| 欧洲一区二区三区免费视频| 国产嫩bbwbbw高潮| 一本色道久久综合亚洲91| 在线观看中文字幕视频| 精品久久久香蕉免费精品视频| 九九视频在线观看| 一区二区免费在线| 欧美精品99久久久| 一区二区三区免费网站| 青青草激情视频| 一区二区三区美女视频| 青娱乐国产在线视频| 伊人婷婷欧美激情| 久久久久成人片免费观看蜜芽| 亚洲女性喷水在线观看一区| 中国毛片直接看| 亚洲人午夜精品天堂一二香蕉| 精品国产国产综合精品| 亚洲丝袜自拍清纯另类| 欧美成人免费观看视频| 一区二区成人在线观看| 国产无码精品久久久| 亚洲成人精品在线观看| 国产成人在线免费视频 | 国产亚洲欧美在线视频| 久久精品一区二区国产| 亚洲高清在线免费观看| 精品一区二区三区视频 | 久久这里只有精品6| 中文幕无线码中文字蜜桃| 久久精品综合网| 亚洲精品天堂网| 一个色综合网站| 国产精品100| 欧美午夜寂寞影院| 999久久久久| 亚洲第一区中文字幕| 欧美人体大胆444www| 中文字幕成人在线| 中文字幕在线观看网站| 91精品国产91久久久久福利| 国产韩日精品| 99在线影院| 国产成人精品999在线观看| 一区视频二区视频| 亚洲第一区色| 超碰在线公开97| 国产成人精品亚洲午夜麻豆| jizz日本免费| 亚洲特级片在线| 久久艹免费视频| 欧美日本一区二区三区四区| 亚洲AV无码精品色毛片浪潮| 亚洲美女av网站| 国产黄色在线观看| 欧美伊久线香蕉线新在线| 高清一区二区| 欧美精品v日韩精品v国产精品| 国产精品久久观看| 国产精品333| 国产在线日韩欧美| 少妇大叫太粗太大爽一区二区| 中文字幕一区二区三| 国产成人亚洲精品自产在线| 欧美日韩免费观看一区三区| 五月天婷婷社区| 久久夜色精品国产| 春暖花开亚洲一区二区三区| 99精彩视频| 不卡一区2区| 91av资源网| 福利一区在线观看| 国产91在线播放九色| 狠狠躁18三区二区一区| 99在线精品视频免费观看20| 亚洲欧美另类中文字幕| 国语对白在线刺激| 91九色国产视频| 精品久久网站| 国产视频一视频二| 成人免费av在线| 中文字幕在线观看2018| 在线观看精品一区| 色资源在线观看| 国模gogo一区二区大胆私拍 | 欧美精品tushy高清| 成人好色电影| 欧美做受高潮1| 欧美日韩一本| 成年女人18级毛片毛片免费| 国产河南妇女毛片精品久久久 | 成人日韩av在线| 成人影院在线| 国产情侣av自拍| wwww国产精品欧美| 日本少妇激情舌吻| 精品国产区一区| 蜜臀av在线| 国产精品久久国产精品| 欧美日韩1080p| 性一交一黄一片| 亚洲精品国产无天堂网2021| 国产精品无码AV| 综合激情国产一区| 国产精品.xx视频.xxtv| 亚洲精品一品区二品区三品区 | 亚洲成人激情小说| 一区二区视频在线| 成人av无码一区二区三区| 欧美xxxx综合视频| 一区二区三区四区视频免费观看 | 精品一区二区三区久久久| 精品一区二区在线观看视频| 欧美唯美清纯偷拍| 91高清在线视频| 91久久精品国产91久久性色| 亚洲综合小说| 亚洲成人福利视频| 午夜精品久久久久久久久久| 三级av在线播放| 日韩美女毛茸茸| 日本一区二区高清不卡| 热久久久久久久久| 亚洲精品欧美在线| 日韩一级免费视频| 欧美在线视频观看免费网站| 欧美男gay| www.久久91| 亚洲精品免费一二三区| 亚洲精品成人区在线观看| 国模视频一区二区| 久久综合亚洲| 日韩va在线观看| 亚洲综合av网| 免费人成在线观看网站| 国产日产亚洲精品| 国产精品啊v在线| 91成人破解版| 4438亚洲最大| 国产粉嫩在线观看| 日本精品一区二区三区视频| 国产在线观看一区二区| 日韩大片免费在线观看| 国产亚洲欧美aaaa| 亚洲va欧美va人人爽成人影院| 波多野结衣家庭教师在线| 国产精品素人视频| 成人免费观看在线视频| 国产成人一区二| 欧美日本一区| 一级片手机在线观看| 欧美一区二区人人喊爽| 最新欧美色图| 超薄肉色丝袜足j调教99| 91啦中文在线观看| 国产片高清在线观看| 欧美性一区二区三区| 91精品啪在线观看国产81旧版| 亚洲一区二区在线免费| 欧美日韩一区二区在线观看视频 | 91精品福利视频| 爱看av在线| 一区二区三区日韩视频| 91免费看`日韩一区二区| 国产精品久久久久久久久久久久久久久久| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 久久99精品久久久久久水蜜桃 | 欧洲亚洲精品在线| 超碰在线中文字幕|