精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。

發(fā)布于 2024-5-6 09:04
瀏覽
0收藏

自2021年誕生,CLIP已在計算機視覺識別系統(tǒng)和生成模型上得到了廣泛的應用和巨大的成功。我們相信CLIP的創(chuàng)新和成功來自其高質(zhì)量數(shù)據(jù)(WIT400M),而非模型或者損失函數(shù)本身。雖然3年來CLIP有大量的后續(xù)研究,但并未有研究通過對CLIP進行嚴格的消融實驗來了解數(shù)據(jù)、模型和訓練的關系。


CLIP原文僅有簡短的數(shù)據(jù)處理描述,而后續(xù)工作依靠已經(jīng)訓練好的CLIP來重新過濾數(shù)據(jù)去訓練CLIP(學生)模型。更廣泛地說,雖然目前的開源著重強調(diào)已訓練模型權重的公開,而訓練數(shù)據(jù)以及如何從低質(zhì)量數(shù)據(jù)獲得高質(zhì)量數(shù)據(jù)的技巧的公開度卻往往并不那么高。


本文帶你揭開CLIP的數(shù)據(jù)質(zhì)量之謎,為開源社區(qū)帶來元數(shù)據(jù)導向的CLIP預訓練(MetaCLIP)。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


  • 原文鏈接:https://arxiv.org/abs/2309.16671
  • 項目鏈接:https://github.com/facebookresearch/MetaCLIP
  • 論文標題:Demystifying CLIP Data


MetaCLIP數(shù)據(jù)質(zhì)量


MetaCLIP根據(jù)CLIP原文對數(shù)據(jù)處理的描述,提出可擴展到整個CommonCrawl上的數(shù)據(jù)算法。該算法接受原始互聯(lián)網(wǎng)數(shù)據(jù)分布,產(chǎn)生在元數(shù)據(jù)上平衡的高質(zhì)量訓練數(shù)據(jù)分布。


MetaCLIP產(chǎn)生的數(shù)據(jù)質(zhì)量源自兩個部分:


(1) 通過元數(shù)據(jù)字符串匹配來抓取高質(zhì)量人類監(jiān)督文本;

(2)通過平衡數(shù)據(jù)在元數(shù)據(jù)上的分布來最大限度保留長尾數(shù)據(jù)的信號、弱化噪聲以及頭部分布的冗余信息。MetaCLIP的元數(shù)據(jù)來自50萬個WordNet和維基百科的視覺概念(visual concept),它們使被匹配的alt文本包含超越人類平均認知水平的監(jiān)督質(zhì)量(superhuman level supervision)。


我們的實驗嚴格遵循CLIP設定來控制研究數(shù)據(jù)分布對結果的影響。整個數(shù)據(jù)提取,訓練無需已訓練CLIP來過濾數(shù)據(jù)以及潛在未知的來自OpenAI CLIP的數(shù)據(jù)偏見。


相反的是,MetaCLIP數(shù)據(jù)算法同時輸出訓練數(shù)據(jù)分布。這使得訓練數(shù)據(jù)更加透明,以方便調(diào)試模型。MetaCLIP在400M訓練數(shù)據(jù)上達到ViT-B 70.8%的零樣本ImageNet分類精度;使用1B訓練數(shù)據(jù)上達到72.4%;在2.5B訓練數(shù)據(jù)上使用ViT-bigG模型達到82.1%,而整個模型和訓練參數(shù)并未進行任何更改(比如學習率或批樣本量)。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


消融實驗表明:字符串匹配(MetaCLIP w/o bal. (400M))和平衡分布(MetaCLIP(400M)) 對MetaCLIP的數(shù)據(jù)質(zhì)量產(chǎn)生重大貢獻。


CLIP數(shù)據(jù)算法介紹


本文正式提出CLIP數(shù)據(jù)算法,來簡化和產(chǎn)生高質(zhì)量的訓練數(shù)據(jù)。


該方法大致分為:創(chuàng)建元數(shù)據(jù),提出數(shù)據(jù)算法,提高數(shù)據(jù)質(zhì)量及輸出訓練數(shù)據(jù)等四個步驟。


具體方法見下:


(1) 實現(xiàn)了CLIP數(shù)據(jù)的相關描述,包括如何創(chuàng)建元數(shù)據(jù);

(2)提出如下數(shù)據(jù)算法:第一部分為元數(shù)據(jù)字符串匹配,第二部分為平衡數(shù)據(jù)分布。該算法簡潔可擴展,本文已證明可在所有CommonCrawl 300+B 級圖片樣本并行運行;

(3)可植入已有數(shù)據(jù)流水線或者數(shù)據(jù)加載器(data loader)來提高數(shù)據(jù)質(zhì)量;

(4)輸出訓練數(shù)據(jù)在元數(shù)據(jù)上的訓練分布使得訓練數(shù)據(jù)更透明。


該算法的python代碼如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


MetaCLIP的元數(shù)據(jù)來自WordNet和Wikipedia的高質(zhì)量視覺概念(visual concept)。我們根據(jù)CLIP原文描述實現(xiàn)了從維基百科提取uni/bi-gram以及高頻標題的過程。


相關選取的超參數(shù)如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

元數(shù)據(jù)的創(chuàng)建來源


MetaCLIP算法簡潔,可以將兩部分分開植入已有的數(shù)據(jù)流水線。


如下圖所示,該算法可以在數(shù)據(jù)流水線的早期進行植入,來減小數(shù)據(jù)規(guī)模和對計算資源存儲的開銷:


  • 第一部分(元數(shù)據(jù)字符串匹配)能減少50%的數(shù)據(jù)量;
  • 第二部分(平衡數(shù)據(jù)分布)能減少77%的數(shù)據(jù)量。


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

算法可輕松接入已有數(shù)據(jù)流水線,降低處理低質(zhì)量數(shù)據(jù)的開銷


下圖展示了平衡數(shù)據(jù)分布的效果:橫坐標將元數(shù)據(jù)里每個視覺概念的匹配數(shù)量從低到高排列,縱坐標累計匹配。


表格中展示了不同頻率區(qū)段視覺概念的匹配數(shù)量:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)

平衡數(shù)據(jù)分布使得1.6B的原始數(shù)據(jù)被下采樣成400M的訓練數(shù)據(jù)。


我們可以看到MetaCLIP數(shù)據(jù)算法對頭部分布進行了高度下采樣,這將降低頭部分布的冗余無效信息和頭部數(shù)據(jù)的噪聲(比如untitled photo),所有長尾分布的視覺概念全部保留。


實驗結果


我們設計了兩個數(shù)據(jù)池來運行數(shù)據(jù)算法。


  • 第一個池的目標是獲得400M訓練數(shù)據(jù)來和CLIP進行比較;
  • 第二個池的目標是所有CommonCrawl數(shù)據(jù)。


我們進一步對第二個數(shù)據(jù)池運行了兩次數(shù)據(jù)算法,一次設定頭尾分布的閾值(t=20k)與400M一致(最終獲得1B數(shù)據(jù)),一次設定尾部分布的比例與400M尾部的比例一致(t=170k,最終獲得2.5B數(shù)據(jù))。


MetaCLIP在DataComp的38個任務上的實驗結果如下:


Meta 聯(lián)合紐約大學和華盛頓大學提出MetaCLIP,帶你揭開CLIP的高質(zhì)量數(shù)據(jù)之謎。-AI.x社區(qū)


我們可以看到MetaCLIP在400M上略好于OpenAI CLIP或者OpenCLIP。在第二個池上性能進一步超越400M。更多的數(shù)據(jù)在更大的模型ViT-bigG上產(chǎn)生更好的效果。而這些性能的提升完全來自數(shù)據(jù)而非模型結構改進或者訓練技巧本身。


在CLIP/SLIP每個分類任務上的詳細實驗結果請參考原文。


實驗結論


本文提出了CLIP的數(shù)據(jù)算法來產(chǎn)生高質(zhì)量訓練數(shù)據(jù):算法可在所有CommonCrawl 的300+B 級圖片樣本對上并行運行。


實驗表明元數(shù)據(jù)字符串匹配和平衡分布都對結果有重大貢獻,算法無需使用CLIP模型過濾或者提高訓練開銷來提升性能,并且使得訓練數(shù)據(jù)分布更加透明。


本文轉(zhuǎn)自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/bEhDOBWcGeUZGMGA6lHoCA??

收藏
回復
舉報
回復
相關推薦
伊是香蕉大人久久| 成年人在线观看网站| 超鹏97在线| 夜夜嗨一区二区三区| 最新中文字幕一区二区三区| 6080yy精品一区二区三区| 伊人成人免费视频| 中文文字幕一区二区三三| 日韩免费电影在线观看| 亚洲香蕉伊在人在线观| 亚洲影视中文字幕| 国产美女久久久久久| 国产精品久久久久久吹潮| 久久久久久免费| 97成人精品区在线播放| 国产农村妇女精品一区| 欧美aaa大片视频一二区| 99久久er热在这里只有精品15 | 国产在线观看h| av免费不卡国产观看| 国产不卡视频一区二区三区| 久久手机免费视频| 五月天激情播播| 四虎久久免费| 国产一区美女在线| 久久综合五月天| 免费看污黄网站在线观看| 日韩影院在线| 国产亚洲一二三区| 国产精品一区二区久久久 | 亚洲精品高清在线| 亚洲一区二区三区四区视频| 国产污视频网站| 欧美精品momsxxx| 在线视频你懂得一区| 色噜噜色狠狠狠狠狠综合色一| 在线观看亚洲黄色| 国产精品久久久久无码av| 67194成人在线观看| 天天综合五月天| 亚洲AV午夜精品| 国产精品二区影院| 日韩精品视频免费专区在线播放 | 欧美成人伊人久久综合网| 免费cad大片在线观看| 成人毛片视频免费看| 国产日韩专区| 亚洲色图第三页| 美女在线视频一区二区| 99热国产在线| www激情久久| 国产精品自产拍高潮在线观看| 五月婷婷中文字幕| 久久激情电影| 色偷偷一区二区三区| 三区精品视频观看| 国产又爽又黄网站亚洲视频123| 美女日韩在线中文字幕| www.色综合| 亚洲成年人在线观看| 天天免费亚洲黑人免费| 亚洲天堂久久久久久久| 国产日产精品一区二区三区四区 | 国产在线欧美| 美女性感视频久久久| 国产黑丝一区二区| 欧美一级做a| 午夜精品久久久久久久 | 亚洲综合婷婷| 日韩电影中文字幕在线| 中文字幕人妻一区二区三区| 国内视频在线精品| 欧美精三区欧美精三区| 精品少妇人妻av免费久久洗澡| freemovies性欧美| 国产精品美日韩| 精品999在线观看| 国产又粗又猛又爽又黄视频| 久久精品午夜| 国产精品揄拍一区二区| 99久久精品日本一区二区免费| 麻豆久久婷婷| 国产在线视频欧美| 极品国产91在线网站| 丝袜美腿亚洲综合| 91国语精品自产拍在线观看性色| 黄色片视频网站| 亚洲综合中文| 午夜精品久久久久久久白皮肤| 可以免费看av的网址| 免费看av成人| 精品国产一区av| 欧美日韩中文视频| 女人天堂亚洲aⅴ在线观看| 国产小视频国产精品| 久久久久亚洲AV成人无码国产| 亚洲激情77| 日韩av一区二区在线| 成人黄色免费网址| 欧美大片一区| 国产精品 欧美在线| 欧美精品韩国精品| 99精品国产一区二区青青牛奶| 国产精品成人va在线观看| 久久久久久少妇| 亚洲美女视频在线免费观看| 国产精品久久久久av| 亚洲精品国产一区二| 国产三区在线成人av| 欧美大黑帍在线播放| 在线三级中文| 91久久精品一区二区三区| 欧美日韩激情视频在线观看 | 色综合男人天堂| 男女性高潮免费网站| 久久亚洲国产| 欧美在线激情网| 成人免费a视频| 国产一区二区福利视频| 日韩激情视频| a视频网址在线观看| 婷婷成人综合网| 国产精品333| 正在播放日韩精品| 色婷婷av一区二区| www.com日本| 久久久久久美女精品 | 免费视频最近日韩| 国产女人精品视频| 欧美大片aaa| 欧美国产亚洲另类动漫| 在线观看成人av| 黄色片免费在线观看| 亚洲精品少妇30p| 欧美黑人在线观看| 亚洲视频自拍| 亚洲大胆人体av| 亚洲综合网在线观看| 波多野结衣在线播放一区| www.精品av.com| av首页在线观看| 久久久久久久久久久久久女国产乱| 欧美国产日韩激情| 日日夜夜天天综合| 91精品国产品国语在线不卡| 亚洲成年人av| 综合久久婷婷| 91手机视频在线观看| 手机看片1024国产| 亚洲国产高清在线观看视频| 99re8这里只有精品| 亚洲日本免费电影| 久久天天躁狠狠躁夜夜躁| 一本一道人人妻人人妻αv | 亚洲一区免费网站| fc2ppv国产精品久久| 91精品国产综合久久久久久| 午夜精品福利在线视频| 国产一区中文字幕| 潘金莲一级淫片aaaaaa播放1| 久久的色偷偷| 亚洲九九九在线观看| 婷婷伊人五月天| 国产精品亚洲视频| 日本高清视频一区二区三区 | 国产亚洲电影| 久久精品亚洲国产| 草久视频在线观看| 国产午夜久久久久| 亚洲xxx在线观看| 中文字幕午夜精品一区二区三区 | 免费av不卡在线| 婷婷久久国产对白刺激五月99| 亚洲jizzjizz日本少妇| av2020不卡| 亚洲精品网站在线播放gif| 潘金莲一级黄色片| 成熟亚洲日本毛茸茸凸凹| 亚洲国产精品毛片| 人人草在线视频| 夜夜嗨av色综合久久久综合网| 亚洲天堂aaa| 一区二区三区不卡在线观看| 538任你躁在线精品免费| 国产图片一区| 日韩av不卡电影| 蜜桃视频污在线观看| 亚洲欧美综合网| 精品1卡二卡三卡四卡老狼| 久久久人成影片免费观看| 高清国产在线一区| 26uuu亚洲电影在线观看| 亚洲国产精品一区二区三区| 免费三片在线播放| 国产乱子伦视频一区二区三区 | 亚洲精品在线91| 911美女片黄在线观看游戏| 国产亚洲一区二区三区| 激情在线观看视频| 久久一区二区三区喷水| 成人综合色站| 成人av色网站| 国模gogo一区二区大胆私拍| 精品人妻一区二区三区四区不卡| 中文字幕日韩av资源站| 日本三级日本三级日本三级极| 日韩和欧美的一区| 日本一区视频在线观看免费| 国产午夜久久av| 久久午夜a级毛片| 日本大臀精品| 91久久奴性调教| 精品一级少妇久久久久久久| 国产成人精品www牛牛影视| 免费黄色特级片| 日韩人体视频| 99久久99| 欧美巨大丰满猛性社交| 久久香蕉频线观| 69久久久久| 在线播放视频一区| 久久久久久无码精品大片| 午夜精品爽啪视频| 国产精品99无码一区二区| 成人免费在线播放视频| 精品人伦一区二区| 蜜臀av性久久久久蜜臀av麻豆| 婷婷五月综合缴情在线视频| 日韩精品免费一区二区夜夜嗨| 国产日韩欧美中文| 日韩精品免费观看视频| 日韩免费中文字幕| 日本在线播放一二三区| 久久久久久国产精品美女| 五月婷婷六月丁香| 精品日韩欧美一区二区| 午夜精品久久久久久久久久久久久蜜桃| 亚洲青青青在线视频| 91香蕉视频污在线观看| 成人综合在线观看| 成人免费播放视频| 国产一区欧美一区| 亚洲免费av一区| 久久精品国产精品亚洲红杏| 成人手机在线播放| 色婷婷综合久久久久久| 国产一区免费在线| 日韩大胆成人| 免费av在线一区二区| 色综合久久久| 国产噜噜噜噜久久久久久久久| 国产精品诱惑| 韩剧1988在线观看免费完整版| 久久不射影院| 色婷婷久久一区二区| 黑人精品一区二区三区| 亚洲精品在线观看视频| 成人一级免费视频| 91福利视频久久久久| 中文字幕av资源| 欧美精品成人一区二区三区四区| 国产精品欧美激情在线| 欧美日韩在线播放一区| 免费在线观看黄网站| 精品美女久久久久久免费| 日本一道本视频| 成人国产电影网| 中文字幕一区久久| 国产精品日韩欧美一区| 欧美视频第三页| 久久国产麻豆精品| 99色精品视频| 日本女人一区二区三区| 91免费黄视频| 久久精品123| 国内国产精品天干天干| 国产精品18久久久久久久久| 一区二区三区免费播放| 激情图片小说一区| 免费看黄色一级大片| 亚洲二区在线| 欧美交换配乱吟粗大25p| 亚洲茄子视频| 欧美性猛交内射兽交老熟妇| 99成人在线| 日本激情视频在线播放| 国产mv日韩mv欧美| 国产真人做爰视频免费| 亚洲人成网站在线| 亚洲天堂男人av| 欧美一区日韩一区| 免费在线稳定资源站| 久久精品99无色码中文字幕| 性感女国产在线| 国产精品香蕉在线观看| 国产成人aa在线观看网站站| 日本一区二区三区www| 国产一区清纯| 欧美日韩在线成人| 久久天堂成人| 伦伦影院午夜理论片| 久久久久久一级片| 九九在线观看视频| 精品视频在线免费观看| 人妻无码中文字幕免费视频蜜桃| 中文字幕久热精品在线视频| www 日韩| 97成人超碰免| 欧美日韩中出| 亚洲一卡二卡三卡| 999视频精品| 国产精品宾馆在线精品酒店| 国产成人精品免费在线| 日本 欧美 国产| 一本色道a无线码一区v| 男人天堂综合网| 蜜臀久久99精品久久久久久宅男 | 欧洲av在线精品| 刘玥91精选国产在线观看| 日韩中文字幕在线播放| 暖暖成人免费视频| 国产精品一区二区av| 欧美重口另类| 欧美一区二区福利| 极品中文字幕一区| 一区二区三区人妻| 99久久婷婷国产综合精品| 国产精品三级在线观看无码| 亚洲综合清纯丝袜自拍| a级片在线视频| 日韩av网址在线| 久草在线新免费首页资源站| 91在线观看免费高清完整版在线观看| 色综合色综合| 色婷婷一区二区三区av免费看| 久久精品网站免费观看| 中文字幕激情小说| 日韩精品电影网| 欧亚av在线| 欧美凹凸一区二区三区视频| 久久久一二三| 波多野结衣一本| 色综合欧美在线视频区| 蜜桃视频在线观看视频| 日韩美女视频免费在线观看| 亚州精品视频| av免费网站观看| 日本一区二区成人| 一级全黄裸体免费视频| 久久伊人色综合| 亚洲一区二区三区在线免费| 欧美亚州在线观看| 亚洲91精品| 原创真实夫妻啪啪av| 亚洲已满18点击进入久久| 日本激情一区二区三区| 68精品国产免费久久久久久婷婷| 欧美偷窥清纯综合图区| 韩国日本美国免费毛片| 欧美国产欧美综合| 国产乱淫a∨片免费观看| 欧美丰满老妇厨房牲生活 | 成人激情视频在线播放| 色综合色综合色综合色综合| 国产精品伦理| 国产精品黄色在线观看| 91日本在线视频| 国产免费高清视频| 丁香婷婷综合色啪| 久99久在线| 亚洲在线免费观看视频| 国产一区在线不卡| 亚洲一区二区三| 黄色一级大片在线免费看国产| 久久免费黄色| 亚洲一区二区四区| 国产九九视频一区二区三区| 国产一级免费观看| 亚洲性猛交xxxxwww| 亚洲伦理一区二区| 男人添女荫道口喷水视频| 久久综合久色欧美综合狠狠| 性欧美精品男男| 欧美人牲a欧美精品| 免费国产在线视频| 成人在线免费观看视视频| 激情六月综合| 国产熟女一区二区| 精品国产麻豆免费人成网站| 男人最爱成人网| 2022中文字幕| 日本一区二区三区国色天香| 国产草草影院ccyycom| 奇米一区二区三区四区久久| 婷婷久久综合| 少妇特黄一区二区三区| 91精品国产综合久久福利软件| 九色porny自拍视频在线观看 | 亚洲综合无码一区二区| 国产在线一在线二|