精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一文講清楚視覺大模型!CLIP模型論文解讀

發(fā)布于 2025-1-7 11:46
瀏覽
0收藏

概覽

該論文提出了一種名為CLIP(Contrastive Language-Image Pre-Training)的多模態(tài)預(yù)訓(xùn)練模型,用于學(xué)習(xí)圖像和文本之間的語義關(guān)系。該模型使用自然語言作為監(jiān)督信號,通過對比預(yù)測正確的圖像-文本配對和錯(cuò)誤的配對來學(xué)習(xí)特征表示。具體來說,CLIP首先將輸入的圖像和文本分別編碼為高維向量,并在兩個(gè)空間中計(jì)算它們之間的相似度。然后,CLIP使用一個(gè)對比損失函數(shù)來優(yōu)化這些向量的表示,以最大化正確配對的相似度并最小化錯(cuò)誤配對的相似度。最終,CLIP可以用于各種下游任務(wù),如圖像分類、對象檢測等。

方法改進(jìn)

相比于傳統(tǒng)的基于標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法,CLIP利用了大量未標(biāo)注的自然語言數(shù)據(jù)來進(jìn)行無監(jiān)督學(xué)習(xí),從而提高了模型的表現(xiàn)。此外,CLIP還采用了多種技術(shù)來提高效率和性能,包括使用多個(gè)GPU進(jìn)行分布式訓(xùn)練、使用半精度浮點(diǎn)數(shù)計(jì)算以及使用梯度檢查點(diǎn)技術(shù)等。

解決的問題

CLIP的主要目標(biāo)是解決多模態(tài)學(xué)習(xí)中的語義匹配問題,即如何將圖像和文本聯(lián)系起來。傳統(tǒng)的方法通常需要大量的標(biāo)注數(shù)據(jù)來進(jìn)行監(jiān)督學(xué)習(xí),而CLIP則可以通過利用未標(biāo)注的自然語言數(shù)據(jù)來進(jìn)行無監(jiān)督學(xué)習(xí),從而減少了對標(biāo)注數(shù)據(jù)的依賴。此外,CLIP還可以應(yīng)用于各種下游任務(wù),如圖像分類、對象檢測等,具有廣泛的應(yīng)用前景。

1. 選擇高效的預(yù)訓(xùn)練方式

一文講清楚視覺大模型!CLIP模型論文解讀-AI.x社區(qū)

給定一批 N(圖像,文本)對,CLIP 被訓(xùn)練來預(yù)測批次中 N × N 可能(圖像,文本)對中的哪一個(gè)實(shí)際發(fā)生。為此,CLIP 通過聯(lián)合訓(xùn)練圖像編碼器和文本編碼器來學(xué)習(xí)多模態(tài)嵌入空間,以最大化批次中 N 個(gè)實(shí)數(shù)對的圖像和文本嵌入的余弦相似度,同時(shí)最小化 N2 - N 個(gè)不正確的配對。我們優(yōu)化了這些相似性分?jǐn)?shù)的對稱交叉熵?fù)p失。在圖 3 中,我們包含了 CLIP 實(shí)現(xiàn)的核心偽代碼。

一文講清楚視覺大模型!CLIP模型論文解讀-AI.x社區(qū)

據(jù)我們所知,這種批量構(gòu)建技術(shù)和目標(biāo)首先作為多類 N 對損失 Sohn (2016) 在深度度量學(xué)習(xí)領(lǐng)域引入,并被 Oord 推廣用于對比表示學(xué)習(xí)。作為 InfoNCE 損失,最近被 Zhang 等人改編為醫(yī)學(xué)成像領(lǐng)域的對比(文本、圖像)表示學(xué)習(xí)。由于我們的預(yù)訓(xùn)練數(shù)據(jù)集很大,過擬合不是主要問題,訓(xùn)練 CLIP 的細(xì)節(jié)得到了簡化。
我們從頭開始訓(xùn)練 CLIP,而沒有使用 ImageNet 權(quán)重初始化圖像編碼器或使用預(yù)訓(xùn)練權(quán)重的文本編碼器。我們不使用表示和對比嵌入空間之間的非線性投影,相反,我們僅使用線性投影將每個(gè)編碼器的表示映射到多模態(tài)嵌入空間。
我們沒有注意到兩個(gè)版本之間訓(xùn)練效率的差異,并推測非線性投影可能僅在自監(jiān)督表示學(xué)習(xí)方法中與當(dāng)前圖像的細(xì)節(jié)共同適應(yīng)。我們還簡化了圖像變換函數(shù)t_v 。來自調(diào)整大小的圖像的隨機(jī)正方形裁剪是訓(xùn)練期間使用的唯一數(shù)據(jù)增強(qiáng)。最后,控制 softmax 中 logits 范圍的溫度參數(shù) τ 在訓(xùn)練期間直接優(yōu)化為對數(shù)參數(shù)化乘法標(biāo)量,以避免轉(zhuǎn)為超參數(shù)。

2.選擇和擴(kuò)展模型

我們考慮圖像編碼器的兩種不同架構(gòu)。

圖像編碼器

一文講清楚視覺大模型!CLIP模型論文解讀-AI.x社區(qū)

首先,我們使用 ResNet-50 (He et al., 2016a) 作為圖像編碼器的基礎(chǔ)架構(gòu),因?yàn)樗粡V泛采用并且經(jīng)過驗(yàn)證有良好的性能。我們使用 He 等人的 ResNetD 改進(jìn)對原始版本進(jìn)行了一些改進(jìn),同時(shí)采用了 Zhang 的抗鋸齒 rect-2 模糊池。我們還用注意力池機(jī)制替換了全局平均池層。注意力池被實(shí)現(xiàn)為單層“transformer形式”的多頭 QKV 注意力,其中查詢以圖像的全局平均池表示為條件。對于第二種架構(gòu),我們試驗(yàn)了最近推出的 Vision Transformer (ViT)。我們密切關(guān)注它們的實(shí)現(xiàn),僅對變換器之前的組合補(bǔ)丁和位置嵌入添加額外的層歸一化并使用略有不同的初始化方案進(jìn)行了微小的修改。

文本編碼器

一文講清楚視覺大模型!CLIP模型論文解讀-AI.x社區(qū)

文本編碼器是一個(gè) Transformer,具有 Radford 等人中描述的架構(gòu)修改。作為基礎(chǔ)尺寸,我們使用具有 8 個(gè)注意力頭的 63M 參數(shù) 12 層 512 寬模型。轉(zhuǎn)換器對具有 49,152 個(gè)詞匯大小的文本的小寫字節(jié)對編碼 (BPE) 表示進(jìn)行操作。為了計(jì)算效率,最大序列長度上限為 76。文本序列用 [SOS] 和 [EOS] 標(biāo)記括起來,轉(zhuǎn)換器最高層在 [EOS] 標(biāo)記處的激活被視為文本的特征表示,該文本被層歸一化,然后線性投影到多 -模態(tài)嵌入空間。Masked self-attention 在文本編碼器中使用,以保留使用預(yù)訓(xùn)練語言模型進(jìn)行初始化或添加語言建模作為輔助目標(biāo)的能力,盡管對此的探索留待未來的工作。

結(jié)合之處

雖然之前的計(jì)算機(jī)視覺研究通常通過單獨(dú)增加寬度或深度來縮放模型,但對于 ResNet 圖像編碼器,我們采用了 Tan & Le(2019)的方法,該方法發(fā)現(xiàn) 在所有寬度、深度和分辨率上分配額外的計(jì)算優(yōu)于僅將其分配給模型的一個(gè)維度。雖然 Tan & Le (2019) 調(diào)整了為其 EfficientNet 架構(gòu)分配給每個(gè)維度的計(jì)算比率,但我們使用了一個(gè)簡單的基線,即平均分配額外的計(jì)算以增加模型的寬度、深度和分辨率。對于文本編碼器,我們只縮放模型的寬度,使其與計(jì)算出的 ResNet 寬度增加成正比,根本不縮放深度,因?yàn)槲覀儼l(fā)現(xiàn) CLIP 的性能對文本編碼器的容量不太敏感。

3.訓(xùn)練過程

我們訓(xùn)練了一系列的 5 個(gè) ResNets 和 3 個(gè) Vision Transformer。對于 ResNet,我們訓(xùn)練了一個(gè) ResNet-50、一個(gè) ResNet-101,然后是另外 3 個(gè),它們遵循 EfficientNet 風(fēng)格的模型縮放,并使用大約 4 倍、16 倍和 64 倍的 ResNet-50 計(jì)算。它們分別表示為 RN50x4、RN50x16 和 RN50x64。對于 Vision Transformers,我們訓(xùn)練了一個(gè) ViT-B/32、一個(gè) ViT-B/16 和一個(gè) ViT-L/14。我們訓(xùn)練所有模型 32 個(gè)epoch。我們使用 Adam 優(yōu)化器將解耦權(quán)重衰減正則化應(yīng)用于所有不是增益或偏差的權(quán)重,并使用余弦計(jì)劃衰減學(xué)習(xí)率 (Loshchilov & Hutter, 2016) .

當(dāng)訓(xùn)練 1 個(gè)epoch時(shí),初始超參數(shù)是使用網(wǎng)格搜索、隨機(jī)搜索和手動調(diào)整的組合在基線 ResNet-50 模型上設(shè)置的。由于計(jì)算限制,超參數(shù)然后啟發(fā)式地適應(yīng)更大的模型。

一文講清楚視覺大模型!CLIP模型論文解讀-AI.x社區(qū)

可學(xué)習(xí)的溫度參數(shù) τ 從初始化為相當(dāng)于 0.07 并被剪裁以防止將 logits 縮放超過 100,我們發(fā)現(xiàn)這是防止訓(xùn)練不穩(wěn)定所必需的。我們使用 32,768 的非常大的minibatch。混合精度用于加速訓(xùn)練和節(jié)省內(nèi)存。為了節(jié)省額外的內(nèi)存,使用了梯度檢查點(diǎn) 、半精度 Adam 統(tǒng)計(jì)和半精度隨機(jī)舍入文本編碼器權(quán)重。嵌入相似度的計(jì)算也與單個(gè) GPU 進(jìn)行了分片,僅計(jì)算其本地批量嵌入所需的成對相似度的子集。最大的 ResNet 模型 RN50x64 在 592 個(gè) V100 GPU 上訓(xùn)練了 18 天,而最大的 Vision Transformer 在 256 個(gè) V100 GPU 上訓(xùn)練了 12 天。對于 ViT-L/14,我們還以更高的 336 像素分辨率對一個(gè)額外的 epoch 進(jìn)行了預(yù)訓(xùn)練,以提高類似于 FixRes 的性能。我們將此模型表示為 ViT-L/14@336px。除非另有說明,否則本文中報(bào)告為“CLIP”的所有結(jié)果均使用我們發(fā)現(xiàn)性能最佳的模型。

4. 零樣本學(xué)習(xí)

CLIP 經(jīng)過預(yù)訓(xùn)練,可以預(yù)測圖像和文本片段是否在其數(shù)據(jù)集中配對在一起。為了執(zhí)行零樣本分類,我們重用了此功能。對于每個(gè)數(shù)據(jù)集,我們使用數(shù)據(jù)集中所有類的名稱作為潛在文本對的集合,并根據(jù) CLIP 預(yù)測最可能的(圖像,文本)對。更詳細(xì)一點(diǎn),我們首先通過各自的編碼器計(jì)算圖像的特征嵌入和一組可能文本的特征嵌入。然后計(jì)算這些嵌入的余弦相似度,通過溫度參數(shù) τ 縮放,并通過 softmax 歸一化為概率分布。請注意,此預(yù)測層是一個(gè)多項(xiàng)邏輯回歸分類器,具有 L2 歸一化輸入、L2 歸一化權(quán)重、無偏差和溫度縮放。以這種方式解釋時(shí),圖像編碼器是計(jì)算圖像特征表示的計(jì)算機(jī)視覺主干,而文本編碼器是超網(wǎng)絡(luò),它根據(jù)指定文本生成線性分類器的權(quán)重。

參考:https://arxiv.org/pdf/2103.00020

本文轉(zhuǎn)載自 ??沐白AI筆記??,作者: 楊沐白

標(biāo)簽
已于2025-1-7 13:45:22修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
成人美女大片| 肉丝一区二区| 黄色av一区| 国产丝袜一区二区| 午夜免费看视频| 一区二区三区伦理| 亚洲女娇小黑人粗硬| 富二代精品短视频| 亚洲欧洲日韩精品| 国产91免费看| 日本午夜精品视频在线观看| 久久色在线播放| 国产十八熟妇av成人一区| 欧美大片免费| 一区二区免费看| 日韩激情久久| 亚洲免费国产视频| 免费在线观看视频一区| 欧美日韩电影在线观看| 国产激情在线免费观看| 久久久精品区| 欧美国产精品久久| 欧美在线视频网| 中文字幕91视频| 操欧美女人视频| 欧美人妖巨大在线| 日本精品一区二区| 日韩一级片中文字幕| 正在播放日韩欧美一页| 亚洲人成网7777777国产| 久久久久久久久久久99| av女优在线| 91在线播放网址| 5g国产欧美日韩视频| jizz国产在线| 国产日韩一区二区三区在线播放| 欧美成人国产va精品日本一级| 在线 丝袜 欧美 日韩 制服| 草莓视频一区二区三区| 91精品蜜臀在线一区尤物| 久久精品影视大全| 成人福利av| 高跟丝袜一区二区三区| 成人一区二区av| 黄色在线免费看| 国产精品天干天干在观线| 久久综合狠狠综合久久综青草| www.热久久| 国产精品一卡二卡| 97超级碰碰| 国产三级小视频| 精品一区二区三区免费观看| 国产日韩专区在线| 在线免费观看日韩视频| 日韩av高清在线观看| 国产精品18久久久久久首页狼| 国产成人综合欧美精品久久| 99精品久久久| 91av视频在线| 波多野结衣视频网站| 久久福利一区| 国产精品久久97| 最新中文字幕第一页| 日本在线观看不卡视频| 国产精品成人一区二区三区吃奶| 亚洲国产成人精品女人久久| 丝袜亚洲另类欧美| 国产精品欧美日韩一区二区| 中文字幕一二三四| 精品亚洲porn| 7777奇米亚洲综合久久| 国产91免费看| 91麻豆国产福利在线观看| 欧美日韩三区四区| 色欧美激情视频在线| 国产精品成人网| 91麻豆天美传媒在线| 色丁香婷婷综合久久| 久久一二三四| 国产精品久久久久免费a∨| 中文字幕在线观看国产| 国产伦精品一区二区三区免费| 91在线视频一区| 国产91麻豆视频| 久久亚洲免费视频| 四虎永久国产精品| 二区在线播放| 欧美日韩美女在线| 激情视频免费网站| 亚洲天堂av资源在线观看| 亚洲精品国产精品国自产观看浪潮 | 成人免费自拍视频| 亚洲精品18p| 久久综合九色综合97婷婷女人| 日韩精品久久久免费观看 | 精品国产导航| 国产亚洲成av人片在线观看桃| 熟女少妇a性色生活片毛片| 亚洲调教视频在线观看| 国产成人精品午夜| 亚洲免费成人网| 国产欧美一区二区三区在线老狼| 欧美大片免费播放| 黄色片在线看| 亚洲男人天堂av网| 欧美日韩亚洲第一| 国产亚洲久久| 一区二区亚洲欧洲国产日韩| 欧美色图一区二区| 97色伦图片97综合影院| 国语自产精品视频在线看一大j8 | 日韩精品在线一区二区三区| 韩国欧美国产一区| 九色综合婷婷综合| 午夜dj在线观看高清视频完整版 | 大陆极品少妇内射aaaaa| 国产精品传媒麻豆hd| 亚洲第一国产精品| 任我爽在线视频| 校园激情久久| av成人综合网| 精品孕妇一区二区三区| 日韩欧美一区二区三区久久| 免费不卡av网站| 精品产国自在拍| 2018日韩中文字幕| 午夜精品久久久久久久99热黄桃| 欧美韩国日本不卡| 99re在线视频免费观看| 精品国产导航| 欧美精品videofree1080p| 一区二区精品视频在线观看| 久久免费美女视频| 极品粉嫩国产18尤物| 国内不卡的一区二区三区中文字幕 | 朝桐光av在线一区二区三区| 国产精品伦一区| 538在线视频观看| 伊人久久大香线蕉无限次| 91国产一区在线| 蜜桃av噜噜一区二区三区麻豆| 国产精品你懂的在线欣赏| 欧美日韩大尺度| 美女久久99| 青青草原一区二区| 日av在线播放| 欧美性精品220| 成人无码www在线看免费| 伊人精品视频| 91精品国产99| 欧日韩在线视频| 亚洲成年人影院| 亚洲精品中文字幕在线播放| 在线成人h网| 国产一区喷水| 午夜影院在线播放| 亚洲人成在线观看网站高清| 无码人妻精品一区二区三区9厂| 久久你懂得1024| 亚洲 欧美 日韩系列| 成人在线免费观看视频| 国产精品日日摸夜夜添夜夜av| 成人高清免费观看mv| 欧美日韩三级一区二区| 免费高清视频在线观看| 欧美激情亚洲| 国产伦精品一区二区三区高清版 | 综合网在线视频| 国产一区二区三区小说| 欧美黑人巨大videos精品| 欧洲成人在线视频| 高清av在线| 亚洲一区二区三区激情| 人妻换人妻a片爽麻豆| 亚洲黄页一区| 日本高清一区| www 久久久| 久久久久久久久久久免费精品| 亚洲三区在线播放| 亚洲一区在线视频观看| 波多野结衣一二三区| 老司机精品久久| 日韩视频在线免费播放| 爱爱精品视频| 国产激情视频一区| 1024在线播放| 亚洲精品自拍第一页| 真实新婚偷拍xxxxx| 亚洲免费观看高清完整版在线观看熊 | heyzo高清在线| 亚洲人成电影网| 国产精品一区二区人人爽| 午夜天堂影视香蕉久久| 欧美乱大交做爰xxxⅹ小说| 国产福利精品一区二区| 日韩欧美激情一区二区| 国产乱码精品一区二区三区亚洲人 | 精品一区二区三区蜜桃在线| 国产麻豆精品一区二区| 青青草原成人网| 欧美激情自拍| 亚洲欧洲精品一区二区| 国产精品qvod| 九九精品在线视频| 欧美3p视频在线观看| 欧美一区二区成人| 亚洲中文无码av在线| 亚洲亚洲人成综合网络| 欧美成人久久久免费播放| av一二三不卡影片| 国产xxxxhd| 蜜桃精品视频在线| 欧美 激情 在线| 国内精品久久久久久久97牛牛| 亚洲乱码国产乱码精品天美传媒| 欧美日韩一区二区三区在线电影 | 中文字幕第三页| 亚洲国产日韩在线一区模特| www.av免费| 国产精品女同互慰在线看| 中文字幕一区二区三区人妻不卡| 国产剧情一区二区| 欧美美女一级片| 日韩精品免费专区| 免费欧美一级视频| 欧美午夜一区| 浴室偷拍美女洗澡456在线| 日韩精品一卡| 日本不卡一区二区三区视频| 色88888久久久久久影院| 波多野结衣久草一区| 亚洲一区二区三区在线免费| 91色精品视频在线| 欧美亚洲人成在线| 国产精品久久久久免费a∨大胸| 中文字幕这里只有精品| 国产91成人在在线播放| 理论不卡电影大全神| 国外色69视频在线观看| 99riav视频在线观看| 欧美激情综合色综合啪啪五月| 在线免费观看a视频| 色综合久久久888| 色黄网站在线观看| 欧美—级a级欧美特级ar全黄| 香蕉成人app免费看片| 欧美成人免费播放| 在线中文字幕视频观看| 欧美激情一区二区久久久| 后进极品白嫩翘臀在线播放| 欧美激情第99页| 男插女视频久久久| 日韩精品在线观看网站| 特级丰满少妇一级aaaa爱毛片| 亚洲第一免费网站| 亚洲日本国产精品| 亚洲色图17p| 国产片在线观看| 在线观看国产精品淫| 9色在线视频网站| 日韩小视频网址| 在线观看h网| 97超级碰碰碰| 欧美aaa视频| 国产日韩欧美视频| 亚洲日本va| 欧美日韩国产精品一卡| 成人av国产| 日本精品福利视频| 国产日韩欧美一区| 在线免费观看av的网站| 国产酒店精品激情| 女人被狂躁c到高潮| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 好吊一区二区三区视频| 久久九九全国免费| 精品亚洲乱码一区二区| 性久久久久久久久久久久| 亚洲欧美偷拍一区| 夜夜嗨av一区二区三区四季av| 麻豆changesxxx国产| 黑人精品xxx一区| 在线观看国产小视频| 精品免费视频一区二区| 日本a一级在线免费播放| 久久久精品久久久| 午夜毛片在线| 久久久之久亚州精品露出| 欧美日韩美女| 亚洲wwwav| 伊人春色精品| 亚洲精品国产suv一区88| 亚洲女同在线| 中文字幕12页| 麻豆免费看一区二区三区| 91人妻一区二区三区| 久久久亚洲精品石原莉奈 | 999成人网| 国产黄页在线观看| 国产美女精品在线| 亚洲精品成人无码| 亚洲国产精品综合小说图片区| 奴色虐av一区二区三区| 欧美白人最猛性xxxxx69交| 成年人在线视频| 午夜美女久久久久爽久久| 久久精品资源| 欧美一级二级三级| 午夜日韩视频| 国产又猛又黄的视频| 99re在线视频这里只有精品| 日本中文在线视频| 一本久久a久久免费精品不卡| 国产高清在线免费| 色黄久久久久久| 成人午夜精品| 久久66热这里只有精品| 欧美激情第10页| 激情图片中文字幕| 国产欧美日韩卡一| 男人日女人网站| 亚洲国产私拍精品国模在线观看| 久久黄色美女电影| 国产精品亚洲一区二区三区| 成人在线高清| 美国av一区二区三区| 黄页网站一区| 国产精久久久久| 亚洲柠檬福利资源导航| 国产精品一区二区人人爽| 自拍偷拍亚洲区| 九九久久国产| 亚洲欧美一区二区原创| 蜜臂av日日欢夜夜爽一区| 免费毛片视频网站| 一本色道久久综合狠狠躁的推荐| 色噜噜在线播放| 91精品国产色综合| 精品人人人人| 国产精品50p| 91天堂素人约啪| 免费观看一区二区三区毛片| 亚洲国产中文字幕久久网| 99热99re6国产在线播放| 岛国视频一区| 亚洲乱码久久| 国产ts丝袜人妖系列视频| 岛国精品视频在线播放| 亚洲av成人无码网天堂| 日韩美女毛茸茸| 欧洲美女日日| 中文av字幕在线观看| 亚洲免费在线电影| www久久久久久| 久久久爽爽爽美女图片| 牛牛视频精品一区二区不卡| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | www.超碰在线| 精品久久久久久中文字幕动漫| 久久精品国产68国产精品亚洲| 91制片厂毛片| 亚洲欧美激情在线| 黑人精品一区二区| 日韩av不卡电影| 日韩高清欧美| 免费看91视频| 懂色aⅴ精品一区二区三区蜜月| 欧美xxx.com| 国产欧美亚洲视频| 欧美日韩第一区| 亚洲综合自拍网| 欧美在线短视频| mm1313亚洲国产精品美女| 国产私拍一区| 三级精品在线观看| 日本福利片在线观看| 精品播放一区二区| 日本一区免费网站| 2022中文字幕| 久久久久久久久伊人| 国产三级三级在线观看| 久久琪琪电影院| 日韩成人精品一区二区| 国产精品一区二区在线免费观看| 日韩欧美aaa| 国产精品剧情一区二区在线观看| 国产免费一区二区三区| 日韩黄色在线观看| 欧美日韩中文字幕在线观看| 精品伊人久久97| 国产高清日韩| 无码aⅴ精品一区二区三区浪潮| 国产精品久久久久久亚洲伦| 免费观看国产精品| 国产欧美日韩中文字幕| 亚洲美女毛片| 91麻豆免费视频网站| 亚洲免费成人av电影| 视频欧美一区| 性chinese极品按摩|