精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力

發布于 2024-7-18 10:42
瀏覽
0收藏

一、背景

這里介紹一下新出的文章 Long-CLIP,方案雖然比較簡單,但是 CLIP 使用的場景非常多,因此對很多任務也會比較有幫助。

對應的論文為:??https://arxiv.org/abs/2403.15378??

對應的代碼庫為:??https://github.com/beichenzbc/Long-CLIP/tree/main??

二、摘要

CLIP(Contrastive Language Image Pre-Training)模型在涉及圖文相關的場景中非常常用,比如圖文檢索、文生圖以及大型多模態模型等。它們通常使用 CLIP 中的 Text Encoder 或 Image Encoder 對文本或圖像進行編碼。然而,CLIP 中的 Text Encoder 只支持 77 個 Text Token,甚至有研究表明其超過 20 個 Token 就會導致性能下降,這會導致其無法處理長文本的場景,比如詳細描述。

在 Long-CLIP 中,作者通過對 Positional Embedding 的 Knowledge-Preserved Stretching 以及 Primary Component Matching 方案對 CLIP 模型進行優化,使其在保留短文本能力的同時擴充長文本理解能力,并且可以無縫替換已有的 CLIP 模型,在針對長文本的圖文檢索任務上提升 20%,在傳統圖文檢索任務提升 6%。

三、方法

3.1 CLIP 模型

CLIP 模型是 OpenAI 在大規模圖像-文本對數據集上通過對比學習方式訓練的圖文模型,具體論文可以參考 [2103.00020] Learning Transferable Visual Models From Natural Language Supervision,對應的代碼庫為 GitHub - openai/CLIP: CLIP (Contrastive Language-Image Pretraining), Predict the most relevant text snippet given an image。其核心思想為:一對圖像-文本分別提取特征,這一對特征的相似性應該盡可能大,而圖像和其他文本對應的特征相似性應該盡可能小。

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

3.2 Knowledge-Preserved Stretching

CLIP 中的 Text Encoder 采用了可學習的絕對 Position Embedding,因此輸入文本 Token 會受到 77 個 Token 的限制,也有一些方案試圖解決這個問題,比如位置編碼插值方法。然而,這種簡單的線性插值方案可能導致對已有 Position Embedding 的干擾,導致影響模型對短文本的理解能力。

幸運的是,作者發現 CLIP 模型本身的前 20 個 Token 的 Postion Embedding 對模型效果起到至關重要的作用,而在之后的 Position Embedding 并沒有經過較充分的學習?;谶@一發現,作者在進行 Position Embedding 插值時會保留前 20 個 Position Embedding,只對后續的 Position Embedding 進行插值。

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

其相應推理過程也很簡單,這里作者額外創建了一個 positional_embedding_res,其有效長度為 248-20=(77-20)*4=228,也就是 57 個 Position Embedding 擴展為 228 個 Position Embedding,推理時分別處理。

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

3.3 Primary Component Matching

在進行長度外推后,直接使用長文本進行微調并不能獲得理想的效果,主要是其會導致短文本能力的下降,尤其是在分類任務上。因此,作者進一步探索了如何通過微調來解鎖長文本理解能力,同時保留短文本能力。

具體方案如下圖 Fig.3 所示,作者提出了 Primary Component Matching 策略:

  1. 同時輸入圖像、短文本以及詳細長文本,分別提取特征,分別對應細粒度圖像特征、粗粒度文本特征細粒度文本特征;
  2. 使用 Primary Component Extraction 模塊從細粒度圖像特征中提取粗粒度圖像特征
  3. 訓練的目標為:細粒度圖像特征細粒度文本特征對齊,粗粒度圖像特征粗粒度文本特征對齊。?

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

那么什么是細粒度圖像特征,什么是粗粒度圖像特征呢?作者認為,一個好的模型不僅應該能捕獲各種屬性,還應該理解它們之間的相對關系和不同的重要性。而長描述文本微調可能將模型推向于只捕獲各種屬性,為此,作者期望模型還能夠專注于捕獲關鍵屬性對應的粗粒度圖像特征,并與短文本特征對齊。

基于以上考量,作者將 Primary Component Extraction 模塊分為 3 個基本組件:

  1. Component-Decomposition Function:分解為特征值(重要性)和特征向量,Ifine 為細粒度圖像特征
    ?
  2. Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

  3. Component-Filtration Function:按照特征值(重要性)過濾,這里作者保留了32 個最大的特征值
    ?
  4. Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

  5. ?
  6. Component-Reconstruction Function:使用過濾后的特征值和特征向量恢復到原來的特征空間,Icoarse 為粗粒度圖像特征
    ?
  7. Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

上述的過程和我們常見的數據壓縮-重建,圖像去噪等處理高度相似,作者也同樣直接使用 PCA(Principal Component Analysis)方法來實現。

PS:其實 OpenAI 在其文生圖模型 DALL-E 2([2204.06125] Hierarchical Text-Conditional Image Generation with CLIP Latents) 中也通過 PCA 來降低 CLIP 圖像 embedding 的維度。這是因為作者發現,當使用 SAM 訓練 CLIP 時,CLIP 表征空間的秩急劇下降,同時略微提升了評估指標。作者發現僅保留 1024 個主成分中的 319 個也能幾乎保留全部信息。

四、評估

4.1 定量評估

如下圖 Table 1 所示,在長文本的文本-圖像檢索任務上,提出的 Long-CLIP 模型獲得了最優的效果:

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

如下圖 Table 2 所示,在短文本的文本-圖像檢索任務上,提出的 Long-CLIP 模型甚至獲得了比原始 CLIP 更好的效果,并且明顯優于直接微調的方案:

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

如下圖 Table 3 所示,在 0-shot 圖像分類任務上,提出的 Long-CLIP 模型明顯優于直接微調的方案,并且相比原始 CLIP 差距不大:

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

4.2 消融實驗

作者也進一步進行了消融實驗,來驗證提出的兩個組件 Knowledge-Preserved Stretching(KPS) 以及 Primary Component Matching(PCM) 的有效性。如下圖 Table 4 所示,同時使用兩個組件在所有任務上獲得了最優效果:

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

4.3 定性評估

為了驗證提供模型的即插即用特性,作者直接替換了 Stable-Diffusion-V1-5 中的 CLIP text encoder,用于驗證其文生圖能力,如下圖可以看出,替換后模型能更好的遵循指令,生成更多的細節信息,而原始的結果中往往容易忽略一些內容:

Long-CLIP:無縫擴展 CLIP 模型的長文本理解能力-AI.x社區

PS:其實 OpenAI 也在很早之前意識到了這個問題,在 DALL-E 3(Improving Image Generation with Better Captions)模型中,他們發現傳統的文生圖模型難以遵循詳細的圖像描述,并且經常出現忽略單詞或混淆提示的語義,作者猜測可能是訓練集中的噪聲或者不準確的圖像描述導致的。相應的解決方案是訓練了一個詳圖圖像描述模型,然后對圖像生成高度描述性的文本,然后借助這些文本用于模型訓練,可以大大提高文生圖的指令跟隨能力。此外作者也將相關能力應用到了其強大的視頻生成模型 Sora 中。

PS:在 Google 的 Imagen([2205.11487] Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding)文生圖模型中作者也發現了類似的現象。具體來說,作者發現使用 CLIP 的 Text Encoder 和 T5-XXL 在 MS-COCO 等簡單任務上獲得了相似的表現,但是在 DrawBench 上人們更喜歡 T5-XXL 作為 Encoder 的結果,作者也認為主要原因是 DrawBench 中的文本 Prompt 更加復雜,比如包含更長、更詳細的描述。

五、參考鏈接

  1. ???https://arxiv.org/abs/2403.15378???
  2. ???https://github.com/beichenzbc/Long-CLIP/tree/main???
  3. ???https://arxiv.org/abs/2103.00020???
  4. ???https://github.com/openai/CLIP???
  5. ???https://arxiv.org/abs/2204.06125???
  6. ???https://cdn.openai.com/papers/dall-e-3.pdf???
  7. ???https://arxiv.org/abs/2205.11487????

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
国产精品对白刺激| 久久9999久久免费精品国产| 国产精品蜜臀| 国产成人综合亚洲网站| 色屁屁一区二区| 午夜精品亚洲一区二区三区嫩草| 夜夜躁很很躁日日躁麻豆| 欧洲成人一区| 亚洲丝袜另类动漫二区| 国产精品区一区二区三含羞草| 中国一级免费毛片| 欧美超碰在线| 欧美videofree性高清杂交| 99免费在线观看视频| 五月婷婷综合激情网| 成人国产精品久久| 亚洲高清久久久| 香蕉久久免费影视| 好吊视频一区二区三区| 九九热爱视频精品视频| 91精品国产丝袜白色高跟鞋| 欧美 国产 日本| 性xxxxfjsxxxxx欧美| 欧美激情在线一区二区| 精品九九九九| 91日韩中文字幕| 日韩三级视频| 日韩三级高清在线| 日本不卡一区| 五月婷婷丁香花| 六月婷婷色综合| 国产999在线观看| 欧美日韩在线国产| 日韩欧美午夜| 精品国产一二三| 亚洲精品国产久| 成人欧美大片| 亚洲综合色丁香婷婷六月图片| 在线免费观看成人网| 三级国产在线观看| 99天天综合性| 91久久精品美女高潮| 在线观看国产区| 久久综合影视| 欧美精品www在线观看| 国产av 一区二区三区| 国产精品二区不卡| 日日狠狠久久偷偷四色综合免费 | 国产视频一区免费看| 久久精品视频网站| 久久网站免费视频| 国产淫片在线观看| 日韩一区在线看| 亚洲精品在线免费看| yourporn在线观看视频| 日本一区二区不卡视频| 亚洲国产一区二区三区在线播 | 日韩不卡免费高清视频| 一本到不卡免费一区二区| 黄在线观看网站| 午夜欧美巨大性欧美巨大 | 在线观看欧美理论a影院| 激情久久av一区av二区av三区| 日韩久久久久久久久久久久| www久久日com| 亚洲精品国产a久久久久久| 先锋影音网一区| www.亚洲视频| 国产欧美在线观看一区| 欧美一区二区三区在线免费观看| 福利小视频在线观看| 中文字幕精品在线不卡| 秋霞在线观看一区二区三区| 国产综合视频一区二区三区免费| 91看片淫黄大片一级| 欧美亚洲另类在线一区二区三区| 成人免费高清在线播放| 中文字幕亚洲区| 男人c女人视频| 亚洲女同志freevdieo| 成人精品免费网站| 久久国产精品 国产精品| 黑人一级大毛片| 日韩激情一二三区| 91亚洲精品久久久久久久久久久久| 国产黄色大片网站| 97久久超碰国产精品| 亚洲激情电影在线| 羞羞网站在线看| 精品久久久久久久久久久久久| 中文字幕欧美人妻精品一区| 成人一区视频| 欧美大胆人体bbbb| 日韩中文字幕二区| 69xxx在线| 欧美日韩国产丝袜另类| 日韩免费高清在线| av在线精品| 亚洲欧洲日产国产网站| 韩国三级丰满少妇高潮| 免费看成人人体视频| 色av吧综合网| 天天操天天操天天操天天| 热久久国产精品| 国产自产精品| 二区三区在线观看| 精品久久久精品| 性一交一黄一片| 你微笑时很美电视剧整集高清不卡 | 国产在线视视频有精品| 日本不卡久久| 色偷偷偷在线视频播放| 欧美一级国产精品| jizz日本在线播放| 久久黄色网页| 国产精华一区| av电影高清在线观看| 日韩欧美在线视频免费观看| 欧美色图校园春色| 九九免费精品视频在线观看| 97色在线播放视频| 性一交一乱一伧老太| 中文字幕精品一区| 天天摸天天碰天天添| 97色成人综合网站| 久久中文久久字幕| 国产黄网在线观看| 99国产精品久久久久久久久久久| 91精品国产毛片武则天| 色老太综合网| 日韩精品视频免费专区在线播放| 国产真人真事毛片| 久久99国产精品免费| 视频在线一区二区三区| 色成人免费网站| 亚洲乱码av中文一区二区| 国产精品1234区| 国产一区二区影院| 色呦呦网站入口| 成人精品视频在线观看| 国产午夜精品免费一区二区三区| 性无码专区无码| www日韩大片| 国产视频九色蝌蚪| 色狼人综合干| 欧美刺激性大交免费视频| 国产av无码专区亚洲av| 亚洲人成伊人成综合网小说| www污在线观看| 黄色网一区二区| 97在线视频免费看| 日本在线视频1区| 亚洲午夜一区二区| 在线观看一区二区三区视频| 亚洲天堂男人| 18成人在线| av免费在线网站| 精品卡一卡二卡三卡四在线| 欧美成人aaaaⅴ片在线看| 国产一区二区精品在线观看| 欧美这里只有精品| 国产一级成人av| 91成人在线播放| 久草在线免费福利资源| 欧美日韩亚洲不卡| 亚洲av无日韩毛片久久| 午夜久久免费观看| 成人看片视频| 国产三线在线| 亚洲欧美综合v| 国产又爽又黄免费软件| 亚洲制服丝袜在线| 久久丫精品国产亚洲av不卡 | 亚洲高清视频免费| 韩国自拍一区| 日韩三级电影| 国产欧美日韩电影| 97视频在线观看免费高清完整版在线观看| 欧美一区二区少妇| 在线观看视频一区| 午夜精品一区二区三区视频| 99久久er热在这里只有精品66| 日本成人中文字幕在线| 成人高清电影网站| 午夜免费日韩视频| 国产最新视频在线| 日韩欧美黄色影院| 午夜婷婷在线观看| 国产精品久线在线观看| 日本精品一二三| 日韩精品亚洲专区| 国产自产在线视频| 欧美视频网址| 国产一区二区三区免费不卡| 久久av影院| 日韩激情视频在线播放| 一级黄色免费看| 精品福利樱桃av导航| 岛国片在线免费观看| 国产激情视频一区二区在线观看 | 91九色综合| 国外成人在线播放| 免费大片在线观看www| 精品国产青草久久久久福利| 伊人网中文字幕| 欧美日韩精品在线| 中文字幕五月天| 九九国产精品视频| 青青草成人免费在线视频| 91日韩欧美| 久久国产欧美精品| 日本综合久久| 538国产精品一区二区免费视频 | 成人黄色一区二区| 国产欧美一级| 欧美在线观看视频免费| 欧美码中文字幕在线| 久久精品一区二区三区不卡免费视频 | 先锋资源久久| 五月天亚洲综合小说网| 红杏aⅴ成人免费视频| 91丝袜美腿美女视频网站| 电影一区二区三| 69精品小视频| 中文字幕中文字幕在线十八区| 日韩精品免费看| 丰满人妻一区二区三区四区53| 91精品午夜视频| 国内av在线播放| 欧美在线观看一二区| 国产精品7777777| 国产1区2区3区精品美女| 中文av一区二区三区| 媚黑女一区二区| 男人天堂999| 亚洲精品孕妇| 黄色大片在线免费看| 极品裸体白嫩激情啪啪国产精品| 神马午夜伦理影院| 日韩在线视频精品| 久久手机视频| 亚洲精品国产精品粉嫩| 国产欧美欧洲| 亚洲精品黑牛一区二区三区| 97人人澡人人爽| 亚洲视频国产精品| 国产精品v欧美精品v日韩| 超碰在线成人| av日韩中文字幕| 精品人人人人| 久久涩涩网站| 精品毛片免费观看| 亚洲精品在线观看免费| 亚洲成人最新网站| 制服国产精品| 欧美日韩一区二区高清| 欧美中日韩在线| 国产欧美69| 别急慢慢来1978如如2| 日韩精品五月天| 亚洲欧洲日本精品| 国产精品一区二区免费不卡 | 精品中文字幕av| 久久久青草婷婷精品综合日韩| 欧美少妇性生活视频| 免费观看成人av| 1314成人网| 成人精品鲁一区一区二区| 99久久人妻精品免费二区| 久久综合成人精品亚洲另类欧美| 免费黄色片网站| 中文字幕欧美三区| 国产盗摄x88av| 黑人极品videos精品欧美裸| 波多野结衣电影在线播放| 亚洲精品伦理在线| 天天操天天射天天爽| 日本精品一区二区三区四区的功能| aaa人片在线| 在线一区二区视频| 91好色先生tv| 亚洲国产精彩中文乱码av| 国产一区二区三区福利| 久久精品99久久香蕉国产色戒| 里番在线播放| 国产乱肥老妇国产一区二| 51亚洲精品| 久久99精品久久久久久秒播放器| 久久电影院7| 欧美激情 国产精品| 日本最新不卡在线| 久草免费资源站| 日本一区二区三区四区| 麻豆chinese极品少妇| 一本久久a久久免费精品不卡| 国产偷拍一区二区| 亚洲成人1234| 国产黄色片在线播放| 欧美激情区在线播放| 国产在线看片| 欧美在线激情网| 国产精一区二区| 青青成人在线| 欧美人成在线| 日韩在线不卡一区| 成人精品视频.| 日本老熟俱乐部h0930| 欧美三级免费观看| 成人av一区二区三区在线观看 | 91嫩草国产在线观看| 蜜桃一区二区| 男人添女荫道口图片| 国产一区亚洲一区| 日韩黄色中文字幕| 欧美日韩日本国产| 欧美熟女一区二区| 欧美成人激情图片网| 亚洲国产aⅴ精品一区二区三区| 免费看成人午夜电影| 亚洲经典三级| 精产国品一区二区三区| 中文字幕一区二区三区不卡在线| 无码人妻aⅴ一区二区三区有奶水| 精品国产自在久精品国产| 成人免费视屏| 91精品视频在线播放| 91综合久久一区二区| 青青艹视频在线| 狠狠久久亚洲欧美| 呻吟揉丰满对白91乃国产区| 欧美综合久久久| 成在在线免费视频| 欧美一区二区大胆人体摄影专业网站| 日韩精品视频一区二区三区| 国产精品美女免费| 国产成人短视频在线观看| 欧美啪啪免费视频| 成人国产亚洲欧美成人综合网| 久久久久久蜜桃| 精品国产髙清在线看国产毛片 | 欧美大成色www永久网站婷| www.26天天久久天堂| 亚洲精品国产精品国自产观看| 日韩电影在线一区二区三区| 在线免费观看成年人视频| 欧美日韩亚洲一区二| 视频一区二区三区国产| 奇米成人av国产一区二区三区| 亚洲8888| 在线观看高清免费视频| 久久蜜桃av一区二区天堂| 男人日女人网站| 精品视频在线播放色网色视频| 岛国av免费在线观看| 欧美另类网站| 蜜桃一区二区三区四区| 人人澡人人澡人人看| 136国产福利精品导航| 国产精品高潮呻吟AV无码| 中文字幕亚洲欧美| 伊人国产精品| 成人午夜视频免费观看| 波多野结衣在线aⅴ中文字幕不卡| 日本一级黄色大片| 国产视频精品在线| 日韩成人亚洲| 中文字幕一区二区三区四区五区六区 | 成人性生生活性生交12| 91年精品国产| 国产剧情在线视频| 色嗨嗨av一区二区三区| 成人免费高清在线播放| 92福利视频午夜1000合集在线观看| 国产毛片精品| 久在线观看视频| 国产亚洲精品bt天堂精选| 日韩一级在线视频| 精品国偷自产在线视频99| 亚洲精品午夜| 久久精品午夜福利| 亚洲婷婷综合久久一本伊一区 | 一区二区三区视频免费| 国产三级在线免费| 国产精品久久久久久久久久小说 | 国产精品美女久久久久久久| 中文字幕一区二区在线视频| 欧美日本啪啪无遮挡网站| 亚洲警察之高压线| 亚洲高清av一区二区三区| 日韩欧美亚洲成人| 国产精品一区二区三区视频网站| 国产精品日本一区二区| 久久久天天操| 激情五月婷婷小说| 亚洲一区二区久久| 久久中文字幕导航| 免费av不卡在线| 欧美性猛交丰臀xxxxx网站| 成a人片在线观看| 水蜜桃一区二区|