精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM2CLIP:使用大語言模型提升CLIP的文本處理,提高長文本理解和跨語言能力

人工智能
在人工智能迅速發展的今天,多模態系統正成為推動視覺語言任務前沿發展的關鍵。CLIP(對比語言-圖像預訓練)作為其中的典范,通過將文本和視覺表示對齊到共享的特征空間,為圖像-文本檢索、分類和分割等任務帶來了革命性突破。

在人工智能迅速發展的今天,多模態系統正成為推動視覺語言任務前沿發展的關鍵。CLIP(對比語言-圖像預訓練)作為其中的典范,通過將文本和視覺表示對齊到共享的特征空間,為圖像-文本檢索、分類和分割等任務帶來了革命性突破。然而其文本編碼器的局限性使其在處理復雜長文本和多語言任務時顯得力不從心。

大型語言模型(LLM),如 GPT-4 和 LLaMA,則展示了卓越的語言理解和生成能力。這種強大的語言能力能否與 CLIP 結合,解決其文本編碼器的短板?微軟團隊提出的 LLM2CLIP 框架便是這一創新的成果。

該論文提出了一種創新的方法,通過將 LLM 強大的語言知識與 CLIP 的視覺能力相結合,顯著提升多模態任務的性能。通過整合 LLM 和 CLIP,LLM2CLIP 解決了傳統 CLIP 在文本理解、語言支持和任務泛化方面的瓶頸。

方法創新

字幕對比微調(Caption Contrastive Fine-tuning)

  • 核心問題:LLM 的原生文本特征缺乏區分性,難以直接用于多模態任務。
  • 創新點:通過監督對比損失函數,將同一圖像的字幕作為正樣本,將其他字幕作為負樣本,從而顯著增強 LLM 的文本編碼能力。

凍結 LLM 梯度

  • 目的:保留 LLM 的開放世界知識,降低計算成本。
  • 方法:僅微調適配器和投影層,實現多模態對齊。

高效訓練策略

  • 使用 LoRA 技術進行輕量級訓練,在計算資源有限的情況下優化模型性能。
  • 預提取文本特征,減少推理階段的計算負擔。

開放世界知識的利用

  • LLM 的廣泛訓練語料使其能夠處理復雜字幕,甚至支持多語言任務。

LLM2CLIP 的關鍵特性

  1. 增強文本理解:LLM2CLIP 能夠處理超過 CLIP 原生限制的長文本和復雜描述。
  2. 跨語言支持:通過 LLM 的知識遷移,即使僅使用英語數據訓練,仍可在中文等多語言任務中實現卓越表現。
  3. 高效計算:通過凍結梯度和輕量級適配器優化計算開銷。

詳細改進描述

處理長字幕和復雜文本: LLM 的更大的上下文窗口和更強的語言理解能力使得 LLM2CLIP 能夠有效地處理長字幕和復雜文本,而無需像之前的工作那樣進行文本截斷或分段。

融入開放世界知識: LLM 在大規模文本語料庫上進行預訓練,因此擁有豐富的開放世界知識。LLM2CLIP 將這些知識融入到 CLIP 的視覺表示中,從而提高了其在各種下游任務中的性能。

跨語言能力: LLM2CLIP 的跨語言能力使其成為構建多語言多模態系統的強大工具,無需為每種語言單獨訓練模型。

高效訓練: 通過凍結 LLM 的權重和預先提取文本特征,LLM2CLIP 的訓練成本與微調原始 CLIP 模型相當。

實驗結果

結果展示

LLM2CLIP 在多個基準測試中表現優異,在短文本、長文本以及跨語言任務中的性能顯著提升,尤其在中文任務中,其表現甚至超越了專用中文數據集訓練的模型。

  • 圖像-文本檢索 (I2T 和 T2I): 在 Flickr30k、COCO、ShareGPT4V、Urban-1k 和 DOCCI 等數據集上進行評估。
  • 跨語言圖像-文本檢索:  在 Flickr30K-CN 和 COCO-CN 數據集上進行評估。
  • 視覺問答 (VQA): 使用 LLaVA 1.5 框架進行評估。
  • 字幕檢索準確率 (CRA):  用于評估文本模型區分字幕的能力。

如何開始使用 LLM2CLIP

以下是快速上手 LLM2CLIP 的完整代碼教程:

1. 安裝依賴環境

pip install llm2vec
 git clone https://github.com/microsoft/LLM2CLIP.git && cd LLM2CLIP
 pip install -r requirements.txt

2. 配置 Jupyter Notebook

如果需要交互式環境:

conda install -c conda-forge --override-channels notebook
 conda install -c conda-forge --override-channels ipywidgets -y jupyter notebook

3. 導入必要庫

from PIL import Image
 from transformers import AutoModel, AutoConfig, AutoTokenizer
 from transformers import CLIPImageProcessor
 import torch
 from llm2vec import LLM2Vec

4. 加載模型

# 圖像處理器
 processor = CLIPImageProcessor.from_pretrained("openai/clip-vit-large-patch14-336")
 
 # 加載 CLIP 模型
 model_name_or_path = "microsoft/LLM2CLIP-Openai-L-14-336"
 model = AutoModel.from_pretrained(
     model_name_or_path,
     torch_dtype=torch.float16,
     trust_remote_code=True
 ).to('cuda').eval()
 
 # 加載微調后的 LLM 模型
 llm_model_name = 'microsoft/LLM2CLIP-Llama-3-8B-Instruct-CC-Finetuned'
 config = AutoConfig.from_pretrained(llm_model_name, trust_remote_code=True)
 llm_model = AutoModel.from_pretrained(llm_model_name, config=config, trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained(llm_model_name)
 
 # 初始化 LLM2Vec
 l2v = LLM2Vec(llm_model, tokenizer, pooling_mode="mean", max_length=512, doc_max_length=512)

5. 圖像和字幕預處理

captions = ["a diagram", "a dog", "horses"]
 image_path = "path_to_image/horses.png"
 
 image = Image.open(image_path)
 input_pixels = processor(images=image, return_tensors="pt").pixel_values.to('cuda')

6. 提取特征并匹配字幕

with torch.no_grad(), torch.cuda.amp.autocast():
     image_features = model.get_image_features(input_pixels)
     text_features = l2v.encode(captions, convert_to_tensor=True).to('cuda')
     text_features = model.get_text_features(text_features)
 
     # 歸一化特征
     image_features /= image_features.norm(dim=-1, keepdim=True)
     text_features /= text_features.norm(dim=-1, keepdim=True)
 
     # 計算匹配概率
     text_probs = (100.0 * image_features @ text_features.T).softmax(dim=-1)
 
 print("匹配結果:", text_probs)

輸入圖像為上面的馬照片時,輸出為:

匹配結果: tensor([[3.425e-08, 1.0911e-06, 1.000e+00]], device='cuda:0')

這表明模型預測圖像對應的字幕為“horses”,匹配概率為 100%。

再試一張更復雜的圖片:

captions = ["a sunset over a mountain range", "a group of people hiking on a trail", "a peaceful lake surrounded by trees"]
 image_path = "hiking_trail.jpg"
 
 image = Image.open(image_path)
 input_pixels = processor(images=image, return_tensors="pt").pixel_values.to('cuda')
 
 with torch.no_grad(), torch.cuda.amp.autocast():
    image_features = model.get_image_features(input_pixels)
    text_features = l2v.encode(captions, convert_to_tensor=True).to('cuda')
    text_features = model.get_text_features(text_features)
 
    image_features /= image_features.norm(dim=-1, keepdim=True)
    text_features /= text_features.norm(dim=-1, keepdim=True)
 
    text_probs = (100.0 * image_features @ text_features.T).softmax(dim=-1)
 
 print("Label probs:", text_probs)

輸出為:

匹配結果:: tensor([[1.122e-06, 9.998e-01, 1.243e-04]], device='cuda:0')

模型可以匹配出更準確的文字。

總結

LLM2CLIP 為多模態學習提供了一種新的范式,通過整合 LLM 的強大功能來增強 CLIP 模型。其在圖像-文本檢索、跨語言應用和長文本理解方面的出色性能,突顯了其作為構建更強大、更通用的多模態系統的潛力。未來的研究可以進一步探索 LLM2CLIP 在更廣泛的應用場景中的潛力,例如視頻理解、多模態對話和具身智能。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2024-11-27 14:00:00

模型訓練

2024-11-06 17:04:47

AWK編程

2024-09-12 17:39:27

2024-04-01 07:25:00

AI框架

2013-10-30 10:35:29

Linux命令文本處理

2010-07-21 10:05:13

Perl文本處理模塊

2024-12-30 13:13:35

2013-08-20 16:14:46

pythonpython文本處理

2021-01-28 08:12:15

Linux命令技巧

2017-03-02 18:10:20

LinuxShell命令

2024-01-11 16:24:12

人工智能RAG

2025-05-29 08:30:00

LLM大語言模型AI

2023-03-19 17:21:31

CLIP架構人工智能

2024-04-12 12:14:39

Rust字符串代碼

2010-01-06 17:12:26

.Net Framew

2023-09-27 07:39:57

大型語言模型MiniGPT-4

2023-01-03 15:42:29

機器學習視頻搜索

2025-04-29 09:21:00

2025-07-03 09:49:43

2023-04-27 13:46:08

語言模型ChatGPT人工智能
點贊
收藏

51CTO技術棧公眾號

亚洲永久精品视频| аⅴ天堂中文在线网| 黄在线观看免费网站ktv| 久久综合久久综合亚洲| 国产精自产拍久久久久久| 蜜臀av午夜精品久久| 精品亚洲精品| 欧美日韩精品一区二区在线播放| 亚洲精品国产suv一区88| 偷拍自拍在线| 国产精品一区二区不卡| 热草久综合在线| 国产一区二区视频在线观看免费| 免费毛片在线不卡| 日韩精品一区二区三区在线 | 天堂网在线最新版www中文网| 国产精品麻豆欧美日韩ww| 国产精品久久7| 又骚又黄的视频| 一本一本久久| 九九热最新视频//这里只有精品| 欧洲av一区二区三区| 豆花视频一区二区| 欧美一区在线视频| 男操女免费网站| 欧美男人天堂| 亚洲一区二区欧美日韩| 在线观看成人av| 精品少妇人妻一区二区黑料社区 | 高清免费电影在线观看| 91麻豆成人久久精品二区三区| 91久久精品日日躁夜夜躁国产| 成人免费a视频| 欧美私人啪啪vps| 久久精品视频网站| 手机看片日韩av| 中文字幕中文字幕精品| 亚洲成人精品视频| 国产精品一区二区在线免费观看| 国产精品视频一区二区三区综合| 欧美性一级生活| 国产福利一区视频| 黑人巨大精品| 色狠狠一区二区| www.99热这里只有精品| 538在线视频| 亚洲一区二区三区四区五区中文| a级网站在线观看| 免费在线观看黄色| 中文字幕一区二区三区四区不卡 | 91久久久精品| 国产一区二区三区在线观看| 美女视频黄久久| 国产免费一区二区三区在线能观看| 亚洲中文一区二区| 日韩av在线免费观看不卡| 日本久久久久久| 无码一区二区三区| 麻豆视频观看网址久久| 成人福利网站在线观看11| 国产熟女精品视频| 国产成人在线网站| 国产女人水真多18毛片18精品| 日韩一级免费毛片| 91毛片在线观看| 欧美在线播放一区| 丝袜美腿美女被狂躁在线观看| 国产精品高清亚洲| 日本一级黄视频| heyzo高清在线| 欧美日韩中文字幕在线| 看欧美ab黄色大片视频免费| 精品福利在线| 欧美一区二区在线视频| 荫蒂被男人添免费视频| 免费电影一区二区三区| 在线精品高清中文字幕| 麻豆天美蜜桃91| 99精品视频免费观看视频| 国产97色在线| 国产国语亲子伦亲子| 成人福利视频在线看| 欧美乱偷一区二区三区在线| 日本福利专区在线观看| 亚洲永久精品大片| 日本a在线免费观看| 国产日韩电影| 日韩欧美你懂的| 加勒比一区二区| 国产精品精品国产一区二区| 午夜精品福利在线观看| 国产精品自拍第一页| 国产裸体歌舞团一区二区| 精品国产乱码久久久久久丨区2区| 免费一级在线观看| 亚洲精品久久久蜜桃| 久草资源站在线观看| 日韩三级一区| 精品视频偷偷看在线观看| 粉嫩精品久久99综合一区| 亚洲私人影院| 国产一区二区色| 免费黄网站在线观看| 亚洲精品乱码久久久久久黑人| 免费高清在线观看免费| 欧美国产中文高清| 在线观看欧美日韩国产| 日韩精品一区二区三| 精品一二三四在线| 欧美大香线蕉线伊人久久| 国产激情视频在线观看| 色就色 综合激情| 玖玖爱在线精品视频| 一区二区日韩欧美| 国产精品久久久久久超碰| 亚洲欧美日韩成人在线| 亚洲最新视频在线播放| 午夜视频在线观| 欧美精品一区二区久久| 97久久精品视频| 亚洲av无码乱码在线观看性色| 国产精品久久久99| 成年人视频在线免费| 欧美挤奶吃奶水xxxxx| 欧美黑人xxx| 国产精品久久久久久免费免熟| 国产情人综合久久777777| 大陆极品少妇内射aaaaa| 91蜜桃臀久久一区二区| 萌白酱国产一区二区| 亚洲天堂网在线视频| 国产女同性恋一区二区| 精品久久久久久无码国产| 米奇精品关键词| 久久久久久久香蕉网| 国产xxxxxx| 亚洲免费资源在线播放| 操人视频免费看| 中文视频一区| 99热在线播放| 少妇av在线| 日韩欧美国产高清| 久久网一区二区| 国产成人综合自拍| 美女av免费观看| jazzjazz国产精品麻豆| 久久久亚洲网站| 婷婷五月综合久久中文字幕| 午夜伊人狠狠久久| 国产激情第一页| 国产精品久久久亚洲一区| 麻豆av一区二区三区| 成人直播视频| 在线观看亚洲区| 一区二区三区日| 亚洲日本在线a| 久久久久亚洲av无码网站| 黄色免费成人| 久久久久久九九九九| 欧美freesex| 在线观看中文字幕亚洲| 国产欧美熟妇另类久久久| 一区二区在线观看免费视频播放| 中文字幕av一区二区三区人妻少妇| 欧美一区二区三区久久精品| 91久久大香伊蕉在人线| 三级在线看中文字幕完整版| 亚洲天堂日韩电影| 在线观看国产一区二区三区| 亚洲精品久久久久久国产精华液| 中国黄色片视频| 视频一区视频二区中文| 亚洲自拍的二区三区| 日韩中文字幕视频网| 欧美性视频网站| 在线a人片免费观看视频| 日韩欧美综合在线| 国产精品一区二区三区四| 国产精品色在线观看| 无套内谢丰满少妇中文字幕| 国产日韩亚洲| 亚洲欧美综合一区| 大型av综合网站| 91av在线播放视频| 日本不卡三区| 亚洲精品久久久久久久久| 中文字幕无线码一区| 亚洲一区中文日韩| 9.1片黄在线观看| 不卡的av在线播放| 最新天堂中文在线| a91a精品视频在线观看| 亚洲一区在线直播| 精品亚洲精品| 亚洲一区二区在线播放| 日本高清不卡一区二区三区视频| 久久国产精品影片| 国产69精品久久app免费版| 欧美大片日本大片免费观看| 中文字幕免费高清网站| 亚洲一区二区欧美日韩 | 涩涩视频在线观看免费| 91精品在线麻豆| 免费看一级视频| 亚洲国产精品综合小说图片区| 午夜影院黄色片| 97久久精品人人做人人爽50路| 成人不卡免费视频| 老司机久久99久久精品播放免费| av 日韩 人妻 黑人 综合 无码| 精品久久影院| 欧美日韩成人一区二区三区| 高清精品视频| 91视频8mav| 国产福利一区二区三区在线播放| 欧美中文字幕精品| 毛片在线导航| 五月天欧美精品| 欧美国产在线观看| 色噜噜狠狠色综合网图区| 四虎精品永久在线| 亚洲综合网站在线观看| 粉嫩av性色av蜜臀av网站| 国产三级精品三级| 免费看黄色aaaaaa 片| 高清国产午夜精品久久久久久| 污网站在线免费| 蜜桃久久av一区| 8x8x最新地址| 日韩高清一区在线| 日本新janpanese乱熟| 亚洲作爱视频| 女人天堂av手机在线| 亚洲福利精品| 97超碰在线人人| 伊人成人网在线看| 国产va亚洲va在线va| 亚洲性视频h| 成人免费在线网| 亚洲精品男同| 久久综合色视频| 国产农村妇女毛片精品久久莱园子 | avav在线看| 国产日韩欧美三区| 波多野结衣乳巨码无在线| 9色精品在线| 99蜜桃臀久久久欧美精品网站| 99xxxx成人网| 久久久久久久久久久久久国产精品 | 丰满饥渴老女人hd| 国产成人在线看| www.555国产精品免费| 成人免费视频视频在线观看免费| 久草免费资源站| kk眼镜猥琐国模调教系列一区二区| 亚洲成年人在线观看| 99久免费精品视频在线观看 | 国产精品久久夜| 午夜精品一区二区三级视频| 综合久久综合久久| 久久亚洲av午夜福利精品一区| 午夜精品成人在线视频| 好看的av在线| 欧美亚洲国产一区二区三区 | 成人软件在线观看| 国产精品一二三视频| 日本精品视频| 精品视频一区在线| jizzjizz欧美69巨大| 91免费网站视频| 一区精品久久| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 亚洲综合色视频| 欧美一级特黄视频| 欧美日韩一区二区三区高清| a天堂在线视频| 亚洲欧美精品在线| 求av网址在线观看| 午夜欧美不卡精品aaaaa| 欧美大片免费高清观看| 亚洲伊人成综合成人网| 欧美深夜视频| 亚洲一区在线免费| 亚洲色诱最新| 四虎成人在线播放| 91美女片黄在线观看91美女| 亚洲欧美另类日本| 午夜精品久久久久久久久| 夜夜狠狠擅视频| 日韩精品视频在线| 麻豆av在线导航| 欧美在线一区二区视频| 国产在线一区不卡| 欧洲亚洲一区二区| 欧美日韩亚洲一区在线观看| 成人免费视频久久| 成人午夜看片网址| 精品亚洲乱码一区二区| 欧美日韩在线影院| 国产黄a三级三级看三级| 亚洲香蕉伊综合在人在线视看| 久久亚洲资源| 91免费福利视频| 精品一区二区三| 国产素人在线观看| 国产精品一区二区免费不卡| 亚洲欧美视频在线播放| 一区二区三区中文在线| 真实新婚偷拍xxxxx| 亚洲精品二三区| 9191在线播放| 国产日韩视频在线观看| 蜜乳av综合| 欧美 日本 亚洲| 国产传媒日韩欧美成人| 国产人与禽zoz0性伦| 日本道色综合久久| 香蕉视频911| 久久久久久久久电影| 精品视频在线观看免费观看 | 在线免费观看麻豆| 亚洲高清视频的网址| www.亚洲黄色| 久久精品99国产精品酒店日本 | 黄网站在线免费看| 国产精品视频免费在线| 日韩小视频网站| 国产xxx精品视频大全| 成人在线观看小视频| 欧美高清你懂得| 中国日本在线视频中文字幕| 国产精品欧美日韩一区二区| 伊人久久大香线蕉综合网站| 99久久国产综合精品五月天喷水| 国产成人免费在线观看不卡| av激情在线观看| 欧美一区二区视频在线观看2022| 香蕉视频免费在线播放| 国产欧美一区二区三区在线看| 欧美老女人另类| 我要看一级黄色大片| 中文一区一区三区高中清不卡| 中文字幕激情视频| 中文字幕在线亚洲| 亚洲电影二区| 欧美一级黄色录像片| 国产一区亚洲一区| 男的操女的网站| 日本美女在线中文版| 成人性生交大片免费看小说 | 中文字幕亚洲区| 在线不卡免费视频| 久久的精品视频| 涩爱av色老久久精品偷偷鲁| 国产欧美日韩小视频| 91色在线porny| 精品一区二三区| 色偷偷综合社区| 欧美日韩国产一区二区在线观看| 国产精品啪啪啪视频| av电影在线观看一区| 免费的毛片视频| 色偷偷av亚洲男人的天堂| 精品中文在线| 青青青国产在线观看| 久久久不卡网国产精品二区| 夜夜躁狠狠躁日日躁av| 美女久久久久久久久久久| 久久久久影视| www.色偷偷.com| 一区二区三区在线视频观看58| 黄色a在线观看| 国产精品福利在线观看| 中文字幕一区二区三三| 奇米777第四色| 欧美色男人天堂| 欧洲精品二区| 日本一区二区三不卡| 国产一区二区三区不卡在线观看| 日本一级黄色大片| 中文字幕久久精品| 99a精品视频在线观看| 日本va中文字幕| 亚洲永久精品大片| 东热在线免费视频| 99久久伊人精品影院| 久久只有精品| 久久黄色免费网站| 一本色道久久88综合亚洲精品ⅰ | 亚洲成人a级片| 国内自拍在线观看| 亚洲私人影院在线观看| 日本一本草久在线中文| 91久久精品美女高潮| 日日欢夜夜爽一区| 国产精选第一页| 久久精品久久久久| 欧美猛男做受videos| av在线播放网址| 欧美一级一级性生活免费录像|