精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用 Llama 3.2-Vision 多模態 LLM 和圖像“聊天”

人工智能
本文專注于了解如何在類似聊天的模式下本地構建 Llama 3.2-Vision,并在 Colab 筆記本上探索其多模態技能。

一、引言

將視覺能力與大型語言模型(LLMs)結合,正在通過多模態 LLM(MLLM)徹底改變計算機視覺領域。這些模型結合了文本和視覺輸入,展示了在圖像理解和推理方面的卓越能力。雖然這些模型以前只能通過 API 訪問,但最近的開放源代碼選項現在允許本地執行,使其在生產環境中更具吸引力。

在本教程中,我們將學習如何使用開源的 Llama 3.2-Vision 模型與圖像進行對話,您將對其 OCR、圖像理解和推理能力感到驚嘆。所有代碼都方便地提供在一個 Colab 筆記本中。

二、背景

Llama 是 “Large Language Model Meta AI” 的縮寫,是由 Meta 開發的一系列先進 LLM。其最新版本 Llama 3.2 引入了先進的視覺能力。視覺變體有兩種尺寸:11B 和 90B 參數,能夠在邊緣設備上進行推理。憑借高達 128k 的上下文窗口和對高達 1120x1120 像素的高分辨率圖像的支持,Llama 3.2 可以處理復雜的視覺和文本信息。

三、架構

Llama 系列模型是僅解碼器的 Transformer。Llama 3.2-Vision 基于預訓練的 Llama 3.1 純文本模型構建。它采用了標準的密集自回歸 Transformer 架構,與前代 Llama 和 Llama 2 沒有顯著偏離。

為了支持視覺任務,Llama 3.2 使用預訓練的視覺編碼器(ViT-H/14)提取圖像表示向量,并通過視覺適配器將這些表示集成到凍結的語言模型中。適配器由一系列交叉注意力層組成,允許模型專注于與正在處理的文本相對應的圖像部分 [1]。

適配器在文本-圖像對上進行訓練,以將圖像表示與語言表示對齊。在適配器訓練期間,圖像編碼器的參數會更新,而語言模型的參數保持凍結,以保留現有的語言能力。

Llama 3.2-Vision 架構。視覺模塊(綠色)集成到固定的語言模型(粉色)中

這種設計使 Llama 3.2 在多模態任務中表現出色,同時保持了強大的純文本性能。生成的模型在需要圖像和語言理解的任務中展示了令人印象深刻的能力,并允許用戶與其視覺輸入進行交互式通信。在了解了 Llama 3.2 的架構后,我們可以深入實際實現。但首先,我們需要做一些準備工作。

四、準備工作

在 Google Colab 上運行 Llama 3.2 — Vision 11B 之前,我們需要進行以下準備工作:

(1) GPU 設置:

  • 推薦使用至少 22GB VRAM 的高端 GPU 以實現高效推理 [2]。
  • 對于 Google Colab 用戶:導航到“運行時” > “更改運行時類型” > 選擇“A100 GPU”。請注意,高端 GPU 可能不適用于免費 Colab 用戶。

(2) 模型權限:在此處申請 Llama 3.2 模型的訪問權限。

(3) Hugging Face 設置:

  • 如果您還沒有 Hugging Face 賬戶,請在此處創建一個。
  • 如果您還沒有訪問令牌,請從您的 Hugging Face 賬戶生成一個。
  • 對于 Google Colab 用戶,在 Google Colab Secrets 中將 Hugging Face 令牌設置為名為“HF_TOKEN”的秘密環境變量。

(4) 安裝所需庫。

五、加載模型

在設置好環境和獲取必要權限后,我們將使用 Hugging Face Transformers 庫實例化模型及其關聯的處理器。處理器負責為模型準備輸入并格式化其輸出。

model_id = "meta-llama/Llama-3.2-11B-Vision-Instruct"

model = MllamaForConditionalGeneration.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto")

processor = AutoProcessor.from_pretrained(model_id)

1.期望的聊天模板

聊天模板通過存儲“用戶”(我們)和“助手”(AI 模型)之間的對話歷史來保持上下文。對話歷史被結構化為一個名為 messages 的列表,其中每個字典代表一個對話輪次,包括用戶和模型的響應。用戶輪次可以包括圖像-文本或純文本輸入,{"type": "image"} 表示圖像輸入。例如,經過幾次聊天迭代后,messages 列表可能如下所示:

messages = [
    {"role": "user",      "content": [{"type": "image"}, {"type": "text", "text": prompt1}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts1}]},
    {"role": "user",      "content": [{"type": "text", "text": prompt2}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts2}]},
    {"role": "user",      "content": [{"type": "text", "text": prompt3}]},
    {"role": "assistant", "content": [{"type": "text", "text": generated_texts3}]}
]

這個 messages 列表稍后會傳遞給 apply_chat_template() 方法,以將對話轉換為模型期望格式的單個可標記化字符串。

2.主函數

在本教程中,我提供了一個 chat_with_mllm 函數,該函數支持與 Llama 3.2 MLLM 進行動態對話。此函數處理圖像加載、預處理圖像和文本輸入、生成模型響應,并管理對話歷史以啟用聊天模式交互。

def chat_with_mllm (model, processor, prompt, images_path=[],do_sample=False, temperature=0.1, show_image=False, max_new_tokens=512, messages=[], images=[]):

    # Ensure list:
    if not isinstance(images_path, list):
        images_path =  [images_path]

    # Load images 
    if len (images)==0 and len (images_path)>0:
            for image_path in tqdm (images_path):
                image = load_image(image_path)
                images.append (image)
                if show_image:
                    display ( image )

    # If starting a new conversation about an image
    if len (messages)==0:
        messages = [{"role": "user", "content": [{"type": "image"}, {"type": "text", "text": prompt}]}]

    # If continuing conversation on the image
    else:
        messages.append ({"role": "user", "content": [{"type": "text", "text": prompt}]})

    # process input data
    text = processor.apply_chat_template(messages, add_generation_prompt=True)
    inputs = processor(images=images, text=text, return_tensors="pt", ).to(model.device)

    # Generate response
    generation_args = {"max_new_tokens": max_new_tokens, "do_sample": True}
    if do_sample:
        generation_args["temperature"] = temperature
    generate_ids = model.generate(**inputs,**generation_args)
    generate_ids = generate_ids[:, inputs['input_ids'].shape[1]:-1]
    generated_texts = processor.decode(generate_ids[0], clean_up_tokenization_spaces=False)

    # Append the model's response to the conversation history
    messages.append ({"role": "assistant", "content": [  {"type": "text", "text": generated_texts}]})

    return generated_texts, messages, images

六、與 Llama 對話

1. 蝴蝶圖像示例

在我們的第一個示例中,我們將與 Llama 3.2 討論一張孵化中的蝴蝶圖像。由于 Llama 3.2-Vision 在使用圖像時不支持系統提示,我們將直接在用戶提示中附加指令以指導模型的響應。通過設置 do_sample=True 和 temperature=0.2,我們允許輕微的隨機性,同時保持響應的一致性。對于固定答案,可以設置 do_sample=False。messages 參數(保存聊天歷史)最初為空,images 參數也是如此。

instructions = "Respond concisely in one sentence."
prompt = instructions + "Describe the image."

response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path],
                                             do_sample=True,
                                             temperature=0.2,
                                             show_image=True,
                                             messages=[],
                                             images=[])

# Output:  "The image depicts a butterfly emerging from its chrysalis, 
#           with a row of chrysalises hanging from a branch above it."

正如我們所見,輸出準確且簡潔,表明模型有效地理解了圖像。在下一個聊天迭代中,我們將傳遞一個新的提示以及聊天歷史(messages)和圖像文件(images)。新提示旨在評估 Llama 3.2 的推理能力:

prompt = instructions + "What would happen to the chrysalis in the near future?"
response, messages, images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.2,
                                             show_image=False,
                                             messages=messages,
                                             images=images)

# Output: "The chrysalis will eventually hatch into a butterfly."

我們在提供的 Colab 筆記本中繼續了這次對話,并獲得了以下對話內容:

對話突出了模型通過準確描述場景來理解圖像的能力。它還展示了其推理能力,通過邏輯連接信息,正確推斷出蛹會發生什么,并解釋了為什么有些是棕色的而有些是綠色的。

2. 表情包圖像示例

在這個示例中,我將向模型展示我自己創建的一個表情包,以評估 Llama 的 OCR 能力,并確定它是否理解我的幽默感。

instructions = "You are a computer vision engineer with sense of humor."
prompt = instructions + "Can you explain this meme to me?"


response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.5,
                                             show_image=True,
                                             messages=[],
                                             images=[])
instructions = "You are a computer vision engineer with sense of humor."
prompt = instructions + "Can you explain this meme to me?"


response, messages,images= chat_with_mllm ( model, processor, prompt,
                                             images_path=[img_path,],
                                             do_sample=True,
                                             temperature=0.5,
                                             show_image=True,
                                             messages=[],
                                             images=[])

這是輸入的表情包:

這是模型的響應:

正如我們所見,模型展示了出色的 OCR 能力,并理解了圖像中的文本含義。至于它的幽默感——你怎么看,它理解了嗎?你理解了嗎?

責任編輯:趙寧寧 來源: 小白玩轉Python
相關推薦

2024-12-17 08:05:34

大型語言模型MetaAILLM

2024-01-11 16:24:12

人工智能RAG

2025-01-08 08:21:16

2023-11-10 08:00:00

微服務架構開發

2024-12-18 18:57:58

2024-10-24 23:37:33

2023-12-07 12:05:39

2024-09-26 14:40:45

2025-05-06 08:40:00

2024-11-19 14:40:00

AI技術

2025-04-07 07:00:00

2024-09-26 17:54:10

2023-08-01 13:31:18

模型Alpacaicuna

2023-10-31 16:37:55

大型語言模型人工智能

2024-11-19 15:00:00

模型開源

2024-08-08 13:04:28

2023-12-25 09:07:50

AI人工智能Ferret

2023-07-10 13:46:58

PythonLlama.cppLLM

2025-07-24 02:00:00

2023-06-08 11:32:00

模型論文
點贊
收藏

51CTO技術棧公眾號

亚洲精品中文字幕99999| 91禁在线看| 黑人精品欧美一区二区蜜桃| 欧美福利在线观看| 在线 丝袜 欧美 日韩 制服| 福利一区视频| 一区二区三区久久久| 久久国产精品一区二区三区四区 | 国产精品18久久久| 午夜伦理精品一区| 亚洲精品自拍视频在线观看| 韩国成人在线| 国产喷白浆一区二区三区| 成人国产精品av| 蜜桃av.com| 高清日韩欧美| 欧美日韩激情在线| 91av资源网| h网站久久久| 国产精品一级片| 欧美一区二区视频97| 国产视频精品免费| 蜜桃成人av| 欧美亚洲精品一区| 日本手机在线视频| 免费在线你懂的| 97精品电影院| 国产精品电影一区| 亚洲欧美卡通动漫| 香蕉久久夜色精品国产更新时间| 欧美网站在线观看| 日韩高清国产精品| 污污视频在线观看网站| 国产精品一区在线观看乱码| 国产精品aaa| 日韩伦人妻无码| 亚洲精品中文字幕乱码| 国产一区二区三区四区福利| 西西大胆午夜视频| 99久久人爽人人添人人澡| 欧美日韩国产一区二区三区| 久久久久久久免费视频| 免费a级人成a大片在线观看| 国产亚洲va综合人人澡精品| 久久99精品久久久久久久久久| 日韩免费av网站| 91精品婷婷色在线观看| 中文字幕日韩在线观看| 精品人妻一区二区三区视频| 欧美韩一区二区| 亚洲第一偷拍网| 第一页在线视频| 久久青青视频| 欧美性感美女h网站在线观看免费| 亚洲人成77777| 国产理论电影在线观看| 国产精品一区二区三区网站| 国产日韩在线一区| 中文字幕一区二区三区精品| 国产精品大片免费观看| 欧美美女15p| 欧美成人精品欧美一级私黄| 美女久久久久| 日韩欧美国产小视频| 51自拍视频在线观看| 亚洲免费资源| 91精品国产入口| 青娱乐国产精品视频| 韩国三级大全久久网站| 日韩手机在线导航| av影片在线播放| 精品国产18久久久久久洗澡| 日韩av一区在线观看| 青青草视频播放| 国产精品国产三级在线观看| 一本色道综合亚洲| 日本三区在线观看| 巨大黑人极品videos精品| 7777精品伊人久久久大香线蕉完整版| 日日橹狠狠爱欧美超碰| 日本高清在线观看视频| 一区二区三区中文字幕| 一区二区三区不卡在线| 国产区高清在线| 国产精品视频观看| 玖玖精品在线视频| 思思99re6国产在线播放| 久久久亚洲精品石原莉奈| 成人黄色av网| 丰满人妻av一区二区三区| 91捆绑美女网站| 天堂一区二区三区| 九色网友自拍视频手机在线| 成人91在线观看| 日本不卡久久| 黄色免费在线播放| 亚洲日本欧美天堂| 日韩欧美国产免费| 国产欧美视频在线| 亚洲欧美视频在线| tube国产麻豆| 先锋a资源在线看亚洲| 91精品综合久久久久久五月天| 日本一区二区三区久久| 国产麻豆日韩欧美久久| 97人人模人人爽视频一区二区| 在线观看亚洲国产| av一二三不卡影片| 一区二区视频在线观看| 国产夫妻在线播放| 欧美日韩亚洲视频一区| 国产精品专区在线| 欧美性生活一级| 精品偷拍一区二区三区在线看| 一级特黄a大片免费| 久久中文字幕av一区二区不卡| 色哟哟网站入口亚洲精品| 国产wwwwxxxx| 老鸭窝91久久精品色噜噜导演| 性欧美视频videos6一9| 91精品国产乱码久久| 91视频国产观看| 欧美日韩午夜爽爽| 久久99国产精品二区高清软件| 欧美群妇大交群中文字幕| 成人免费无码大片a毛片| 伊人久久大香线| 国语自产精品视频在免费| 一级黄色免费看| 久久久久久久综合狠狠综合| 欧美一级免费播放| 美女精品视频在线| 日韩中文字幕亚洲| 波多野结衣电影在线播放| 99在线视频精品| av一区二区三区免费观看| 高端美女服务在线视频播放| 欧美一区二区黄| 99久久久无码国产精品不卡| 三级久久三级久久久| 久久另类ts人妖一区二区| 欧美高清另类hdvideosexjaⅴ| 精品美女永久免费视频| 免费在线观看日韩av| 蜜桃一区二区三区| 性欧美暴力猛交69hd| 亚洲国产精品一| 国产亚洲成aⅴ人片在线观看| 超薄肉色丝袜足j调教99| 欧美aaaaaa| 日韩视频免费在线观看| 久久精品偷拍视频| 欧美激情在线看| 亚洲狼人综合干| 日韩欧美精品综合| 国产又爽又黄的激情精品视频| 天天干,夜夜爽| 五月天欧美精品| 超碰人人草人人| 五月久久久综合一区二区小说| 国内精品久久久久久| 日韩专区第一页| 大荫蒂欧美视频另类xxxx| 人人妻人人澡人人爽人人精品| 欧美在线91| 国产精品免费一区二区| 久久国产精品一区| 日韩一级精品视频在线观看| 久久这里只有精品国产| 久久激五月天综合精品| 亚洲视频在线观看日本a| 欧美电影免费观看| 在线亚洲欧美视频| 91精品国产乱码久久| 久久精品这里都是精品| 一区二区三区网址| 91精品电影| 国产欧美日韩综合一区在线观看| 久久99精品久久久久久野外| 欧美一区二区免费视频| 日韩欧美不卡视频| 欧美国产欧美综合| 国产乱叫456| 亚洲经典三级| 神马影院我不卡午夜| 亚洲性色av| 最新69国产成人精品视频免费| 欧美a视频在线观看| 中文字幕乱码一区二区免费| 奇米777在线视频| 一区二区毛片| 综合久久国产| 欧美美女啪啪| 97碰碰碰免费色视频| 成人欧美一区| 精品伦理精品一区| 九九九免费视频| 国产亚洲综合在线| 欧美xxxx日本和非洲| 视频在线观看91| 男人天堂新网址| 日韩极品一区| 久久国产精品-国产精品| 亚洲美女色播| 日韩美女在线看| 日本中文字幕在线观看| 精品国产伦一区二区三区观看方式 | 亚洲欧美日韩精品在线| 国产精品色在线网站| 国产精品无码专区在线观看| av男人的天堂在线观看| 日韩中文字幕在线观看| 色视频在线观看| 日韩免费高清av| 日本天堂在线视频| 中文字幕制服丝袜一区二区三区| 亚洲高清视频免费| 久久久久久一区二区| 久久综合久久网| 国产精品88久久久久久| 日本一区二区三区四区高清视频 | 中文字幕一区二区三区在线不卡| 日本三级黄色网址| 翔田千里一区二区| 999一区二区三区| 少妇久久久久| 粉嫩精品一区二区三区在线观看| 日本蜜桃在线观看视频| 永久免费精品影视网站| 国产精品无码白浆高潮| 欧美影院午夜播放| 黄色片中文字幕| 亚洲欧洲av另类| 成人激情五月天| 91免费在线播放| 欲求不满的岳中文字幕| 日本中文字幕一区二区有限公司| 大地资源第二页在线观看高清版| 99re8这里有精品热视频免费 | 日韩一区国产二区欧美三区| 中文字幕日本人妻久久久免费 | 成人免费看片视频在线观看| 女同一区二区三区| 国产偷国产偷亚洲高清97cao| 台湾成人免费视频| 国产不卡精品视男人的天堂| 亚洲国产成人二区| 欧美中文字幕精品| 成人午夜视屏| 日韩美女视频免费在线观看| 外国成人直播| 国产精品久久久久久久app | 国产精品99导航| 色yeye免费人成网站在线观看| 日韩av网址在线| 国内精品久久久久久久久久| 91九色02白丝porn| 无码人妻精品一区二| 欧美综合在线视频| 伊人精品在线视频| 欧美一区二区在线免费播放| 国产精华7777777| 欧美婷婷六月丁香综合色| 久久精品视频国产| 亚洲欧洲韩国日本视频| 欧美日韩综合一区二区| 一区二区三区四区激情| 国产精品视频在| 亚洲欧美视频在线观看视频| 欧美偷拍第一页| 亚洲国产日日夜夜| 全程偷拍露脸中年夫妇| 亚洲第一精品在线| 国产视频1区2区| 欧美日韩国产bt| www国产在线| 亚洲毛茸茸少妇高潮呻吟| h视频网站在线观看| 欧美精品在线第一页| 国产h片在线观看| 国产精品91免费在线| 久久丁香四色| 精品日本一区二区| 精品日韩毛片| 女女百合国产免费网站| 麻豆精品网站| 在线观看视频在线观看| 91丨porny丨国产| 国产探花在线视频| 午夜视频在线观看一区二区| 欧美男人天堂网| 日韩欧美亚洲一区二区| 欧美一区二区视频| 久久大大胆人体| 涩涩在线视频| 91九色国产社区在线观看| 日韩大片在线免费观看| 中文精品一区二区三区| 99热精品在线观看| 亚洲最大天堂网| 91麻豆6部合集magnet| 欧美国产日韩综合| 欧美视频一区在线| 91黄色在线视频| 精品视频久久久久久久| www在线观看播放免费视频日本| 精品视频9999| 三级成人在线| 国产女人18毛片水18精品| 欧美网色网址| 麻豆传媒网站在线观看| 日韩电影在线一区二区三区| 日本一卡二卡在线| 亚洲精品v日韩精品| 国产乱码在线观看| 日韩久久免费视频| 91豆花视频在线播放| 91网免费观看| 日本一区福利在线| 国产精品国三级国产av| 久久精品国产99国产| 国产精品久久久久久久99| 久久精品日韩一区二区三区| 国产乡下妇女做爰毛片| 日韩欧美国产一区二区在线播放| 五月婷婷在线播放| 欧美日本中文字幕| 国产精品亚洲综合在线观看| 少妇免费毛片久久久久久久久| 伊人青青综合网| 粉色视频免费看| 欧美国产乱子伦 | 日韩av无码一区二区三区不卡| 久久亚洲一级片| 日韩久久久久久久久| 亚洲精品一区二区三区精华液 | 亚洲精品自拍偷拍| 日韩精品黄色| 国产精品福利网站| 国产成人av| 精品久久久噜噜噜噜久久图片| 国产成人aaa| 日韩一区二区a片免费观看| 狠狠色香婷婷久久亚洲精品| 天堂中文资源在线观看| 久久久亚洲国产| 美女视频亚洲色图| 成年人视频观看| 激情文学综合插| www.超碰在线观看| 日韩精品中文字幕一区二区三区| 黄色软件在线| 国产精品久久久久aaaa九色| 欧美艳星介绍134位艳星| 激情综合网俺也去| 国产精品女主播在线观看| 911美女片黄在线观看游戏| 日韩在线视频网| 精品国产一区二区三区2021| 日本一区二区久久精品| 蜜桃91丨九色丨蝌蚪91桃色| 欧美性生给视频| 日韩欧美在线网站| 成年网站在线视频网站| 久久国产欧美精品| 激情综合久久| 日韩av一二区| 欧美性做爰猛烈叫床潮| 黄色网在线看| 国产成人精品免费视频大全最热 | 在线电影av不卡网址| 激情中国色综合| 日本一道在线观看| 久久精品国产网站| 亚洲自拍偷拍图| 欧美人狂配大交3d怪物一区| www.亚洲免费| 成人黄色生活片| 99精品综合| 久久久精品人妻一区二区三区| 中文字幕中文字幕在线一区| 国产乱淫片视频| 国外成人免费在线播放| av亚洲免费| 佐佐木明希电影| 日本电影亚洲天堂一区| 国产高清免费av在线| 亚洲影院高清在线| 99久久久久国产精品| zjzjzjzjzj亚洲女人| 日本道色综合久久| 国产视频福利在线| 97欧洲一区二区精品免费| 久久精品123| 精品99久久久久成人网站免费| 日韩精品综合一本久道在线视频| a免费在线观看| 蜜桃狠狠色伊人亚洲综合网站| 午夜在线播放视频欧美| 人妻人人澡人人添人人爽|