精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態模型結構與訓練總結

人工智能
看了這么多多模態基座模型,今天來對多模態結構和訓練流程做個總結。

01、模型結構

圖片

一般的多模態模型架構包含5個部分,分別是:模態編碼器、輸入映射器、大模型骨干、輸出映射器以及模態生成器。

模態編碼器(Modality Encoder, ME)

將多種模態輸入圖片編碼成特征表示圖片,公式如下

圖片

X表示模態,圖片表示各種預訓練好的編碼器。

目前模態主要分為:視覺模態、語音模態、3D點云模態,其中視覺模態主要包括圖像和視頻,對于視頻,視頻通常被均勻采樣成5幀圖像,然后進行與圖像相同的預處理。各模態常用的編碼器如下:

圖像編碼器(Image Encoder)

  • NFNet-F6:這是一個無歸一化(normalizer-free)的ResNet變體,它使用了自適應梯度裁剪技術,允許在大量增強的數據集上進行訓練,同時保持了高水平的圖像識別性能。
  • ViT(Vision Transformer):ViT將Transformer架構應用于圖像,通過將圖像分割成小塊(patches),然后進行線性投影和多層Transformer編碼來處理圖像。
  • CLIP ViT:CLIP(Contrastive Language-Image Pre-training)結合了文本和圖像,通過對比學習優化ViT,將成對的文本和圖像視為正樣本,其他視為負樣本。
  • Eva-CLIP ViT:Eva-CLIP是CLIP的穩定版本,它通過對比學習優化了大規模CLIP的訓練和優化過程,為擴展和加速昂貴的多模態基礎模型訓練提供了新的方向。

視頻編碼器(Video Encoder):

  • UL2:UL2(Universal Language Model 2)是一個編碼器-解碼器模型,它使用混合去噪目標進行訓練,適用于視頻內容的理解。

音頻編碼器(Audio Encoder):

  • C-Former:C-Former使用CIF(Cross-Information Flow)對序列進行轉錄,并結合Transformer提取音頻特征。
  • HuBERT:HuBERT是一個自監督的語音表示學習框架,基于BERT,通過預測離散隱藏單元的掩蔽來實現。
  • BEATs:BEATs是一個迭代的音頻預訓練框架,旨在從音頻Transformer中學習雙向編碼器表示。
  • Whisper:Whisper是一個大型的自監督語音識別模型,它使用大量的未標記數據進行訓練。

3D點云編碼器(3D Point Cloud Encoder)

  • ULIP-2:ULIP-2(Universal Language Image Pre-training 2)是一個點云編碼器,它結合了PointBERT作為其主干,用于處理3D點云數據。

輸入映射器(Input Projector, IP)

將模態編碼器輸出的特征圖片與文本特征空間TT對齊,以便輸入到LLM主干。

圖片為輸入映射器,圖片為映射后的特征向量,即:

圖片

給定模態-文本數據集圖片,通過如下目標函數實現特征對齊:

圖片

典型的輸入映射器如下:

  • 線性投影器(Linear project)或多層感知機(MLP),現在多模態大模型中最常用的輸入映射方式。
  • 交叉注意力(Cross-Attention):使用一組可訓練的向量作為query, 將編碼的模態特征圖片作為key,將其壓縮為固定長度的特征表示。壓縮后的特征表示隨后直接輸入到LLM主干,或者用于與其他模態的交叉注意力融合。
  • Q-Former:從模態編碼器的輸出特征圖片中提取相關特征圖片,并將這些特征用作LLM主干的輸入。Q-Former通常需要一個單獨的預訓練過程來初始化。
  • P-Former:生成“參考提示”(reference prompts),對Q-Former產生的提示施加對齊約束,同樣需要一個單獨的預訓練過程。

大模型骨干(LLM Backbone)

處理來自不同模態的表示,進行語義理解、推理和決策。

LLM主干通常是基于預訓練的文本模型,能夠處理多種模態的輸入,并生成文本輸出 t 和其他模態的信號Token圖片,指導模態生成器產生相應的多模態內容。

對于其他模態的信號Token 圖片,如果用于生成多模態內容,其生成過程可表示為:

圖片

圖片表示其他模態的對其表征,可以看做LLM的軟Prompt-tuning。

典型的LLM包括:Flan-T5、ChatGLM、UL2、Qwen、Chinchilla、OPT、PaLM、LLaMA、LlaMA2、Vicuna等。

輸出映射器(Output Projector, OP)

輸出映射器將LLM主干產生的信號Token圖片映射成模態生成器可以理解的特征,通常由Tiny Transformer或MLP實現。

圖片為輸出映射器,映射過程即:

圖片

在這一過程中,為了促進映射后特征圖片的對齊,通過如下目標函數最小化圖片和模態生成器的條件文本表示之間的距離,即:

圖片

圖片為模態生成器中的文本條件編碼器。

模態生成器(Modality Generator,MG)

模態生成器根據LLM主干的輸出從而實現不同模態的輸出,如對于圖像,可以使用基于擴散模型(如Stable Diffusion)的生成器;對于視頻,可以使用基于時間序列的生成器(如Zeroscope);對于音頻,可以使用基于音頻變換器的生成器(如AudioLDM)。

由輸出映射器映射的特征圖片充當去噪過程中的條件輸入,為了生成特定模態的內容,模態生成器首先需要將真實內容轉換為潛在特征圖片。這一步通過預訓練的變分自編碼器(VAE)完成。接著,向圖片添加噪聲 ? 以獲取帶有噪聲的潛在特征圖片。之后,通過一個預訓練的U-Net模型計算出預測的噪聲圖片,并基于此計算模態生成器的損失函數。該損失函數定義如下:

圖片


02、模型訓練

在訓練過程中,輸入和輸出映射器通常是輕量級組件,而LLM主干則是模型的核心,通常保持凍結狀態,以減少訓練成本。通過這種方式,MM-LLMs能夠在保持高效訓練的同時,實現對多模態任務的強大支持。

LMM訓練考慮要素

  • 圖像分辨率
    更高的圖像分辨率可以包含更詳細的視覺特征,有利于需要細粒度信息的任務。像LLaVA-1.5和VILA采用336*336分辨率,Qwen-VL和MiniGPT-v2采用448*448分辨率。
    大分辨率帶來的較長的詞元序列,需要額外的訓練和推理代價。MiniGPT-v2通過拼接4個相鄰的視覺詞元,降低詞元序列的長度。Monkey方法提出了增強輸入圖像分辨率而無需重訓練高分辨率的視覺編碼器模型的方法,使用低分辨率編碼器,可以處理1300*800的圖像。DocPedia方法,為了增強富文本圖像、表格和文檔的理解, 將視覺編碼器分辨率增強到25602560。
  • 高質量SFT數據
    高質量SFT數據可顯著提升特定任務的性能。
  • 在LLM骨干進行執行PEFT, 可以提升深度嵌入對齊能力,對ICL重要
  • 交替文本-圖像數據更好,而僅圖像文本對則是次優的
  • 在SFT中,重新混合僅文本的指令數據 與圖文數據(如非自然語言指令),不僅可以解決僅文本任務的性能下降,也正提升視覺語言任務的準確性。

多模態大模型的訓練主要分為兩個階段:多模態預訓練(MM PT, MultiModal Pre-Training)和多模態指令微調(MM IT, MultiModal Instruction Tuning)

多模態預訓練

預訓練階段,采用數據集,輸入和輸出映射器用于實現不同模態之間的對齊,對于LLM Backbone有時使用PEFT訓練。

對于多模態理解模型,只優化文本生成損失;對于多模態生成模型,需要優化文本生成損失、模態生成損失和輸出對齊損失。

典型的數據集包括:圖像-文本、視頻-文本、語音-文本等,其中圖像文本包含兩種,分別是圖像文本(<img1><txt1>)和交替圖像文本(<img1><txt1><txt2><img3><txt3>)。

多模態指令微調

這一階段,通過指令格式化的數據集對預訓練的MM-LLM進行微調,以提高模型遵循新指令的能力,增強其在未見任務上的性能。

指令微調包括監督微調(SFT)和人類反饋強化學習(RLHF),增強多模態大模型的交互能力,顯著改善零樣本性能,極大增強泛化能力。

視覺語言指令微調(VLIT)

圖片

預訓練階段,MLLM需要使用大量的圖像文本對作為訓練數據,以在不同模態之間實現對齊,并將視覺信號轉化為LMM可以理解的表征或Token。

指令微調階段,需額外的需求以理解視覺信息。隨著多模態數據越來越多地融入 LLM 中,視覺語言指令調優(VLIT)受到了越來越多的關注,與純文本指令調優相比,它呈現出更復雜的特征。

指令微調階段的損失函數:

圖片

03、總結

最近看了很多多模態大模型相關的論文,今天對模型結構和訓練進行一個簡單總結,整體來看,各家的模型結構基本上一致,無非是一些模型細節上的改變。模型訓練方式也大差不差,基本上都是預訓練+微調。整體的模型結構了解了,后續就開始更新模型的各個模塊單元了,首先從模態編碼器上繼續進行一個系統的學習,希望能幫助到大家。

責任編輯:龐桂玉 來源: 小白學AI算法
相關推薦

2025-09-16 09:35:52

2025-01-08 08:21:16

2025-03-13 09:47:29

2024-12-30 00:01:00

多模態大模型Python

2024-12-12 00:25:09

2024-05-27 07:21:43

2025-07-22 10:15:44

2023-05-22 09:22:41

論文CV

2025-05-14 08:51:00

2024-03-25 12:30:18

AI訓練開源

2024-12-18 18:57:58

2024-11-13 09:39:13

2025-03-19 09:30:00

2024-11-22 08:22:58

2023-09-29 22:31:25

高斯混合模型機器學習

2025-09-19 09:05:18

AI模型訓練

2024-06-03 06:49:53

2025-11-17 09:22:09

2024-09-25 16:08:52

點贊
收藏

51CTO技術棧公眾號

精品久久久久久久久久久久包黑料 | 久久国产精品国产精品| 午夜激情视频在线观看| 国产美女精品一区二区三区| 午夜精品久久久久久久久久久久| 欧美 变态 另类 人妖| 久久免费影院| 午夜精品久久久久久久| 日韩精品无码一区二区三区| 99热这里只有精品5| 翔田千里一区二区| 久久天天躁狠狠躁老女人| 国产chinese中国hdxxxx| 日韩毛片在线| 精品日韩美女的视频高清| 亚洲在线观看一区| 日日夜夜精品免费| 精品一区二区免费视频| 日本国产一区二区三区| 欧美精品xxxxx| 色综合久久一区二区三区| 亚洲成人国产精品| 999热精品视频| 日日夜夜天天综合| 婷婷综合另类小说色区| 中文字幕第50页| se在线电影| 99re视频这里只有精品| 91亚洲永久免费精品| 久久久久在线视频| 国产精品啊啊啊| www.亚洲免费视频| 青青草视频成人| 超碰成人在线免费| 欧美性欧美巨大黑白大战| 中文字幕无码精品亚洲35| 八戒八戒神马在线电影| 国产精品蜜臀在线观看| 蜜桃av噜噜一区二区三区| 丰满人妻一区二区三区免费| 国产精品影视网| 国产欧美va欧美va香蕉在| 国产一区二区视频网站| av成人毛片| 欧美精品久久久久a| 免费在线观看h片| 欧美国产一区二区三区激情无套| 亚洲天堂av综合网| 熟女俱乐部一区二区| 欧美一区 二区| 亚洲国内精品在线| 稀缺呦国内精品呦| 999精品视频在这里| 日韩一区二区三区高清免费看看| 日本中文字幕影院| 在线不卡一区| 欧美精品xxxxbbbb| 性久久久久久久久久久久久久| 农村妇女一区二区| 欧美日韩在线不卡| 超碰在线人人爱| 精品久久在线| 欧美一区二区三区免费在线看| 午夜激情视频网| 91蜜桃臀久久一区二区| 精品国产a毛片| 熟妇人妻久久中文字幕| 亚洲黄色录像| 国产亚洲xxx| 亚洲毛片亚洲毛片亚洲毛片| 欧美mv日韩| 久久不射电影网| 久久久久成人片免费观看蜜芽| 欧美/亚洲一区| 国内精品免费午夜毛片| www欧美在线| 日本不卡视频一二三区| 国产一区玩具在线观看| 亚洲va天堂va欧美ⅴa在线| 国产91丝袜在线18| 蜜桃臀一区二区三区| 中国日本在线视频中文字幕| 日韩理论片中文av| 免费不卡av在线| 超级碰碰久久| 欧美精品v国产精品v日韩精品| 精品人妻二区中文字幕| 婷婷成人影院| y97精品国产97久久久久久| 久草成人在线视频| 日日夜夜一区二区| 91亚洲国产精品| 三级视频网站在线| 中文字幕在线一区免费| 国产免费一区二区视频| 成人日韩精品| 精品免费国产二区三区| 四虎永久免费在线观看| 久久精品影视| 97超级碰碰碰| 国产男男gay体育生网站| av成人免费在线| 在线观看一区二区三区三州| 91美女精品| 欧美日韩免费一区二区三区视频| 香蕉在线观看视频| 不卡中文字幕| 亚洲91精品在线观看| 亚洲一区在线观| 99久久伊人精品| 在线观看亚洲视频啊啊啊啊| jk漫画禁漫成人入口| 欧美一区二区人人喊爽| 午夜时刻免费入口| 在线观看的日韩av| 成人激情在线播放| 欧美精品a∨在线观看不卡| 亚洲精品亚洲人成人网| www.色就是色| 欧美一区自拍| 色综合天天狠天天透天天伊人| 波多野结衣网站| 99视频精品在线| 国产精品一二三在线观看| 日本精品裸体写真集在线观看| 亚洲成人激情在线观看| 久久久久久久久久久久久女过产乱| 老色鬼久久亚洲一区二区| 岛国视频一区免费观看| 免费黄网在线观看| 欧美日韩在线综合| 国产在线综合视频| 另类亚洲自拍| 精品一区二区三区视频日产| 久久99亚洲网美利坚合众国| 777午夜精品视频在线播放| 亚洲激情图片网| 丝袜美腿亚洲一区| 欧美精品与人动性物交免费看| 国产精品69xx| 欧美成人video| 国模无码国产精品视频| 国产精品2024| www国产无套内射com| 精品成人18| 久久精品久久久久久国产 免费| 中文字幕乱码在线观看| 中文字幕精品在线不卡| 手机在线免费观看毛片| 成人毛片免费看| 国产精品亚洲一区二区三区| 成年人在线视频| 欧美色图片你懂的| 伊人久久久久久久久久久久久久| 美女视频黄a大片欧美| 亚洲午夜精品福利| 91久久青草| 欧美成人精品激情在线观看 | 午夜剧场免费在线观看| 精品一区二区在线播放| 国产日产欧美一区二区| 一区二区三区欧洲区| 国内精品久久久久久影视8| 午夜小视频免费| 色先锋aa成人| 精品亚洲乱码一区二区| 国产在线精品一区二区不卡了| 久久av喷吹av高潮av| 一区二区三区在线资源| 97色在线视频| 欧美777四色影视在线| 欧美色倩网站大全免费| 亚洲区一区二区三| 国v精品久久久网| 国产成人在线免费看| 视频精品在线观看| 成人久久一区二区| 97人澡人人添人人爽欧美| 亚洲男人天堂2019| 一区二区三区免费观看视频| 一区二区三区免费| 亚洲第一黄色网址| 美女网站色91| 国产精品久久..4399| 欧美精品一二| 91精品天堂| 欧美性xxx| 久久伊人91精品综合网站| 日本韩国在线观看| 欧美综合一区二区三区| 九九九在线视频| 国产日韩欧美一区二区三区综合| 肉色超薄丝袜脚交| 国产日韩欧美| 日本免费在线视频观看| 秋霞影视一区二区三区| 国产精品入口尤物| 9765激情中文在线| 久久精品国产久精国产思思| 天堂а√在线8种子蜜桃视频 | 97视频在线观看免费高清完整版在线观看| 日韩a级作爱片一二三区免费观看| 欧美日韩一级黄| 中文字幕亚洲高清| 亚洲色图清纯唯美| 五月天精品视频| 粉嫩av亚洲一区二区图片| 韩国视频一区二区三区| 99国产精品| 日本三日本三级少妇三级66| 国产欧美日韩精品一区二区免费 | v8888av| 国产精品白丝av| 我看黄色一级片| 亚欧美中日韩视频| 日韩欧美精品免费| 亚洲91精品| 亚洲激情一区二区三区| 亚洲免费毛片| 国产精品一 二 三| 欧洲大片精品免费永久看nba| 国产精品日韩专区| 成人av免费电影网站| 高清欧美一区二区三区| 99热国产在线| 精品国产一区二区三区久久久| 婷婷在线免费视频| 日韩欧美国产小视频| 国产又粗又大又爽视频| 在线观看一区不卡| 伦av综合一区| 激情av一区二区| 国产精品99精品无码视| 一区二区三区四区av| 91视频综合网| 国产日韩欧美精品在线| 亚洲午夜久久久久久久久红桃| 99久久国产综合精品色伊| 国产精品熟妇一区二区三区四区| 国产做a爰片久久毛片| 成人综合久久网| 精品在线观看免费| www午夜视频| 久久99久久99精品免视看婷婷| 三上悠亚在线一区二区| 蜜桃精品在线观看| 91看片在线免费观看| 久久激情综合网| 最新av免费在线观看| 久久国产精品色| 小明看看成人免费视频| 久久草av在线| 一个人看的视频www| 国产精品自产自拍| 影音先锋资源av| 99久久国产综合精品女不卡| 新91视频在线观看| 欧美国产精品一区二区| 三上悠亚在线观看视频| 亚洲欧美一区二区三区国产精品| 欧美风情第一页| 亚洲精品免费看| 久久久精品视频免费| 精品美女国产在线| 99re国产在线| 欧美久久免费观看| 国内老熟妇对白xxxxhd| 亚洲国产精品久久| 久草在线免费福利资源| www.亚洲男人天堂| 国产区美女在线| 2019中文字幕在线| 日本精品另类| 99国产视频| 婷婷精品在线| 永久久久久久| 红桃视频欧美| 日韩免费高清在线| 黄一区二区三区| 小毛片在线观看| 亚洲国产精品成人综合色在线婷婷| 黄色香蕉视频在线观看| 亚洲成人av电影| 亚洲高清视频免费观看| 欧美一区二区黄| 免费在线观看一级毛片| 草民午夜欧美限制a级福利片| av在线私库| 成人免费视频97| 加勒比中文字幕精品| 亚洲午夜精品国产| 99国产精品私拍| 91福利免费观看| 91色视频在线| 一区二区视频免费看| 色视频一区二区| 亚洲精品97久久中文字幕| 亚洲深夜福利视频| 国产精品蜜臀| 国产主播喷水一区二区| 欧美电影在线观看完整版| 在线观看一区二区三区三州 | 欧美在线视频观看| 高清久久精品| 免费看成人午夜电影| 欧美激情91| 亚洲综合欧美在线| 91麻豆视频网站| 四虎免费在线视频| 欧美色老头old∨ideo| 欧美日韩激情视频一区二区三区| 欧美成人自拍视频| 久久伊人国产| 日韩精品伦理第一区| 亚洲欧美大片| 在线免费看黄色片| 一区二区免费视频| 在线观看色网站| 亚洲人成网站在线播| 国产免费拔擦拔擦8x高清在线人 | 国模gogo一区二区大胆私拍| 亚洲精品一区二区在线播放∴| 欧美乱偷一区二区三区在线| 夜夜爽av福利精品导航| 中文字幕在线观看91| 亚洲欧美国产高清| 国产又粗又黄又爽的视频| 国产亚洲精品日韩| 黑人巨大亚洲一区二区久| 精品国产乱码久久久久久蜜柚| 欧美国产高潮xxxx1819| 欧美一级免费在线| 自拍偷在线精品自拍偷无码专区 | 日韩影院一区| 久久九九99| 亚洲码无人客一区二区三区| 狠狠色噜噜狠狠狠狠97| 日批视频免费播放| 8090成年在线看片午夜| 久久婷婷国产| 国内性生活视频| 久久夜色精品国产噜噜av| 日韩av大片在线观看| 国产视频久久久久| 中文字幕在线看片| 欧美男人的天堂| 日本怡春院一区二区| 国产三级黄色片| 欧美日韩视频在线一区二区| 成年人在线视频| 成人有码视频在线播放| 中文字幕亚洲精品乱码| 中文字幕av一区二区三区人妻少妇| 最新欧美精品一区二区三区| 国产剧情久久久| 欧美成人午夜免费视在线看片 | 免费不卡在线观看| 国产喷水在线观看| 日韩欧美视频一区| heyzo高清在线| 蜜桃av噜噜一区二区三| 日韩黄色小视频| 亚洲精品自拍视频在线观看| 欧美一级电影网站| xxx性欧美| 欧美日韩最好看的视频| 麻豆国产精品官网| 一区二区视频免费看| 亚洲成年人影院在线| 国产精欧美一区二区三区蓝颜男同| 日本不卡久久| 精品一二三四区| 日本一区二区免费在线观看| 亚洲精品视频网上网址在线观看| 国产成人精品一区二区三区在线 | 色网在线观看| 激情小说综合网| 秋霞电影网一区二区| 免费在线观看a级片| 亚洲国产精品大全| 国产亚洲欧美日韩精品一区二区三区| 欧美日韩在线免费观看视频| 白白色亚洲国产精品| 国产三级理论片| 欧美大片免费看| 国产欧美日韩精品一区二区免费| 亚洲欧美一区二区三区不卡| 香蕉乱码成人久久天堂爱免费| √新版天堂资源在线资源| 福利视频一区二区三区| 日日摸夜夜添夜夜添精品视频| 97成人资源站| 国产亚洲欧洲高清| 91国内精品白嫩初高生| 成年人在线观看视频免费| 亚洲综合色噜噜狠狠| 国产日韩精品在线看| 国产精品日韩一区二区免费视频| 日韩精品一区第一页| 日本特黄一级片|