精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

什么是多模態AI 如何融合和對齊? 原創

發布于 2024-11-11 11:03
瀏覽
0收藏

近年來,大型語言模型Large Language Models(LLM)的研究取得了顯著的進展(例如GPT-3,LLaMa,ChatGPT,GPT-4),這些模型在各項自然語言處理(NLP)任務上展現了出色的性能。

通過在海量數據上預訓練,LLM獲得了豐富的知識以及強大的推理能力。只需要輸入一些用戶指令,這些模型就可以解析指令、進行推理并給出符合用戶預期的回答。這些能力背后蘊含著眾多關鍵思想和技術,包括指令微調(Instruction Tuning),上下文學習(In-Context Learning)和思維鏈(Chain of Thought)等,以及多模態。

什么是多模態

多模態人工智能利用來自多個不同模態(如文本、圖像、聲音、視頻等)的數據進行學習和推理。多模態人工智能強調不同模態數據之間的互補性和融合性,通過整合多種模態的數據,利用表征學習、模態融合與對齊等技術,實現跨模態的感知、理解和生成,推動智能應用的全面發展。

接下來分三部分:_數據采集與表示、數據處理與融合、學習與推理,一起來科普下多模型的基本術語。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模態學習(Multimodal Learning)是一種利用來自不同感官或交互方式的數據進行學習的方法,這些數據模態可能包括文本、圖像、音頻、視頻等。多模態學習通過融合多種數據模態來訓練模型,從而提高模型的感知與理解能力,實現跨模態的信息交互與融合。接下來分三部分:模態表示、多模態融合、跨模態對齊,一起來總結下多模型的核心。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態協同表示(Coordinated Representation)?多模態協同表示是一種將多個模態的信息分別映射到各自的表示空間,但映射后的向量或表示之間需要滿足一定的相關性或約束條件的方法。這種方法的核心在于確保不同模態之間的信息在協同空間內能夠相互協作,共同優化模型的性能。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態融合

什么是多模態融合(MultiModal Fusion)?多模態融合能夠充分利用不同模態之間的互補性,它將抽取自不同模態的信息整合成一個穩定的多模態表征。從數據處理的層次角度將多模態融合分為數據級融合、特征級融合和目標級融合。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模態融合

  1. 數據級融合(Data-Level Fusion):
  • 數據級融合,也稱為像素級融合或原始數據融合,是在最底層的數據級別上進行融合。這種融合方式通常發生在數據預處理階段,即將來自不同模態的原始數據直接合并或疊加在一起,形成一個新的數據集。
  • 應用場景:適用于那些原始數據之間具有高度相關性和互補性的情況,如圖像和深度圖的融合。
  1. 特征級融合(Feature-Level Fusion)
  • 特征級融合是在特征提取之后、決策之前進行的融合。不同模態的數據首先被分別處理,提取出各自的特征表示,然后將這些特征表示在某一特征層上進行融合。
  • 應用場景:廣泛應用于圖像分類、語音識別、情感分析等多模態任務中。
  1. 目標級融合(Decision-Level Fusion)
  • 目標級融合,也稱為決策級融合或后期融合,是在各個單模態模型分別做出決策之后進行的融合。每個模態的模型首先獨立地處理數據并給出自己的預測結果(如分類標簽、回歸值等),然后將這些預測結果進行整合以得到最終的決策結果。
  • 應用場景:適用于那些需要綜合考慮多個獨立模型預測結果的場景,如多傳感器數據融合、多專家意見綜合等。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是多模態對齊

什么是跨模態對齊(MultiModal Alignment)?跨模態對齊是通過各種技術手段,實現不同模態數據(如圖像、文本、音頻等)在特征、語義或表示層面上的匹配與對應。跨模態對齊主要分為兩大類:顯式對齊和隱式對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是顯示對齊(Explicit Alignment)?直接建立不同模態之間的對應關系,包括無監督對齊和監督對齊。

  1. 無監督對齊:利用數據本身的統計特性或結構信息,無需額外標簽,自動發現不同模態間的對應關系。
  • CCA(典型相關分析):通過最大化兩組變量之間的相關性來發現它們之間的線性關系,常用于圖像和文本的無監督對齊。
  • 自編碼器:通過編碼-解碼結構學習數據的低維表示,有時結合循環一致性損失(Cycle Consistency Loss)來實現無監督的圖像-文本對齊。
  1. 監督對齊:利用額外的標簽或監督信息指導對齊過程,確保對齊的準確性。
  • 多模態嵌入模型:如DeViSE(Deep Visual-Semantic Embeddings),通過最大化圖像和對應文本標簽在嵌入空間中的相似度來實現監督對齊。
  • 多任務學習模型:同時學習圖像分類和文本生成任務,利用共享層或聯合損失函數來促進圖像和文本之間的監督對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

什么是隱式對齊(Implicit Alignment)?不直接建立對應關系,而是通過模型內部機制隱式地實現跨模態的對齊。這包括注意力對齊和語義對齊。

注意力對齊:通過注意力機制動態地生成不同模態之間的權重向量,實現跨模態信息的加權融合和對齊。Transformer模型:在跨模態任務中(如圖像描述生成),利用自注意力機制和編碼器-解碼器結構,自動學習圖像和文本之間的注意力分布,實現隱式對齊。BERT-based模型:在問答系統或文本-圖像檢索中,結合BERT的預訓練表示和注意力機制,隱式地對齊文本查詢和圖像內容。

語義對齊:在語義層面上實現不同模態之間的對齊,需要深入理解數據的潛在語義聯系。圖神經網絡(GNN):在構建圖像和文本之間的語義圖時,利用GNN學習節點(模態數據)之間的語義關系,實現隱式的語義對齊。預訓練語言模型與視覺模型結合:如CLIP(Contrastive Language-Image Pre-training),通過對比學習在大量圖像-文本對上訓練,使模型學習到圖像和文本在語義層面上的對應關系,實現高效的隱式語義對齊。

什么是多模態AI 如何融合和對齊?-AI.x社區

多模特LLM示例

Flamingo是2022年推出的多模態大語言模型。視覺和語言組件的工作原理如下:

視覺編碼器將圖像或視頻轉換為嵌入(數字列表)。這些嵌入的大小取決于輸入圖像的尺寸或輸入視頻的長度,因此另一個稱為感知器重采樣器的組件將這些嵌入轉換為通用的固定長度。

語言模型接收文本和來自 Percever Resampler 的固定長度視覺嵌入。視覺嵌入用于多個“交叉注意力”塊,這些塊學習根據當前文本權衡視覺嵌入不同部分的重要性。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 1 來自 Flamingo 論文,展示了模型架構。

訓練分為三個步驟:

  • 視覺編碼器使用 CLIP 進行預訓練。CLIP 實際上同時訓練視覺編碼器和文本編碼器,因此此步驟中的文本編碼器將被丟棄。
  • 該語言模型是一個預先訓練了下一個標記預測的Chinchilla模型,即根據一系列先前的字符預測下一組字符。大多數 LLM(如 GPT-4)都是這樣訓練的。您可能會聽到這種類型的模型被稱為“自回歸”,這意味著該模型根據過去的值預測未來的值。
  • 在第三階段,將未經訓練的交叉注意力模塊插入語言模型中,并在視覺編碼器和語言模型之間插入未經訓練的感知器重采樣器。這是完整的 Flamingo 模型,但交叉注意力模塊和感知器重采樣器仍需要訓練。為此,整個 Flamingo 模型用于計算下一個標記預測任務中的標記,但輸入現在包含與文本交錯的圖像。此外,視覺編碼器和語言模型的權重被凍結。換句話說,只有感知器重采樣器和交叉注意力模塊實際上得到更新和訓練。

經過訓練,Flamingo 能夠執行各種視覺語言任務,包括以對話形式回答有關圖像的問題。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 2 取自 Flamingo 論文,展示了視覺對話的示例。

Flamingo 論文:

??https://arxiv.org/pdf/2204.14198??

BLIP-2是一款多模態 LLM,于 2023 年初發布。與 Flamingo 一樣,它包含預訓練的圖像編碼器和 LLM。但與 Flamingo 不同的是,圖像編碼器和LLM 均未受影響(預訓練后)。

為了將圖像編碼器連接到 LLM,BLIP-2 使用“Q-Former”,它由兩個組件組成:

  • 視覺組件接收一組可學習的嵌入和凍結圖像編碼器的輸出。與 Flamingo 中所做的一樣,圖像嵌入被輸入到交叉注意層中。
  • 文本組件接收文本。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖摘自 BLIP-2 論文,展示了 Q-Former 的內部結構及其訓練目標。

BLIP-2 訓練分為兩個階段:

  • 在第 1 階段,Q-Former 的兩個組件針對三個目標進行訓練,這些目標實際上源自BLIP-1論文:
  • 圖像-文本對比學習(類似于 CLIP,但有一些細微的差別)。
  • 基于圖像的文本生成(生成圖像的標題)。
  • 圖像-文本匹配(二元分類任務,其中對于每個圖像-文本對,模型必須回答 1 來表示匹配,否則回答 0)。
  • 在第 2 階段,通過在 Q-Former 和 LLM 之間插入投影層來構建完整模型。此投影層將 Q-Former 的嵌入轉換為具有與 LLM 兼容的長度。然后,完整模型負責描述輸入圖像。在此階段,圖像編碼器和 LLM 保持凍結狀態,并且僅訓練 Q-Former 和投影層。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 3 摘自 BLIP-2 論文,展示了完整的模型架構。投影層標記為“完全連接”。

在論文的實驗中,他們使用 CLIP 預訓練圖像編碼器和OPT或Flan-T5作為 LLM。實驗表明,BLIP-2 在各種視覺問答任務上的表現都優于 Flamingo,但可訓練參數卻少得多。這使得訓練過程更加輕松,且更具成本效益。

BLIP-2 論文

??https://arxiv.org/pdf/2301.12597??

LLaVA是一種多模態 LLM,于 2023 年發布。其架構非常簡單:

  • 視覺編碼器使用 CLIP 進行預訓練
  • LLM 是經過預先訓練的Vicuna模型
  • 視覺編碼器通過單個投影層連接到 LLM

請注意視覺編碼器和 LLM 之間的組件的簡單性,與 BLIP-2 中的 Q-Former 以及 Flamingo 中的感知器重采樣器和交叉注意層相比。

訓練分為兩個階段:

  • 在第 1 階段,訓練目標是圖像字幕。視覺編碼器和 LLM 被凍結,因此只訓練投影層。
  • 在第 2 階段,LLM 和投影層在部分合成的指令跟蹤數據集上進行微調。它是部分合成的,因為它是在 GPT-4 的幫助下生成的。

什么是多模態AI 如何融合和對齊?-AI.x社區

圖 1 來自 LLaVA 論文,展示了完整的模型架構。

作者對 LLaVA 的評價如下:

  • 他們使用 GPT-4 來評估 LLaVA 在部分合成數據集上的響應質量。在這里,LLaVA 相對于 GPT-4 的得分為 85%。
  • 他們在名為 ScienceQA

LLaVA 說明,簡單架構在使用部分合成數據進行訓練可取得優異結果。LLaVA論文:https://arxiv.org/pdf/2304.08485


本文轉載自公眾號數字化助推器  作者:天涯咫尺TGH

原文鏈接:??https://mp.weixin.qq.com/s/ca3J3xMN8Z5V8jQv2jUoOA??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-11 11:03:45修改
收藏
回復
舉報
回復
相關推薦
亚洲精品久久久久久久久| 久久九九99视频| 欧美人与性动交| 国产精品成人99一区无码| 精品捆绑调教一区二区三区| 不卡一卡二卡三乱码免费网站| 2025国产精品视频| 欧美性猛交xxxx乱大交少妇| 亚洲91网站| 91久久国产综合久久| 亚洲国产精品影视| 天天操天天操天天操| 免费人成网站在线观看欧美高清| 美女黄色丝袜一区| 欧美成人午夜精品免费| 99视频这里有精品| 日韩欧亚中文在线| 国产乱子伦精品视频| 毛片免费在线| 国产成人在线视频播放| 日韩av电影免费观看高清| 成人在线观看免费完整| 国产一区二区三区四区二区| 精品国产凹凸成av人网站| 国产精品人人妻人人爽人人牛| a黄色片在线观看| 欧美国产1区2区| 国产精品免费观看高清| 国产美女自慰在线观看| 日韩和欧美一区二区| 78色国产精品| 久草视频免费在线| 99视频精品视频高清免费| 亚洲天堂网在线观看| 在线免费看黄色片| 欧美经典一区| 6080亚洲精品一区二区| 中文字幕有码av| 午夜影院在线播放| 亚洲成人手机在线| 欧美极品少妇无套实战| 黄色大片在线播放| 成人欧美一区二区三区白人| 日韩欧美亚洲精品| 欧美zozo| 久久久午夜电影| 国产精品一区二区欧美黑人喷潮水| 国产一区二区在线视频观看| 日韩av午夜在线观看| 91爱爱小视频k| 日本三级一区二区| 99精品国产在热久久| 久久久久久18| 精品无码m3u8在线观看| 狠狠色丁香久久综合频道| 欧美日韩高清区| 国产97免费视频| 欧美激情日韩| 久久99热这里只有精品国产 | 婷婷综合成人| 日韩美女av在线| 9.1成人看片| 亚洲精品合集| 亚洲天堂av综合网| 国产视频不卡在线| 国产精品久久久久蜜臀| 欧美第一页在线| 日本天堂在线视频| 男女精品视频| 国产精品永久在线| 国产理论视频在线观看| 国产不卡视频在线观看| 成人av资源网| 四虎成人免费在线| 国产蜜臀97一区二区三区| 亚洲午夜在线观看| 在线免费观看污| 午夜激情综合网| aaaaaa亚洲| 亚洲精品aa| 精品国产乱码久久久久久免费| 国产精品无码一区二区三| 伊人久久综合影院| www亚洲精品| 日韩精品无码一区二区| 久久久久久久欧美精品| 成人精品视频久久久久| 好男人在线视频www| 久久综合九色综合欧美98| 亚洲国产日韩欧美| 欧美14一18处毛片| 色激情天天射综合网| 99久久99精品| 牲欧美videos精品| 久久韩剧网电视剧| 中日韩黄色大片| 久久99精品国产麻豆婷婷| 国产精品久久国产精品| 电影在线高清| 亚洲成人精品一区二区| 欧美自拍小视频| 1204国产成人精品视频| 国产香蕉97碰碰久久人人| 亚洲综合网在线| 视频一区二区国产| 波多野结衣久草一区| 成年人在线视频免费观看| 亚洲风情在线资源站| 欧美伦理片在线观看| 久久精品凹凸全集| 久久亚洲精品一区二区| 麻豆成人免费视频| 国产成人久久精品77777最新版本| 青青草原亚洲| 99在线视频影院| 欧美高清hd18日本| 四虎国产精品成人免费入口| 国语对白精品一区二区| 91精品久久久久久| 天堂а在线中文在线无限看推荐| 亚洲美女精品一区| 欧美日韩一区二区三区69堂| 日韩精品a在线观看91| 九九热99久久久国产盗摄| 最好看的日本字幕mv视频大全| av电影天堂一区二区在线观看| 欧美少妇一级片| 992tv国产精品成人影院| 亚洲精品理论电影| 久久久久久久国产精品毛片| 黄色资源网久久资源365| 日韩亚洲视频在线| 亚洲黄色网址| 日韩av在线网站| 久久97人妻无码一区二区三区| 老汉av免费一区二区三区| 欧美日韩一区在线播放| 天堂中文av在线资源库| 亚洲精品成人久久| 免费观看一级视频| 懂色av一区二区夜夜嗨| 今天免费高清在线观看国语| 91麻豆精品| 久久精品国产成人精品| 一级α片免费看刺激高潮视频| 国产日本欧美一区二区| 免费日韩中文字幕| 免费看成人吃奶视频在线| 欧美最猛性xxxxx亚洲精品| 亚洲欧美日韩动漫| 狠狠躁夜夜躁久久躁别揉| 超碰97在线资源站| 国产欧美69| 蜜桃av久久久亚洲精品| 中文在线а√天堂| 亚洲男女自偷自拍图片另类| 亚洲GV成人无码久久精品| 久久蜜桃一区二区| 久久久精品麻豆| 久久免费大视频| 国产主播欧美精品| www.久久com| 免费在线视频一级不卡| 欧美午夜精品久久久久久久| 女同毛片一区二区三区| 日韩中文字幕区一区有砖一区 | 欧美成人福利在线观看| 香蕉综合视频| 97人人做人人人难人人做| 黄色污污视频在线观看| 亚洲国产欧美一区二区三区同亚洲| 久久精品无码人妻| 91天堂素人约啪| 国产黄色特级片| 日本精品三区| 91在线在线观看| 国产美女高潮在线| 亚洲美女av网站| 中文字幕二区三区| 亚洲乱码国产乱码精品精可以看| 国产精品嫩草69影院| 国产欧美大片| 亚洲一区美女| 超碰97成人| 国产成人综合亚洲| a在线免费观看| 亚洲精品国产精品久久清纯直播 | 91.成人天堂一区| 久久伊人成人网| 久久精品网站免费观看| 亚洲午夜精品一区| 国产日韩欧美一区在线| 一本久久a久久精品vr综合| 亚洲精品一二三**| 国产成人在线亚洲欧美| 天堂va在线| 亚洲天堂av在线免费观看| 草草视频在线播放| 91福利视频网站| 久一视频在线观看| 欧美国产激情一区二区三区蜜月| 女人扒开双腿让男人捅| 日韩**一区毛片| 久久国产午夜精品理论片最新版本| 久操国产精品| 古典武侠综合av第一页| 国产精品原创视频| 97在线观看免费| 国产日产一区二区三区| 亚洲欧美在线免费| 亚洲av无码乱码国产精品| 日本韩国欧美国产| 国产精品第二十页| 亚洲天堂福利av| 亚洲性猛交xxxx乱大交| 成人avav在线| 中文字幕55页| 青青草国产精品97视觉盛宴| 欧美不卡在线播放| 欧美黄污视频| 亚洲欧美日韩精品久久久| 外国成人在线视频| 官网99热精品| 天堂久久av| 91探花福利精品国产自产在线| 极品美女一区| 7m精品福利视频导航| 免费在线看污片| 久久伊人精品天天| av在线电影免费观看| 精品无人国产偷自产在线| 99免费在线视频| 欧美日韩成人在线一区| 91黑人精品一区二区三区| 五月婷婷色综合| 国产主播在线播放| 一区二区三区欧美久久| 国产精品成人69xxx免费视频| 中文字幕第一区第二区| 欧美大波大乳巨大乳| 久久色视频免费观看| 泷泽萝拉在线播放| 97久久超碰国产精品| 一本色道综合久久欧美日韩精品| 国产盗摄一区二区三区| 日本少妇xxx| 国产高清在线精品| 91精品国产高清91久久久久久| 国产一区不卡精品| 亚洲第一天堂久久| 激情综合亚洲精品| 欧美污在线观看| 国产激情精品久久久第一区二区 | 理论片在线不卡免费观看| 美女黄视频在线观看| 久久久国产精品一区| 福利视频在线| 久久久久亚洲精品| 国产精品一二三产区| 欧美尤物巨大精品爽| 成人影院网站| 国产精品久久久久久久久免费看| 91国拍精品国产粉嫩亚洲一区| 国产精品久久不能| 日韩欧美2区| 成人欧美在线视频| 1313精品午夜理伦电影| 国内精品一区二区| 九九视频精品全部免费播放| 日韩欧美激情一区二区| 91久久电影| 男人添女荫道口喷水视频| 最新日韩av| 热久久精品免费视频| 精品综合免费视频观看| 国产欧美视频一区| 久久综合久久鬼色| 男女全黄做爰文章| 亚洲综合色婷婷| 一区二区三区在线观看av| 欧美调教femdomvk| 精品欧美在线观看| 亚洲美女www午夜| 欧美精品日韩少妇| 久久久视频免费观看| 精品欧美日韩精品| 99视频在线播放| 国产欧美亚洲精品a| 老司机av福利| 国产精品亚洲综合久久| 青青草原国产在线视频| 丁香六月久久综合狠狠色| 中文字幕在线视频播放| 亚洲国产成人在线| 精品一区二区三区四| 色菇凉天天综合网| japanese国产| 亚洲欧美综合区自拍另类| 老司机午夜在线| 午夜精品一区二区三区在线视 | 国产天堂在线播放视频| 国产成人福利网站| 日韩国产在线不卡视频| 欧美日韩在线观看一区| 欧美aⅴ99久久黑人专区| 久久精品网站视频| 国产成人在线视频免费播放| 免费看91的网站| 亚洲成人福利片| 一卡二卡三卡在线| 精品视频久久久久久| av在线导航| 国产免费成人av| 亚洲人挤奶视频| 黄色一级片av| 久久精品99国产精品| 狠狠人妻久久久久久综合蜜桃| 亚洲欧美日韩国产成人精品影院| 男人天堂av在线播放| 日韩av综合中文字幕| 手机在线免费av| 国产美女被下药99| 国产成人三级| 日本精品免费在线观看| 国产成人综合视频| 亚洲一级生活片| 欧美日韩一级片网站| 免费在线高清av| 欧美一级电影免费在线观看| a级日韩大片| 日本丰满大乳奶| 久久99久久久久| 日日操免费视频| 欧美色图免费看| 国产在线小视频| 日本人成精品视频在线| 日韩极品少妇| 欧美国产激情视频| 91在线你懂得| 亚洲欧美在线视频免费| 亚洲成人精品视频| 91超碰在线播放| 国产一区二区自拍| 99国产精品视频免费观看一公开 | 国产精品久久777777| 亚洲av人无码激艳猛片服务器| 亚洲精品在线看| 国产高清不卡| 日韩电影大全在线观看| 老司机精品视频网站| 亚洲精品乱码久久久久久久久久久久 | 国产一级av毛片| 精品国产一区久久| a级片免费在线观看| 国产九色精品| 国产欧美一级| 国产jk精品白丝av在线观看| 欧洲国产伦久久久久久久| 激情在线视频| 国产精品视频自在线| 亚洲激情中文在线| 无码人妻少妇色欲av一区二区| 一区二区三区四区高清精品免费观看 | 国产电影精品久久禁18| 国产精品第108页| 亚洲人成网站777色婷婷| 欧美色片在线观看| 椎名由奈jux491在线播放| 国产麻豆精品在线观看| 在线免费日韩av| 日韩久久精品成人| 日本精品网站| 午夜久久久久久久久久久| 成人午夜av电影| 日本中文字幕在线观看视频| 久久久91精品国产一区不卡| 伊人精品久久| 国产av无码专区亚洲精品| 国产精品日日摸夜夜摸av| 国内精品偷拍视频| 91干在线观看| 欧美激情国产在线| 人妻换人妻a片爽麻豆| 色香蕉久久蜜桃| 黄色在线观看网站| 精品免费国产| 久久国产成人午夜av影院| 国产亚洲精品女人久久久久久| 日韩精品在线免费观看| 亚洲精品无播放器在线播放| 亚洲精品久久久久久久蜜桃臀| 久久久亚洲精品一区二区三区 | 国产亚洲精品成人av久久ww | 国产精品一区二区a| 欧美aaaaaa午夜精品| 精品少妇theporn| 中文字幕成人精品久久不卡| 国产精品网址| 久久久久久蜜桃一区二区| 亚洲v日本v欧美v久久精品|