精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態大模型:基礎架構 原創

發布于 2024-10-29 12:36
瀏覽
0收藏

大模型技術論文不斷,每個月總會新增上千篇。本專欄精選論文重點解讀,主題還是圍繞著行業實踐和工程量產。若在某個環節出現卡點,可以回到大模型必備腔調或者LLM背后的基礎模型重新閱讀。而最新科技(Mamba,xLSTM,KAN)則提供了大模型領域最新技術跟蹤。若對于具身智能感興趣的請移步具身智能專欄。技術宅麻煩死磕AI架構設計。當然最重要的是訂閱“魯班模錘”。

多模態大型語言模型(MLLM)是人工智能領域的前沿創新,它結合了語言和視覺模型的功能,可以處理復雜的任務,如視覺問答和圖像字幕。這些模型利用大規模預訓練,集成了多種數據模態,以顯著提高其在各種應用程序中的性能。

1.架構概覽

較為常見的MLLM框架可以分為三個主要模塊:接收且有效編碼的多模態編碼器、多模態之間數據對齊的投影器、和接收對齊信號并執行推理的大語言模型。當然各種項目總有自己的差異化設計,例如Chameleon或者Octo。<可以隨鏈接查看!>

多模態大模型:基礎架構-AI.x社區

MLLM的主要的優化方向,在于處理高分辨率圖像、壓縮視覺標記(token)、多模態對齊、高效結構和利用緊湊語言模型等。

多模態大模型:基礎架構-AI.x社區

上圖是一些MLLM的部分例子,將其中的基座LLM、視覺編碼器、圖像分辨率和投影器列具出來。

2.視覺編碼器

來看看視覺編碼器,與主流MLLM實踐一致,基本上都是選擇CLIP<鏈接查看詳情!>的預訓練模型。這種方法有助于更好地對齊視覺和文本輸入的特征空間。視覺編碼器在MLLM參數中所占比例相對較小,因此與語言模型相比,輕量級優化不是剛需。

單一的編碼器肯定無法在不同的任務中始終表現出色,將各種偏差的數據編碼器進行聯動則能夠產生令人驚訝的相似結果。

多模態大模型:基礎架構-AI.x社區


BRAVE的深度消融實驗證明了上述的結論。BRAVE按順序連接了K個不同視覺編碼器的特征(上圖左)。之后這些串聯特征被MEQ-Former進一步提煉(上圖右)。


多個視覺編碼器的確有助于捕捉廣泛的視覺表征,從而增強模型對視覺數據的理解。Cobra將DINOv2和SigLIP集成為其視覺主干,其原理是將DINOv2的低級空間特征與 SigLIP提供的語義屬性相結合將提高后續任務的性能。SPHINX-X采用兩個視覺編碼器DINOv2和CLIP-ConvNeXt。

鑒于這些基礎模型已經通過不同的學習方法(自監督與弱監督)和網絡架構(ViT與 CNN)進行預訓練,應該能夠提供互補和復雜的視覺表征。

這些術語將在后續的文章中逐一講解!可以關注“具身智能”專欄!

輕量級視覺編碼器Vision Transformer架構在實際應用中由于硬件和環境限制而面臨挑戰。ViTamin代表一種輕量級視覺模型,專門針對視覺和語言模型量身定制。依照下圖所示,通過兩層的MBC外加一層的注意力塊完成視覺編碼,然后和文本一起進行對比學習。

多模態大模型:基礎架構-AI.x社區

值得一提,ViTamin-XL的參數數量只有436M,卻達到了ImageNet zero-shot 82.9%的準確率,超過了EVA-E的準確率82.0%。要知道EVA-E的參數數量為4.4B。

3.視覺投影器

視覺投影器的目的在于將視覺嵌入(Visual embeddings)等輸入映射到文本空間(Text Embeddings)中。換句話說也就是將不同模態進行對齊。

1)投影,相信讀者最直觀的就是線性投影儀或多層感知器(MLP)來實現,可以理解就是最普通的神經網絡。比如幾層的神經網與非線性激活函數組合而成。

2)部分的投影基于注意力機制。BLIP2引入Q-Former,這是一種輕量級轉換器,它使用一組可學習的查詢向量從凍結的視覺模型中提取視覺特征。

多模態大模型:基礎架構-AI.x社區

Q-former基于對比學習進行訓練,上圖右側展示了由Flamingo提出的感知重采樣器(Perceiver Resampler)考慮在交叉注意力中使用earned Queries(上圖彩色序列塊)作為Q,而圖像特征展開與Q連接起來,在交叉注意力中充當K和V。

多模態大模型:基礎架構-AI.x社區

上圖為BLIP-2的第二階段架構,通過這種方式,在Learned Queries的相應位置的轉換器輸出被作為視覺特征的聚合表示,從而將可變長度的視頻幀特征標準化為固定大小的特征。

3)部分的投影基于CNN。MobileVLMv2提出了LDPv2,這是一種新的投影。由三部分組成:特征轉換、Token壓縮和位置信息增強。通過使用逐點卷積層、平均池化和具有跳躍連接的PEG模塊,LDPv2實現了更高的效率,與原始LDP相比,參數減少了99.8%,處理速度略快。

多模態大模型:基礎架構-AI.x社區

4)最后還有基于大名鼎鼎的Mamba,VL-Mamba在其視覺語言投影儀中實現了2D視覺選擇性掃描(VSS)技術,促進了不同學習方法的融合。

多模態大模型:基礎架構-AI.x社區

5)和所有武功都有最后一式一樣,投影可以采用混合架構。Honeybee提出了兩種視覺投影儀的組合,即C-Abstractor和D-Abstractor,它們遵循兩個主要設計原則:(i)在視覺Token數量生成方面提供適應性,以及(ii)有效地維護本地上下文。下圖詳細的展示了Honeybee的投影混合架構:

多模態大模型:基礎架構-AI.x社區

C-Abstractor,或卷積抽象器,專注于通過采用卷積架構來熟練地對局部上下文進行建模。該結構由L個ResNet塊組成,然后緊接著是額外的L個ResNet塊,這有助于將視覺特征抽象為任意平方數量的視覺標記。而D-Abstractor是基于Deformable注意力的Abstractor。

多模態大模型:基礎架構-AI.x社區

4.視覺Token壓縮

MLLM在需要復雜識別的任務中面臨著相當大的挑戰,尤其是帶有OCR的場景。盡管提高圖像分辨率可以解決,然而增加視覺Token的數量給MLLM帶來了巨大的計算負擔,這主要是由于Transformer架構中計算成本與輸入Token數量呈二次比例,因此如何優化則成為這個領域很熱門的主題。

直接使用高分辨率視覺編碼器進行細粒度感知的成本高,并且不符合實際使用要求。為了讓MLLM能夠感知細節且實現低分辨率的編碼能力,一般會利用全局視圖進行圖片規模的壓縮以及通過拆分衍生局部的圖像塊(Patch)。

LLaVA-UHD提出了一種圖像模塊化策略,將原生分辨率的圖像劃分為更小的可變大小切片,以實現高效和可擴展的編碼。注意下圖左側,這個框架自動的選擇最優的切分方案。

多模態大模型:基礎架構-AI.x社區

此外,InternLM-XComposer2-4KHD 引入了一種通過自動布局排列動態調整分辨率的策略,不僅可以保持圖像的原始縱橫比,還可以自適應地改變Patch布局和計數,從而提高圖像信息提取的效率。

多模態大模型:基礎架構-AI.x社區

通過對不同分辨率的圖像實施自適應輸入策略,可以在感知能力和效率之間實現平衡。如上圖所示,說白了就是將原圖壓縮和切塊一起進行編碼。

Mini-Gemini由兩個編碼器組成,一個用于高分辨率圖像,另一個用于低分辨率視覺嵌入。它提出了patch的信息挖掘,它使用低分辨率的視覺嵌入作為查詢,通過交叉注意力從高分辨率候選者那里檢索相關的視覺線索。

多模態大模型:基礎架構-AI.x社區

Scaling on Scales表明,多尺度較小模型的學習能力與較大模型相當,并且預訓練較小的模型可以在MLLM基準測試上匹配甚至超過較大模型的優勢,同時計算效率更高。

多模態大模型:基礎架構-AI.x社區

S2-Wrapper是一種簡單的機制,它可以以無參數的方式將任何預訓練的視覺模型擴展到多個圖像尺度。以ViT-B為例,S2-Wrapper將輸入圖像插值到不同的尺度(例如2242和4482),然后將每個尺度分割成幾個與默認輸入大小相同的子圖像(4482→4×2242)。對于每個尺度,所有子圖像都被輸入到同一個模型中,輸出(例如4×162)被合并到整個圖像的特征圖中(322)。不同尺度的特征圖被平均池化到原始空間大小(162)并連接在一起。最終的多尺度特征具有與單尺度特征相同的空間形狀,但有更高維度(例如1536 vs 768)。

5.小結

MLLM的主要問題是資源需求,訓練這些模型需要大量的計算資源,通常只有擁有大量預算的大型企業才能使用。例如,在 NVIDIA A100 GPU上訓練像MiniGPT-v2這樣的模型需要超過800個GPU小時,這對于許多學術研究人員和小公司來說成本是巨大的。此外,推理的高計算成本進一步加劇了這個問題,使得在邊緣計算等資源受限的環境中部署這些模型變得困頓。OpenAI的GPT-4V和谷歌的Gemini等模型通過大規模預訓練取得了顯著的性能,但它們的計算需求限制了它們的使用。

目前應對這些挑戰的方法集中在優化MLLM的效率上,需要MLLM采用多種創新技術來解決資源消耗問題。其中包括引入更輕的架構,旨在降低參數和計算復雜性。例如,MobileVLM和LLaVA-Phi等模型使用視覺Token壓縮和高效的視覺語言投影器來提高效率。

通過采用Token壓縮和輕量級模型結構,這些模型實現了計算效率的顯著提高,并拓寬了其應用范圍。例如,與以前的型號相比,LLaVA-UHD支持處理分辨率高達6倍的圖像,只需94%的計算量。這使得在學術環境中訓練這些模型成為可能,一些模型只需23小時即可使用8個A100 GPU進行訓練。值得一提的是,這些效率的提高不是以犧牲性能為代價的。

本文轉載自 ??魯班模錘??,作者: 龐德公

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-11-4 11:15:43修改
收藏
回復
舉報
回復
相關推薦
国产三区四区在线观看| 男女视频免费看| 一区二区精彩视频| 欧美日韩国产专区| 一区二区三区欧美成人| 免费观看成年人视频| 三级影片在线观看欧美日韩一区二区| 日韩中文有码在线视频| 91成人在线观看喷潮蘑菇| 一级毛片久久久| 亚洲欧美国产77777| 久久国产日韩欧美| 国产福利资源在线| 日韩国产欧美在线播放| 性欧美xxxx视频在线观看| 国产一区第一页| 亚洲人成亚洲精品| 欧美大片拔萝卜| 久久久久久久久久久久91| av中文资源在线资源免费观看| 中文字幕+乱码+中文字幕一区| 国产精品青青草| 国产三级小视频| 视频一区二区国产| 97久久久久久| 久久97人妻无码一区二区三区| 日韩欧美中字| 亚洲色图18p| 在线黄色免费网站| 另类视频一区二区三区| 欧美色老头old∨ideo| 俄罗斯av网站| 182在线播放| 亚洲午夜免费视频| 黄色污污在线观看| 18免费在线视频| 久久精品一区二区三区不卡| 久精品国产欧美| 亚洲国产999| 国产一区 二区 三区一级| 国产精品一区电影| 在线观看中文字幕2021| 日韩二区三区在线观看| 国产成人精品在线观看| 国产黄色免费观看| 国产视频一区在线观看一区免费| 久久久久久国产免费| 极品颜值美女露脸啪啪| 一区二区日韩欧美| 精品少妇一区二区30p| 黄色录像免费观看| 中文精品久久| 欧美日韩国产成人| 欧美日韩激情在线观看| 欧美激情aⅴ一区二区三区| 欧美成人午夜免费视在线看片| 久艹在线观看视频| 久久久久久久久久久9不雅视频| 在线观看亚洲视频| 国产一二三av| 亚洲高清影视| 欧美黑人视频一区| 国产无码精品久久久| 亚洲成人直播| 欧美又大又粗又长| 中文字幕黄色片| 男女男精品网站| 国产在线精品播放| 国产av无码专区亚洲av| 国产电影一区二区三区| 国产精品久久7| 五月天激情婷婷| 久久精品一区蜜桃臀影院| 亚洲国产精品日韩| 成人免费视屏| 精品久久久久久中文字幕一区奶水 | 国产精品女同一区二区三区| av不卡在线免费观看| 三级福利片在线观看| 五月婷婷欧美视频| 熟女人妇 成熟妇女系列视频| 欧美日韩破处视频| 精品电影一区二区| 人妻一区二区视频| 欧美日韩一区二区国产| 日韩av免费在线观看| 在线观看xxxx| av一区二区久久| 亚洲二区自拍| 三级资源在线| 在线观看日韩电影| 麻豆tv在线观看| 蜜臀av免费一区二区三区| 久久精品91久久香蕉加勒比| 精品无码av在线| 免费在线视频一区| 精品乱码一区| 精品美女在线观看视频在线观看| 五月婷婷欧美视频| 三级黄色片免费看| 国产成人三级| 国模精品视频一区二区| 影音先锋黄色网址| 91视频.com| 一级黄色免费在线观看| 欧美成人资源| 精品99999| а天堂中文在线资源| 国产精品日韩欧美一区| 91午夜在线播放| 免费在线国产| 性感美女极品91精品| 日本不卡一区在线| 欧美美女在线观看| 国产做受高潮69| 99热这里只有精品在线| 国产精品热久久久久夜色精品三区| 男女激情免费视频| crdy在线观看欧美| 亚洲性生活视频| 欧美三级韩国三级日本三斤在线观看| 国产综合成人久久大片91| 欧美精品二区三区四区免费看视频| av网站网址在线观看| 欧美亚洲国产一卡| 在线观看国产精品一区| 亚洲神马久久| 国产精品日本一区二区| 在线网址91| 91精品福利在线一区二区三区 | 色婷婷狠狠18禁久久| 五月天久久777| 国产精品嫩草影院一区二区| 日本a一级在线免费播放| 亚洲成人综合在线| 国产精品偷伦视频免费观看了| 久久影院100000精品| 国产精品99久久久久久白浆小说| 天堂资源最新在线| 激情久久av一区av二区av三区 | 国产欧美一区二区在线观看| 久久久久久久久久久视频| 风间由美性色一区二区三区四区| 色综合色综合久久综合频道88| 97caocao| 中文字幕一区二区视频| 久久这里只精品| 日韩欧美网址| 成人免费淫片aa视频免费| 男人的天堂在线视频免费观看 | 色婷婷av一区二区三区软件| 精品人妻一区二区三区日产乱码卜| 亚洲欧洲视频| 久久精品国产精品青草色艺| 三级中文字幕在线观看| 亚洲欧洲偷拍精品| 伊人久久一区二区| 亚洲视频在线观看一区| 亚洲丝袜在线观看| 亚洲大片av| 欧美日韩中文国产一区发布 | 色婷婷av一区二区三区gif| 亚洲黄色小说视频| 毛片av一区二区三区| 一区二区三区久久网| 免费观看在线一区二区三区| 久久久久久亚洲精品| 神马久久高清| 欧美日韩精品欧美日韩精品一综合| 美国黄色片视频| 国产电影精品久久禁18| 亚洲国产精品久久久久爰色欲| 国产永久精品大片wwwapp| 国产欧美va欧美va香蕉在线| av网站导航在线观看免费| 亚洲国产高清高潮精品美女| 手机av免费观看| 亚洲欧美一区二区视频| 亚洲乱妇老熟女爽到高潮的片| 国产精品色网| 麻豆md0077饥渴少妇| 国产精品对白久久久久粗| 欧美与欧洲交xxxx免费观看 | 污版视频在线观看| 久久精品国产亚洲夜色av网站 | 日韩av第一页| 黄色网址免费在线观看| 亚洲国内高清视频| 在线免费看91| 精品女同一区二区三区在线播放| 丁香六月激情综合| 丁香亚洲综合激情啪啪综合| 成人免费毛片播放| 激情一区二区| 亚洲天堂电影网| 欧美福利在线播放网址导航| 国产有码在线一区二区视频| 黄频免费在线观看| 久久国产精品首页| 国产在线网站| 精品毛片乱码1区2区3区| 中文区中文字幕免费看| 五月综合激情日本mⅴ| 男人的天堂久久久| 国产精品天干天干在观线| 精品国产一区在线| 国产精品一区二区无线| 精品久久久久久久无码| 亚洲人成在线影院| 日韩中文在线字幕| 欧美日韩黑人| 久久久综合香蕉尹人综合网| 亚洲欧美日本国产| 国产一区二区在线免费视频| 大胆人体一区二区| 欧美激情a在线| 欧美性videos| 一色桃子一区二区| 欧美大片aaa| 亚洲国产成人精品女人久久久| 国产黄色美女视频| 欧美日韩夫妻久久| 涩涩视频在线观看| 日韩欧美国产免费播放| 精品无码人妻一区二区三区| 亚洲视频图片小说| 天堂网av2018| 欧美国产日本韩| 91激情视频在线观看| www欧美成人18+| 你懂的在线观看网站| 成人高清视频在线观看| 日本女人性视频| 国产精品一二三四| 中文字幕在线观看日| 极品尤物av久久免费看| 欧美精品久久久久久久久25p| 免费观看在线综合色| 人人爽人人av| 美美哒免费高清在线观看视频一区二区 | 成人欧美一区二区三区在线观看| 外国成人毛片| 成人网中文字幕| 欧美高清一级片| 国产精品美女诱惑| 国产区精品视频在线观看豆花| av日韩免费电影| 成人动态视频| 久久精品丝袜高跟鞋| 亚洲另类春色校园小说| 欧洲一区二区在线| 精品国产乱码久久久| 亚洲国产婷婷香蕉久久久久久99| 久久久影院免费| 国产人妻互换一区二区| 欧美久久九九| 热99这里只有精品| 久久青草久久| 国产无遮挡猛进猛出免费软件| 国产综合色精品一区二区三区| 亚洲热在线视频| 成人激情免费网站| 少妇饥渴放荡91麻豆| 国产欧美综合在线观看第十页| 亚洲国产精品一区二区久久hs| 亚洲人成7777| 国产精品xxxx喷水欧美| 色综合久久久久综合99| 国产一区视频在线| 秋霞视频一区二区| 亚洲精品xxx| 91精品专区| 欧美日韩不卡合集视频| 美女在线视频免费| 国产精品精品久久久久久| www.欧美日韩| 成人在线观看一区二区| 99在线精品观看| 亚洲精品国产熟女久久久| 国产精品三级av| 激情五月婷婷小说| 岛国av一区二区在线在线观看| 成人av网站在线播放| 欧美日本在线播放| 亚洲欧美另类视频| 亚洲欧美综合精品久久成人| 黄色在线免费看| 4444欧美成人kkkk| 欧美美女被草| 精品国产一区二区三区麻豆小说 | 日韩伦理在线免费观看| 视频精品一区二区| 久久精品aⅴ无码中文字字幕重口| 久久色视频免费观看| 裸体武打性艳史| 色婷婷亚洲一区二区三区| 国产男女裸体做爰爽爽| 亚洲乱码一区二区| 成人毛片av在线| 清纯唯美亚洲综合| 亚洲天堂中文字幕在线观看| 欧洲亚洲一区二区| 亚洲午夜激情在线| 黄色片视频在线| 久久综合丝袜日本网| 欧美成人免费观看视频 | www.xxx国产| 伊人av综合网| 三妻四妾完整版在线观看电视剧 | 国产91精品视频在线观看| 精品国产亚洲一区二区三区在线| 日韩jizzz| 西西人体一区二区| 成人啪啪18免费游戏链接| 国产精品护士白丝一区av| 亚洲欧美一二三区| 亚洲精品国偷自产在线99热| 三级资源在线| 91精品网站| 一区二区三区毛片免费| www.com操| 国产欧美一区二区精品仙草咪| 天堂网一区二区三区| 欧美zozo另类异族| 黄色网在线免费看| 91精品久久久久久久久久另类| 一本色道久久综合狠狠躁的番外| 777av视频| 国产99久久久久久免费看农村| 天堂网avav| 欧美一区二区网站| 久草免费在线观看| 国产欧美精品在线| 欧美日韩国产在线观看网站| 成人在线观看黄| 久久综合九色欧美综合狠狠 | 欧美性高清videossexo| 日本不卡视频一区二区| 奇米4444一区二区三区| 一呦二呦三呦国产精品| 北条麻妃在线观看| 久久久国际精品| 国产无遮挡又黄又爽又色视频| 亚洲品质视频自拍网| 午夜无码国产理论在线| 视频一区二区三区在线观看| 日韩精品乱码免费| 一级片久久久久| 欧美日精品一区视频| 色多多视频在线观看| 国产日产欧美a一级在线| 国产精品久久久久久久免费观看 | 男女视频一区二区三区| 欧美激情一区二区三区不卡| 中文字幕乱码人妻二区三区| 中文字幕国产亚洲2019| 一级欧美视频| 污污污污污污www网站免费| 成人免费福利片| 国产成人综合欧美精品久久| 亚洲欧洲日产国码av系列天堂| 欧美aaa大片视频一二区| 中文字幕一区二区三区精彩视频| 国产中文一区二区三区| 国产精品suv一区二区69| 亚洲毛片在线看| 成人深夜福利| 精品一区二区三区毛片| hitomi一区二区三区精品| 狠狠人妻久久久久久| 最近中文字幕2019免费| 欧美特黄不卡| av7777777| 国产精品网站在线| 亚洲精品久久久蜜桃动漫| 2021久久精品国产99国产精品| 成人区精品一区二区婷婷| theporn国产精品| 欧美日韩国产页| 在线观看av的网站| 99久热re在线精品视频| 午夜亚洲性色视频| 日本成人免费在线观看| 亚洲第一色在线| 成人黄色图片网站| 国产一二三区在线播放| 国产欧美日韩精品一区| 午夜精品久久久久久久91蜜桃| 欧美性受xxxx黑人猛交| 先锋资源久久| 大又大又粗又硬又爽少妇毛片 | 在线欧美日韩精品| 在线āv视频| 日本精品一区二区三区不卡无字幕| 精品一区二区三区免费| 成人免费视频毛片| 久久视频在线直播| 国产va免费精品观看精品视频 | 中文字幕一区二区三区四区| 亚洲 欧美 自拍偷拍|