精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

把圖像視為外語,快手、北大多模態大模型媲美DALLE-3

人工智能 新聞
動態視覺分詞統一圖文表示,快手與北大合作提出基座模型 LaVIT 刷榜多模態理解與生成任務。

當前的大型語言模型如 GPT、LLaMA 等在自然語言處理領域取得了顯著進展,能夠理解和生成復雜的文本內容。但你是否想過,如果能夠將大語言模型這強大的理解和生成能力遷移到多模態數據上,就可以輕松理解海量的圖像與視頻,并輔助創作圖文并茂的內容。近期,來自快手和北大合作的最新多模態大模型 LaVIT, 正在讓這個想法逐步變為現實。

圖片


  • 論文標題:Unified Language-Vision Pretraining in LLM with Dynamic Discrete Visual Tokenization
  • 論文地址:https://arxiv.org/abs/2309.04669
  • 代碼模型地址:https://github.com/jy0205/LaVIT

模型總覽

LaVIT 作為一個新型的通用多模態基礎模型,可以像語言模型那樣,既能夠理解也能生成視覺內容。LaVIT 繼承了大語言模型成功的訓練范式,即以自回歸的方式預測下一個圖像或文本 token。在訓練完成后,其可以充當一個多模態通用接口,無需進一步的微調,就可以執行多模態理解和生成任務。例如,LaVIT 具有以下的能力:

實現高質量文本到圖像的生成:LaVIT 能夠根據給定的文本提示生成高質量、多種縱橫比和高美感的圖像。其圖像生成能力與最先進的圖像生成模型(如 Parti、SDXL 和 DALLE-3)相媲美。

根據多模態提示進行圖像生成:由于在 LaVIT 中,圖像和文本都被統一表示為離散化的 token,因此其可以接受多種模態組合(例如文本、圖像 + 文本、圖像 + 圖像)作為提示,生成相應的圖像,而無需進行任何微調。

理解圖像內容并回答問題:在給定輸入圖像的情況下,LaVIT 能夠閱讀圖像內容并理解其語義。例如,模型可以為輸入的圖像提供 caption 并回答相應的問題。

圖片

方法概覽

LaVIT 的模型結構如下圖所示,其整個優化過程包括兩個階段:

圖:LaVIT 模型的整體架構

階段 1: 動態視覺分詞器

為了能夠像自然語言一樣理解和生成視覺內容,LaVIT 引入了一個設計良好的視覺分詞器,用于將視覺內容(連續信號)轉換為像文本一樣的 token 序列,就像 LLM 能夠理解的外語一樣。作者認為,為了實現統一視覺和語言的建模,該視覺分詞器 (Tokenizer) 應該具有以下兩個特性:

  1. 離散化:視覺 token 應該被表示為像文本一樣的離散化形式。這樣對于兩種模態采用統一的表示形式,有利于 LaVIT 在一個統一的自回歸生成式訓練框架下,使用相同的分類損失進行多模態建模優化。
  2. 動態:與文本 token 不同的是,圖像 patch 之間有著顯著的相互依賴性,這使得從其他圖像 patch 中推斷另一個 patch 相對簡單。因此,這種依賴性會降低原本 LLM 的 next-token prediction 優化目標的有效性。LaVIT 提出通過使用 token merging 來降低視覺 patch 之間的冗余性,其根據不同圖像語義復雜度的不同,編碼出動態的視覺 token 數量。這樣對于復雜程度不同的圖像,采用動態的 token 編碼也進一步提高了預訓練的效率,避免了冗余的 token 計算。

下圖是 LaVIT 所提出的視覺分詞器結構:

圖片

圖:(a) 動態視覺 token 生成器 (b) token 合并器

該動態視覺分詞器包括 token 選擇器和 token 合并器。如圖所示, token 選擇器用來選擇最具信息的圖像區塊,而 token 合并器則將那些 uninformative 的視覺塊的信息壓縮到保留下的 token 上,實現對冗余 token 的 merging。整個動態視覺分詞器則通過最大限度地重構輸入圖像的語義進行訓練。

Token 選擇器

Token 選擇器接收 N 個圖像區塊級的特征作為輸入,其目標是評估每個圖像區塊的重要性并選擇信息量最高的區塊,以充分代表整個圖像的語義。為實現這一目標,采用輕量級模塊,由多個 MLP 層組成,用于預測分布 π。通過從分布 π 中采樣,生成一個二進制決策 mask,用于指示是否保留相應的圖像區塊。

Token 合并器

Token 合并器據生成的決策掩碼,將 N 個圖像區塊劃分為保留 X_r 和舍棄 X_d 兩組。與直接丟棄 X_d 不同,token 合并器可以最大限度地保留輸入圖像的詳細語義。token 合并器由 L 個堆疊的塊組成,每個塊包括因果自注意力層、交叉注意力層和前饋層。因果自注意力層中, X_r 中的每個 token 只關注其前面的 token,以確保與 LLM 中的文本 token 形式一致。與雙向自注意相比,這種策略表現更好。交叉注意力層將保留的 token X_r 作為 query,并根據它們在語義上的相似性合并 X_d 中的 token。

階段 2: 統一的生成式預訓練

經過視覺分詞器處理后的視覺 token 與文本 token 相連接形成多模態序列作為訓練時的輸入。為了區分兩種模態,作者在圖像 token 序列的開頭和結尾插入了特殊 token :[IMG] 和 [/IMG],用于表示視覺內容的開始和結束。為了能夠生成文本和圖像,LaVIT 采用兩種圖文連接形式:[image, text] 和 [text; image]。

對于這些多模態輸入序列,LaVIT 采用統一的、自回歸方式來直接最大化每個多模態序列的似然性進行預訓練。這樣在表示空間和訓練方式上的完全統一,有助于 LLM 更好地學習多模態交互和對齊。在預訓練完成后,LaVIT 具有感知圖像的能力,可以像處理文本一樣理解和生成圖像。

實驗

零樣本多模態理解

LaVIT 在圖像字幕生成(NoCaps、Flickr30k)和視覺問答(VQAv2、OKVQA、GQA、VizWiz)等零樣本多模態理解任務上取得了領先的性能。

圖片

表 1 零樣本的多模態理解任務評估

零樣本多模態生成

在這個實驗中,由于所提出的視覺 tokenizer 能夠將圖像表示為離散化 token,LaVIT 具有通過自回歸生成類似文本的視覺 token 來合成圖像的能力。作者對模型進行了零樣本文本條件下的圖像合成性能的定量評估,比較結果如表 2 所示。

圖片

表 2 不同模型的零樣本文本到圖像生成性能

從表中可以看出,LaVIT 的表現優于所有其他多模態語言模型。與 Emu 相比,LaVIT 在更小的 LLM 模型上取得了進一步改進,展現了出色的視覺 - 語言對齊能力。此外,LaVIT 在使用更少的訓練數據的情況下,實現了與最先進的文本到圖像專家 Parti 可比的性能。

多模態提示圖像生成

LaVIT 能夠在無需進行任何微調的情況下,無縫地接受多種模態組合作為提示,生成相應的圖像,而無需進行任何微調。LaVIT 生成的圖像能夠準確反映給定多模態提示的風格和語義。而且它可以通過輸入的多模態提示修改原始輸入圖像。在沒有額外微調的下游數據的情況下,傳統的圖像生成模型如 Stable Diffusion 無法達到這種能力。

圖片

多模態圖像生成結果的示例

定性分析

如下圖所示,LaVIT 的動態分詞器可以根據圖像內容動態選擇最具信息量的圖像塊,學習到的代碼本可以產生具有高層語義的視覺編碼。

圖片

動態視覺分詞器(左)和學習到的 codebook(右)的可視化

總結

LaVIT 的出現為多模態任務的處理又提供了一種創新范式,通過使用動態視覺分詞器將視覺和語言表示為統一的離散 token 表示,繼承了 LLM 成功的自回歸生成學習范式。通過在統一生成目標下進行優化,LaVIT 可以將圖像視為一種外語,像文本一樣理解和生成它們。這一方法的成功為未來多模態研究的發展方向提供了新的啟示,利用 LLM 強大的推理能力,實現更智能、更全面的多模態理解和生成打開新的可能性。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-20 13:18:46

模型多模態體系

2023-11-29 15:00:00

數據訓練

2025-02-18 09:10:00

2025-01-08 08:21:16

2025-06-09 08:50:00

2024-07-16 13:18:36

2024-10-24 23:37:33

2024-08-13 15:00:00

大模型提示學習

2021-01-18 15:28:13

加密貨幣比特幣貨幣

2025-09-16 09:35:52

2025-02-07 11:00:00

模型開源AI

2025-04-28 14:13:43

開源SOTA多模態

2024-12-30 00:01:00

多模態大模型Python

2025-04-10 06:30:00

2023-10-16 12:31:17

人工智能數據

2023-09-12 13:59:41

OpenAI數據集

2025-04-28 09:10:00

2023-09-28 07:24:13

KOSMOS模型文檔
點贊
收藏

51CTO技術棧公眾號

国内自拍在线观看| 久久久影院一区二区三区| 国产精品视频一区二区三 | 91久久国产精品| 久久综合色综合| 国产剧情在线观看一区| 91精品婷婷国产综合久久竹菊| 无码人妻精品一区二区蜜桃网站| 蜜桃视频在线播放| 国产乱码精品1区2区3区| 91超碰caoporn97人人| 国产馆在线观看| 狼人精品一区二区三区在线| 欧美电影影音先锋| 九九九九免费视频| av色综合久久天堂av色综合在| 97精品国产97久久久久久久久久久久| 91精品美女在线| 综合激情网五月| 红桃视频国产一区| 亚洲色图综合久久| 中文字幕在线永久| 久久久久亚洲精品中文字幕| 在线一区二区三区四区五区| 日日摸日日碰夜夜爽无码| 尤物网在线观看| 91亚洲精品久久久蜜桃网站| 亚洲在线免费视频| 中文字幕日韩国产| 久久人人精品| 97色在线视频观看| 欧美精品xxxxx| 97精品视频| 一本色道久久综合狠狠躁篇的优点 | 久久99精品久久久久久青青日本| 99国产精品99| 日本中文字幕一区二区视频| 久久好看免费视频| 日本少妇xxxxx| 国产一区二区精品福利地址| 亚洲成av人乱码色午夜| 黄色片免费网址| 91精品麻豆| 欧美日韩成人在线| 美女网站视频黄色| 91伊人久久| 欧美亚洲综合另类| 国产精品拍拍拍| 精品123区| 欧美性欧美巨大黑白大战| 日本www高清视频| 天天综合网站| 91高清视频在线| 亚洲欧美另类动漫| 黄色日韩网站| 欧美精品v日韩精品v韩国精品v| 五月天激情视频在线观看| 国产福利亚洲| 91精品国产免费| 人妻少妇偷人精品久久久任期| 日韩在线亚洲| 亚洲国产高潮在线观看| av网页在线观看| 秋霞影院一区二区三区| 日韩乱码在线视频| 久久丫精品忘忧草西安产品| 日韩免费视频| 欧美不卡视频一区发布| 国产在线欧美在线| 国产亚洲一区在线| 国产精品美女免费| 国产欧美一级片| 成人毛片视频在线观看| 久久国产精品99久久久久久丝袜| 国产一二三区在线视频| 亚洲欧洲另类国产综合| 日韩黄色片在线| 在线免费看h| 欧洲精品一区二区| 韩国一区二区在线播放| 精品亚洲免a| 怡红院精品视频| 亚洲不卡在线播放| 日韩五码在线| 国产精品自产拍高潮在线观看| 国产成人av免费看| 91亚洲男人天堂| 一区二区不卡视频| 91桃色在线观看| 欧美午夜宅男影院| 师生出轨h灌满了1v1| 嫩草一区二区三区| 久久这里只有精品99| 男女啊啊啊视频| 精品中文字幕一区二区| 精品麻豆av| 黄色网页在线看| 狠狠躁夜夜躁久久躁别揉| 少妇一级淫免费放| 久久资源综合| 不卡av在线网站| 一级黄色免费网站| 国产激情视频一区二区三区欧美| 欧美日韩一区二区三区在线视频| 麻豆传媒视频在线观看免费| 精品国产乱码久久久久久天美| 深夜黄色小视频| 青草久久视频| 欧美肥臀大乳一区二区免费视频| www.久久网| 99视频国产精品| 男女h黄动漫啪啪无遮挡软件| 色多多在线观看| 欧美一级爆毛片| 欧美三级视频网站| 国产日韩亚洲欧美精品| 9a蜜桃久久久久久免费| 午夜视频在线看| 日韩欧美中文在线| fc2成人免费视频| 亚洲视频在线免费| 国产精品久久久久久久一区探花| 少妇一级淫片免费看| 亚洲美女一区二区三区| 日本www.色| 精品一区免费| 欧美孕妇毛茸茸xxxx| 黄色av网站免费在线观看| 亚洲色图视频网| 538任你躁在线精品免费| 国产精品密蕾丝视频下载| 久久久久久久av| 国产黄色大片网站| 亚洲蜜桃精久久久久久久| www.cao超碰| 日韩毛片视频| 国产久一一精品| 日本在线免费中文字幕| 精品视频免费看| 色www亚洲国产阿娇yao| 日韩成人一级大片| 亚洲不卡一卡2卡三卡4卡5卡精品| 草草影院在线| 亚洲激情视频网站| 亚洲天堂日韩av| av中文字幕亚洲| 亚洲美免无码中文字幕在线| 国产精品巨作av| 韩国v欧美v日本v亚洲| 午夜av免费观看| 精品国产成人av| 国产色视频一区二区三区qq号| 麻豆精品网站| 台湾成人av| 91九色成人| 色综合五月天导航| 日本高清视频www| 色综合久久久久| 91精品国自产在线| 免费人成网站在线观看欧美高清| 视频在线精品一区| 国产亚洲字幕| 久久久久久久久电影| 水莓100国产免费av在线播放| 欧美小视频在线| 精品国产aaa| 激情图片小说一区| 久久人人爽人人爽人人av| 国产精品天天看天天狠| 欧美亚洲另类激情另类| 137大胆人体在线观看| 91麻豆精品国产91久久久更新时间 | 色先锋久久影院av| 国产精品九九久久久久久久| 免费观看在线午夜影视| 精品国产伦理网| 天天干,天天干| 亚洲美女少妇撒尿| 久久精品女同亚洲女同13| 老司机午夜精品视频在线观看| 亚洲一区综合| 超碰精品在线观看| 国产精品96久久久久久| 在线观看wwwxxxx| 亚洲精品一二区| 99久久久无码国产精品免费| 亚洲图片欧美色图| 男人操女人动态图| 国产成人av一区二区| 免费观看日韩毛片| 久久精品青草| 欧美极品一区二区| 欧美经典影片视频网站| 国产97人人超碰caoprom| 激情视频在线观看| 亚洲精品网站在线播放gif| va婷婷在线免费观看| 欧美色另类天堂2015| 国产福利视频网站| www国产成人| 人妻激情偷乱视频一区二区三区| 久久婷婷av| av一区二区三区免费观看| 欧美freesex8一10精品| 亚洲伊人第一页| 欧美xxxx做受欧美护士| 久久91亚洲精品中文字幕奶水 | 牛牛视频精品一区二区不卡| 成人a在线视频| 日韩电影网站| 久久欧美在线电影| 国产原厂视频在线观看| 亚洲天堂视频在线观看| 日韩在线观看视频一区二区三区| 欧美精三区欧美精三区| 黄色污污网站在线观看| 亚洲第一激情av| 岛国毛片在线观看| 中文字幕在线一区免费| 久久国产柳州莫菁门| 972aa.com艺术欧美| 涩视频在线观看| 国产精品一区二区免费不卡| 羞羞的视频在线| 日韩精品一二区| 漂亮人妻被中出中文字幕| 亚洲激情欧美| 国产九色porny| 欧美96在线丨欧| 妞干网这里只有精品| 97精品视频在线看| 在线观看成人av电影| 奇米影视亚洲| 亚洲国产精品综合| 精品国产91乱码一区二区三区四区 | 欧美日韩第二页| 亚洲免费网址| 成年人观看网站| 久久精品麻豆| www日韩视频| 日韩国产在线观看一区| 国产成人精品无码播放| 视频一区二区中文字幕| 国产视频一区二区视频| 日韩精品免费视频人成| 黄色成人免费看| 麻豆91在线播放免费| 久久久久久综合网| 国产精品自在在线| 久久人妻少妇嫩草av蜜桃| 成人免费黄色大片| 男生裸体视频网站| 久久久国产精品不卡| 国产黄色录像视频| 1024成人网| 久久黄色av网站| 国产一二三av| 亚洲欧洲av另类| 在线观看成人毛片| 天天色综合成人网| 免费观看日批视频| 欧美伦理视频网站| www香蕉视频| 日韩激情av在线播放| 你懂的在线观看| 日韩一区二区精品视频| 日本高清在线观看| 97视频免费在线看| 久久久成人av毛片免费观看| 国产欧美日韩免费| 一区二区在线视频观看| 九色一区二区| 日本精品黄色| 福利在线一区二区| 玖玖在线精品| 色黄视频免费看| 91丨九色丨蝌蚪富婆spa| 美国一级黄色录像| 夜夜夜精品看看| 中文字幕免费高清网站| 日韩视频中午一区| 嫩草研究院在线| 欧美成人精品一区二区| 伊人网在线播放| 91手机视频在线观看| 日韩在线麻豆| 激情五月五月婷婷| 三级在线观看一区二区| 国产人妻精品久久久久野外| 久久综合狠狠综合久久激情| 日韩国产第一页| 一本高清dvd不卡在线观看| 99久久国产免费| 亚洲天天在线日亚洲洲精| 香蕉久久aⅴ一区二区三区| 日韩美女免费视频| 66精品视频在线观看| 视频二区一区| 亚洲理论在线| 婷婷激情小说网| 国产日韩欧美制服另类| 久久精品视频8| 91麻豆精品久久久久蜜臀| 精品久久久久一区二区三区| 欧美国产视频一区二区| 欧美电影在线观看网站| 女人一区二区三区| 影音先锋久久久| 国产乱码一区二区三区四区| 久久久精品蜜桃| 黄色一级片免费看| 91精品国产91综合久久蜜臀| 国产黄在线观看| 69av在线视频| 风间由美中文字幕在线看视频国产欧美 | 一卡二卡在线视频| 亚洲视频在线观看视频| 理论不卡电影大全神| 91视频免费进入| 婷婷激情综合| 色婷婷成人在线| 国产欧美日韩在线看| 日本视频网站在线观看| 91亚洲精品一区二区乱码| 成人三级在线| 欧美成a人免费观看久久| 久久视频免费在线| 精品一区二区三区在线视频| 99久久精品免费视频| 狠狠色狠色综合曰曰| 日本黄色不卡视频| 欧美国产精品人人做人人爱| 欧美激情三级| 无颜之月在线看| 国产福利精品一区| 欧产日产国产v| 日韩欧美国产综合| 超碰公开在线| 91色精品视频在线| 一区二区电影| 久久黄色一级视频| 一区二区免费看| 韩国av在线免费观看| 欧美精品精品精品精品免费| 一区二区在线视频观看| 国产真人做爰毛片视频直播| 国产伦精品一区二区三区在线观看| 国产成人av免费在线观看| 欧美精品18+| 2024最新电影在线免费观看| 亚洲一区美女视频在线观看免费| 欧美精品91| 小毛片在线观看| 精品欧美aⅴ在线网站| 亚洲 国产 欧美 日韩| 欧美专区日韩视频| 国内亚洲精品| 亚洲一区二区福利视频| 中文字幕中文字幕在线一区| 国产农村老头老太视频| 蜜臀久久99精品久久久无需会员| 欧美三级一区| 国产a级片网站| 2023国产精品视频| 亚洲天堂2021av| 欧美高清无遮挡| 免费成人av| 欧美美女一级片| 亚洲一区二区三区四区的| 亚洲av成人无码网天堂| 国产精品成人在线| 亚洲一区二区| 一女三黑人理论片在线| 欧美视频三区在线播放| 成人国产免费电影| 精品网站在线看| 久久se这里有精品| 亚洲一区欧美在线| 精品视频www| 99久久999| 5月婷婷6月丁香| 国产精品素人一区二区| 亚洲第一精品网站| 国产精品成人播放| 在线观看一区视频| 精品一区二区在线观看视频| 欧美成人乱码一区二区三区| 日韩影片中文字幕| 中国女人做爰视频| 久久女同性恋中文字幕| 国产精品无码久久久久成人app| 992tv成人免费影院| 欧美韩日一区| 99久久久久久久久久| 日韩一区二区三区电影在线观看 | 国产精品一区久久久| 精品96久久久久久中文字幕无| 精品国产一区二区三区免费| 亚洲精华液一区二区三区| 免费h精品视频在线播放|