精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

拋棄視覺編碼器,這個「原生版」多模態大模型也能媲美主流方法

人工智能 新聞
近期,關于多模態大模型的研究如火如荼,工業界對此的投入也越來越多。國外相繼推出了炙手可熱的模型。

一作刁海文,是大連理工大學博士生,導師是盧湖川教授。目前在北京智源人工智能研究院實習,指導老師是王鑫龍博士。他的研究興趣是視覺與語言,大模型高效遷移,多模態大模型等。共同一作崔玉峰,畢業于北京航空航天大學,是北京智源人工智能研究院視覺中心算法研究員。他的研究興趣是多模態模型、生成模型和計算機視覺,主要工作有 Emu 系列。

近期,關于多模態大模型的研究如火如荼,工業界對此的投入也越來越多。國外相繼推出了炙手可熱的模型,例如 GPT-4o (OpenAI)、Gemini(Google)、Phi-3V (Microsoft)、Claude-3V(Anthropic),以及 Grok-1.5V(xAI)等。與此同時,國內的 GLM-4V(智譜 AI)、Step-1.5V(階躍星辰)、Emu2(北京智源)、Intern-VL(上海 AI 實驗室)、Qwen-VL(阿里巴巴)等模型百花齊放。

當前的視覺語言模型(VLM)通常依賴視覺編碼器(Vision Encoder, VE)來提取視覺特征,再結合用戶指令傳入大語言模型(LLM)進行處理和回答,主要挑戰在于視覺編碼器和大語言模型的訓練分離。這種分離導致視覺編碼器在與大語言模型對接時引入了視覺歸納偏置問題,例如受限的圖像分辨率和縱橫比,以及強烈的視覺語義先驗。隨著視覺編碼器容量的不斷擴大,多模態大模型在處理視覺信號時的部署效率也受到極大限制。此外,如何找到視覺編碼器和大語言模型的最佳容量配置,也變得越來越具有復雜性和挑戰性。

圖片

在此背景下,一些更加前沿的構想迅速浮現:

  • 能否去除視覺編碼器,即直接構建無視覺編碼器的原生多模態大模型?
  • 如何高效且絲滑地將大語言模型演變為無視覺編碼器的原生多模態大模型?
  • 如何彌合無編碼器的原生多模態框架和基于編碼器的主流多模態范式的性能差距?

Adept AI 在 2023 年末發布了 Fuyu 系列模型并做出了一些相關嘗試,但在訓練策略、數據資源和設備信息方面沒有任何披露。同時,Fuyu 模型在公開的視覺文本評測指標上與主流算法存在顯著的性能差距。同期,我們進行的一些先導試驗顯示,即使大規模拉升預訓練數據規模,無編碼器的原生多模態大模型仍面臨收斂速度慢和性能表現差等棘手問題。

針對這些挑戰,智源研究院視覺團隊聯合大連理工大學、北京大學等國內高校,推出了新一代無編碼器的視覺語言模型 EVE。通過精細化的訓練策略和額外的視覺監督,EVE 將視覺 - 語言表征、對齊和推理整合到統一的純解碼器架構中。使用公開數據,EVE 在多個視覺 - 語言基準測試中表現出色,與類似容量的基于編碼器的主流多模態方法相媲美,并顯著優于同類型 Fuyu-8B。EVE 的提出旨在為純解碼器的原生多模態架構發展提供一條透明且高效的路徑。

圖片

圖片


  • 論文地址:  https://arxiv.org/abs/2406.11832
  • 項目代碼:  https://github.com/baaivision/EVE
  • 模型地址:  https://huggingface.co/BAAI/EVE-7B-HD-v1.0

1. 技術亮點 

  • 原生視覺語言模型:打破了主流的多模態模型的固定范式,去除視覺編碼器,可處理任意圖像長寬比。在多個視覺語言基準測試中顯著優于同類型的 Fuyu-8B 模型,并接近主流的基于視覺編碼器的視覺語言架構。
  • 數據和訓練代價少:  EVE 模型的預訓練僅篩選了來自 OpenImages、SAM 和 LAION 的公開數據,并利用了 66.5 萬條 LLaVA 指令數據和額外的 120 萬條視覺對話數據,分別構建了常規版本和高分辨版本的 EVE-7B。訓練在兩個 8-A100 (40G) 節點上約需 9 天完成,或者在四個 8-A100 節點上約需 5 天完成。
  • 透明和高效的探索: EVE 嘗試探索一條高效、透明且實用的路徑通往原生視覺語言模型,為開發新一代純解碼器的視覺語言模型架構提供全新的思路和寶貴的經驗,為未來多模態模型的發展開辟新的探索方向。

2. 模型結構

圖片

首先,通過 Vicuna-7B 語言模型進行初始化,使其具備豐富的語言知識和強大的指令跟隨能力。在此基礎上,去除深度視覺編碼器,構建輕量級視覺編碼層,高效無損地編碼圖像輸入,并將其與用戶語言命令輸入到統一的解碼器中。此外,通過視覺對齊層與通用的視覺編碼器進行特征對齊,強化細粒度的視覺信息編碼和表征。

圖片

2.1 Patch Embedding Layer

  • 首先使用單層卷積層來獲取圖像的 2D 特征圖,然后通過平均池化層進行下采樣;
  • 使用交叉注意力模塊(CA1)在限定感受野中交互,增強每個 patch 的局部特征;
  • 使用 < CLS> token 并結合交叉注意力模塊(CA2),為后續每個 patch 特征提供全局信息;
  • 在每個 patch 特征行的末尾插入了一個可學習的 < SPL> token,幫助網絡理解圖像的二維空間結構。

2.2 Patch Aligning Layer

  • 記錄有效 patch 的二維形狀;丟棄 < CLS>/<PAD> tokens,并利用自適應池化層還原到原始的二維形狀;
  • 通過層級交叉注意力模塊(CA3),整合多層網絡視覺特征,從而實現與視覺編碼器輸出的細粒度對齊。

3. 訓練策略

圖片

  • 大語言模型引導的預訓練階段:建立視覺和語言之間的初步聯系,為后續穩定高效的大規模預訓練打下基礎;
  • 生成式預訓練階段:進一步提高模型對視覺 - 語言內容的理解能力,實現純語言模型到多模態模型的絲滑轉變;
  • 監督式的微調階段:進一步規范模型遵循語言指令和學習對話模式的能力,滿足各種視覺語言基準測試的要求。

圖片

  • 在預訓練階段,篩選了來自 SA-1B、OpenImages 和 LAION 等 3300 萬公開數據,僅保留分辨率高于 448×448 的圖像樣本。特別地,針對 LAION 圖像冗余度高的問題,通過在 EVA-CLIP 提取的圖像特征上應用 K-means 聚類,生成 50,000 個聚類,并從中挑選出最接近每個聚類中心的 300 張圖像,最終選出 1500 萬張 LAION 圖像樣本。隨后,利用 Emu2 (17B)和 LLaVA-1.5 (13B)重新生成高質量圖像描述。
  • 在監督微調階段,使用 LLaVA-mix-665K 微調數據集來訓練得到標準版的 EVE-7B,并整合 AI2D、Synthdog、DVQA、ChartQA、DocVQA、Vision-Flan 和 Bunny-695K 等混合數據集來訓練得到高分辨率版本的 EVE-7B。

4. 定量分析

圖片

EVE 模型在多個視覺語言基準測試中明顯優于同類型的 Fuyu-8B 模型,并且與多種主流的基于編碼器的視覺語言模型表現相當。然而,由于使用大量視覺語言數據訓練,其在準確響應特定指令方面存在挑戰,在部分基準測試中表現有待提高。令人興奮的是,通過高效的訓練策略,可以實現無編碼器的 EVE 與帶編碼器基礎的視覺語言模型取得相當的性能,從根本上解決主流模型在輸入尺寸靈活性、部署效率和模態容量匹配方面的問題。

圖片


相較于帶編碼器的模型易受到語言結構簡化和豐富知識丟失等問題困擾,EVE 表現出隨著數據規模的增加而逐步穩定地提升性能,逐漸逼近基于編碼器模型的性能水平。這可能是因為在統一網絡中編碼和對齊視覺和語言模態更具挑戰性,使得無編碼器模型相對于帶編碼器的模型更不容易過擬合。

5. 同行怎么看?

英偉達高級研究員 Ali Hatamizadeh 表示,EVE 令人耳目一新,嘗試提出全新的敘事,區別于構建繁雜的評測標準和漸進式的視覺語言模型改進。

圖片


谷歌 Deepmind 首席研究員 Armand Joulin 表示,構建純解碼器的視覺語言模型令人興奮。

圖片

蘋果機器學習工程師 Prince Canuma 表示,EVE 架構非常有趣,對 MLX VLM 項目集是一個很好的補充。

圖片

6.未來展望

作為無編碼器的原生視覺語言模型,目前 EVE 取得了令人鼓舞的結果。沿著這條路徑,未來還有一些有趣的方向值得探索嘗試:

  • 進一步的性能提升:實驗發現,僅使用視覺 - 語言數據進行預訓練顯著地降低了模型的語言能力(SQA 得分從 65.3% 降至 63.0%),但逐步提升了模型的多模態性能。這表明在大語言模型更新時,內部存在語言知識的災難性遺忘。建議適當融合純語言的預訓練數據,或采用專家混合(MoE)策略來減少視覺與語言模態間干擾。
  • 無編碼器架構的暢想:通過恰當策略和高質量數據的訓練,無編碼器視覺語言模型可以與帶編碼器的模型相匹敵。那么在相同的模型容量和海量的訓練數據下,二者性能如何?我們推定通過擴大模型容量和訓練數據量,無編碼器架構是能夠達到甚至超越基于編碼器架構,因為前者幾乎無損地輸入圖像,避開了視覺編碼器的先驗偏置。
  • 原生多模態的構建: EVE 完整地展現了如何高效穩定地構建原生多模態模型,這為之后整合更多模態(如音頻、視頻、熱成像、深度等)開辟了透明和切實可行的道路。核心思想是在引入大規模統一訓練之前,先通過凍結的大語言模型對這些模態進行預對齊,并利用相應的單模態編碼器和語言概念對齊進行監督。
責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-18 14:50:00

AI訓練數據

2025-04-10 06:30:00

2025-08-07 02:00:00

2025-04-28 02:03:00

多模態大模型EVEv2

2025-02-28 10:15:00

3D模型編碼器

2024-06-20 14:12:53

2022-07-28 12:18:40

視覺語言模型

2025-04-17 14:11:10

視覺AI模型

2025-05-15 08:30:00

2025-09-16 09:08:00

2025-04-08 04:20:00

2025-04-07 04:30:00

2025-04-07 03:30:00

2024-11-13 09:39:13

2025-08-07 16:24:19

小紅書開源dots.vlm1

2024-12-18 18:57:58

2025-04-10 11:52:55

2025-04-08 03:00:00

2025-05-27 15:35:02

大模型技術AI

2025-01-08 08:21:16

點贊
收藏

51CTO技術棧公眾號

91丨九色丨海角社区| 成人h视频在线观看播放| 日韩不卡中文字幕| 久久婷婷开心| 在线不卡免费视频| 欧美日韩一区自拍| 日韩av一区在线| 九热视频在线观看| 欧美xxx黑人xxx水蜜桃| 久久久国产精品麻豆| 亚洲aaaaaa| 久久久久久在线观看| 午夜久久久久| 伊人久久精品视频| 欧美大喷水吹潮合集在线观看| 亚洲AV无码精品自拍| 黄色国产精品视频| 久久99精品久久久久久琪琪| 亚洲福利一二三区| 久久九九电影| 欧洲成人综合网| 乱码一区二区三区| 成年人网站免费看| 天堂久久午夜av| 亚洲一区二区av电影| 亚洲精品乱码久久久久久蜜桃91| 亚洲伦理在线观看| 欧美久久一区二区三区| 欧美日韩国产综合视频在线观看中文| 成人国产精品日本在线| 精品成人av一区二区在线播放| 天天综合精品| 国产一区二区三区三区在线观看| 女性生殖扒开酷刑vk| 国模雨婷捆绑高清在线| 中文字幕精品一区二区三区精品| 黄色国产精品一区二区三区| 国产黄色免费大片| 乱一区二区av| 国产成人免费av| 日韩在线视频免费播放| 亚洲伦理一区| 欧美国产日韩中文字幕在线| 特一级黄色录像| 国产精品麻豆久久| 色噜噜久久综合伊人一本| 欧美 日韩 国产 成人 在线观看| 久久91导航| 精品国产1区2区| 黄色一级在线视频| 都市激情国产精品| 国产日韩欧美在线一区| 免费久久久一本精品久久区| 中文字幕av第一页| 日一区二区三区| 国产激情视频一区| 亚洲综合在线网站| 9.1国产丝袜在线观看| 国产精品一区二区久久久久| 日本一区二区免费在线观看| 亚洲视频免费| 欧美日韩第一页| a级片在线观看免费| 亚洲女同中文字幕| 欧美精品手机在线| 美女视频黄免费| 亚洲精品传媒| 99亚洲视频| 97在线视频观看| 91偷拍精品一区二区三区| 潘金莲一级淫片aaaaaa播放| 久久经典综合| 国产精品日日做人人爱| 日韩成人短视频| 欧美福利一区| 久久久噜久噜久久综合| 国产免费嫩草影院| 成人免费在线观看av| 综合国产在线观看| 欧美在线视频第一页| 激情91久久| 日本人成精品视频在线| 中文字幕日韩三级| 国产精品996| 精品国产一区二区三区麻豆小说| 韩国免费在线视频| 最新不卡av在线| 男人插女人视频在线观看| 亚洲美女久久精品| 欧美三级韩国三级日本一级| 97中文字幕在线观看| 亚洲精品动态| 蜜臀久久99精品久久久无需会员| 日本熟妇毛耸耸xxxxxx| 日产欧产美韩系列久久99| 91久久精品国产91久久性色| 天天综合在线视频| 国产精品对白交换视频| 日日摸日日碰夜夜爽无码| av成人在线播放| 精品三级av在线| 日韩一级av毛片| 国产一区二区三区自拍| 国产不卡一区二区在线播放| 精品人妻一区二区三区浪潮在线 | 欧美激情资源网| 免费的一级黄色片| av成人在线观看| 日韩电视剧在线观看免费网站| 人与动物性xxxx| 一区二区三区国产盗摄| 亚洲自拍偷拍网址| av在线首页| 欧美视频在线视频| 日韩精品xxxx| 一区二区三区无毛| 亚洲人成在线观| 国产成人精品无码免费看夜聊软件| 99久久亚洲精品蜜臀| 全球成人中文在线| 亚洲精品911| 成人欧美一区二区三区白人| 欧美激情精品久久久久久小说| 成人福利一区| 欧美成年人在线观看| 亚洲天天综合网| 久久久精品国产免费观看同学| av网站大全免费| 蜜桃在线一区| 久久精品中文字幕| 亚洲天堂一二三| 亚洲国产岛国毛片在线| 久久久久久久久久久久久国产精品| 成人福利一区| 欧美激情性做爰免费视频| 99久久精品国产一区色 | 欧美日韩免费做爰视频| 精品一区免费av| 亚洲精品一区二区三区樱花 | 在线免费看黄色片| 欧美精品激情| 欧美精品三级日韩久久| 天堂资源在线亚洲资源| 免费成人直播| 精品视频在线播放免| 久草资源在线视频| 成人永久免费视频| 日本阿v视频在线观看| 亚洲成人偷拍| 精品久久久影院| 国内偷拍精品视频| 国产综合色精品一区二区三区| 亚洲一区二区三区涩| 欧美黄色成人| xxxxx成人.com| 国产精品伦一区二区三区| 国产盗摄一区二区三区| 欧美 日韩 国产 在线观看| 俺来也官网欧美久久精品| 精品少妇一区二区| 日韩av在线播| 91日韩一区二区三区| 红桃av在线播放| 精品国产一区探花在线观看 | 99视频在线观看一区三区| 国产视频九色蝌蚪| 国产精品探花在线观看| 国产精品视频男人的天堂| 日本美女在线中文版| 4hu四虎永久在线影院成人| 青青草国产在线观看| 成熟亚洲日本毛茸茸凸凹| 丝袜老师办公室里做好紧好爽| 精品香蕉视频| 亚洲一区二区在线| 丁香花在线电影小说观看| 精品视频久久久久久久| 波多野结衣电车| 亚洲欧洲美洲综合色网| 日韩女优在线视频| 久久这里只有| 91成人在线视频观看| 国产福利一区二区精品秒拍| 国产精品va在线| av毛片在线看| 在线观看视频一区二区欧美日韩| 四虎影视1304t| 成人小视频免费在线观看| 欧美视频第三页| 亚洲精品成人| 久久久99爱| 国产精品xnxxcom| 亚洲视频在线免费看| 一级特黄特色的免费大片视频| 亚洲国产精品嫩草影院| www中文在线| 成人av在线一区二区| 狠狠躁狠狠躁视频专区| 91久久亚洲| 在线免费观看成人| 久久av导航| 99久久精品免费看国产四区| av一区在线| 久久久久久久久久久免费| 电影在线一区| 亚洲国产精品成人va在线观看| 国产少妇在线观看| 久久久久久久综合| 国产精品成人免费一区久久羞羞| 日韩成人一级片| 国内精品视频一区二区三区| 五月激情综合| 日韩中文一区| 奇米影视777在线欧美电影观看| 成人免费视频97| 校园春色亚洲色图| 尤物精品国产第一福利三区| 亚洲国产www| 欧美日韩高清影院| 五月婷婷激情视频| 亚洲777理论| 免费中文字幕在线| 亚洲欧洲www| 免费黄色片网站| 91麻豆精品视频| fc2成人免费视频| 国产精品456露脸| 亚洲美女性囗交| 久久激情五月激情| 成年人免费在线播放| 国产精品久久777777毛茸茸| 日b视频免费观看| 欧美+日本+国产+在线a∨观看| 亚洲欧美国产一区二区| 狠狠综合久久av一区二区蜜桃 | 秋霞视频一区二区| 日韩欧美亚洲国产精品字幕久久久 | 色先锋资源久久综合| 日本熟妇色xxxxx日本免费看| 一区二区三区精品在线观看| 亚洲视频在线播放免费| 国产精品亚洲综合一区在线观看| 一级片视频免费观看| 欧美 亚欧 日韩视频在线 | 欧美日韩综合| 国产91porn| 欧美日本二区| 国产日韩亚洲欧美在线| 国内精品福利| 国产3p露脸普通话对白| 一本色道久久| 女性隐私黄www网站视频| 久久综合导航| 天堂av在线网站| 激情综合网激情| 搡的我好爽在线观看免费视频| 国产一区二区不卡| 中文在线字幕观看| 成人av在线网站| 亚洲AV无码国产成人久久| 久久精品网站免费观看| 实拍女处破www免费看| 三级视频在线播放| 日日狠狠久久偷偷综合色| 精品亚洲成a人| 在线观看视频一区二区欧美日韩| 97国产精品人人爽人人做| 欧美亚洲精品一区二区| 国产在线观看黄色| 国产精品粉嫩| 国产精品自拍av| 亚洲国产精品嫩草影院久久| 亚洲欧洲中文天堂| 青青草国产免费| 国产精彩视频在线观看| 免费毛片在线看片免费丝瓜视频 | 夜夜嗨av一区二区三区四区| 91亚洲精选| 精品视频在线视频| 国产又大又黑又粗| 亚洲第一网站免费视频| 国产小视频在线播放| 久久国产精品电影| 超碰91在线观看| 国产精品男女猛烈高潮激情| 久久久91麻豆精品国产一区| 久久精品国产美女| 久久性感美女视频| 国产午夜福利100集发布| 秋霞av亚洲一区二区三| 亚洲精品成人无码毛片| 久久久99久久| 免费一级全黄少妇性色生活片| 日韩欧美在线视频观看| 99久久婷婷国产一区二区三区| 亚洲精品v天堂中文字幕 | 国产日韩欧美不卡在线| 看片网站在线观看| 色综合天天综合狠狠| www.黄色一片| 伊人成人开心激情综合网| segui88久久综合| 成人h猎奇视频网站| 精品在线播放| 国产又粗又大又爽的视频| 久久久精品日韩| 男男一级淫片免费播放| 综合久久久久久| 欧美videossex极品| 日韩欧美在线网站| 91久久精品无码一区二区| 亚洲精品国产拍免费91在线| 成人免费在线| 国产精品视频导航| 在线看成人短视频| 精品无码一区二区三区爱欲| 国产综合成人久久大片91| 亚洲а∨天堂久久精品2021| 婷婷六月综合网| 欧美性猛交 xxxx| 久久久国产成人精品| 另类中文字幕国产精品| 免费日韩av电影| 亚洲人成人一区二区三区| 久久综合桃花网| 亚洲欧洲美洲综合色网| 亚洲一区二区激情| 国产亚洲精品久久久久久牛牛| 色综合亚洲图丝熟| 精品欧美一区二区在线观看视频| 欧美视频不卡| 性色av浪潮av| 一区二区三区成人| 99热这里只有精品3| 久久天天躁狠狠躁夜夜爽蜜月| 福利一区和二区| 亚洲自拍三区| 六月婷婷色综合| 91精品少妇一区二区三区蜜桃臀| 亚洲一区中文在线| av在线亚洲天堂| 久久成人av网站| 精品中文在线| 一二三四中文字幕| 国产成人av资源| 久久精品视频久久| 亚洲第一网中文字幕| h片在线观看下载| 国产一区二区三区高清视频| 亚洲看片一区| 亚洲蜜桃精久久久久久久久久久久| 亚洲电影在线免费观看| 日韩在线一区二区三区四区| 亚洲18私人小影院| 亚洲系列另类av| 久久久国产欧美| 国产精品福利电影一区二区三区四区| 国产又黄又粗又长| 欧美人成在线视频| 欧美黄色录像| www.国产区| 亚洲欧洲av色图| 亚洲AV无码一区二区三区性 | 亚洲人体一区| 国产一区二区日韩精品| 久久黄色小视频| 日韩成人av在线播放| 91精品美女| 国产盗摄视频在线观看| av亚洲精华国产精华精| 日韩 国产 欧美| 日韩视频一区在线| 久久久久久亚洲精品美女| 精品久久久久久久久久中文字幕| 久久久精品天堂| 国产激情无套内精对白视频| 91精品国产91| 日韩1区2区| 日韩成人av影院| 在线日韩av片| 日本大胆在线观看| 青娱乐国产91| 国产乱码精品一区二区三区忘忧草| 99热在线观看免费精品| 中文字幕综合一区| 999精品视频在这里| 免费男同深夜夜行网站| 亚洲欧美国产毛片在线| 你懂的在线观看视频网站| 成人中文字幕+乱码+中文字幕| 亚洲精品激情| 操她视频在线观看| 精品亚洲精品福利线在观看| 在线日韩三级| 激情五月开心婷婷| 亚洲黄色免费电影| www.亚洲资源| 精品日本一区二区三区| 国产在线国偷精品产拍免费yy| 国产精品人人人人|