精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Florence-VL來了!使用生成式視覺編碼器,重新定義多模態(tài)大語言模型視覺信息

人工智能 新聞
Florence-VL 提出了使用生成式視覺編碼器 Florence-2 作為多模態(tài)模型的視覺信息輸入,克服了傳統(tǒng)視覺編碼器(如 CLIP)僅提供單一視覺表征而往往忽略圖片中關(guān)鍵的局部信息。

本文由馬里蘭大學(xué),微軟研究院聯(lián)合完成。作者包括馬里蘭大學(xué)博士生陳玖海,主要研究方向?yàn)檎Z言模型,多模態(tài)模型。通訊作者為 Bin Xiao, 主要研究方向?yàn)橛?jì)算機(jī)視覺,深度學(xué)習(xí)和多模態(tài)模型。其他作者包括馬里蘭大學(xué)助理教授Tianyi Zhou , 微軟研究院研究員 Jianwei Yang , Haiping Wu, Jianfeng Gao 。

圖片

  • 論文:https://arxiv.org/pdf/2412.04424
  • 開源代碼:https://github.com/JiuhaiChen/Florence-VL
  • 項(xiàng)目主頁:https://jiuhaichen.github.io/florence-vl.github.io/
  • 在線 Demo:https://huggingface.co/spaces/jiuhai/Florence-VL-8B
  • 模型下載:https://huggingface.co/jiuhai/florence-vl-8b-sft

Florence-VL 提出了使用生成式視覺編碼器 Florence-2 作為多模態(tài)模型的視覺信息輸入,克服了傳統(tǒng)視覺編碼器(如 CLIP)僅提供單一視覺表征而往往忽略圖片中關(guān)鍵的局部信息。 然而 Florence-2 通過生成式預(yù)訓(xùn)練,將多種視覺任務(wù)(如圖像描述、目標(biāo)檢測(cè)、文字識(shí)別和對(duì)象定位)統(tǒng)一為 sequence-to-sequence 結(jié)構(gòu),并通過 prompt 來完成多樣化的視覺任務(wù)。在 Florence- VL 中,我們僅使用一個(gè)視覺編碼器 Florence-2,但采用多個(gè)不同的 prompt,分別注重 caption,OCR 和 grounding,來獲得不同層次的視覺表征。通過融合這些不同深度的特征,F(xiàn)lorence-VL 實(shí)現(xiàn)了更全面的視覺理解。

圖片


圖片

引言

隨著大規(guī)模語言模型(LLM)的快速發(fā)展,多模態(tài)大語言模型(MLLMs)成為視覺與語言任務(wù)的主流解決方案。然而,現(xiàn)有的視覺編碼器(如 CLIP 和 SigLIP)雖然在整體語義提取方面表現(xiàn)出色,但存在明顯不足:

  1. 缺乏細(xì)粒度理解:僅捕獲圖像的整體語義,忽略像素級(jí)和局部區(qū)域的細(xì)節(jié)。
  2. 任務(wù)泛化能力有限:難以適配 OCR、物體定位等需要特定視覺特征的任務(wù)。

Florence-VL 正是針對(duì)這一問題提出的解決方案。通過引入生成式視覺基礎(chǔ)模型 Florence-2,F(xiàn)lorence-VL 在保持高效訓(xùn)練的同時(shí),能夠靈活適配不同任務(wù),彌補(bǔ)傳統(tǒng)視覺編碼器的缺陷。

在接下來的部分,我們將詳細(xì)介紹 Florence-2 背后的技術(shù)原,F(xiàn)lorence-VL 如何利用多任務(wù)視覺特征,以及我們提出的深度 - 廣度融合策略如何實(shí)現(xiàn)視覺信息的高效整合。

背景介紹:Florence-2

傳統(tǒng)視覺編碼器如 CLIP 和 SigLIP 主要依賴對(duì)比學(xué)習(xí)來預(yù)訓(xùn)練,雖然能在跨模態(tài)任務(wù)中取得不錯(cuò)效果,但其輸出的圖像特征通常是單一的全局語義表示,難以捕獲細(xì)粒度信息。這一缺陷使得這些模型在 OCR 文本提取、對(duì)象定位等任務(wù)上表現(xiàn)不佳。

Florence-2 則采用了生成式預(yù)訓(xùn)練的方式,將多種視覺任務(wù)統(tǒng)一到一個(gè)編碼 - 解碼框架中,能夠根據(jù)不同任務(wù)提示生成多樣化的視覺特征。

Florence-2 的主要流程包括:

  1. 視覺編碼器 DaViT:將輸入圖像轉(zhuǎn)換為基礎(chǔ)視覺特征。
  2. 任務(wù)提示機(jī)制:通過不同的文本提示調(diào)整生成目標(biāo),從而提取任務(wù)特定的視覺信息。
  3. 編碼 - 解碼框架:結(jié)合視覺和文本特征,輸出滿足不同任務(wù)需求的結(jié)果。

通過這一架構(gòu),F(xiàn)lorence-2 實(shí)現(xiàn)了全局語義到局部細(xì)節(jié)的視覺特征生成,為多模態(tài)任務(wù)提供了更全面的視覺表示。接下來我們將介紹如何使用 Florence-2 來構(gòu)建 Florence-VL。

方法:深度與廣度融合 (DBFusion)

Florence-VL 的核心創(chuàng)新在于我們提出的深度 - 廣度融合(Depth-Breadth Fusion)策略,它充分挖掘 Florence-2 的生成式特性,將多任務(wù)提示和多層級(jí)特征有效結(jié)合,形成更豐富的視覺表征。

1. 廣度:通過任務(wù)提示擴(kuò)展視覺表征

不同的視覺任務(wù)需要不同的視覺信息。例如:

  • Captioning:用于理解圖像整體語義,生成描述性文本。
  • OCR:提取圖像中的文本內(nèi)容,尤其適用于帶有文字的圖像。
  • Grounding:用于定位物體,捕捉物體之間的關(guān)系。

Florence-2 通過不同的任務(wù)提示,生成針對(duì)性強(qiáng)的視覺特征,從而實(shí)現(xiàn)視覺特征的 “廣度” 擴(kuò)展。

2. 深度:整合多層級(jí)的視覺特征

Florence-2 的不同深度層能夠捕獲從 low- level 到 high-level 的視覺特征,這種多層級(jí)特征的結(jié)合,保證了視覺編碼器既能關(guān)注細(xì)節(jié),又能捕獲整體信息。

3. 融合策略:通道拼接實(shí)現(xiàn)高效整合

為了將多任務(wù)和多層級(jí)的特征高效融合,我們?cè)O(shè)計(jì)了通道拼接(Channel Integration)策略。具體做法是將不同特征按通道維度拼接,并通過 MLP 映射到語言模型的輸入空間。這一策略的優(yōu)勢(shì)在于:避免了增加訓(xùn)練與推理時(shí)的序列長(zhǎng)度以及最大程度保留了視覺特征的多樣性與完整性。

圖片

分析:多種視覺編碼器的對(duì)比

為探討不同視覺編碼器(如 CLIP、SigLIP、DINOv2 和 Florence-2)和大語言模型的對(duì)齊能力,我們采用了實(shí)驗(yàn)來定量評(píng)估不同視覺編碼器與語言模型的跨模態(tài)對(duì)齊質(zhì)量。具體方法如下:對(duì)于每組圖文配對(duì) (image- caption pair),視覺編碼器生成視覺特征,語言模型生成文本特征,我們通過可訓(xùn)練投影對(duì)視覺特征和文本特征進(jìn)行維度對(duì)齊,并且通過對(duì)齊損失函數(shù)來評(píng)估視覺編碼器和語言模型的對(duì)齊能力。實(shí)驗(yàn)結(jié)果表明,F(xiàn)lorence-2 相較于其他視覺編碼器顯示出更優(yōu)的跨模態(tài)對(duì)齊能力。

圖片

實(shí)驗(yàn)驗(yàn)證

為了全面評(píng)估 Florence-VL 的性能,我們?cè)O(shè)計(jì)了一系列實(shí)驗(yàn),涵蓋通用視覺問答、OCR、知識(shí)理解等多模態(tài)任務(wù)。

1. 實(shí)驗(yàn)任務(wù)與數(shù)據(jù)

  • 通用視覺問答:如 VQAv2、GQA 等。
  • OCR 與圖表任務(wù):如 TextVQA 和 ChartQA,側(cè)重文本提取與圖表分析。
  • 視覺主導(dǎo)任務(wù):如 CV-bench 和 MMVP, 側(cè)重視覺信息理解。
  • 知識(shí)密集型任務(wù):如 AI2D、MathVista 等,測(cè)試模型對(duì)基本知識(shí)的理解能力。

我們使用了經(jīng)過篩選的 15M 圖像描述數(shù)據(jù) (detailed caption)與 10M 高質(zhì)量指令微調(diào)數(shù)據(jù)進(jìn)行訓(xùn)練,以確保數(shù)據(jù)的多樣性和高質(zhì)量。

圖片

2. 實(shí)驗(yàn)結(jié)果

在實(shí)驗(yàn)結(jié)果中,F(xiàn)lorence-VL 在多個(gè)多模態(tài)基準(zhǔn)任務(wù)上展現(xiàn)出卓越的性能優(yōu)勢(shì)。特別是在 TextVQA 和 OCR-Bench 等文本提取任務(wù)上,得益于 Florence-2 生成式視覺編碼器提供的細(xì)粒度 OCR 特征。此外,在通用視覺問答任務(wù),視覺主導(dǎo)任務(wù),知識(shí)密集型任務(wù)中,F(xiàn)lorence-VL 通過深度 - 廣度融合策略有效結(jié)合了多層級(jí)、多任務(wù)視覺特征,使得整體準(zhǔn)確率相比傳統(tǒng) CLIP-based 方法有所提升。

3. 消融實(shí)驗(yàn)

為了證明采用 Florence-2 作為視覺編碼器的優(yōu)越性,我們使用 llava 1.5 的預(yù)訓(xùn)練和指令微調(diào)數(shù)據(jù),并且采用和 llava 1.5 相同的訓(xùn)練策略。我們發(fā)現(xiàn) florence-VL 顯著優(yōu)于 llava 1.5,  Florence-VL 在 TextVQA 和 OCR-Bench 等任務(wù)中表現(xiàn)突出,顯示出生成式視覺特征在提取圖像文字信息中的優(yōu)勢(shì)。

圖片

總結(jié)

在本文中,我們提出了 Florence-VL,一種基于生成式視覺編碼器 Florence-2 的多模態(tài)大語言模型。與傳統(tǒng)依賴對(duì)比學(xué)習(xí)的視覺編碼器(如 CLIP)相比,F(xiàn)lorence-2 通過生成式預(yù)訓(xùn)練能夠捕捉更豐富的視覺特征,提供多層次、多角度的圖像表征。我們?cè)O(shè)計(jì)了創(chuàng)新的深廣融合(Depth-Breadth Fusion)策略,通過整合不同深度層次和任務(wù)提示生成的視覺特征,將視覺信息全面映射到語言模型輸入空間。通過廣泛的實(shí)驗(yàn),我們驗(yàn)證了 Florence-VL 在多種任務(wù)中的卓越表現(xiàn),包括通用視覺問答、OCR、圖表理解和知識(shí)密集型任務(wù)等。在未來,我們將進(jìn)一步探索:例如自適應(yīng)融合策略:根據(jù)任務(wù)動(dòng)態(tài)調(diào)整深度與廣度特征的平衡等。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-07-16 13:18:36

2025-09-16 09:08:00

2025-05-15 08:30:00

2022-07-28 12:18:40

視覺語言模型

2025-04-28 02:03:00

多模態(tài)大模型EVEv2

2024-06-20 14:12:53

2025-02-28 10:15:00

3D模型編碼器

2024-12-18 18:57:58

2025-04-07 04:30:00

2025-04-11 02:00:00

模態(tài)編碼器ALIGN視覺語言模型

2025-04-17 14:11:10

視覺AI模型

2024-10-22 13:33:48

2025-01-09 09:56:34

視覺模型圖像生成

2025-08-07 02:00:00

2024-08-30 15:19:22

2024-07-23 10:34:57

2024-11-13 09:39:13

2025-05-27 15:35:02

大模型技術(shù)AI

2024-10-21 08:24:29

Florence-2視覺語言模型VLM

2025-08-07 16:24:19

小紅書開源dots.vlm1
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产成人午夜视频网址| 亚洲精品国产精品国自产观看浪潮 | 精品亚洲一区二区| 亚洲黄色a v| 国产色在线观看| 成人av网站免费观看| 国产91精品网站| 2018天天弄| 妖精视频一区二区三区| 欧美狂野另类xxxxoooo| 青青青免费在线| 麻豆影院在线观看| 99re8在线精品视频免费播放| 午夜视频一区二区| 日韩福利二区| 亚洲a视频在线观看| 日本精品三区| 精品国产免费视频| 亚洲美女爱爱视频| 在线黄色的网站| 亚洲欧美日韩一区| 日韩电影在线播放| 欧美 日韩 人妻 高清 中文| 久久国产欧美日韩精品| 久久久噜噜噜久久| 99久久99久久精品国产| 日韩国产网站| 亚洲精品伦理在线| 欧美激情导航| 亚洲成人av影片| 欧美18免费视频| 3atv在线一区二区三区| 欧美视频免费播放| 婷婷国产在线| 国产成人在线免费| 欧美黑人一级爽快片淫片高清| 少妇按摩一区二区三区| av成人资源网| 91精品国产免费久久综合| 日本成人中文字幕在线| 大桥未久在线视频| 一级特黄大欧美久久久| 一区二区三区四区欧美日韩| 久热av在线| 99热精品一区二区| 成人免费在线一区二区三区| 97在线视频人妻无码| 人人狠狠综合久久亚洲| 国产精品久久久久秋霞鲁丝| 日本在线观看网址| 香蕉久久夜色精品国产使用方法 | 秋霞欧美视频| 亚洲天堂免费在线| 亚洲图色中文字幕| 国产亚洲欧美日韩精品一区二区三区| 国产精品美女久久久久久2018| 久久久神马电影| 天天操天天干天天爱| 丁香激情综合五月| 国产欧美日韩一区| 欧美视频xxx| 成人高清在线视频| 国产午夜精品在线| 天天综合网在线观看| 99re热这里只有精品视频| 国产精品一级久久久| 免费av网站在线播放| av在线综合网| 欧美动漫一区二区| 国产精品久久久久久久龚玥菲| 日本一区二区三区高清不卡 | 国产精品久久久久久久| 色青青草原桃花久久综合| 精品丰满少妇一区二区三区| 久久亚洲专区| 欧美激情一区二区三级高清视频 | 国产男女无遮挡| 韩国美女久久| 欧美精品 日韩| 人妻av一区二区三区| 国产精品网在线观看| 国产视频精品自拍| 一级特黄曰皮片视频| 97精品一区| 欧美国产日韩一区二区三区| 久久久国产精品成人免费| 久久看片网站| 成人av番号网| 好吊视频一区二区三区| 日韩精品亚洲一区| 成人观看高清在线观看免费| 黄色av小说在线观看| 久久久久99精品一区| 在线观看日韩羞羞视频| 波多野结衣久久| 欧美性视频一区二区三区| 搡的我好爽在线观看免费视频| 玖玖玖免费嫩草在线影院一区| 亚洲人成电影网站色…| 日韩影院一区二区| 亚洲免费婷婷| 91精品国产综合久久香蕉| 三级网站免费观看| 国产精品天美传媒| 免费看污久久久| 日本免费在线视频| 亚洲成人资源网| 高清av免费看| 欧美国产极品| 久久精品电影网| 国产在线观看黄色| 国产精品一区在线| 日韩精品不卡| h片在线观看视频免费| 欧美日韩成人综合在线一区二区| 一道本视频在线观看| 成人开心激情| 精品国产99国产精品| 三级黄色片在线观看| 99精品视频网| 国产乱码精品一区二区三区不卡| 日韩在线免费电影| 色www精品视频在线观看| 国产ts在线观看| 综合激情一区| 国产精选久久久久久| 欧美日韩影视| 欧美日韩激情视频| 中文在线永久免费观看| 天堂网av成人| 欧美激情综合色综合啪啪五月| 在线观看一二三区| 国产天堂亚洲国产碰碰| 久久久免费视频网站| 999在线精品| 欧美成人午夜影院| 国产女主播福利| 1000部国产精品成人观看| 欧美精品aaaa| 国产不卡一区| 国产成人精品久久二区二区| 午夜一区在线观看| 亚洲精品久久7777| 久久久久亚洲av无码网站| 91亚洲一区| 国产精品视频免费在线观看| av中文字幕第一页| 夜夜嗨av一区二区三区四季av| 国产三级三级看三级| 国产一区网站| 国产高清视频一区三区| 亚洲欧美激情国产综合久久久| 亚洲一区二区视频在线| 欧美一级片在线免费观看| 中文乱码免费一区二区三区下载| 国产精品偷伦一区二区| 国产69精品久久app免费版| 欧美丝袜自拍制服另类| 先锋影音av在线| 丝袜美腿亚洲色图| 精品乱色一区二区中文字幕| 国产高清中文字幕在线| 亚洲黄在线观看| 中国一级免费毛片| 26uuu久久天堂性欧美| 精品国产一区二区三区麻豆小说| 污片视频在线免费观看| 欧美一区二区三区四区高清| 亚洲一级生活片| 国产麻豆91精品| 中文字幕一区二区三区在线乱码| 欧美片网站免费| 色综合视频网站| 日本成人动漫在线观看| 亚洲va在线va天堂| 精品人妻一区二区三区香蕉| 重囗味另类老妇506070| 亚洲一区二区自拍| 黄色大片在线| 日韩国产高清污视频在线观看| 国产原创视频在线| 日本一二三四高清不卡| 亚洲午夜激情影院| 欧美精品网站| 欧美日韩另类综合| 男人亚洲天堂| 欧美乱妇高清无乱码| 午夜在线视频免费| 色8久久精品久久久久久蜜| 免费看91的网站| 国产aⅴ精品一区二区三区色成熟| 久草视频国产在线| 久久av资源| 91精品免费久久久久久久久| 污视频在线免费观看网站| 亚洲免费视频一区二区| 91女人18毛片水多国产| 午夜精品久久久久久| 538精品视频| 国产不卡视频在线播放| 美女福利视频在线| 午夜精品一区二区三区国产| 国产自产在线视频一区| 欧美与亚洲与日本直播| 午夜精品视频在线| 日本免费视频在线观看| 亚洲精品美女久久久| 国产一区二区视频免费观看 | 精品在线视频观看| 国产亚洲精品福利| 亚洲国产欧美日韩在线| 国产午夜久久| 欧美少妇一级片| 天天久久夜夜| 亚洲在线免费看| 久久久午夜影院| 精品久久综合| 国产91色在线|亚洲| 另类一区二区| 91chinesevideo永久地址| 男人天堂久久久| 亚洲精品乱码久久久久久按摩观| www.午夜激情| 欧美日韩综合不卡| 亚洲AV无码成人精品区东京热| 亚洲欧美日韩一区二区| 男男一级淫片免费播放| 国产精品小仙女| 超碰在线公开97| 久久精品二区三区| 日韩av高清在线看片| 亚洲精品小说| 亚洲午夜精品福利| 网红女主播少妇精品视频| 99re在线视频观看| 国产精品一区二区三区av| 国产精品久久久久福利| 亚洲欧洲自拍| 5252色成人免费视频| 老司机在线看片网av| 中文字幕一区日韩电影| 成人不用播放器| 亚洲美女激情视频| 天天操天天射天天| 亚洲精品乱码久久久久久金桔影视 | 68精品久久久久久欧美| 在线免费观看污| 欧美黑人国产人伦爽爽爽| caoporn97在线视频| 深夜精品寂寞黄网站在线观看| 青青草在线免费视频| 国产亚洲精品久久久久动| 欧美新色视频| 亚洲午夜国产成人av电影男同| 日本在线一二三| 国产一区二区三区精品久久久 | 日韩 欧美 中文| 无吗不卡中文字幕| 国产污污视频在线观看| 亚洲国产日韩a在线播放性色| 国产这里有精品| 一区二区三区中文字幕精品精品 | 好吊成人免视频| 四虎成人在线观看| 欧洲一区二区三区免费视频| 国产一卡二卡三卡| 欧美人妇做爰xxxⅹ性高电影| 在线免费观看高清视频| 欧美精品第一页| 国产深喉视频一区二区| 91精品国产欧美日韩| www.黄色国产| 亚洲国产天堂久久综合| 水莓100在线视频| 精品偷拍一区二区三区在线看| 国产三级视频在线看| 色哟哟入口国产精品| caopen在线视频| 国内精品久久久久伊人av| 欧亚一区二区| 成人美女av在线直播| 99精品国产高清一区二区麻豆| 久久一区二区三区欧美亚洲| 自拍自偷一区二区三区| 亚洲国产日韩综合一区| 天天插综合网| 91精品国产吴梦梦| 国产模特精品视频久久久久| 中文字幕第21页| 国产福利视频一区二区三区| 性xxxxxxxxx| 91蝌蚪porny| 久久精品国产亚洲AV熟女| 国产精品精品国产色婷婷| 男女免费视频网站| 色丁香久综合在线久综合在线观看| 国产日韩欧美视频在线观看| 亚洲激情中文字幕| av在线之家电影网站| 欧美成在线视频| 99只有精品| 国产99在线免费| 亚洲素人在线| www.国产二区| 九色综合狠狠综合久久| 玖草视频在线观看| 成人欧美一区二区三区小说 | 国产综合自拍| 色一情一区二区三区| 99re视频这里只有精品| 99自拍视频在线| 婷婷丁香久久五月婷婷| 99热这里只有精品5| 亚洲片在线资源| 丁香花在线影院| 国产精品久久不能| 精品三级av| 特级黄色录像片| 免费视频最近日韩| 免费成人深夜天涯网站| 精品成人久久av| 亚洲精品久久久蜜桃动漫| 日韩在线精品一区| 日韩欧美看国产| 国产亚洲二区| 国内视频精品| 日本wwwxx| 亚洲日穴在线视频| 中文字幕欧美色图| 亚洲国产精品久久精品怡红院| 直接在线观看的三级网址| 国产精品嫩草影院久久久| 日韩a级大片| 日韩精品久久一区二区| 韩国视频一区二区| 人人艹在线视频| 在线一区二区三区四区| 久久免费看视频| 欧美亚洲在线观看| 日韩有码一区| 一卡二卡三卡视频| 99在线热播精品免费| 国产一级在线观看视频| 日韩美一区二区三区| 欧美激情办公室videoshd| 国产成人精品最新| 性欧美xxxx免费岛国不卡电影| 免费av手机在线观看| 成人网在线免费视频| 免费在线视频观看| 欧美一区二区三区免费| 美足av综合网| 国产精品久久久对白| 国产精品v欧美精品v日本精品动漫| 少妇欧美激情一区二区三区| 亚洲男人都懂的| 午夜精品一二三区| 久久久免费电影| 亚洲精品小区久久久久久| 黄色动漫网站入口| 国产亚洲一区二区三区四区| 久久久久久少妇| 国产性色av一区二区| a成人v在线| 欧美一级二级三级九九九| 久久激情五月婷婷| 欧美丰满熟妇bbbbbb| 欧美v亚洲v综合ⅴ国产v| av资源在线播放| 麻豆成人小视频| 日韩精品每日更新| 99精品久久久久| 欧美精品一区二区不卡| 美女的胸无遮挡在线观看| 国产精品免费区二区三区观看| 亚洲专区在线| 国产伦理片在线观看| 欧美日韩高清不卡| 波多野结衣精品| 日本欧洲国产一区二区| 久久精品国产亚洲高清剧情介绍| 欧美精品99久久久| 日韩精品在线影院| 国产毛片精品久久| 91国在线高清视频| 91丝袜呻吟高潮美腿白嫩在线观看| 午夜精品久久久久久久久久久久久蜜桃| 中文字幕一区二区三区电影| 警花av一区二区三区| 草草视频在线免费观看| 26uuu国产在线精品一区二区| 国产精品久久婷婷| 久久久久久久97| 精品一区二区三区中文字幕老牛| 中国老熟女重囗味hdxx| 欧美日韩色婷婷| 老司机午夜在线视频| 欧美精品成人一区二区在线观看| 久久精品免费看| 五月天婷婷网站|