精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元 精華

發布于 2024-9-9 00:16
瀏覽
0收藏

OCR-Free多頁文檔理解的挑戰與進展

在現代信息時代,多頁文檔的自動理解和處理變得尤為重要。這些文檔可能包括書籍、報告、學術論文等,它們通常包含大量的文本、圖表和其他視覺元素。傳統的文檔理解方法依賴于光學字符識別(OCR)技術將圖像轉換為文本數據。然而,OCR過程不僅耗時,而且在處理高分辨率或多頁文檔時,容易出現錯誤,尤其是在文檔格式復雜或字體多樣的情況下。

隨著深度學習技術的發展,OCR-Free的文檔理解方法逐漸受到關注。這類方法直接從文檔圖像中提取信息,無需轉換為文本格式,從而避免了OCR過程中可能出現的錯誤。然而,這種方法面臨的主要挑戰之一是如何有效處理和理解高分辨率的多頁文檔圖像。高分辨率圖像通常意味著更多的視覺信息和更大的數據量,這對計算資源(如GPU內存)和處理速度提出了更高的要求。

為了應對這些挑戰,研究人員提出了多種策略。一種有效的策略是開發高分辨率文檔壓縮模塊,該模塊能夠將每個高分辨率文檔圖像壓縮成更少的視覺標記(tokens),同時保留布局和大部分文本信息。例如,mPLUG-DocOwl2模型采用了一種高分辨率文檔壓縮器,通過跨注意力機制,以全局低分辨率視覺特征為指導,將文檔圖像壓縮成324個視覺標記。這種方法不僅顯著減少了GPU內存的使用和推理時間,而且在多頁文檔理解基準測試中設定了新的最高標準。

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

此外,為了進一步提升模型的多頁文檔理解能力,研究人員還開發了三階段訓練框架,包括單圖像預訓練、多圖像連續預訓練和多任務微調。這種訓練策略有助于模型在處理單頁和多頁文檔時都能達到較高的性能,同時保持較高的標記效率和問題回答性能的平衡。

總之,OCR-Free多頁文檔理解技術的發展為自動文檔處理領域帶來了新的進展。通過高效的圖像壓縮技術和精細的訓練策略,現代模型能夠在保持高效率的同時,提供準確的文檔內容理解,這對于信息檢索、內容管理等應用場景具有重要意義。

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

論文概覽

1. 標題
MPLUG-DOCOWL2: HIGH-RESOLUTION COMPRESSING FOR OCR-FREE MULTI-PAGE DOCUMENT UNDERSTANDING

2. 作者
Anwen Hu1, Haiyang Xu1*, Ji Zhang1, Qin Jin2, Liang Zhang2, Fei Huang1, Jiabo Ye1, Jingren Zhou1, Ming Yan1*

3. 機構

  1. Alibaba Group
  2. Renmin University of China

4. 鏈接
???https://github.com/X-PLUG/mPLUG-DocOwl/tree/main/DocOwl2??

高分辨率文檔圖像的挑戰

在處理高分辨率文檔圖像時,多模態大型語言模型(MLLMs)面臨著一系列挑戰。隨著文檔圖像分辨率的提高,模型需要生成數千個視覺令牌來理解單一文檔圖像,這不僅增加了GPU內存的消耗,也導致了推理速度的降低,特別是在多頁文檔理解的場景中。

1. 視覺令牌的過多生成

高分辨率圖像處理通常會產生大量的視覺令牌。例如,InternVL 2模型在單頁文檔理解基準測試中平均需要約3000個視覺令牌。這種大量的視覺令牌不僅導致長時間的推理延遲,還占用了大量的GPU內存,從而限制了模型在完整文檔或視頻理解方面的應用。

2. 壓縮視覺特征的挑戰

為了解決視覺令牌過多的問題,研究者們嘗試了多種壓縮方法。然而,現有的壓縮架構往往難以在保留信息和提高令牌效率之間取得平衡。例如,獨立壓縮文檔圖像的每個部分可以減少每個子圖像的視覺令牌數量,但在所有子圖像連接后,總的視覺令牌數量仍然很長。此外,使用可學習的查詢或選定的令牌作為壓縮指導可能會忽略整體布局信息,這對于文檔圖像的視覺特征壓縮至關重要。

3. 布局感知的壓縮架構

為了更有效地壓縮文檔圖像中的視覺特征,本研究提出了一種布局感知的壓縮架構——高分辨率DocCompressor。這種架構利用全局低分辨率圖像的視覺特征作為壓縮指導,通過交叉注意力機制將高分辨率文檔圖像壓縮為更少的令牌,同時保留了布局和大部分文本信息。具體來說,每個來自全局特征圖的查詢在注意力機制中只關注原始高分辨率圖像中相對位置相同的一組高分辨率特征,從而在壓縮過程中減少計算復雜性并保留重要的文本語義。

通過這種方法,我們的模型DocOwl2在多頁文檔理解基準測試中設定了新的最高標準,并且在首個令牌延遲方面實現了超過50%的減少,展示了在多頁問答、證據頁解釋和跨頁結構理解方面的先進能力。此外,與在類似數據上訓練的單圖像MLLMs相比,DocOwl2在使用的視覺令牌數量上減少了超過80%,同時保持了可比的單頁文檔理解性能。

DocOwl2模型架構解析

DocOwl2模型是為了解決多頁文檔理解中的挑戰而設計的,特別是在處理高分辨率文檔圖像時,傳統的多模態大型語言模型(MLLMs)往往需要生成大量的視覺令牌,這不僅消耗大量GPU內存,還會導致推理速度變慢。為了優化這一過程,DocOwl2采用了一種高效的壓縮模塊,即高分辨率DocCompressor,以及一個三階段的訓練框架,包括單圖像預訓練、多圖像連續預訓練和多任務微調。

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

1. 高分辨率DocCompressor壓縮模塊

高分辨率DocCompressor是DocOwl2中的核心組件,它能夠將每個高分辨率文檔圖像壓縮成324個令牌。這一壓縮是通過低分辨率的全局視覺特征來引導的,這些全局視覺特征能夠捕捉到文檔的整體布局信息。具體來說,DocCompressor使用跨注意力機制,將高分辨率特征映射到較少的令牌上,同時保留布局和大部分文本信息。

2. 三階段訓練框架

為了充分發揮DocOwl2模型在多頁文檔理解上的能力,開發團隊設計了一個三階段的訓練框架:

  • 單圖像預訓練:在這一階段,模型首先在單頁文檔圖像上進行預訓練,學習如何有效地壓縮視覺特征并保留重要的文本信息。
  • 多圖像連續預訓練:隨后,模型在多頁文檔圖像上進行預訓練,這有助于模型學習如何處理和理解多個相關聯的圖像。
  • 多任務微調:最后,通過在具體的多頁文檔理解任務上進行微調,進一步優化模型的性能,使其能夠更好地應對實際應用中的挑戰。

通過這種方法,DocOwl2不僅顯著提高了處理速度,減少了GPU內存的使用,還在多頁文檔理解基準測試中達到了新的最佳性能。此外,與類似數據訓練的單圖像MLLMs相比,DocOwl2在單頁理解性能上也表現出色,但使用的視覺令牌數量不到20%。

實驗設計與基準測試

在進行多頁文檔理解的研究中,我們設計了一種高分辨率文檔壓縮模塊(High-resolution DocCompressor),旨在通過低分辨率全局視覺特征的引導,將每個高分辨率文檔圖像壓縮為324個視覺標記。這種方法不僅提高了處理速度,而且顯著減少了GPU內存的使用。

1. 壓縮模塊的設計

我們提出的高分辨率DocCompressor模塊基于交叉注意力機制,利用全局低分辨率圖像捕獲的布局信息作為壓縮指導。這種布局感知的壓縮對于文檔圖像非常重要,因為文檔中的文本通常在布局區域內語義連貫,更易于概括。例如,在一個雙欄的論文中,屬于“相關工作”部分的文本與同一行但屬于“方法”部分的文本難以概括在一起。

2. 訓練框架

為了充分利用這種壓縮方法,我們開發了DocOwl2模型,并在三階段訓練框架下進行訓練:單圖像預訓練、多圖像連續預訓練和多任務微調。這種訓練策略旨在平衡標記效率和問答性能,從而加強多頁文檔理解能力。

3. 基準測試

我們在單頁和多頁文檔理解基準測試中對DocOwl2進行了測試。結果顯示,DocOwl2在多頁文檔理解任務中設定了新的最先進水平,并且在首個標記延遲方面實現了超過50%的減少,證明了其在多頁問答、帶證據頁的解釋以及跨頁結構理解方面的先進能力。此外,與在類似數據上訓練的單圖像MLLMs相比,我們的DocOwl2在單頁理解性能上具有可比性,但視覺標記數量減少了80%以上。

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

通過這些實驗和基準測試,我們驗證了高分辨率DocCompressor在壓縮視覺特征和保持文檔圖像文本語義方面的有效性,以及三階段訓練框架在提升單頁和多頁文檔理解性能方面的優勢。

mPLUG-DocOwl2:新模型無需OCR,多頁文檔理解邁入新紀元-AI.x社區

模型性能分析與討論

1. 性能概述

DocOwl2模型在多頁文檔理解方面設定了新的行業標準。通過引入高分辨率DocCompressor模塊,該模型能夠將每個高分辨率文檔圖像壓縮為324個視覺令牌,同時保留了布局和大部分文本信息。這種壓縮顯著提高了模型在多頁文檔理解任務中的效率,減少了首個令牌的延遲時間超過50%,并且與單頁文檔理解性能相當,僅使用不到20%的視覺令牌。

2. 性能對比

與其他多模態大型語言模型(MLLMs)相比,DocOwl2在單頁和多頁文檔理解基準測試中均展現出優越性能。尤其是在處理高分辨率圖像時,DocOwl2通過有效減少視覺令牌的數量,能夠在保持高性能的同時,顯著減少GPU內存的使用和推理時間。例如,在DocVQA基準測試中,DocOwl2的表現與使用更多視覺令牌的模型相當,但其首個令牌延遲(First Token Latency)顯著更低。

3. 訓練與優化

DocOwl2的訓練過程包括單圖像預訓練、多圖像連續預訓練和多任務微調三個階段。這種三階段訓練框架的設計旨在平衡令牌效率和問題回答性能。通過在多圖像理解任務中引入結構感知的多頁文檔解析數據集,模型能夠更好地理解和關聯多個圖像之間的內容,從而提高了在復雜文檔理解任務中的表現。

4. 應用場景與前景

DocOwl2模型不僅在學術界引起了重視,其在工業界的應用前景也非常廣泛。從法律文件的自動解析到醫療記錄的信息提取,再到新聞視頻的內容理解,DocOwl2的高效、準確的多頁文檔理解能力都是極具價值的。此外,模型的開源性質也為廣大研究人員和開發者提供了進一步探索和優化的可能。

通過這些詳細的性能分析和討論,我們可以看到DocOwl2模型在OCR-free多頁文檔理解領域的重要進展和潛力。未來的研究可以進一步探索如何優化模型結構和訓練策略,以適應更多樣化的應用場景。

本文轉載自 ??AI論文解讀??,作者:柏企

收藏
回復
舉報
回復
相關推薦
大胆av不用播放器在线播放| 最近中文字幕免费| 丁香花电影在线观看完整版| 国产成人日日夜夜| 国内精品免费午夜毛片| 欧美黑人欧美精品刺激| 四虎4545www国产精品| 久久久精品中文字幕麻豆发布| 国产精品久久精品| 强行糟蹋人妻hd中文| 国产精品白丝av嫩草影院| 欧美日韩亚洲高清| 一区二区视频在线观看| 人妻偷人精品一区二区三区| 亚洲综合不卡| 久久亚洲精品毛片| 青青草视频成人| 亚洲国产91视频| 亚洲不卡av一区二区三区| 欧美连裤袜在线视频| 国产视频在线一区| 欧美亚洲一区| 色综合五月天导航| 亚洲一级黄色录像| 岛国成人av| 欧美狂野另类xxxxoooo| 大陆极品少妇内射aaaaa| 欧美精品videos另类| 成人18视频日本| 成人午夜激情网| 四虎成人永久免费视频| 你懂的网址国产 欧美| 伊人伊成久久人综合网小说| 成人啪啪18免费游戏链接| 欧美影视资讯| 亚洲一区二区在线观看视频| 欧洲亚洲一区二区| 欧美77777| 国产一区二区影院| 国产精品视频永久免费播放| 国产精品免费av一区二区| 91精品综合| 色吧影院999| 亚洲人人夜夜澡人人爽| 国产精品一区二区中文字幕| 3d动漫精品啪啪| 国产一级特黄a大片免费| av在线播放资源| 亚洲免费伊人电影| 正在播放91九色| 国产人成在线视频| 久久综合久久久久88| 国产精品yjizz| 国产特级黄色片| 久久精品国产999大香线蕉| 日本电影亚洲天堂| 亚洲AV无码成人精品区东京热| 天天色综合色| 中文字幕亚洲图片| 色呦呦一区二区| 久本草在线中文字幕亚洲| 日韩欧美国产不卡| 自拍偷拍21p| 天然素人一区二区视频| 色国产综合视频| 日本www高清视频| 日韩影片中文字幕| 日本高清无吗v一区| 欧美日韩国产精品激情在线播放| 久久久男人天堂| 欧美日韩国产麻豆| 青青草成人免费在线视频| 自拍亚洲图区| 一区二区三区四区乱视频| 亚洲色图都市激情| 丝袜综合欧美| 舔着乳尖日韩一区| 精品99在线视频| 性高爱久久久久久久久| 欧美色图在线观看| 午夜一区二区视频| 蜜桃精品视频| 精品动漫一区二区三区在线观看| 逼特逼视频在线观看| 国产精品男女| 亚洲色图第三页| 青青青视频在线播放| 天堂美国久久| 97国产精品视频| 日本中文字幕在线| 美女高潮久久久| 国产在线播放91| 国产成人精品毛片| 国产精品一区二区在线播放| 99久久久精品免费观看国产| 天堂在线视频免费观看| 国产亚洲精品超碰| 国产日韩欧美大片| 毛片在线网站| 欧美日韩中文字幕一区| 91视频福利网| 日本午夜精品| 日韩中文字幕av| 好吊色视频在线观看| 国产欧美一级| 91久久精品一区| 天堂a√中文在线| 国产精品久久久久久福利一牛影视| 男人天堂成人网| 亚洲伊人av| 91精品国产91综合久久蜜臀| 精品一区二区视频在线观看| 国产国产精品| 欧美做爰性生交视频| 97超碰人人模人人人爽人人爱| 久久av中文字幕片| 精品一区在线播放| 黄在线免费看| 日韩欧美精品在线观看| 91视频福利网| 欧美艳星介绍134位艳星| 九九热这里只有精品6| 久久国产视频精品| 国产成人精品三级麻豆| 日韩欧美视频一区二区三区四区| 国产一线二线在线观看| 欧美日韩一区二区欧美激情| 激情av中文字幕| 欧美成免费一区二区视频| 57pao国产精品一区| a毛片在线免费观看| 亚洲国产成人私人影院tom| 国产中文字幕视频在线观看| 香蕉免费一区二区三区在线观看| 亚洲天堂第二页| 香蕉免费毛片视频| 国产一区在线不卡| 一本一道久久a久久综合精品 | 国产小视频你懂的| 久久激情综合| 久久精彩视频| 国产第一页在线| 日韩欧美色电影| 国产亚洲精品久久久久久豆腐| 久久蜜桃资源一区二区老牛| 国产精品一区二区欧美| 午夜伦理在线视频| 678五月天丁香亚洲综合网| 亚洲一区二区自偷自拍 | 91看片就是不一样| 日本午夜精品久久久| 欧美激情啊啊啊| 99久久一区二区| 1区2区3区欧美| 国产精品久久久久9999小说| 欧美性生活一级片| 91国内在线视频| 无码精品在线观看| 亚洲.国产.中文慕字在线| 亚洲精品乱码久久久久久9色| 久久久久电影| 亚洲一区国产精品| 怡红院在线播放| 日韩三级视频中文字幕| 99精品久久久久| 精品无人区卡一卡二卡三乱码免费卡 | 99热这里只有精品免费| 2023国产精华国产精品| 欧美麻豆久久久久久中文 | 嗯啊主人调教在线播放视频| 精品国产乱码久久久久久免费| 久久精品波多野结衣| 高清国产一区二区三区| 日韩精品一区在线视频| 女一区二区三区| 欧美一区二三区| 免费a在线观看| 欧美性一级生活| fc2ppv在线播放| 国产成人av在线影院| 欧美又粗又长又爽做受| 色天天色综合| 国产精品视频一| 性xxxfreexxxx性欧美| 日韩美女一区二区三区四区| 日韩欧美一区二区一幕| 久久久亚洲高清| 国产日韩欧美久久| 夜间精品视频| 99理论电影网| 精精国产xxxx视频在线野外 | 女女调教被c哭捆绑喷水百合| 亚洲国产激情| 日韩一区二区三区资源| 成人豆花视频| 亚洲2020天天堂在线观看| 国产精品麻豆一区二区三区| 666欧美在线视频| 在线观看免费国产视频| 国产精品欧美一区喷水| 日批视频免费看| 久久欧美肥婆一二区| 手机在线视频你懂的| 久久久久久毛片免费看| 国产欧美亚洲视频| 国产白浆在线免费观看| 日韩中文字幕不卡视频| 六月丁香综合网| 欧美色爱综合网| 超碰在线国产97| 99v久久综合狠狠综合久久| 亚洲最大综合网| 欧美黄色大片网站| 日本精品一区二区| 第四色中文综合网| 国产有码一区二区| 欧美aa免费在线| 久久精品久久久久电影| 毛片网站在线观看| 欧美电影免费观看完整版| 伊人久久中文字幕| 舔着乳尖日韩一区| 久久精品99国产精| 国产精品第一页第二页第三页| 800av在线播放| 国产一区二区在线观看免费| 粉嫩虎白女毛片人体| 狠色狠色综合久久| 五月天色婷婷综合| 黄色不卡一区| 欧美精品亚洲精品| 九色丨蝌蚪丨成人| av一区二区三区在线观看| 欧美97人人模人人爽人人喊视频| 国内自拍欧美激情| 日本高清成人vr专区| 日韩中文在线不卡| 国产福利电影在线| 亚洲欧美日韩精品久久亚洲区| 国产欧美日韩成人| 亚洲成年人影院| 欧美国产日韩综合| 亚洲精品国产a| 黑人操日本美女| 91日韩精品一区| 中国一级特黄录像播放| 丰满放荡岳乱妇91ww| 一级黄色片在线免费观看| 毛片av中文字幕一区二区| 亚洲成色www.777999| 老司机免费视频久久 | 日韩国产精品91| 成人免费毛片网| 国产视频一区欧美| 日韩在线综合网| 亚洲久久在线| 一二三四视频社区在线| 很黄很黄激情成人| 国产精品久久久久9999爆乳| 欧美三级网页| 轻点好疼好大好爽视频| 亚洲激情国产| 无罩大乳的熟妇正在播放| 亚洲另类黄色| 久久国产成人精品国产成人亚洲| 中国女人久久久| 国产极品粉嫩福利姬萌白酱| 伊人成人网在线看| 无码人妻丰满熟妇区96| 久久久久久自在自线| 毛片一区二区三区四区| 日日夜夜一区二区| 在线观看免费av网址| 国产麻豆精品一区二区| 国产在线a视频| 成人高清视频在线| 亚洲精品乱码久久久久久不卡| 成人午夜看片网址| 欧美双性人妖o0| 国产精品1024| 中文在线永久免费观看| 不卡一区二区三区四区| 亚洲精品理论片| 国产精品久久久久永久免费观看| 日韩av手机在线免费观看| 夜夜精品视频一区二区| 久草国产精品视频| 欧美性猛交xxxxxx富婆| 国产精品毛片久久久久久久av| 日韩一区二区三区视频在线观看 | 日韩精品午夜视频| 成人亚洲精品777777大片| 蜜臀av性久久久久蜜臀av麻豆| 欧美性受xxxxxx黑人xyx性爽| 国产福利一区在线观看| 亚洲 欧美 日韩在线| 国产日韩欧美高清在线| 亚洲人免费视频| 亚洲第一精品夜夜躁人人躁| 国产乱码精品一区二三区蜜臂 | av片免费观看| 91精品综合久久久久久| 日韩在线视频观看免费| 国产一区二区三区网站| 中中文字幕av在线| 日本一欧美一欧美一亚洲视频| 亚洲影视资源| 久久精品国产第一区二区三区最新章节 | 亚洲h视频在线观看| 亚洲精品国产电影| 麻豆网站在线| 日本三级久久久| 欧美专区视频| 日韩伦理一区二区三区av在线| 欧美在线91| 黄色片视频在线| 99久久精品免费看| 午夜精品一区二区三区视频| 欧美午夜影院在线视频| 国内精品久久久久久久久久久| 亚洲三级av在线| 性欧美1819sex性高清大胸| 欧美最顶级的aⅴ艳星| 国产精品白浆| 成人手机在线播放| 美女脱光内衣内裤视频久久网站| www.黄色网| 中文字幕制服丝袜成人av| 天堂中文字幕在线观看| 欧美久久高跟鞋激| 日本大片在线观看| 中文字幕亚洲无线码在线一区| 在线中文免费视频| 国产精品夜间视频香蕉| 亚洲第一福利专区| a级免费在线观看| 国产一本一道久久香蕉| 在线视频第一页| 欧美性猛交xxxx富婆弯腰| 日本高清视频免费观看| 美女性感视频久久久| 日韩久久一区| 亚洲欧美国产精品桃花| 久色成人在线| 国产 中文 字幕 日韩 在线| 亚洲成av人综合在线观看| 国产精品人妻一区二区三区| 亚洲精品短视频| 成入视频在线观看| 国产中文一区二区| 亚洲黄色成人| 欧美日韩在线另类| av图片在线观看| 日韩精品极品视频免费观看| 亚洲男同gay网站| 91免费版黄色| 国产在线成人| 91亚洲一线产区二线产区| 中文字幕中文在线不卡住| 一级黄色片免费看| 中文字幕第22页| 日本欧美在线| 欧美激情第一页在线观看| 日韩久久精品网| 国产高清av片| 亚洲男人的天堂在线aⅴ视频| 中文字幕一区二区在线视频 | 亚洲色图美腿丝袜| 深夜福利视频一区二区| 麻豆av福利av久久av| 日韩成人午夜电影| 久久精品亚洲a| 亚洲成人久久网| 玛雅亚洲电影| 日本黄色播放器| 成人av电影免费在线播放| 日本a级c片免费看三区| 最近2019好看的中文字幕免费| 四虎影视国产精品| 加勒比成人在线| 国产日韩精品视频一区| 国产a级免费视频| 欧美在线激情网| 99久久亚洲精品蜜臀| 小毛片在线观看| 欧美日韩极品在线观看一区| 四季久久免费一区二区三区四区| 久久一区二区三区av| 狠狠色综合色综合网络| 麻豆久久久久久久久久| 久久精品国产69国产精品亚洲| 老司机aⅴ在线精品导航| 五月天av在线播放| 精品久久久久久久久久久久久久| 最新电影电视剧在线观看免费观看 | 久久久久亚洲av无码专区| 一本大道久久加勒比香蕉| 国产伦乱精品| 欧美日韩久久婷婷| 91精品福利在线|