精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

阿里7B多模態文檔理解大模型拿下新SOTA

人工智能 新聞
本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰和阿里巴巴mPLUG團隊給出的解決方案。

多模態文檔理解能力新SOTA!

阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl 1.5,針對高分辨率圖片文字識別、通用文檔結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。

話不多說,先來看效果。

復雜結構的圖表一鍵識別轉換為Markdown格式:

不同樣式的圖表都可以:

圖片

更細節的文字識別和定位也能輕松搞定:

還能對文檔理解給出詳細解釋:

要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有很多輔助文檔閱讀的產品,有的主要通過OCR系統進行文字識別,配合LLM進行文字理解可以達到不錯的文檔理解能力。

不過,由于文檔圖片類別多樣、文字豐富且排版復雜,難以實現圖表、信息圖、網頁等結構復雜圖片的通用理解。

當前爆火的多模態大模型QwenVL-Max、Gemini, Claude3、GPT4V都具備很強的文檔圖片理解能力,然而開源模型在這個方向上的進展緩慢。

而阿里新研究mPLUG-DocOwl 1.5在10個文檔理解基準上拿下SOTA,5個數據集上提升超過10個點,部分數據集上超過智譜17.3B的CogAgent,在DocVQA上達到82.2的效果。

除了具備基準上簡單回答的能力,通過少量“詳細解釋”(reasoning)數據的微調,DocOwl 1.5-Chat也能具備多模態文檔領域詳細解釋的能力,具有很大的應用潛力。

阿里mPLUG團隊從2023年7月份開始投入多模態文檔理解的研究,陸續發布了mPLUG-DocOwl、 UReader、mPLUG-PaperOwl、mPLUG-DocOwl 1.5,開源了一系列文檔理解大模型和訓練數據。

本文從最新工作mPLUG-DocOwl 1.5出發,剖析“多模態文檔理解”領域的關鍵挑戰和有效解決方案。

挑戰一:高分辨率圖片文字識別

區分于一般圖片,文檔圖片的特點在于形狀大小多樣化,其可以包括A4大小的文檔圖、短而寬的表格圖、長而窄的手機網頁截圖以及隨手拍攝的場景圖等等,分辨率的分布十分廣泛。

主流的多模態大模型編碼圖片時,往往直接縮放圖片的大小,例如mPLUG-Owl2和QwenVL縮放到448x448,LLaVA 1.5縮放到336x336。

簡單的縮放文檔圖片會導致圖片中的文字模糊形變從而不可辨認。

為了處理文檔圖片,mPLUG-DocOwl 1.5延續了其前序工作UReader的切圖做法,模型結構如圖1所示:

△圖1:DocOwl 1.5模型結構圖

UReader最早提出在已有多模態大模型的基礎上,通過無參數的形狀適應切圖模塊(Shape-adaptive Cropping Module)得到一系列子圖,每張子圖通過低分辨率編碼器進行編碼,最后通過語言模型關聯子圖直接的語義。

該切圖策略可以最大程度利用已有通用視覺編碼器(例如CLIP ViT-14/L)的能力進行文檔理解,大大減少重新訓練高分辨率視覺編碼器的代價。形狀適應的切圖模塊如圖2所示:

圖片
△圖2:形狀適應的切圖模塊。

挑戰二:通用文檔結構理解

對于不依賴OCR系統的文檔理解來說,識別文字是基本能力,要實現文檔內容的語義理解、結構理解十分重要,例如理解表格內容需要理解表頭和行列的對應關系,理解圖表需要理解線圖、柱狀圖、餅圖等多樣化結構,理解合同需要理解日期署名等多樣化的鍵值對。

mPLUG-DocOwl 1.5著力于解決通用文檔等結構理解能力,通過模型結構的優化和訓練任務的增強實現了顯著更強的通用文檔理解能力。

結構方面,如圖1所示,mPLUG-DocOwl 1.5放棄了mPLUG-Owl/mPLUG-Owl2中Abstractor的視覺語言連接模塊,采用基于“卷積+全連接層”的H-Reducer進行特征聚合以及特征對齊

相比于基于learnable queries的Abstractor,H-Reducer保留了視覺特征之間的相對位置關系,更好的將文檔結構信息傳遞給語言模型。

相比于保留視覺序列長度的MLP,H-Reducer通過卷積大幅縮減了視覺特征數量,使得LLM可以更高效地理解高分辨率文檔圖片。

考慮到大部分文檔圖片中文字優先水平排布,水平方向的文字語義具有連貫性,H-Reducer中采用1x4的卷積形狀和步長。論文中,作者通過充分的對比實驗證明了H-Reducer在結構理解方面的優越性以及1x4是更通用的聚合形狀。

訓練任務方面,mPLUG-DocOwl 1.5為所有類型的圖片設計了統一結構學習(Unified Structure Learning)任務,如圖3所示。

△圖3:統一結構學習

Unified Structure Learning既包括了全局的圖片文字解析,又包含了多粒度的文字識別和定位。

在全局圖片文字解析任務中,對于文檔圖片和網頁圖片,采用空格和換行的形式可以最通用地表示文字的結構;對于表格,作者在Markdown語法的基礎上引入表示多行多列的特殊字符,兼顧了表格表示的簡潔性和通用性;對于圖表,考慮到圖表是表格數據的可視化呈現,作者同樣采用Markdown形式的表格作為圖表的解析目標;對于自然圖,語義描述和場景文字同等重要,因此采用圖片描述拼接場景文字的形式作為解析目標。

在“文字識別和定位”任務中,為了更貼合文檔圖片理解,作者設計了單詞、詞組、行、塊四種粒度的文字識別和定位,bounding box采用離散化的整數數字表示,范圍0-999。

為了支持統一的結構學習,作者構建了一個全面的訓練集DocStruct4M,涵蓋了文檔/網頁、表格、圖表、自然圖等不同類型的圖片。

經過統一結構學習,DocOwl 1.5具備多領域文檔圖片的結構化解析和文字定位能力。

圖片

△圖4: 結構化文字解析

如圖4和圖5所示:

圖片

△圖5: 多粒度文字識別和定位

挑戰三:指令遵循

“指令遵循”(Instruction Following)要求模型基于基礎的文檔理解能力,根據用戶的指令執行不同的任務,例如信息抽取、問答、圖片描述等。

延續mPLUG-DocOwl的做法,DocOwl 1.5將多個下游任務統一為指令問答的形式,在統一的結構學習之后,通過多任務聯合訓練的形式得到一個文檔領域的通用模型(generalist)

此外,為了使得模型具備詳細解釋的能力,mPLUG-DocOwl曾嘗試引入純文本指令微調數據進行聯合訓練,有一定效果但并不理想。

在DocOwl 1.5中,作者基于下游任務的問題,通過GPT3.5以及GPT4V構建了少量的詳細解釋數據(DocReason25K)

通過聯合文檔下游任務和DocReason25K進行訓練,DocOwl 1.5-Chat既可以在基準上實現更優的效果:

圖片

△圖6:文檔理解Benchmark評測

又能給出詳細的解釋:

圖片

△圖7:文檔理解詳細解釋

挑戰四:外部知識引入

文檔圖片由于信息的豐富性,進行理解的時候往往需要額外的知識引入,例如特殊領域的專業名詞及其含義等等。

為了研究如何引入外部知識進行更好的文檔理解,mPLUG團隊著手于論文領域提出了mPLUG-PaperOwl,構建了一個高質量論文圖表分析數據集M-Paper,涉及447k的高清論文圖表。

該數據中為論文中的圖表提供了上下文作為外部知識來源,并且設計了“要點”(outline)作為圖表分析的控制信號,幫助模型更好地把握用戶的意圖。

基于UReader,作者在M-Paper上微調得到mPLUG-PaperOwl,展現了初步的論文圖表分析能力,如圖8所示。

圖片

△圖8:論文圖表分析

mPLUG-PaperOwl目前只是引入外部知識進文檔理解的初步嘗試,仍然面臨著領域局限性、知識來源單一等問題需要進一步解決。

總的來說,本文從最近發布的7B最強多模態文檔理解大模型mPLUG-DocOwl 1.5出發,總結了不依賴OCR的情況下,進行多模態文檔理解的關鍵四個關鍵挑戰(“高分辨率圖片文字識別”,“通用文檔結構理解”,“指令遵循”, “外部知識引入” )和阿里巴巴mPLUG團隊給出的解決方案。

盡管mPLUG-DocOwl 1.5大幅提升了開源模型的文檔理解表現,其距離閉源大模型以及現實需求仍然有較大差距,在自然場景中文字識別、數學計算、通用型等方面仍然有進步空間。

mPLUG團隊會進一步優化DocOwl的性能并進行開源,歡迎大家持續關注和友好討論!

GitHub鏈接:https://github.com/X-PLUG/mPLUG-DocOwl
論文鏈接:https://arxiv.org/abs/2403.12895

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-25 12:40:19

訓練模型

2024-09-14 08:54:38

2024-05-09 08:33:33

2025-05-27 15:35:02

大模型技術AI

2024-06-03 10:43:34

2025-07-21 09:07:00

模型訓練視頻

2025-05-20 13:02:23

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-04-28 14:13:43

開源SOTA多模態

2025-01-08 08:21:16

2025-06-17 09:07:24

2024-11-08 10:00:00

AI模型

2023-06-28 21:47:54

2025-03-11 13:07:58

2024-12-20 12:30:00

模型AI數據

2023-06-28 13:55:30

模型AI

2025-11-05 08:51:33

2025-10-31 08:50:00

AI模型開源

2023-07-17 11:02:36

模型開源

2024-03-25 08:00:00

點贊
收藏

51CTO技術棧公眾號

日韩高清不卡一区二区| 日本免费在线一区| 久久人人爽爽爽人久久久| 日本中文字幕成人| 小向美奈子av| 国产福利一区二区精品秒拍| 色综合天天综合| 在线成人av电影| 内射后入在线观看一区| 久久亚洲一区| 欧美理论片在线观看| 天堂www中文在线资源| 亚洲国产成人二区| 亚洲柠檬福利资源导航| 欧美亚洲一级二级| 精品国产免费无码久久久| 久久精品欧洲| 欧美激情视频网站| 大地资源高清在线视频观看| 欧美美女啪啪| 日韩欧美国产一区二区在线播放 | 66国产精品| 日韩电视剧在线观看免费网站| 日本超碰在线观看| 精品91久久| 午夜久久久影院| 国产奶头好大揉着好爽视频| 国产一区二区三区福利| 韩国欧美国产一区| 国产精品女人久久久久久| 日韩福利片在线观看| 国产精品国内免费一区二区三区| 亚洲码在线观看| www.美色吧.com| 91精品网站在线观看| 欧美主播一区二区三区| 狠狠97人人婷婷五月| 日本大片在线播放| 亚洲女子a中天字幕| 在线观看免费91| 国产剧情在线观看| 久久精品人人爽人人爽| 久久人人爽爽人人爽人人片av| 精品国产伦一区二区三区| 精品亚洲porn| 91精品国产综合久久香蕉的用户体验| 免费又黄又爽又猛大片午夜| 久久精品动漫| 国产suv精品一区二区三区88区| 久久午夜免费视频| 99精品国产一区二区青青牛奶 | 国产乱码午夜在线视频| 亚洲综合色区另类av| 毛片在线视频观看| 污视频网站在线免费| 亚洲精品写真福利| 波多野结衣与黑人| 国产黄色大片在线观看| 亚洲午夜av在线| 国产v片免费观看| 九色porny丨国产首页在线| 性久久久久久久久久久久| 日韩 欧美 视频| 136福利第一导航国产在线| 亚洲国产精品久久不卡毛片 | 欧美一卡在线观看| 亚洲国产综合av| 香蕉成人app| 亚洲精品在线三区| 网站免费在线观看| 国产精品嫩模av在线| 在线观看精品自拍私拍| 日本裸体美女视频| 欧美1区2区3区| 性色av一区二区三区| 天天操夜夜操视频| 欧美aaaaaa午夜精品| 欧美日韩免费高清| 精品av综合导航| 日本成人三级电影网站| 欧美精品一区二区三区免费播放| 中文字幕资源网在线观看免费 | 欧美成人女星排行榜| 亚洲熟妇一区二区| 四虎5151久久欧美毛片| 夜夜嗨av色一区二区不卡| 色www亚洲国产阿娇yao| 欧美aa国产视频| 91精品国产91久久久久久| 国产91精品看黄网站在线观看| 全部av―极品视觉盛宴亚洲| 成人激情视频免费在线| 黄色a在线观看| 久久女同互慰一区二区三区| 欧美日韩一区二区三区在线观看免 | 韩日毛片在线观看| 91成人免费在线视频| 天美一区二区三区| 亚洲人成精品久久久 | 久久国产精品亚洲va麻豆| 成年人视频在线观看免费| 亚洲精品水蜜桃| 亚洲中文字幕久久精品无码喷水| 亚洲福利影视| 亚洲九九九在线观看| 紧身裙女教师波多野结衣| 一区二区三区精品视频在线观看| 国产精品亚洲激情| 免费看国产片在线观看| 18成人在线视频| 无码人妻h动漫| 亚洲国产视频二区| 自拍偷拍免费精品| 影音先锋亚洲天堂| 国产精品亚洲专一区二区三区| 日本不卡二区高清三区| 国产色婷婷在线| 欧美日韩不卡视频| 亚洲综合色一区| 激情成人综合| 91免费看国产| 97最新国自产拍视频在线完整在线看| 亚洲国产成人av好男人在线观看| 日韩欧美国产片| 亚洲丝袜美腿一区| 久久久视频免费观看| 国产高清免费观看| 中文字幕一区二区三区在线观看 | 在线观看v片| 精品成人在线观看| 成人免费毛片东京热| 精品在线观看视频| 亚洲国产日韩美| 欧美黑人巨大xxxxx| 亚洲国产欧美一区二区丝袜黑人| 九九免费精品视频| 国产一区二区三区在线观看精品| 亚洲精品中文字幕在线| 人人视频精品| 亚洲人成电影网站色…| 欧美日韩综合在线观看| 成人av在线网| 六月婷婷在线视频| 黑人久久a级毛片免费观看| 九九精品在线视频| 精品国产无码AV| 亚洲自拍另类综合| 中文字幕 欧美 日韩| 中文字幕免费精品| av免费观看久久| 欧美另类tv| 精品国产成人系列| 日韩无码精品一区二区三区| 成人福利视频在线看| 色欲色香天天天综合网www| ady日本映画久久精品一区二区| 九九热这里只有在线精品视| 精品乱子伦一区二区| 亚洲国产一区二区三区| 亚洲一级av无码毛片精品| 亚洲在线观看| 欧美一区2区三区4区公司二百| 成人黄色图片网站| 视频在线观看99| 精品国产亚洲AV| 亚洲电影在线免费观看| 国产肉体xxxx裸体784大胆| 欧美一级二区| 亚洲激情图片| 久久伊人影院| 国自产精品手机在线观看视频| 亚洲 欧美 精品| 在线观看成人小视频| 91ts人妖另类精品系列| 国产高清在线观看免费不卡| 国产婷婷一区二区三区| 狠狠做六月爱婷婷综合aⅴ| 成人精品网站在线观看| 在线中文字幕电影| 亚洲欧美第一页| 97成人在线观看| 亚洲福利视频一区二区| 欧美老女人性生活视频| 国产麻豆精品在线观看| 欧美 丝袜 自拍 制服 另类 | 国产又黄又爽免费视频| 国产精品极品在线观看| 国产成人综合精品| 污污片在线免费视频| 亚洲日韩欧美视频| av av片在线看| 色综合天天综合网国产成人综合天 | 手机亚洲手机国产手机日韩| 99影视tv| 日韩精品影院| 欧美激情三级免费| 婷婷成人激情| 亚洲精品黄网在线观看| 一级黄色免费看| 天天色综合成人网| av成人免费网站| 久久久久综合网| 在线播放第一页| 美国三级日本三级久久99 | 蜜臀av一区二区在线免费观看 | 91制片在线观看| 国产一区二区三区在线免费观看 | 亚洲av综合色区| 国产精品欧美在线观看| 国产精品区一区二区三含羞草| av高清一区| 91av在线免费观看视频| sm国产在线调教视频| 亚洲天堂成人在线| 天堂网在线中文| 欧美一区二区三区爱爱| 黄色一区二区视频| 疯狂做受xxxx高潮欧美日本| 岛国毛片在线观看| 国产精品国产精品国产专区不蜜| 亚洲第九十七页| eeuss影院一区二区三区| 交换做爰国语对白| 久久精品国产一区二区| 热久久精品国产| 国产一级一区二区| 国产一二三区在线播放| 一区二区电影| 夜夜爽99久久国产综合精品女不卡| 亚洲精品aaaaa| 就去色蜜桃综合| 欧美sss在线视频| 国产精品99久久久久久久| 精品国产不卡一区二区| 国产热re99久久6国产精品| 日韩欧美一区二区三区在线观看| 97精品久久久中文字幕免费| 毛片网站在线看| 欧美精品制服第一页| 久久久久久国产精品免费无遮挡| 中文字幕在线视频日韩| 春暖花开成人亚洲区| 亚洲视频在线播放| 国产日韩精品在线看| 亚洲人成网站免费播放| 国产在线视频网站| 国产亚洲在线播放| 国产69精品久久app免费版| 亚洲欧美中文字幕在线一区| 嫩草精品影院| 亚洲人成网站色ww在线| 成av人电影在线观看| 中文字幕在线精品| 国产一区久久精品| 欧美老少配视频| 性欧美videoshd高清| 欧美极品美女视频网站在线观看免费| 女同视频在线观看| 国语对白做受69| 欧美xxx视频| 国产精品尤物福利片在线观看| 亚洲男人在线| yy111111少妇影院日韩夜片 | 亚洲激情视频网站| 欧美偷拍视频| 中文字幕久久亚洲| 黄色网页在线播放| 欧美国产精品日韩| 草草在线视频| 国产精品1234| 欧美h版在线观看| 精品国产乱码久久久久久88av| 美女毛片一区二区三区四区| 亚洲色图自拍| 亚洲福利免费| www.99在线| 国产成人综合在线观看| 性久久久久久久久久| 国产精品欧美一区二区三区| 青青草原在线免费观看视频| 动漫精品一区二区| 91久久久久国产一区二区| 欧美不卡在线视频| 欧美日韩国产中文字幕在线| 日韩中文字幕网| а√天堂8资源在线| 国产精品久久久久aaaa九色| 精品入口麻豆88视频| 精品日本一区二区| 婷婷另类小说| 欧美性大战久久久久xxx| 麻豆成人久久精品二区三区小说| 精品伦一区二区三区| 国产欧美一区在线| 国产性生活网站| 欧美色图一区二区三区| 人妻无码一区二区三区久久99| 伊人精品在线观看| av在线视屏| 91在线视频一区| 免费视频亚洲| 成人午夜精品久久久久久久蜜臀| 久久国产婷婷国产香蕉| 国产精品伦子伦| 亚洲精品菠萝久久久久久久| 日本黄色中文字幕| 亚洲精品一区二区三区精华液| 自拍视频在线网| 2019av中文字幕| 欧美激情三级| 亚洲7777| 性高湖久久久久久久久| 在线播放第一页| 亚洲精品视频免费看| 成人免费一区二区三区| 亚洲男人天堂2023| 福利网站在线观看| 亚洲aa在线观看| 成人亚洲一区二区| 黄色片久久久久| 99精品国产一区二区三区不卡| 在线免费观看亚洲视频| 欧美视频在线观看一区| 欧美色图另类| 777国产偷窥盗摄精品视频| 亚洲精品国产九九九| 一本色道久久99精品综合| 日韩福利视频导航| 中国美女乱淫免费看视频| 午夜成人免费视频| 亚洲AV无码精品自拍| 久久中文字幕在线| 亚洲精品三区| 中日韩在线视频| 久久99热这里只有精品| 男人天堂资源网| 欧美日韩小视频| 91caoporn在线| 国产精品一区二区三区久久久 | 中文字幕精品国产| 影视一区二区三区| 天堂√在线观看一区二区| 三级久久三级久久久| 亚洲精品成人无码| 色女孩综合影院| 国产香蕉在线| 国产精品一区二区三区毛片淫片| 成人无号精品一区二区三区| 国产精品一区二区羞羞答答| 日本一区二区三区国色天香| 中文字幕免费视频观看| 色偷偷av一区二区三区乱| 欧美日韩破处视频| 中文字幕在线乱| 国产精品69毛片高清亚洲| 久久久综合久久| 亚洲二区在线播放视频| 中文字幕影音在线| 四虎永久在线精品免费一区二区| 久久99精品视频| 深夜福利影院在线观看| 精品国产91九色蝌蚪| 人在线成免费视频| 色999日韩自偷自拍美女| 久久精品72免费观看| 九九精品在线观看视频| 亚洲国产精品系列| 欧美色片在线观看| 国产人妻互换一区二区| 成人性色生活片| 无码aⅴ精品一区二区三区| 中文字幕亚洲综合| 日本99精品| 精品人妻一区二区三区四区在线| 日本一区二区三区免费乱视频| 国产一区二区视频免费观看| 久久久久成人精品| 久久av电影| 51自拍视频在线观看| 午夜国产精品一区| 在线观看黄色av| 国产精品传媒毛片三区| 美女视频一区免费观看| www深夜成人a√在线| 亚洲国产精品视频在线观看| 粉嫩91精品久久久久久久99蜜桃| 女女同性女同一区二区三区按摩| 91亚洲精品久久久蜜桃| 国产精品久久久久久久久毛片 | 国产精品美女久久久久久| 亚洲欧美另类视频| 国产精品免费福利| 极品尤物久久久av免费看| 91精品久久久久久久久久久久| 日韩视频免费观看高清在线视频| 都市激情亚洲综合| 国产精品88久久久久久妇女| 国产人妖乱国产精品人妖| 欧美自拍偷拍第一页| 国产日韩在线看|