精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通用文檔理解新SOTA,多模態大模型TextMonkey來了

人工智能 新聞
TextMonkey 是一個專注于文本相關任務(包括文檔問答和場景文本問答)的多模態大模型(LMM)。

最近,華中科技大學和金山的研究人員在多模態大模型 Monkey [1](Li et al., CVPR2024)工作的基礎上提出 TextMonkey。在多個場景文本和文檔的測試基準中,TextMonkey 處于國際領先地位,有潛力帶來辦公自動化、智慧教育、智慧金融等行業應用領域的技術變革。


  • 論文鏈接:https://arxiv.org/abs/2403.04473
  • 代碼地址:https://github.com/Yuliang-Liu/Monkey

TextMonkey 是一個專注于文本相關任務(包括文檔問答和場景文本問答)的多模態大模型(LMM)。相比于 Monkey,TextMonkey 在多個方面進行改進:通過采用零初始化的 Shifted Window Attention,TextMonkey 實現了更高輸入分辨率下的窗口間信息交互;通過使用相似性來過濾出重要的圖像特征,TextMonkey 不僅能夠簡化輸入,還可以提高模型的性能。

此外,通過擴展多個文本相關任務并將位置信息納入回答,TextMonkey 增強了可解釋性并減少了幻覺。與此同時,TextMonkey 在微調之后還可以具備 APP Agent 中理解用戶指令并點擊相應位置的能力,展現了其下游應用的巨大潛力。

例如,TextMonkey 展現出強大的視覺定位與理解能力,不僅能夠定位圖像中的所有文本,還能在視覺問答時給出答案及其所在位置,增加了可解釋性并減少了幻覺。

圖片

圖片

即使在文字相當密集的情況下,TextMonkey 也可以讀取輸入圖片中的所有文字并且給出圖片中文本的坐標。

圖片

圖片


圖片

TextMonkey 還能幫助我們結構化圖表,表格以及文檔數據,通過將圖像內容轉化為 Json 格式的信息,方便記錄和提取。

圖片


圖片

實驗結果表明,TextMonkey 在各種基準數據集上的性能得到了顯著提升,在以場景文本為中心的視覺問答、文檔 VQA 和關鍵信息抽取任務中分別取得了 5.2%、6.9% 和 2.8% 的準確率增長,特別是在 OCRBench [2] 上獲得了 561 的得分,超越此前所有已開源的多模態大模型。

方法介紹

TextMonkey 的成功核心在于它模擬人類視覺認知的方法,這使它能自然而然地識別高清文檔圖像中各部分的相互關聯,并靈敏地鑒別出圖像內的關鍵要素。更進一步,基于對用戶多樣化需求的深入理解,TextMonkey 通過文本定位技術強化了答案的準確性,提升了模型的解釋性,減少了幻覺,有效提高了在處理各類文檔任務上的表現。


圖片圖 1 TextMonkey 整體架構

1.Shifted Window Attention

現有的多模態大模型,如 Monkey 和 LLaVA1.6,通過將圖像切分為小塊來提高輸入分辨率。然而這種裁剪策略可能會無意中分割相關單詞,導致語義不連貫。此外,這種分裂造成的空間分離也使得處理與文本位置相關的任務(如文本檢測)變得具有挑戰性。TextMonkey 在繼承 Monkey 高效的圖像分辨率縮放功能的同時,采用滑動窗口注意力機制建立了塊與塊之間的上下文聯系。

2.Token Resampler

目前的多模態大模型面臨著圖像 token 數目隨著輸入分辨率的增加而增加的挑戰。由于語言模型的輸入長度和訓練時間的限制,減少 token 的數量是很有必要的。

在自然語言中,語言元素會存在一些冗余信息。那么可以自然的猜測在擴大圖像分辨率之后,視覺部分的 token 也會存在冗余。本文根據以往確定語言元素相似性的方法,對已經映射到語言空間的圖像 token 的相似性進行了度量:在圖像 Resampler 之后隨機選取 20 個有序特征,利用余弦相似性成對比較這些特征的相似性,得到的結果如圖 2 所示。顏色越深代表相似性越高,實驗發現每個圖片的 token 都有一個到幾個類似的 token,圖片特征中存在冗余。

同時,本文還觀察到某些 token 是高度獨特的,并且缺乏其他相似的 token,如圖中的第四個 token,這表明這個 token 是更為重要的。因此本文選用相似度來度量并識別獨特的視覺 token。并提出 Token Resampler 來壓縮冗余視覺 token。通過計算每個 token 與其他 token 的相似度,過濾得到最重要(相似度最低)的 K 個 token。同時,為了避免直接丟棄其他 token 造成的信息丟失,這里還會利用過濾得到的 K 個 token 作為查詢,并采用交叉注意力機制進一步融合所有特征。

圖片

圖 2 圖像 token 相似性比較

3. 多任務訓練

TextMonkey 支持讀出所有文本,文本檢測識別,輸出給定文本坐標,文本問答,具有位置感知的文本問答,圖像結構化等多個任務。TextMonkey 在進行問答時不僅看可以給出答案,還能給出答案所在位置,進一步增強了模型的可解釋性。與此同時,在經過微調之后,TextMonkey 還可以具備 APP Agent 中理解用戶指令并點擊相應位置的能力。

實驗分析

1.TextMonkey 與現有的多模態大模型相比,表現出了優越的性能。

圖片

2. 為了進一步驗證 TextMonkey 的有效性,本文還在更多數據集上進行了測試。(其中 Deepform 和 KLC 使用 F1-score 作為評估指標,WTQ 使用 accuracy, ChartQA 使用 relaxed accuracy, DocVQA 使用 ANLS。)

圖片

3.TextMonkey 在 Text Spotting 數據集上相比于傳統 OCR 模型也取得了極具競爭力的效果。

圖片

4. 表 7 的消融實驗表明 Shifted Window Attention 和 Token Resampler 兩個模塊的有效性。

圖片

5. 表 9 的消融實驗證明:由于分辨率的提高導致冗余 token 的顯著增加,使得找到關鍵信息變得更加困難,在不壓縮 Token 的情況下直接增加分辨率實際上會導致一致的性能損失,如在表中第一行和第四行,在不壓縮 Token 時,分辨率由 896 增加到 1344 會導致模型在四個數據集上的指標均有所下降,這說明了沒有策略地一味增加模型的分辨率反而會帶來負面影響,如何合理地增加分辨率,將會是一個需要集中解決的問題。不僅如此,表 9 中還說明,當選取不同的壓縮 Token 數量時,對模型性能的影響也是顯著的,選取一個合適的值來作為壓縮 Token 的數量,可以使得模型的性能進一步提升。

圖片

可視化結果展示

TextMonkey 在場景圖像和文檔圖像中都能準確定位和識別文本。此外,(a) 中的自然圖像、(b) 中的文檔、(c) 中的圖表和 (d) 中的表格都展示了 TextMonkey 在多種場景下識別、理解和定位文本信息的能力。

圖片

本文還探索了 TextMonkey 作為智能手機應用程序的 Agent 代理方面的可行性。使用來自 Rico 數據集的 15k 用戶點擊數據上進行微調之后,TextMonkey 能夠理解用戶意圖并點擊相應的圖標,這表明了 TextMonkey 在微調之后作為 App Agent 的巨大潛力。

圖片

總結

TextMonkey 在 Monkey 的基礎上增強了其圖像間的跨窗口交互,在擴大分辨率的基礎上增強了視覺信息的語義連續性,有效緩解了視覺信息碎片化的問題;并通過提出過濾融合策略減少圖像特征長度,從而減少輸入到大語言模型中冗余的視覺 token 數量。論文的實驗說明,分辨率不是越大越好,不合理的提高模型分辨率策略有時會給模型帶來負面影響,如何合理地擴大分辨率才是一個更值得去思考的問題。

此外,通過在問答中引入位置信息,TextMonkey 增強了可解釋性并減少了幻覺。TextMonkey 在多個文本相關的測試基準中處于國際領先,在 OCRBench 中超越其他開源多模態大模型。TextMonkey 的到來為通用文檔理解帶來曙光,這有潛力促進辦公自動化、智慧教育、智慧金融等行業的技術變革。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-02 09:17:50

AI數據開源

2025-05-27 15:35:02

大模型技術AI

2025-04-28 14:13:43

開源SOTA多模態

2025-01-08 08:21:16

2025-05-20 13:02:23

2025-11-05 08:51:33

2023-07-17 11:02:36

模型開源

2023-06-28 13:55:30

模型AI

2025-09-19 09:05:18

AI模型訓練

2025-05-07 01:00:00

多模態大模型AI

2023-12-30 13:31:30

模型數據信息

2024-09-10 12:11:18

2024-12-12 00:25:09

2025-01-07 09:11:07

2024-06-17 00:00:00

MiCo模態人腦

2023-10-07 09:29:09

2025-09-16 09:35:52

2024-04-25 14:53:59

模型視覺

2025-08-07 16:24:19

小紅書開源dots.vlm1
點贊
收藏

51CTO技術棧公眾號

欧美xxxxx在线视频| 欧美黄色直播| 国产手机在线视频| 国产一区日韩| 日韩精品一区二区三区中文精品| 日韩在线综合网| 欧美18hd| xnxx国产精品| 1卡2卡3卡精品视频| 日韩中文字幕在线观看视频| 91成人精品视频| 亚洲欧美日韩国产中文| 中文字幕人妻无码系列第三区| 国模私拍一区二区国模曼安| 中文字幕一区二区三| 久久精品99| av网站在线免费看| 日韩电影网1区2区| 性色av一区二区三区在线观看| 麻豆一区在线观看| 伊人精品一区| 亚洲国产精品va在线看黑人动漫| 亚洲免费成人在线视频| 精品国模一区二区三区| 午夜天堂影视香蕉久久| 久久视频免费在线| 久操视频在线播放| 国产香蕉久久精品综合网| 国产精品久久久久久久免费大片 | 精品国产乱码久久久久久蜜柚| 一级α片免费看刺激高潮视频| 国产精品免费看| 久久久久久久国产精品| 乱h高h女3p含苞待放| 成人影院天天5g天天爽无毒影院| 亚洲精品日韩久久久| 四虎成人免费视频| 精品久久久久久久久久岛国gif| 色综合夜色一区| 丰满爆乳一区二区三区| 爱情岛亚洲播放路线| 夜夜夜精品看看| 在线观看av的网址| 91精品国产91久久久久久青草| 国产精品久久久久一区二区三区| 日韩欧美一区二区视频在线播放| 日本人妖在线| 久久日一线二线三线suv| 国产精品一区二区三区在线| 亚洲欧美黄色片| 福利一区二区在线观看| 成人免费在线一区二区三区| 亚洲卡一卡二卡三| 不卡一区二区中文字幕| 国产日韩欧美亚洲一区| 天天射天天操天天干| 99re热这里只有精品视频| 久久精品国产综合精品| 三级视频在线| 国产女主播视频一区二区| 热re99久久精品国产99热| 久久久资源网| 国产精品久久一卡二卡| 久久久成人精品一区二区三区| 丝袜美腿美女被狂躁在线观看| 综合分类小说区另类春色亚洲小说欧美 | 久久免费精品视频| 少妇一级淫片免费放中国 | 人妖欧美1区| 亚洲成人免费影院| 国产av无码专区亚洲精品| 欧美亚洲大片| 91精品免费在线观看| 一级黄色大片免费看| 黑色丝袜福利片av久久| 亚洲欧美日韩综合| 国产一区在线观看免费| 欧美日韩网址| 国产精品18久久久久久麻辣| 一级做a爱片性色毛片| 国产精品一区不卡| 久久精品国产一区二区三区日韩 | 国产女人18毛片水真多成人如厕 | 日韩国产美国| 亚洲综合影视| 欧美国产日韩一区二区| 久国产精品视频| 97视频一区| 日韩www在线| 黄大色黄女片18免费| 亚洲成人免费| 欧美亚洲成人网| 一级全黄裸体免费视频| 99久久精品免费| 亚洲欧美99| 18video性欧美19sex高清| 在线观看不卡视频| 潘金莲一级淫片aaaaaaa| 同性恋视频一区| 久久精品电影网站| 日本在线播放视频| 国产乱子轮精品视频| 精品国产免费一区二区三区| 日本免费在线视频| 五月天丁香久久| 国产在线观看中文字幕| 你微笑时很美电视剧整集高清不卡| 日韩视频永久免费观看| 91精品国产综合久久久蜜臀九色| 国产一区二区网址| 日韩黄色影视| 日韩欧美精品一区二区三区| 欧美一区二区在线播放| 老头老太做爰xxx视频| 欧美日韩亚洲一区三区| 国产精品露脸av在线| 性生活视频软件| 久久久久久久久99精品| 99er在线视频| 国产亚洲观看| 深夜福利91大全| 真实新婚偷拍xxxxx| 91老师片黄在线观看| www.av毛片| 51vv免费精品视频一区二区 | 国产欧美亚洲视频| 青青色在线视频| 亚洲国产你懂的| 九色91porny| 91精品一区二区三区综合| 国产精品www| 黄网在线观看| 日韩欧美黄色动漫| 久久一区二区电影| 一本久道久久综合婷婷鲸鱼| 欧美一区二区在线视频观看| 成人性生交免费看| 精品按摩偷拍| 欧美成人精品激情在线观看| 成人免费性视频| 国产亚洲一区二区手机在线观看 | 成人无号精品一区二区三区| 欧美一区二区三区免费观看| 欧洲av在线播放| 夜夜亚洲天天久久| 色婷婷狠狠18禁久久| 欧美+亚洲+精品+三区| 国产区亚洲区欧美区| 不卡在线视频| 欧美唯美清纯偷拍| 国产一级淫片久久久片a级| 欧美aaaaa成人免费观看视频| 欧美二区三区| 日韩av超清在线观看| 在线精品播放av| 在线免费观看视频网站| 国产精品毛片久久久久久久| 少妇一级淫免费放| 99精品全国免费观看视频软件| 国产又爽又黄的激情精品视频| 日韩伦理在线电影| 欧美一区二区三区视频免费播放| 国产少妇在线观看| 成人免费毛片片v| 日韩中文字幕三区| 日本久久黄色| 亚洲尤物视频网| a级片在线免费观看| 日韩精品丝袜在线| 亚洲精品无码久久久久| 中文字幕在线不卡国产视频| 欧美xxxxxbbbbb| 亚洲二区精品| 视频一区视频二区视频三区高 | 粉嫩精品一区二区三区在线观看 | 男人资源在线播放| 精品国精品国产| 91久久国产综合久久91| 亚洲色图.com| 国产精品久久AV无码| 日韩高清一区二区| 中国女人做爰视频| 日韩高清成人在线| 中文字幕av一区二区三区高| 久久99精品久久久久久青青日本| 日韩精选视频| 欧美成人精品在线播放| 色视频在线看| 日韩一级二级三级| 日本黄色中文字幕| 亚洲欧美经典视频| 欧美熟妇一区二区| 国产成人三级在线观看| 国产精品wwwww| 你懂的成人av| 日韩高清国产精品| 激情亚洲另类图片区小说区| 国产精品都在这里| 青青草视频在线免费直播| 亚洲视频第一页| 亚洲av综合色区无码一二三区 | 日本美女视频一区| 一本综合久久| 看全色黄大色大片| 国产免费播放一区二区| 国产精品xxx在线观看www| 国模私拍国内精品国内av| 午夜精品久久17c| 国产丝袜在线| 亚洲天堂av高清| 黄色美女一级片| 在线91免费看| 波多野结衣一本一道| 亚洲成人av电影在线| 亚洲一区电影在线观看| 久久天堂av综合合色蜜桃网 | 久久久国产午夜精品| xxxwww国产| 国产精品538一区二区在线| 日本www.色| 媚黑女一区二区| 国产素人在线观看| 国产综合自拍| 国产成人生活片| 欧美肥老太太性生活| 日本不卡一区| 精品中文字幕一区二区三区av| 国产伦精品一区二区三| 日韩亚洲精品在线观看| 91久久久久久久久久久久久| 亚洲精品国产嫩草在线观看| 亲爱的老师9免费观看全集电视剧| 欧美四级在线| 91搞黄在线观看| 一区二区三区在线视频111| 亚洲大奶少妇| 91在线国产电影| 国产精品视频一区视频二区 | 色愁久久久久久| 狠狠色综合一区二区| 高清欧美性猛交xxxx黑人猛| 成人在线资源网址| aiai久久| 黄色国产精品一区二区三区| 久久夜色精品国产噜噜av小说| 国产日韩欧美一区二区三区四区| 999国产精品一区| 丁香五月网久久综合| 99精品中文字幕在线不卡| 国产91一区二区三区| 日本亚洲欧美| 成人福利视频在线看| 色呦色呦色精品| 久久66热偷产精品| 国产不卡的av| 高清不卡一区二区在线| 99久久人妻精品免费二区| 91丨九色丨黑人外教| 国产全是老熟女太爽了| 中文字幕av资源一区| 紧身裙女教师波多野结衣| 亚洲尤物视频在线| 国产精品suv一区二区69| 欧美日韩国产专区| 中文字幕永久在线| 7777精品伊人久久久大香线蕉超级流畅 | 99久久久精品免费观看国产| caoporn成人| 欧美成人第一区| 久久中文字幕av| 搞av.com| 男人的天堂久久精品| 国产黄色一区二区三区| 99热在这里有精品免费| 小早川怜子久久精品中文字幕| 国产精品免费久久久久| 久久久久亚洲av片无码下载蜜桃| 欧美日韩色婷婷| 一二区在线观看| 亚洲大胆人体在线| 国产中文字幕在线播放| 麻豆成人在线看| 伊人久久综合一区二区| 成人性生交大片免费看小说| 欧美在线导航| 一区二区三区av在线| 亚洲国产精品一区制服丝袜| 日韩在线视频线视频免费网站| 中文字幕乱码在线观看| 欧美成人精品福利| 丁香在线视频| 久久久久久久久久国产| 成人国产一区二区三区精品麻豆| 99久久国产免费免费| 成人在线免费观看91| av网站大全免费| 九色porny丨国产精品| 日韩aaaaa| 亚洲色图第一区| 日韩免费av网站| 亚洲国产精品国自产拍av秋霞| 中国日本在线视频中文字幕| 午夜精品99久久免费| 豆花视频一区| 日韩一区二区三区高清| 国产综合激情| 一区二区免费av| 国产丝袜在线精品| 国产精品99精品无码视| 欧美一区二区观看视频| av在线1区2区| 国产v综合ⅴ日韩v欧美大片| 豆花视频一区二区| 国产精品igao激情视频| 老汉av免费一区二区三区| 久久偷拍免费视频| 亚洲永久免费av| 国产白浆在线观看| 日韩亚洲精品视频| 精品国模一区二区三区| 欧美一区二区视频17c| 中文亚洲字幕| 日本性生活一级片| 亚洲精品一二三| 国产精品久久久久久久久久久久久久久久久久| 亚洲欧美国产一区二区三区| 888av在线视频| 国产精品视频免费一区| 91精品一区国产高清在线gif | 日本免费观看视| 精品国产一区二区三区忘忧草| 黄视频在线观看网站| 国产日韩欧美影视| 91欧美大片| 日本不卡一区二区在线观看| 中文av一区特黄| 中文字幕人妻精品一区| 伊人久久免费视频| 在线一区视频观看| 日韩在线三区| 免费高清在线视频一区·| 自拍偷拍你懂的| 欧美三区免费完整视频在线观看| 成人在线免费观看| 国产精品日韩欧美综合| 久久中文字幕av一区二区不卡| 污污网站免费观看| 成人免费小视频| 国产偷拍一区二区| 欧美老女人性视频| 国产精品久久久久久久久久白浆| 青草视频在线观看视频| 欧美aaa免费| 国产精品亚洲激情| 99久久婷婷| 熟女人妻一区二区三区免费看| 亚洲永久精品国产| 亚洲欧洲综合在线| 国产福利视频一区| 99免费精品| 美女又黄又免费的视频| 亚洲国产综合91精品麻豆| 天堂在线视频网站| 国产精品69av| 亚洲最大av| 亚洲精品激情视频| 日韩欧美视频一区二区三区| 第九色区av在线| 亚洲字幕在线观看| 国产亚洲综合精品| 日本美女xxx| 3751色影院一区二区三区| 麻豆av在线播放| 欧美性xxxx69| 国产一区91精品张津瑜| 日干夜干天天干| 中文字幕精品—区二区| 日韩欧美一级| 午夜视频在线瓜伦| 亚洲欧美aⅴ...| 欧美成人片在线| 亚洲999一在线观看www| 国产婷婷精品| 老湿机69福利| 亚洲视频第一页| 91成人噜噜噜在线播放| 色综合天天色综合| 亚洲午夜一区二区三区| www在线播放| 国产视频精品网| 久久99国产乱子伦精品免费| 日韩免费视频网站| 中文字幕综合在线| 欧美黄色录像| 激情成人在线观看| 欧美探花视频资源| av最新在线| 菠萝蜜视频在线观看入口| 国产欧美一区二区在线| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的|