精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通用端到端OCR模型開源,拒絕多模態大模型降維打擊

人工智能
要想引入新OCR feature如支持一項新語言,不是SFT一下就能訓進模型的,得打開vision encoder做pre-training或者post-training,這都是相當耗資源的。

在AI-2.0時代,OCR模型的研究難道到頭了嗎!?
(OCR:一種將圖像中的文字轉換為可編輯和可搜索文本的技術)

Vary作者團隊開源了第一個邁向OCR-2.0的通用端到端模型GOT

用實驗結果向人們證明:No~No~No~

圖片圖片

GOT模型效果如何?

話不多說,直接上效果圖:

最常用的PDF image轉markdown能力最常用的PDF image轉markdown能力

 

圖片

△ 雙欄文本感知能力

圖片圖片

△ 自然場景以及細粒度OCR能力

動態分辨率OCR能力動態分辨率OCR能力

多頁OCR能力多頁OCR能力

更多符號的OCR能力更多符號的OCR能力


研究團隊稱,盡管GOT模型表現不錯,但也存在一些局限,如更多的語言支持,更復雜的幾何圖,chart上的OCR性能。

他們說OCR-2.0的研究還遠的很,GOT也還有不小提升空間(該項目在數據和算力資源上都是非常受限的)。

正是因為深知GOT以及OCR-2.0的潛力,我們希望通過開源GOT吸引更多的人,放棄VQA,再次投向強感知。都說純OCR容易背鍋,但也正好說明做的不夠work,不是嗎?

GOT: Towards OCR-2.0

通用OCR模型須要夠通用,體現在輸入輸出都要通用上。

GOT的通用具體表現為:在輸入方面,模型支持Scene Text OCR、Document OCR、Fine-grained OCR、More General OCR等任務。

圖片圖片

△ 通用OCR模型須“通用”

輸出方面,模型同時支持plain texts輸出以及可讀性強、可編輯的formatted文本輸出,如markdown等。

模型的結構和訓練方法,采用vision encoder+input embedding layer+decoder的pipeline。

Encoder主體采用帶local attention的VITDet架構,不會讓CLIP方案的全程global attention在高分辨率下激活太大,炸顯存。

Encoder后兩層采用Vary的雙卷積設計方案。整個Encoder將1024×1024×3的圖像壓縮為256×1024的image tokens,足以做好A4紙級別的dense OCR。

圖片圖片

△ GOT結構與訓練流程圖

研究團隊將整個訓練過程分為三個步驟,沒有一個階段鎖LLM,過程中沒有存在圖像到文本的對齊階段,進而導致損害image token的文字壓縮率。

三個訓練階段分別為:

第一階段:高效預訓練encoder,GOT在整個訓練過程中,沒有A100級別的卡,為了節省資源,該階段使用小型OPT-125M作為decoder為encoder提供優化方向,快速灌入大量數據。

第二階段:聯合訓練encoder-decoder,該階段GOT的基本結構搭建完成,為上一階段預訓練好的encoder,以及Qwen團隊預訓練好的Qwen0.5B。

研究團隊稍稍加大了decoder的大小,因為該階段需要喂入大量OCR-2.0的知識,而不少數據(如化學式的OCR)其實也是帶點reasoning的,不過更小的decoder他們未敢嘗試。

第三階段:鎖住encoder,加強decoder以適配更多的OCR應用場景,如支持坐標或者顏色引導的細粒度OCR(點讀筆可能會用到),支持動態分辨率OCR技術(超大分辨率圖可能會用到),多頁OCR技術。

該feature主要是為了后續follower能更好地訓練Arxiv這種數據,我們的設想是多頁PDF直接訓練,無須再對.tex斷頁而苦惱!

面對整個GOT模型設計中最困難的數據工程環節。研究團隊為了構造各種各樣的數據,還學習了眾多數據渲染工具,包括Latex,Mathpix-markdown-it,Matplotlib,Tikz,Verovio, Pyecharts等等。

圖片圖片

△ GOT使用到的數據渲染工具

OCR的研究才剛剛開始

關于為什么在大模型相互梭哈的時代繼續研究OCR?

研究團隊有他們自己的理由:

OCR一直是離落地最近的研究方向之一,是AI-1.0時代的技術結晶。


到了以LLM(LVLM)為核心的AI-2.0時代,OCR成了多模大模型的一項基本能力,各家模型甚至有梭哈之勢。


多模態大模型作為通用模型,總有種降維打擊OCR模型的感覺。


那么純OCR的研究真的到頭了嗎?我們想說:當然沒有!沒準才剛剛開始。


首先盤一下AI-1.0 OCR系統和LVLM OCR的缺點:


首先是AI-1.0流水線式的OCR系統,缺點不用多說,各個模塊比較獨立,局部最優,維護成本也大。


最重要的是不通用,不同OCR任務需路由不同模型,不太方便。


那么多模態大模型在pure OCR任務上有什么缺陷呢?我們認為有以下兩點:


1、為Reasoning讓路必然導致image token數量過多,進而導致在純OCR任務上存在bottle-neck。


Reasoning(VQA-like)能力來自LLM(decoder),要想獲得更好的VQA能力(至少在刷點上),就要充分利用起LLM來,那么image token就得越像text token(至少高維上,這樣就會讓LLM更舒服)。


試想一下,100個text token在LLM詞表上能編碼多少文字?那么一頁PDF的文字,又需要多少token呢?不難發現,保VQA就會導致在做OCR任務上,尤其是dense OCR任務上,模型搞得比較丑陋。


例如,一頁PDF圖片只有A4紙大小,很多LVLM要都需要切圖做OCR,切出幾千個image token。單張都要切圖,拿出多頁PDF拼接圖,閣下又當如何應對?


我們認為對于OCR模型這么多token大可不必。


2、非常直觀的一點就是模型太大,迭代困難


要想引入新OCR feature如支持一項新語言,不是SFT一下就能訓進模型的,得打開vision encoder做pre-training或者post-training,這都是相當耗資源的。

對于OCR需求來說太浪費了。


有人會說,小模型能同時做好這么多OCR任務嗎?


我們的答案是肯定的,而且甚至還能更好

論文地址:https://arxiv.org/pdf/2409.01704

項目地址:https://github.com/Ucas-HaoranWei/GOT-OCR2.0

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-01-08 08:21:16

2024-03-25 12:40:19

訓練模型

2025-01-16 10:11:58

2025-09-16 09:35:52

2025-07-02 09:46:30

2024-10-14 14:10:00

大模型AI開源

2024-03-25 12:30:18

AI訓練開源

2023-12-25 13:24:00

模型OCR頁面

2024-12-12 00:25:09

2024-01-22 13:59:00

模型訓練

2025-09-23 09:20:05

2024-12-30 00:01:00

多模態大模型Python

2024-05-27 07:21:43

2025-03-19 09:30:00

2025-04-07 03:00:00

自動駕駛
點贊
收藏

51CTO技術棧公眾號

人人人妻人人澡人人爽欧美一区| 国产一区二区片| 亚洲中文字幕一区二区| 亚洲a一区二区三区| 日韩欧美一区在线观看| 日本男女交配视频| 国产私人尤物无码不卡| 精品一区二区免费视频| 97国产精品免费视频| 99精品欧美一区二区| 亚洲视频一起| 欧美三级资源在线| 欧美日韩不卡在线视频| 91在线播放网站| 99在线精品一区二区三区| 国产免费一区视频观看免费| 激情五月色婷婷| 婷婷成人基地| 亚洲男人天天操| 韩国av中国字幕| 国产精品3区| 色一情一伦一子一伦一区| 妞干网这里只有精品| 国产视频第一区| 成人av网站在线观看免费| 国产精品女主播视频| 99精品视频99| 欧美亚韩一区| 久久综合伊人77777| 日韩毛片无码永久免费看| 噜噜噜狠狠夜夜躁精品仙踪林| 欧美日韩久久久久久| 日韩欧美国产免费| 波多野结衣中文在线| 亚洲乱码国产乱码精品精可以看| 少妇精品久久久久久久久久| 人操人视频在线观看| 成人亚洲一区二区一| 亚洲japanese制服美女| 中文字幕在线观看高清| 久久综合九色| 国产91av在线| 成年人视频在线免费看| 亚洲欧洲午夜| 午夜精品视频网站| 久久精品国产亚洲av无码娇色| 久久久久国产精品| 日韩一区二区在线视频| 中文字幕在线观看二区| 成人高清av| 正在播放欧美一区| 免费一级黄色录像| 成人羞羞动漫| 色偷偷av亚洲男人的天堂| 99在线视频免费| 欧美精选一区二区三区| 国产一区二区三区丝袜| 黄色片在线观看免费| 国产亚洲一区二区三区不卡| 国产亚洲精品久久久久久| 国产美女精品久久| 激情五月色综合国产精品| 亚洲日韩第一页| 亚洲精品91在线| 欧美gay男男猛男无套| 色婷婷综合久久久久中文字幕1| 精品亚洲乱码一区二区 | 精彩视频一区二区| 成人日韩在线电影| 亚洲精品久久久久久动漫器材一区 | 国产精品久久久久一区二区三区共 | 亚洲一区二区免费视频| 拔插拔插海外华人免费| 漫画在线观看av| 欧美午夜片在线免费观看| 成年人小视频网站| 久久久国产精品网站| 91麻豆精品国产91久久久资源速度| 性生活在线视频| 成人在线视频你懂的| 日韩精品高清视频| 又嫩又硬又黄又爽的视频| 91精品国偷自产在线电影| 欧美乱人伦中文字幕在线| 中日韩黄色大片| 蜜臀a∨国产成人精品| 99久久综合狠狠综合久久止| 亚洲色欧美另类| 日本一区二区三区国色天香 | 午夜精产品一区二区在线观看的| 久久国产精品成人免费观看的软件| 欧美成人激情图片网| 日本熟妇毛茸茸丰满| 肉色丝袜一区二区| 97视频热人人精品| 日韩专区一区二区| 中文字幕亚洲成人| 人妻夜夜添夜夜无码av| 成人毛片免费| 精品久久人人做人人爽| 国产视频三区四区| 亚洲国产精品一区| 国产噜噜噜噜噜久久久久久久久| 国产 日韩 欧美 综合| 国产日韩欧美电影| 无码熟妇人妻av在线电影| 色成人免费网站| 欧美mv日韩mv国产网站| 国产三级在线观看完整版| 在线看片成人| 国产精品久久久久久久久久免费| www.黄色一片| 久久久久久久久免费| 黄色片免费在线观看视频| 51一区二区三区| 亚洲美女黄色片| 久久久久无码精品国产| 精品一区二区在线观看| 欧美在线激情| 国产不卡人人| 日韩视频在线你懂得| 一本一本久久a久久| 免费在线亚洲欧美| 国产区日韩欧美| 日韩123区| 日韩一区二区在线观看视频| 99国产精品无码| 日韩中文字幕av电影| 久久精品一区二区三区不卡免费视频| av观看在线| 欧美精品18+| 女人裸体性做爰全过| 久久精品30| 久久影院理伦片| 欧美gv在线观看| 亚洲精品白浆高清久久久久久| 九九热国产在线| 国产一区二区三区黄视频| 在线免费观看成人网| 成人福利片在线| 最近2019中文字幕mv免费看| 婷婷激情五月综合| 久久众筹精品私拍模特| 91九色在线观看视频| 国产香蕉精品| 性色av一区二区咪爱| 国产综合在线播放| 无码av中文一区二区三区桃花岛| 亚州av综合色区无码一区| 亚洲高清二区| 久久精品日韩| 奇米777日韩| 在线播放精品一区二区三区| 中文字幕 视频一区| 国产精品无遮挡| 亚洲天堂国产视频| 亚洲v在线看| 99三级在线| jizzjizz中国精品麻豆| 亚洲精品按摩视频| 天天爽夜夜爽人人爽| 久久久久国产精品人| 波多结衣在线观看| 水蜜桃久久夜色精品一区| 91久久国产精品| 丁香花视频在线观看| 亚洲精品www久久久久久广东| 岛国av中文字幕| 中文子幕无线码一区tr| 中文字幕一区二区在线观看视频| 中文字幕av亚洲精品一部二部| 国产精品播放| 日韩大尺度黄色| 日韩在线欧美在线国产在线| 国产jzjzjz丝袜老师水多 | 日韩综合在线观看| 国产精品国产三级国产| 韩国三级视频在线观看| 一区二区三区国产盗摄| 视频一区视频二区视频三区高| 成人影院在线免费观看| 久久综合免费视频| 亚欧洲精品视频| 欧美日韩高清在线| 久久久久久久久久91| 久久先锋资源网| 三级性生活视频| 在线视频免费在线观看一区二区| 视频一区视频二区视频| 超碰97成人| 国产精品成人品| 牛牛精品在线| 一区二区三区黄色| 日批视频免费播放| 欧美日韩在线亚洲一区蜜芽| 久久精品美女视频| 亚洲国产精品激情在线观看| 国产成人av片| 免费看日韩精品| 青青草精品视频在线| 日韩免费在线| 麻豆av一区二区| 欧美h版在线观看| 国产精品久久久久久久久久久新郎| 久草在线视频资源| 中文字幕在线成人| 神宫寺奈绪一区二区三区| 欧美久久免费观看| 69xxxx国产| 午夜影视日本亚洲欧洲精品| 在线视频这里只有精品| 久久婷婷色综合| 精品国产午夜福利在线观看| 青青草97国产精品免费观看无弹窗版 | 人妻激情偷乱频一区二区三区| 美女视频黄久久| www.亚洲天堂网| 亚洲黄色在线| 18视频在线观看娇喘| 日韩电影免费网址| 欧美日产一区二区三区在线观看| www.久久东京| 51国偷自产一区二区三区的来源| 欧洲美女精品免费观看视频| 国产成人一区二区三区电影| 国产拍在线视频| 欧美激情视频播放| 91精品久久| 不卡av电影院| 成人在线免费看黄| 日韩亚洲欧美中文在线| jizzjizz在线观看| 亚洲欧洲美洲在线综合| 亚洲人妻一区二区| 日韩av综合网| 亚洲 小说区 图片区 都市| 亚洲成人黄色网址| 免费观看a视频| 亚洲成人999| 亚洲精品久久久久久久久久久久久久| 欧美一级片在线观看| 国产强被迫伦姧在线观看无码| 欧美精品视频www在线观看| 在线观看免费高清视频| 欧美日本在线视频| 国产精品一区二区av白丝下载| 欧美老年两性高潮| 91精品国产乱码久久| 欧美日韩国产美| 国产又粗又猛又爽又黄的视频一| 欧美精品在线一区二区| aaa一区二区三区| 日韩免费电影一区| 亚洲精品福利网站| 亚洲精品av在线| 国产三级电影在线| 这里只有精品视频在线| 久cao在线| 久久久久久久久久久av| 岛国在线视频网站| 全球成人中文在线| 成人国产一区二区三区精品麻豆| 成人在线中文字幕| 最新国产精品精品视频| 六月婷婷久久| 成人激情电影在线| 久久av喷吹av高潮av| 国产精品草草| av天堂永久资源网| 美美哒免费高清在线观看视频一区二区 | 国产成都精品91一区二区三| 182在线视频| 国产欧美一区二区精品久导航 | 国产欧美精品| 国产91色在线观看| 国产乱码字幕精品高清av| 男人网站在线观看| 久久精品亚洲乱码伦伦中文| 二区三区四区视频| 亚洲地区一二三色| 亚洲 小说区 图片区| 欧美一级艳片视频免费观看| 天堂网av在线播放| 伊人精品在线观看| 视频在线观看入口黄最新永久免费国产| 久久久亚洲国产| 免费污视频在线一区| 91手机在线播放| 你懂的一区二区三区| 国产精品一区在线免费观看| 亚洲在线一区| www.偷拍.com| 久久蜜桃香蕉精品一区二区三区| 女人18毛片毛片毛片毛片区二| 亚洲亚洲人成综合网络| 91porny九色| 精品国产一区二区三区忘忧草 | 日本肉体xxxx裸体xxx免费| 精品一区二区影视| 成人在线电影网站| 亚洲欧美日韩国产手机在线| 四虎成人在线观看| 欧美一区二区三区四区高清| 极品美乳网红视频免费在线观看| 欧美成aaa人片免费看| 外国电影一区二区| 久久er99热精品一区二区三区| 亚洲欧美色图| 三级在线免费看| 91免费视频观看| 精品一级少妇久久久久久久| 欧美日韩亚洲高清一区二区| 四虎影视精品成人| 久久综合国产精品台湾中文娱乐网| 日韩欧美看国产| 好吊色欧美一区二区三区视频| 中文字幕乱码亚洲无线精品一区| 天天干天天爽天天射| 99精品国产热久久91蜜凸| 欧美爱爱小视频| 717成人午夜免费福利电影| 福利小视频在线观看| 4p变态网欧美系列| 精品亚洲精品| 日韩精品在线视频免费观看| 国模无码大尺度一区二区三区| 亚洲精品成人av久久| 日本丶国产丶欧美色综合| 视频午夜在线| 91精品国产亚洲| 韩国女主播一区二区三区| 日韩欧美猛交xxxxx无码| 国产一区二区三区av电影| 91香蕉视频网| 欧美精品 日韩| 成年人黄视频在线观看| 国产欧美日韩中文| 日韩欧美精品一区| 亚洲黄色av网址| 一区免费观看视频| 免费黄色片视频| 亚洲午夜未删减在线观看 | 在线视频观看一区| 久热av在线| 国产999精品久久久| 欧美日韩国产传媒| 亚洲色图久久久| ...中文天堂在线一区| 国产又大又粗又长| 久久久国产精品一区| 国产一区二区三区免费在线| 咪咪色在线视频| 国产aⅴ精品一区二区三区色成熟| 九九热国产在线| 日韩av在线天堂网| 欧美艳星kaydenkross| 午夜精品区一区二区三| 蜜桃免费网站一区二区三区| 国产美女福利视频| 日韩欧美专区在线| 国产夫妻在线播放| 久久青青草原一区二区| 视频一区国产视频| 毛片视频免费播放| 日韩一级二级三级| av老司机在线观看| 欧美精品一区在线| 日本成人在线不卡视频| 日本精品在线免费观看| 欧美精品一区二区三区高清aⅴ| 另类专区亚洲| 99热这里只有精品7| 成人深夜在线观看| 免费视频网站在线观看入口| 久久中文字幕在线视频| 欧美顶级毛片在线播放| 中文字幕永久视频| 亚洲美女视频在线观看| 午夜影院在线视频| 国产一区二区在线免费视频| 激情综合久久| 国产一二三四区在线| 日韩欧美国产综合| 国产精品迅雷| 亚洲欧美日韩不卡| 91网站视频在线观看| 在线中文字幕网站| 欧美精品www| 成人中文视频| 少妇一级淫免费观看| 欧美色图12p| 瑟瑟视频在线看| 黄色www在线观看| 久久亚洲综合色| 99久久精品免费看国产交换| 欧美亚洲视频一区二区| 女人天堂亚洲aⅴ在线观看| 午夜精产品一区二区在线观看的| 欧美电影免费观看完整版| 中韩乱幕日产无线码一区|