精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源) 原創(chuàng)

發(fā)布于 2025-10-24 09:57
瀏覽
0收藏

olmOCR 2相關(guān)對比:

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

持?jǐn)?shù)據(jù)、模型和代碼完全開源

olmOCR 2 是一套面向文檔 OCR 的端到端解決方案,其核心方法圍繞RLVR,通過 “合成數(shù)據(jù)規(guī)模化 - 單元測試定獎勵 - RL 訓(xùn)練提性能” 的閉環(huán),解決傳統(tǒng) OCR 系統(tǒng)在復(fù)雜場景(數(shù)學(xué)公式、表格、多列布局)中的痛點(diǎn)。

現(xiàn)有問題

傳統(tǒng)OCR系統(tǒng)的性能評估依賴編輯距離 ,計(jì)算模型輸出與Ground Truth的字符級差異(插入、刪除、替換次數(shù))。

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

圖1:傳統(tǒng)編輯距離的局限性:閱讀順序問題

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

圖2:傳統(tǒng)編輯距離的局限性:公式識別問題

為解決上述問題,設(shè)計(jì)了下面6類可驗(yàn)證的二進(jìn)制單元測試(結(jié)果僅“通過(PASS)”或“失敗(FAIL)”),覆蓋文檔OCR的需求:

測試類型

核心功能

文本存在性

驗(yàn)證特定短語(如關(guān)鍵句子、公式)是否精確出現(xiàn)在輸出中

文本不存在性

驗(yàn)證無關(guān)內(nèi)容(如頁眉、頁腳、頁碼)是否未出現(xiàn)在輸出中

自然閱讀順序

驗(yàn)證句子/段落的順序是否符合人類閱讀習(xí)慣(如圖1中“綠色→黃色”不被紅色打斷)

表格準(zhǔn)確性

驗(yàn)證表格單元格的相對位置與數(shù)值是否正確(如“Model”在“GPT-4-turbo”上方)

數(shù)學(xué)公式準(zhǔn)確性

用KaTeX渲染模型輸出與參考公式,驗(yàn)證視覺結(jié)構(gòu)是否一致(如圖2)

基線魯棒性

驗(yàn)證無長重復(fù)n-gram、無非目標(biāo)語言字符(避免模型幻覺)

這些測試的優(yōu)勢在于:

  1. 公平處理浮動元素:對圖注、表格等位置靈活的元素,只要核心邏輯正確(如表格單元格關(guān)系、閱讀順序),均判定為通過,避免編輯距離的“過度懲罰”;
  2. 精準(zhǔn)反映實(shí)際正確性:聚焦“用戶是否能用”(如公式能否正確渲染、表格能否正確讀取),而非“字符是否完全匹配”。

數(shù)據(jù)

手動為每個文檔設(shè)計(jì)單元測試耗時(shí)極長(原文提到“需數(shù)小時(shí)/文檔”),無法支撐RL訓(xùn)練的大規(guī)模數(shù)據(jù)需求。因此,文章開發(fā)了全自動合成數(shù)據(jù)生成 pipeline,實(shí)現(xiàn)“文檔→HTML→單元測試”的端到端規(guī)模化,核心流程分三步:

1. 步驟1:挑選“難處理場景”PDF數(shù)據(jù)源

為確保合成數(shù)據(jù)的挑戰(zhàn)性(覆蓋真實(shí)OCR痛點(diǎn),避免“模板化數(shù)據(jù)”,確保數(shù)據(jù)多樣性,與真實(shí)世界OCR需求對齊。),文章選擇高難度文檔樣本: 數(shù)據(jù)來源arXiv數(shù)學(xué)論文(含復(fù)雜公式)、舊掃描件(低分辨率)、多列布局文檔、含復(fù)雜表格的文檔。

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

olmOCR 2 合成數(shù)據(jù)流水線的 HTML 頁面生成。從真實(shí)文檔中采樣一個頁面(左圖),并提示通用 視覺語言模型(VLM)生成一個高度相似的 HTML 頁面(右圖)。渲染后的 HTML 頁面圖像與原始 HTML 配對,作 為專用于 OCR 的 VLM 的監(jiān)督信號。

2. 步驟2:PDF→HTML的三階段轉(zhuǎn)換(生成“帶Ground Truth的結(jié)構(gòu)化文檔”)

HTML是生成單元測試的關(guān)鍵:其語義標(biāo)簽(如??<header>???、??<footer>???、??<table>??、KaTeX公式)可直接用于自動提取測試用例。轉(zhuǎn)換過程依賴通用VLM(Claude-sonnet-4-20250514) ,分三階段迭代優(yōu)化:

階段

核心任務(wù)

輸入

輸出

1. 布局分析

讓VLM識別文檔結(jié)構(gòu):列數(shù)、圖像/表格位置、頁眉/頁腳區(qū)域、公式位置等

原始PDF頁面圖像

布局結(jié)構(gòu)描述(如“2列,右上角有表格”)

2. 內(nèi)容渲染

讓VLM基于布局分析,生成與原始PDF尺寸一致的語義HTML

原始圖像+布局描述

初始HTML(含文本、KaTeX公式、HTML表格)

3. 輸出優(yōu)化

渲染初始HTML為圖像,與原始PDF對比,讓VLM修正差異(如字體、間距、公式格式)

原始圖像+初始HTML+渲染圖像

優(yōu)化后的最終HTML

3. 步驟3:基于HTML自動生成單元測試

利用HTML的結(jié)構(gòu)化信息,程序化提取單元測試用例,無需人工干預(yù):

  • 文本不存在性測試:從??<header>??/??<footer>??標(biāo)簽提取頁眉/頁腳,生成“這些內(nèi)容不應(yīng)出現(xiàn)”的測試;
  • 數(shù)學(xué)公式測試:從KaTeX標(biāo)簽提取公式,生成“渲染后與參考一致”的測試;
  • 表格測試:從??<table>??標(biāo)簽隨機(jī)采樣單元格,生成“單元格相對位置正確”的測試;
  • 閱讀順序測試:基于HTML中段落的先后順序,生成“段落順序符合HTML結(jié)構(gòu)”的測試。

最終生成的合成數(shù)據(jù)集 olmOCR2-synthmix-1025 包含:2186個PDF頁面 → 30381個單元測試用例,為RL訓(xùn)練提供充足數(shù)據(jù)。

訓(xùn)練流程:SFT→RLVR→模型融合,端到端優(yōu)化

olmOCR 2的訓(xùn)練分為監(jiān)督微調(diào)(SFT) 和強(qiáng)化學(xué)習(xí)(RLVR) 兩階段,結(jié)合模型融合(Souping)進(jìn)一步提升性能:

1. 階段1:sft

讓模型掌握基礎(chǔ)的文檔解析能力(文本提取、公式識別、表格結(jié)構(gòu)感知),為后續(xù)RL優(yōu)化打基礎(chǔ)。選擇Qwen2.5-VL-7B-Instruct,使用改進(jìn)后的監(jiān)督數(shù)據(jù)集 olmOCR-mix-1025(267962頁,來自10萬+PDF),相比舊版(olmOCR-mix-0225)的改進(jìn):

  • 用GPT-4.1替代GPT-4o處理數(shù)據(jù),減少幻覺;
  • 統(tǒng)一公式格式(塊級公式用??\[??,行內(nèi)公式用??\(??);
  • 表格用HTML格式存儲(而非純文本);
  • 為圖像添加基礎(chǔ)alt文本;

2. 階段2:強(qiáng)化學(xué)習(xí)(RLVR)

核心是用合成數(shù)據(jù)的單元測試作為獎勵信號,通過GRPO算法優(yōu)化模型,解決SFT階段未覆蓋的復(fù)雜場景(如多列、公式、表格)。

  • 訓(xùn)練數(shù)據(jù):olmOCR2-synthmix-1025的合成文檔(帶單元測試);
  • 采樣策略:每個文檔生成28個不同的模型輸出(completions),確保覆蓋足夠多的候選結(jié)果;

獎勵函數(shù)設(shè)計(jì)

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

olmOCR 2 的 RLVR 訓(xùn)練的單元測試獎勵。給定一個生成的 HTML 頁面及其單元測試(左側(cè)),可以 根據(jù)這些單元測試輕松地對生成的 Markdown 頁面(右側(cè))進(jìn)行評分。每個測試貢獻(xiàn)一個二元獎勵,這些獎勵在頁面級 別匯總為通過率。例如,6 個測試中有 4 個通過,則頁面級別的獎勵為 0.67。

獎勵總分為三部分,取值均為0~1,確保模型同時(shí)優(yōu)化“內(nèi)容正確性”和“輸出格式合規(guī)性”:

獎勵類型

計(jì)算方式

作用

主獎勵:單元測試通過率

(通過的單元測試數(shù)量)/(總單元測試數(shù)量)

核心:優(yōu)化內(nèi)容正確性(公式、表格等)

輔助獎勵1:EOS token

若輸出以EOS(結(jié)束符)結(jié)尾則為1,否則為0

避免模型無限重復(fù)(解決“重復(fù)循環(huán)”)

輔助獎勵2:元數(shù)據(jù)位置

若文檔元數(shù)據(jù)(語言、旋轉(zhuǎn)校正系數(shù))在輸出頂部則為1,否則按位置遞減

確保輸出結(jié)構(gòu)規(guī)范,便于下游處理

3. 階段3:模型融合(Souping)

為避免單一模型的隨機(jī)性,文章采用模型權(quán)重平均(Souping) 策略:訓(xùn)練6個不同隨機(jī)種子的RL模型(3個用token級重要性采樣,3個用序列級重要性采樣);對6個模型的權(quán)重進(jìn)行平均,得到最終的olmOCR-2-7B-1025模型;

實(shí)驗(yàn)性能

RLVR訓(xùn)練多模態(tài)文檔解析模型-olmOCR 2技術(shù)方案(模型、數(shù)據(jù)和代碼均開源)-AI.x社區(qū)

OCR 模型性能對比

參考文獻(xiàn): olmOCR 2 Unit Test Rewards for Document OCR,https://arxiv.org/pdf/2510.19817v1
repo:https://github.com/allenai/olmocr

本文轉(zhuǎn)載自???大模型自然語言處理???   作者:老余

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲免费小视频| 亚洲欧洲中文日韩久久av乱码| 97在线看免费观看视频在线观看| jlzzjizz在线播放观看| 二区三区不卡| 18欧美乱大交hd1984| 国产精品区一区| 波多野结衣黄色网址| 中文乱码免费一区二区三区下载| 亚洲第一在线视频| 一本色道久久亚洲综合精品蜜桃| 2024最新电影免费在线观看| 97超碰欧美中文字幕| 国产日韩在线看| 日韩不卡视频在线| 97在线精品| 日韩精品在线视频| 日韩精品视频网址| 校园春色亚洲色图| 亚洲图片欧美视频| 一区不卡字幕| 国产小视频在线观看| 岛国精品在线观看| 成人网在线观看| 蜜臀99久久精品久久久久小说| 欧美精品三级| y97精品国产97久久久久久| 亚洲色图欧美另类| 国产欧美日韩电影| 欧美视频一区二区三区在线观看| 欧美 日韩 国产在线观看| 黄色在线免费| 中文字幕免费在线观看视频一区| 精品国产乱码久久久久| av网站在线观看免费| 青青草国产精品97视觉盛宴 | 蜜桃久久精品成人无码av| aiai久久| 欧美一级二级三级蜜桃| 超碰在线公开97| 成人免费看黄| 欧美日韩在线视频一区| 国产真实老熟女无套内射| free性欧美hd另类精品| 中文字幕在线一区| 影音欧美亚洲| www免费网站在线观看| 久久久久久久久久久久久女国产乱 | 日本一区二区三区四区五区六区| av网页在线| 亚洲国产成人午夜在线一区| 亚州欧美一区三区三区在线| 成人午夜影视| 国产精品毛片无遮挡高清| 视频一区三区| 91ph在线| 亚洲欧洲日产国产综合网| 国产日韩视频在线播放| 好操啊在线观看免费视频| 亚洲欧美日韩在线| 女女同性女同一区二区三区按摩| 免费不卡视频| 亚洲欧洲综合另类在线 | 亚洲激情综合| 18久久久久久| 永久免费无码av网站在线观看| 久久精品天堂| 国产日韩欧美影视| 国产精品无码免费播放| 国产福利91精品一区二区三区| 91在线在线观看| 日本高清视频网站| 久久久www成人免费毛片麻豆| 日韩欧美视频一区二区| 麻豆网站在线观看| 一区二区三区四区在线| heyzo亚洲| 欧美美女日韩| 欧美喷水一区二区| 日本中文字幕精品| 欧美美女啪啪| 中文字幕日韩电影| 91嫩草|国产丨精品入口| 韩国久久久久| 国产精品69久久| 国产精品羞羞答答在线| 成人免费观看av| 日本一区视频在线| av网址在线播放| 午夜精品福利久久久| 午夜dv内射一区二区| 在线高清欧美| 国产婷婷97碰碰久久人人蜜臀| 久久国产柳州莫菁门| 在线国产一区二区| 青青青国产精品一区二区| 亚洲在线观看av| 99久久99久久免费精品蜜臀| 亚洲日本无吗高清不卡| 色呦呦在线播放| 日韩欧美中文在线| 手机在线播放av| 亚洲人成精品久久久 | 日韩中文字幕一区| 九色91在线| 欧美视频一区二区三区在线观看| 乱码一区二区三区| 欧美日韩在线播放视频| 久久免费成人精品视频| 最新中文字幕在线观看视频| 国产高清久久久| 日韩福利在线| 都市激情国产精品| 欧美一级欧美三级| 久久久视频6r| 国产精品一国产精品k频道56| 91丝袜美腿美女视频网站| 三级无遮挡在线观看| 亚洲一区二区免费视频| 亚洲欧美日韩精品一区| 自拍亚洲一区| 久久久久久中文字幕| 国产又粗又猛又黄又爽| 国产婷婷一区二区| 老太脱裤子让老头玩xxxxx| 国产精品日本一区二区三区在线| 亚洲最新视频在线| 天堂网av手机版| 成人小视频在线| 午夜啪啪福利视频| ww久久综合久中文字幕| 精品中文字幕久久久久久| 国产一级性生活| 国产一区二区按摩在线观看| 一本久道久久综合| 99re66热这里只有精品4| 日韩国产精品亚洲а∨天堂免| 欧美日韩成人免费观看| 国产乱子轮精品视频| 中文字幕一区二区三区精彩视频 | 亚洲一区亚洲二区亚洲三区| 77导航福利在线| 色婷婷久久久综合中文字幕| 亚洲色图14p| 1024成人| 狠狠色综合色区| av在线资源| 亚洲成人av在线播放| 久草免费在线视频观看| 国产盗摄视频一区二区三区| 肉大捧一出免费观看网站在线播放 | 精品久久久久久久中文字幕| 欧美在线一级片| 亚洲片区在线| 精品国产中文字幕| 欧美大片免费| 国产午夜精品全部视频在线播放| 免费无码国产精品| 国产亚洲欧美激情| 日韩欧美黄色大片| 999国产精品| 亚洲wwwav| 超免费在线视频| 日韩国产中文字幕| 无码日韩精品一区二区| 久久久久国产精品厨房| 欧美三级理论片| 天天天综合网| 国产伦精品一区二区三毛| 国产色播av在线| 一本色道久久88亚洲综合88| 亚洲天堂男人网| 一区二区三区蜜桃| 最新在线黄色网址| 日韩成人精品视频| 六月婷婷激情网| 红杏视频成人| 日韩免费观看视频| 精品国产99久久久久久| 精品国产伦一区二区三区观看方式 | 国产精品久久久久一区二区三区厕所| 91精品久久久久久蜜桃| 在线视频超级| www.色综合| 空姐吹箫视频大全| 色呦呦网站一区| 日韩国产第一页| 97精品视频在线观看自产线路二| 亚洲不卡视频在线| 黄色另类av| 日本在线成人一区二区| 视频二区欧美| 日本在线观看天堂男亚洲| 99热国产在线| 亚洲无限av看| 亚洲第九十九页| 91精品国产入口在线| 日韩免费视频播放| 欧美一区二区三区激情视频| 91国产丝袜在线放| 性高爱久久久久久久久| 久久不射电影网| 邻居大乳一区二区三区| 日韩一区二区免费在线观看| 99超碰在线观看| 亚洲精品免费在线| 亚洲精品一区二区三区影院忠贞| 国产一区999| 一本久道中文无码字幕av| 欧美日韩综合| 亚洲精品二区| 免费久久精品| 成人91免费视频| 玖玖精品在线| 欧美一级淫片aaaaaaa视频| 国产在线激情视频| 在线观看成人黄色| 无码精品视频一区二区三区 | 高清欧美性猛交xxxx黑人猛| 国产精品久久久久久婷婷天堂| 91九色美女在线视频| 久久夜色精品国产亚洲aⅴ| 久久精品国产亚洲a∨麻豆| 精品国产乱码久久久久久蜜臀| 96日本xxxxxⅹxxx17| 91久久久免费一区二区| 国产成人无码精品久久久久| 一区二区三区在线看| 久艹在线观看视频| 国产精品美女久久久久久久久| 波多野结衣福利| av网站免费线看精品| 性折磨bdsm欧美激情另类| 久久国产视频网| 国产wwwxx| 久久字幕精品一区| av网站在线观看不卡| 日韩一级在线| 日本午夜激情视频| 亚洲三级网站| 男的插女的下面视频| 狠狠入ady亚洲精品| 日韩欧美一级在线| 牛牛国产精品| 成人在线免费观看视频网站| 欧美久久成人| 欧美国产视频一区| 影音先锋在线一区| 欧美亚洲黄色片| 亚洲精品乱码| 日本福利视频在线| 国产精品亚洲综合色区韩国| 成人黄色片视频| 久久久水蜜桃av免费网站| 国产精品69页| 日韩成人精品视频| 午夜精品久久久久久久99热影院| 麻豆免费看一区二区三区| 鲁一鲁一鲁一鲁一av| 精品一区二区三区在线播放 | 最新的欧美黄色| 欧美精品videos另类| 久久天天躁狠狠躁老女人| 免费在线播放电影| 91大神在线播放精品| 345成人影院| 国产精品狼人色视频一区| 久久人体av| 91入口在线观看| 精品视频高潮| 日韩免费三级| 亚洲字幕久久| xxxx18hd亚洲hd捆绑| 久久综合婷婷| 日韩av影视大全| 91在线视频播放地址| 黄色aaa视频| 亚洲天堂av一区| www.av麻豆| 欧美性极品少妇| 精品久久无码中文字幕| 日韩精品在线观看一区| 97视频在线观看网站| 欧美激情区在线播放| 高清不卡av| 亚洲a∨日韩av高清在线观看| 红杏一区二区三区| 日韩激情久久| 国产精品啊v在线| 男女爽爽爽视频| 国产成人av电影在线| 日韩丰满少妇无码内射| 亚洲综合偷拍欧美一区色| 无码人妻精品一区二区三区9厂| 91精品国产品国语在线不卡| 偷拍25位美女撒尿视频在线观看| 色老头一区二区三区| cao在线视频| 成人免费大片黄在线播放| 西瓜成人精品人成网站| 亚洲免费视频播放| 欧美一区=区| 国产a级片视频| 中文字幕va一区二区三区| 日本少妇激情舌吻| 666欧美在线视频| 国内av一区二区三区| 久久久久久网站| 精品亚洲二区| 婷婷久久伊人| 国产精品一区毛片| 香蕉视频免费网站| 国产精品成人午夜| 在线观看 亚洲| 亚洲精品福利在线观看| a免费在线观看| 国产精品免费一区豆花| 婷婷综合电影| 九九热只有这里有精品| 精品一区二区三区视频在线观看| 18禁裸乳无遮挡啪啪无码免费| 亚洲精品精品亚洲| 中文字幕久久网| 亚洲男人天堂手机在线| 18aaaa精品欧美大片h| 亚洲中国色老太| 久久一区二区中文字幕| 成人免费视频久久| 91视频www| 91精品国产乱码久久久张津瑜| 日韩欧美国产成人一区二区| 欧美尤物美女在线| 国产免费一区二区三区在线能观看 | 久久精品成人| free性中国hd国语露脸| 亚洲国产精品一区二区www在线 | 巨胸喷奶水www久久久免费动漫| 久久99久久99精品蜜柚传媒| 欧美日韩国产亚洲一区| 欧美性猛交xxxx乱大交91| 国产精品久久久久久久久图文区 | 情侣偷拍对白清晰饥渴难耐| 欧美日韩一区二区三区免费看| 黄色毛片在线观看| 欧美一级视频一区二区| 久操国产精品| 不要播放器的av网站| 欧美激情在线免费观看| 进去里视频在线观看| 这里只有精品丝袜| 久久亚洲人体| 欧洲金发美女大战黑人| 国产成人精品在线看| 久久精品国产亚洲AV无码男同| 精品久久人人做人人爽| www.51av欧美视频| 久久久久久久久四区三区| 午夜在线视频观看日韩17c| 欧美多人猛交狂配| 欧美日韩三级在线| 成人免费在线| 粉嫩av免费一区二区三区| 亚洲精品乱码| 国产一级久久久久毛片精品| 欧美日韩综合不卡| gogo在线高清视频| 国模精品娜娜一二三区| 免费在线亚洲| www.4hu95.com四虎| 91精品国产欧美日韩| 欧美黑人xx片| 精品亚洲第一| 蜜臀久久久久久久| 国产亚洲欧美久久久久| 精品偷拍一区二区三区在线看| 福利一区二区免费视频| 4444在线观看| 91丨国产丨九色丨pron| 中文字幕第三页| 欧美另类xxx| 色天下一区二区三区| 亚洲国产精品三区| 一二三四社区欧美黄| 男人天堂综合| 91亚洲精品在线观看| 国产精品主播| 日韩在线视频网址| 精品一区二区亚洲| 不卡一区视频| 日韩avxxx| 亚洲人成影院在线观看| 日本大片在线观看| 亚洲自拍中文字幕| 日韩中文字幕亚洲一区二区va在线| 极品美妇后花庭翘臀娇吟小说| 亚洲精品一区二区三区影院| 亚洲成人激情社区| 精品人妻大屁股白浆无码| 国产日韩欧美制服另类| www.久久久久久久久久|