精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案 原創(chuàng)

發(fā)布于 2025-9-16 06:56
瀏覽
0收藏

前期在《文檔智能專欄》中詳細(xì)介紹了各種pipline(MinerU、ppstructure、Docling等)、檢測(cè)+多模態(tài)VLM(monkeyocr等)、端到端(olmocr等)的文檔解析技術(shù)鏈路及相關(guān)方案。

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

pipline

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

layout+VLM

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

VLM finetune

下面再來(lái)看一個(gè)端到端的解析方案,騰訊開(kāi)源的多模態(tài)大模型-POINTS-Reader,實(shí)測(cè)了下效果一般,但可以看看數(shù)據(jù)合成及思路。

方法

1、數(shù)據(jù)形式

這個(gè)不用多說(shuō),基本上各種文檔解析的格式都趨向大同,純文本使用Markdown、表格使用html、數(shù)學(xué)公式使用LaTeX。

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

2、合成數(shù)據(jù)生成

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

兩階段pipline生成大規(guī)模高質(zhì)量數(shù)據(jù)集的過(guò)程

文檔解析的標(biāo)注數(shù)據(jù)由于其通用性還是非常難以獲取的,因此,為讓模型在統(tǒng)一格式下充分學(xué)習(xí),需生成多樣性高、覆蓋真實(shí)場(chǎng)景常見(jiàn)布局的合成數(shù)據(jù)。生成過(guò)程兼顧“數(shù)據(jù)多樣性”和“構(gòu)建效率”,POINTS-Reader的數(shù)據(jù)構(gòu)建思路如下:

1)數(shù)據(jù)分類

將合成數(shù)據(jù)分為4類,覆蓋文檔常見(jiàn)組合場(chǎng)景,確保模型接觸多樣化輸入:

  • 僅含純文本(如單欄書籍正文);
  • 含純文本+數(shù)學(xué)公式(如學(xué)術(shù)論文公式推導(dǎo)部分);
  • 含純文本+表格(如財(cái)報(bào)數(shù)據(jù)表格部分);
  • 含多列布局+表格(如報(bào)紙、學(xué)術(shù)論文的多欄表格排版)。

2)數(shù)據(jù)生成流程

  • 文本生成:設(shè)計(jì)與類別匹配的Prompt,調(diào)用大語(yǔ)言模型(LLM,論文使用Qwen2.5-3B-Instuct)生成對(duì)應(yīng)內(nèi)容。例如,為“類別3(文本+表格)”設(shè)計(jì)Prompt時(shí),要求LLM生成帶表格描述的段落,并插入從PubTabNet(含復(fù)雜表格結(jié)構(gòu)的公開(kāi)數(shù)據(jù)集)中篩選的表格,增強(qiáng)數(shù)據(jù)真實(shí)性。
  • 規(guī)則過(guò)濾:對(duì)生成的文本、表格、公式進(jìn)行初步質(zhì)量校驗(yàn)(提前篩除明顯錯(cuò)誤,如語(yǔ)法錯(cuò)誤的公式、結(jié)構(gòu)無(wú)效的表格)。
  • HTML渲染:將過(guò)濾后的文本按“單欄、雙欄、三欄”布局模板轉(zhuǎn)換為HTML,通過(guò)Chrome的Headless Mode渲染為圖片,形成“圖片-文本(統(tǒng)一格式)”配對(duì)數(shù)據(jù)。

相關(guān)prompt:

  • 文本

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

  • 公式

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

  • 表格

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

  • 多欄

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

3)模型訓(xùn)練與迭代訓(xùn)練

用上述合成數(shù)據(jù)對(duì)VLM進(jìn)行微調(diào)訓(xùn)練,模型結(jié)構(gòu)上沒(méi)有特別大的創(chuàng)新,LLM使用的是qwen2,視覺(jué)側(cè)使用的是qwenvl的視覺(jué)編碼器,文中提到的一點(diǎn)就是迭代訓(xùn)練,思路一句話概括就是使用訓(xùn)練好的模型對(duì)更寬泛的數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)的數(shù)據(jù)通過(guò)各種規(guī)則校驗(yàn),然后加到訓(xùn)練數(shù)據(jù)中持續(xù)迭代訓(xùn)練,筆者認(rèn)為這樣最大的問(wèn)題就是很難評(píng)價(jià)這個(gè)“偽數(shù)據(jù)”是否符合訓(xùn)練數(shù)據(jù)的標(biāo)準(zhǔn)(僅覆蓋了過(guò)濾規(guī)則)。

實(shí)驗(yàn)

端到端的多模態(tài)大模型文檔解析:POINTS-Reader數(shù)據(jù)合成與迭代訓(xùn)練提升方案-AI.x社區(qū)

參考文獻(xiàn):POINTS-Reader: Distillation-Free Adaptation of Vision-Language Models for Document Conversionrepo:https://github.com/Tencent/POINTS-Reader


本文轉(zhuǎn)載自??大模型自然語(yǔ)言處理??   作者:llmnlp

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-9-16 09:31:36修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
午夜剧场成人观在线视频免费观看| 91精品国产高清一区二区三区蜜臀 | 欧美综合国产| 国产精品家庭影院| 91成人在线看| 日韩综合在线观看| 亚洲欧美偷拍自拍| 日韩精品亚洲元码| 在线观看免费视频污| 熟妇人妻av无码一区二区三区| 亚洲黄色在线| 精品日韩99亚洲| 国产美女三级视频| 在线观看男女av免费网址| 91蜜桃免费观看视频| 成人激情春色网| 丰满人妻老熟妇伦人精品| 成人三级av在线| 色偷偷久久一区二区三区| 色婷婷777777仙踪林| 日韩午夜影院| 成人国产精品免费观看| 欧美成人午夜激情视频| 9.1成人看片免费版| 久久伦理中文字幕| 欧美色男人天堂| 91猫先生在线| 国产三线在线| 亚洲精品成人精品456| 日本午夜一区二区三区| 三级视频在线观看| 亚洲欧洲美洲国产香蕉| 欧美三级欧美成人高清www| 蜜桃视频成人在线观看| 福利在线午夜| 久久影院电视剧免费观看| 欧美孕妇与黑人孕交| 538任你躁在线精品视频网站| jlzzjlzz亚洲女人| 欧美电影一区二区三区| 可以免费在线看黄的网站| 日本乱码一区二区三区不卡| 亚洲夂夂婷婷色拍ww47| 国产成人精品免费看在线播放| 91九色蝌蚪91por成人| 久久一二三四| 国语自产偷拍精品视频偷| 欧美三级在线免费观看| 天天天综合网| 久久视频免费观看| 中文字幕人妻一区二| 天天影视综合| 九九久久国产精品| 国产大片免费看| 欧美在线亚洲| 久久久久久久999精品视频| 激情视频在线播放| 韩国在线一区| 国外成人在线直播| 国产www在线| 天堂影院一区二区| 国产精品中文字幕久久久| 一本大道伊人av久久综合| 欧美色综合网| 国内成人精品视频| 欧美一级特黄视频| 视频在线在亚洲| 国产在线观看精品| 看片网址国产福利av中文字幕| 一本一道久久综合狠狠老精东影业| 在线观看亚洲视频| 公肉吊粗大爽色翁浪妇视频| 色乱码一区二区三区网站| 色婷婷av一区二区三区久久| 青青青在线免费观看| 亚洲二区在线| 国产激情久久久| 91精品在线视频观看| 福利电影一区二区| 免费在线观看一区二区| 日本三级视频在线观看| 久久众筹精品私拍模特| 日本在线观看一区二区三区| 成年网站在线| 91免费看片在线观看| 欧美日韩综合另类| 黄色网在线播放| 午夜久久久久久电影| av无码精品一区二区三区| www一区二区三区| 亚洲福利精品在线| 一二三四国产精品| 日韩影视高清在线观看| 伊人av综合网| 国产亚洲精品av| 久久蜜桃精品| 51蜜桃传媒精品一区二区| 五月天婷婷在线播放| 国产精品污www在线观看| www.18av.com| 国产精品毛片久久久久久久久久99999999 | 国产福利一区二区三区视频在线 | 成人欧美一区二区三区黑人免费| 中文字幕资源网| 国产乱码精品一区二区三区av| 久久婷婷人人澡人人喊人人爽| 天堂а√在线资源在线| 五月天欧美精品| 91pony九色| 九色精品国产蝌蚪| 欧美黄色片免费观看| 波多野结衣电车痴汉| 国产v日产∨综合v精品视频| 午夜久久资源| 97成人资源| 精品国产乱码久久久久久浪潮 | 中文精品99久久国产香蕉| 欧美黄色一区二区三区| 美女mm1313爽爽久久久蜜臀| 国产日韩欧美二区| www在线免费观看视频| 91黄色免费版| 丰满圆润老女人hd| 亚洲人体大胆视频| 97超碰资源| 嫩草在线视频| 欧美日韩一区二区不卡| 欧美色图亚洲激情| 亚洲高清毛片| 99re国产视频| 18网站在线观看| 91精品国产欧美一区二区18| 波多野结衣久久久久| 免播放器亚洲一区| 日本高清久久一区二区三区| 在线人成日本视频| 日韩乱码在线视频| 日韩手机在线观看| av午夜一区麻豆| 亚洲色成人www永久在线观看| 日韩视频在线直播| 欧美理论电影在线观看| 国产超碰人人模人人爽人人添| 国产精品高清亚洲| 日本在线播放一区二区| 日韩欧美一区二区三区在线视频| 国产精品国产自产拍高清av水多| 精品视频二区| 91精品办公室少妇高潮对白| www.99热| 久久se这里有精品| 熟妇熟女乱妇乱女网站| 国色天香久久精品国产一区| 欧美老少做受xxxx高潮| 亚洲av无码一区二区乱子伦| 亚洲一区在线视频| 国产高清成人久久| 亚洲欧美日韩国产综合精品二区 | 狠狠入ady亚洲精品经典电影| 91传媒免费看| 国产精品高颜值在线观看| 日韩h在线观看| 夜夜春很很躁夜夜躁| 日韩激情一区二区| 天天人人精品| 国产欧美88| 国内成人精品视频| 九色在线观看| 7777精品伊人久久久大香线蕉超级流畅 | 色爱精品视频一区| 国产人妖在线播放| 亚洲成人免费影院| 一级片视频免费看| 欧美日韩精品一本二本三本| 国产精品国产亚洲精品看不卡15| 手机在线观看av| 中文字幕精品一区久久久久| 国产强伦人妻毛片| 欧美日韩精品二区| 日本在线观看网址| 大陆成人av片| 中文字幕国内自拍| 91国语精品自产拍| 久久99精品久久久久久三级 | 91精品久久久久久久99蜜桃| 国产一级做a爱免费视频| 91美女在线观看| 老司机午夜性大片| 亚洲三级观看| 日韩欧美亚洲精品| 超碰97久久| 国产美女精品视频| 白浆在线视频| 精品国产依人香蕉在线精品| 五月激情六月婷婷| 91精品国产综合久久精品图片| 免费观看一区二区三区毛片| 亚洲人精品一区| 国产精品1000部啪视频| 国产精品一二三在| 国产三级日本三级在线播放| 国产综合视频| 正在播放国产精品| 亚洲精品中文字幕99999| 亚洲精品免费一区二区三区| 暖暖成人免费视频| 亚洲成人三级在线| 国产一区二区三区中文字幕| 精品成人国产在线观看男人呻吟| 日韩三级在线观看视频| 久久se这里有精品| 韩国日本在线视频| 国语自产精品视频在线看8查询8| 婷婷久久青草热一区二区| 你懂的在线观看一区二区| 成人福利在线观看| 亚洲四虎影院| 欧美在线一级va免费观看| 欧美人体视频xxxxx| www.日韩av.com| 国产免费av高清在线| 精品视频久久久久久久| 黑人乱码一区二区三区av| 91麻豆精品国产91| 中文字幕一区二区三区四区免费看 | 日韩中文字幕在线精品| 精品99又大又爽又硬少妇毛片| 亚洲激情在线观看视频免费| 性生活黄色大片| 欧美一区午夜视频在线观看| 亚洲午夜激情视频| 欧美丝袜第三区| 婷婷激情四射网| 中日韩av电影| 男人的天堂av网| 国产欧美一区二区三区在线老狼| 成人免费毛片日本片视频| 成人免费看黄yyy456| 三级网站免费看| 国产精品2024| 少妇愉情理伦片bd| 国产精品一区二区你懂的| 亚洲综合伊人久久| 激情深爱一区二区| 激情五月婷婷基地| 久久99精品国产.久久久久久| 欧美成年人视频在线观看| 免费观看成人av| www午夜视频| 国产专区欧美精品| 亚洲成人激情小说| 成人晚上爱看视频| 欧美做受高潮中文字幕| 99久久免费国产| 中文字幕在线观看的网站| 麻豆国产91在线播放| 性chinese极品按摩| 精品在线一区二区| 9191在线视频| 99riav久久精品riav| 青青草视频成人| 日本一区二区三区四区| 亚洲精品电影院| 一区二区高清在线| 国产成人一区二区三区影院在线| 一本久久综合亚洲鲁鲁五月天 | 日韩精品欧美成人高清一区二区| 成人性做爰aaa片免费看不忠| 日本不卡高清视频| 性久久久久久久久久久久久久| 成人蜜臀av电影| 国产一二三四五区| 中文字幕一区二区视频| 青青草手机在线观看| 精品久久久香蕉免费精品视频| 国产黄网在线观看| 欧美一区二区在线免费播放 | 日韩在线视频免费观看高清中文| а√天堂8资源在线官网| 91黑丝高跟在线| 91精品国产66| 国产精品美女黄网| 成人毛片在线| www.成年人视频| 久久只有精品| 午夜天堂在线视频| 97se亚洲国产综合自在线不卡 | 日本免费不卡| 日韩在线观看免费高清完整版| 波多野结衣中文在线| 国产精品视频精品| 精品视频高潮| 亚洲三区四区| 99视频+国产日韩欧美| 中日韩av在线播放| 91啪九色porn原创视频在线观看| 亚洲天堂最新地址| 欧美日韩国产一区二区三区| 国产女人高潮时对白| 亚洲免费影视第一页| 色屁屁www国产馆在线观看| 色偷偷av一区二区三区| 欧美寡妇性猛交xxx免费| 国产精品成人品| 老牛精品亚洲成av人片| 中文字幕中文字幕一区三区| 亚洲一区欧美二区| 中文在线字幕观看| 国产成人精品亚洲日本在线桃色| 国产又粗又猛又爽视频| 亚洲福利电影网| 国产欧美综合视频| 中文字幕久久亚洲| 欧美7777| 乱一区二区三区在线播放| 欧美视频日韩| 国内自拍第二页| 国产精品你懂的| 97人妻一区二区精品视频| 亚洲国产成人久久| 尤物yw193can在线观看| 国产日韩精品综合网站| 国产99精品一区| 国产免费黄色av| 成人av资源在线| 黄色在线观看免费| 日韩丝袜情趣美女图片| 免费在线观看黄色| 国产精品热视频| 激情综合网站| 最新av在线免费观看| 日韩成人免费电影| 99久久久无码国产精品性| 精品久久在线播放| 天天操天天干天天爱| 97高清免费视频| 久久99国产精品久久99大师| 国产精品一线二线三线| www.日韩大片| 国产精品黄色大片| 亚洲精品在线观看www| 日本不卡一二三| 日韩av图片| 久久电影网站中文字幕| 又色又爽的视频| 欧美蜜桃一区二区三区| 久草资源在线| 97人人干人人| 在线日韩电影| 少妇精品一区二区| 一本色道**综合亚洲精品蜜桃冫| 国产精品久久一区二区三区不卡| 国产精品91在线| 91综合在线| 亚洲一区二区三区四区精品| 一区二区三区欧美在线观看| 丰满人妻一区二区三区免费| 久久久久在线观看| 日韩深夜影院| www.99av.com| 亚洲免费在线观看| 国产成人自拍一区| 欧美专区中文字幕| re久久精品视频| 日本亚洲一区二区三区| 亚洲福利视频一区二区| 户外极限露出调教在线视频| 国产精品久久久久免费a∨| 久久中文字幕二区| 超碰人人cao| 欧美日韩国产专区| 大胆av不用播放器在线播放| 成人免费视频97| 99riav国产精品| 国产18无套直看片| 日韩精品专区在线| 625成人欧美午夜电影| 一区二区三区免费看| 国产成人免费av在线| 国产无套粉嫩白浆内谢| 国产亚洲日本欧美韩国| 视频国产精品| 成年人黄色片视频| 亚洲视频在线一区二区| 天天干天天舔天天射| 国产精品久久久久7777婷婷| 中文字幕一区二区三三| 可以直接看的无码av| 欧美精品久久99| 三级在线看中文字幕完整版| 一区二区免费在线观看| va亚洲va日韩不卡在线观看| 在线视频播放大全| 亚洲 日韩 国产第一| 日韩一区二区三区免费播放| 日本人添下边视频免费| 欧美精品久久天天躁| 欧美香蕉视频| 国产免费一区二区视频| 中文字幕一区二区三区视频|