精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法 原創

發布于 2025-10-21 10:00
瀏覽
0收藏

DeepSeek-OCR是一個端到端的多模態文檔解析模型,是Vary、GOT-OCR2.0的后續,前期也有詳細介紹《??【多模態&文檔智能】OCR-free感知多模態大模型技術鏈路及訓練數據細節??》。其核心目標是用極少的視覺 token(vision tokens)解碼出大量文本 token(text tokens)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

視覺token壓縮比和性能比較

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

VLMs中的典型視覺編碼?:處理長文本時視覺 token 過多、激活內存大的問題

多模態文檔解析相關就不再過多介紹了,詳細可以看專欄《???文檔智能??》。

模型架構

如下圖,DeepSeek-OCR的架構由編碼器(DeepEncoder)和解碼器(DeepSeek3B-MoE-A570M)組成。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

DeepSeek-OCR的架構

DeepEncoder

DeepEncoder設計

DeepEncoder是DeepSeek-OCR的最核心部分(高分辨率下的輕量視覺壓縮器),專門解決現有VLMs視覺編碼器(如Vary、InternVL2.0)的痛點:高分辨率輸入時token過多、激活內存大、不支持多分辨率。包含三個組件:

  • 模塊1:視覺感知(窗口注意力主導)
    采用SAM-base(Segment Anything Model,80M參數),輸入圖像被分割為16×16的patch(如1024×1024圖像生成4096個patch token)。這個在vary和got中均使用。
    作用:通過窗口注意力(局部注意力)捕捉圖像細節(如文本位置、字體),避免全局注意力的高內存消耗。
  • 模塊2:16×卷積壓縮器
    位于SAM和CLIP之間,由2層卷積構成(核大小3×3,步長2,通道數從256→1024),實現視覺token的16倍下采樣。
    作用:將SAM輸出的4096個token壓縮為256個(1024×1024輸入場景),大幅減少后續全局注意力模塊的計算量,控制激活內存。
  • 模塊3:視覺知識(全局注意力主導)
    采用CLIP-large(300M參數),但移除第一層patch嵌入層(輸入改為壓縮后的token)。
    作用:通過全局注意力整合壓縮后的token,提煉圖像全局語義(如文檔布局、文本邏輯),為解碼提供結構化視覺知識。
多分辨率支持:適配不同壓縮比需求

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

DeepEncoder的多分辨率支持。為了研究和應用目的,設計了具有多種原生分辨率和動態分辨率模式的DeepEncoder

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

Base/Large模式通過“ padding 保留寬高比”,有效token數按公式下面公式計算(避免無效token浪費)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

MoE解碼器

解碼器使用的是DeepSeek3B-MoE,由3B參數的MoE模型,包含64個routed experts和2個shared experts。推理時僅激活6個routed experts+2個shared experts,實際激活參數約570M(僅為3B模型的19%)。這樣做既保留3B模型的文本生成能力,又將推理速度提升至“500M小模型”級別,適合大規模部署。

數據

1. OCR 1.0數據

OCR 1.0數據和前面的vary、got-ocr數據構建相似,主要用于訓練模型識別傳統OCR場景(文檔、自然場景文本)。 構成如下:

  • 文檔數據:30M頁多語言PDF(100種語言,中英占25M頁),含“粗標注”(fitz工具提取,教模型識別文本)和“細標注”(2M頁中英,用PP-DocLayout+MinerU2.0標注布局+文本,教模型理解排版);
  • 自然場景數據:20M頁圖像(LAION+Wukong數據集,用PaddleOCR標注,支持中英場景文本識別);
  • Word數據:3M頁,無布局干擾,優化公式、HTML表格的識別。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OCR 1.0示例:將真實值格式化為交錯布局和文本格式,其中每段文本前都附有其在原始圖像中的坐標和標簽。所有坐標都歸一化到1000個區間內。

2. OCR 2.0數據

支持圖表、化學公式、幾何圖形的結構化解析。

  • 圖表數據:10M張(線圖、柱狀圖等),標注為HTML表格(而非字典格式,節省token);
  • 化學公式:5M對圖像-文本(SMILES格式數據源,RDKit工具渲染圖像);
  • 平面幾何:1M張(Slow Perception方法生成,標注線段、端點坐標,支持幾何結構重建)。

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

示例

3. 通用視覺數據

避免模型僅適配OCR場景,保留VLMs的通用視覺能力(如圖像描述、目標檢測)。數據構成參考DeepSeek-VL2,生成圖像描述、目標檢測、視覺定位任務數據,占總數據20%。

4. 純文本數據

目的是提升解碼器的文本流暢度,避免“視覺-文本”映射導致語言能力退化。 10%的內部純文本數據,統一處理為8192 token長度(與模型序列長度一致)。

訓練流程

訓練分兩階段進行,先優化編碼器質量,再訓練端到端模型。

1. 階段1:獨立訓練DeepEncoder

與vary相似,讓編碼器學會“高分辨率輸入→壓縮視覺token”的映射,保證token質量。使用上述所有OCR 1.0和2.0數據,以及從LAION數據集中抽取的1億條通用數據。

2. 階段2:訓練端到端DeepSeek-OCR

聯合優化“編碼器→解碼器”的映射,提升OCR精度與泛化性。采用流水線并行(PP=4),DeepEncoder占2段(SAM+壓縮器凍結,CLIP解凍),解碼器占2段(12層MoE分6層/段);

Gundam-M模式微調適配超高清文檔(如報紙),但避免與其他模式共訓拖慢速度。在預訓練好的DeepSeek-OCR上,用6M采樣數據繼續訓練Gundam-M模式(1024×1024局部+1280×1280全局)。

實驗

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

視覺-文本壓縮比

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OmniDocBench評測

端到端的多模態文檔解析模型-DeepSeek-OCR架構、數據、訓練方法-AI.x社區

OmniDocBench中不同類別文檔的編輯距離

參考文獻:DeepSeek-OCR: Contexts Optical Compression,https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
權重地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR

本文轉載自??大模型自然語言處理??   作者:老余

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-10-21 10:01:37修改
收藏
回復
舉報
回復
相關推薦
波多野结衣不卡视频| 亚洲综合在线免费观看| 欧美色综合网站| 99porn视频在线| www.黄色com| 都市激情亚洲综合| 综合精品久久| 欧美性xxxxxx少妇| 久久综合久久久| 国产精品99精品无码视| 99国内精品久久久久| 久久精品人人爽人人爽| 911国产网站尤物在线观看| 国产a级片视频| 中文国产字幕在线观看| 久久一本综合| 欧美亚洲愉拍一区二区| 色一情一乱一乱一区91| 国产又粗又猛视频| 久久男人av| 亚洲成av人片在www色猫咪| 91九色蝌蚪嫩草| 精品97人妻无码中文永久在线| 国产精品国产亚洲精品| 亚洲女厕所小便bbb| 国产精品高潮呻吟久久av无限| 久久久久国产精品区片区无码| segui88久久综合| 不卡视频免费播放| 欧美一级大胆视频| 亚洲AV无码国产精品| 精品视频91| 亚洲第一精品在线| 精品国产乱码久久久久| 中文字幕视频网站| 精品国产一区二区三区久久久樱花| 欧美性猛交xxxx偷拍洗澡| 免费看国产精品一二区视频| 亚洲精品国产suv一区| 伊人成人在线视频| 日韩精品亚洲元码| 日本新janpanese乱熟| 91女主播在线观看| 国产九色精品成人porny| 欧美激情videos| 欧美大片免费播放器| 校园春色亚洲色图| 中文字幕一区二区三区在线不卡| 91精品在线一区| 日韩成人在线免费视频| 国内成人精品| 91精品国产欧美一区二区成人| 黑人巨茎大战欧美白妇| 日本蜜桃在线观看| 成人天堂资源www在线| 日本三级久久久| 特一级黄色录像| 欧美久久香蕉| 欧美午夜视频网站| 免费午夜视频在线观看| bt在线麻豆视频| 久久综合国产精品| 91精品久久久久久久久| 日韩精品人妻中文字幕| 狠狠爱成人网| 最近中文字幕日韩精品| 农村末发育av片一区二区| 欧美动物xxx| 在线一区二区观看| 欧美国产视频一区| www.久久热.com| 不卡av免费在线观看| 国语精品中文字幕| 开心激情综合网| 麻豆91精品91久久久的内涵| 久久人91精品久久久久久不卡| 五月婷婷六月香| 国产伦乱精品| 欧美一级二级在线观看| www.欧美日本| 五月天色综合| 在线日韩一区二区| 不卡的av中文字幕| 国产精品迅雷| 欧美日韩一区小说| 黑人巨大猛交丰满少妇| 成人在线观看免费视频| 都市激情亚洲色图| 国产一区二区三区乱码| 黄色网址视频在线观看| 久久精品一区四区| 精品蜜桃传媒| av在线首页| 夜夜操天天操亚洲| 50路60路老熟妇啪啪| 欧美综合影院| 日韩精品免费看| 亚洲精品乱码久久久久久蜜桃欧美| 久久动漫网址| 最近中文字幕日韩精品| 日韩污视频在线观看| 国内自拍视频一区二区三区| 欧美最顶级丰满的aⅴ艳星| 精品午夜福利在线观看| 欧美精品麻豆| 欧美久久精品午夜青青大伊人| 亚洲av无码一区二区二三区| 欧美久久精品| 久久在线视频在线| 国产精品丝袜一区二区| 国产一区二区你懂的| 69精品小视频| av中文字幕播放| 国产福利精品导航| 国产精品久久国产精品| va视频在线观看| 国产亚洲一区字幕| 亚洲精品无码国产| 精品国产一级| 主播福利视频一区| 18岁成人毛片| 日韩av电影天堂| 国产精品香蕉国产| 一区二区美女视频| 国产视频一区二区三区在线观看| 国内自拍中文字幕| 91麻豆精品国产91久久久更新资源速度超快| 亚洲国产精品va| 中文字幕一区二区久久人妻网站| 性xxxx欧美老肥妇牲乱| 欧美成人四级hd版| 亚洲一区 中文字幕| 国产在线乱码一区二区三区| 91亚洲精品视频| av资源种子在线观看| 欧美丝袜一区二区| aaaa黄色片| 伊人久久成人| 国产一区二区在线观看免费播放| 亚洲三区在线观看无套内射| 国产午夜亚洲精品理论片色戒 | 台湾佬综合网| 亚洲人成伊人成综合网久久久| 伊人网在线视频观看| 97精品视频| 天堂视频中文在线| 精品成av人一区二区三区| 久久久久久久久久久国产| 国产精品变态另类虐交| 国产电影一区二区三区| 91成人在线视频观看| jizz一区二区三区| 国产一区二区| 亚洲精品一线二线三线无人区| 污污免费在线观看| 九色精品国产蝌蚪| 久久久av一区| 日本学生初尝黑人巨免费视频| 国产九色精品成人porny| 佐佐木明希av| 亚洲高清在线一区| 亚洲午夜av电影| 麻豆changesxxx国产| 国产乱子伦视频一区二区三区| 自拍偷拍视频在线| 范冰冰一级做a爰片久久毛片| 亚洲风情亚aⅴ在线发布| 亚洲精品国产精品乱码| 91网站黄www| 欧美日韩一级在线| 国产一区一区| 久久久久久久电影一区| 五月婷婷开心中文字幕| 色婷婷久久久亚洲一区二区三区| 在线观看网站黄| 日韩成人精品一区二区| 91精品国产99| 国产综合在线观看| 午夜电影网一区| 搡老熟女老女人一区二区| 日韩黄色一级片| 久久国产精品高清| 天堂av最新在线| 欧美日韩国产电影| 亚洲AV无码片久久精品| 美洲天堂一区二卡三卡四卡视频| 精品国产免费久久久久久尖叫 | 户外极限露出调教在线视频| 欧美日韩aaaaaa| 国产一级视频在线播放| 国产日韩一级二级三级| 男女视频在线观看网站| 欧美艳星介绍134位艳星| 午夜精品视频在线| 国产91免费在线观看| 黑人巨大精品欧美一区二区一视频 | 异国色恋浪漫潭| 色天下一区二区三区| 国产精品久久久久福利| 污污网站在线观看| 亚洲午夜未删减在线观看| 精品人妻无码一区二区| 日韩理论片中文av| 三上悠亚在线一区二区| 欧美日韩调教| 五月天色一区| 97精品国产99久久久久久免费| 另类美女黄大片| 青青免费在线视频| 色综合视频一区二区三区高清| 蜜桃视频最新网址| 久久综合九色综合97_久久久| 91网址在线观看精品| 久久性天堂网| 五月天久久综合网| 美女视频亚洲色图| 亚洲一区二区三区久久| 国产在线观看a| 亚洲人成伊人成综合网久久久| xxxx18国产| 欧美日韩一区二区三区四区| 日韩 欧美 综合| 不卡的电视剧免费网站有什么| 亚洲人视频在线| 久久精品免费一区二区三区| 欧美性天天影院| 久久久久伊人| 欧美超级免费视 在线| 国内精品在线视频| 日韩理论片久久| 天天操天天干天天操| 欧美日韩在线视频一区| 九九热只有精品| 综合色中文字幕| 精品久久久久一区二区| 精品亚洲porn| 免费视频爱爱太爽了| 午夜精品久久久久久久四虎美女版| 91在线国产电影| 福利视频一区| 国产精品激情av在线播放| 成人影院av| 欧美主播福利视频| 亚洲欧洲高清| 久久视频在线观看免费| 高清性色生活片在线观看| 日韩一级视频免费观看在线| 97人妻人人澡人人爽人人精品| 欧美在线播放高清精品| 波多野结衣视频网址| 亚洲激情图片一区| 中文字幕一区二区三区人妻电影| 91捆绑美女网站| 91久久免费视频| 久久久不卡网国产精品一区| 中文字幕被公侵犯的漂亮人妻| 国产伦精品一区二区三区免费| 爱豆国产剧免费观看大全剧苏畅| 亚洲精品韩国| 天堂v在线视频| 五月天久久777| 男人天堂成人网| 亚洲午夜黄色| 国产精品97在线| 欧美日韩精品一本二本三本| 久久99久久久久久| 99国产精品99久久久久久粉嫩| 性欧美18一19内谢| 午夜国产精品视频免费体验区| 日韩国产精品一区二区| 99精品中文字幕在线不卡| 国产精品爽爽ⅴa在线观看| 欧美美女福利视频| 91视频婷婷| 欧美一区自拍| 午夜精品福利一区二区| 91精品成人| 男女激情无遮挡| 午夜欧美精品| 久久综合九色综合88i| 欧美日韩一区二区三区四区在线观看| av动漫在线免费观看| 我不卡伦不卡影院| 免费看国产一级片| 日韩不卡一二三区| 成人三级做爰av| 久久免费国产精品| 精品国产乱码久久久久久鸭王1| 国产精品污www在线观看| 日本黄色网址大全| 国产精品美女一区二区| 性欧美13一14内谢| 中文字幕在线视频一区| 国产成人精品亚洲男人的天堂| 91国在线观看| 午夜久久久久久久久久影院| 91精品国产综合久久香蕉的特点| 最新黄色网址在线观看| 日本道精品一区二区三区| 国产模特av私拍大尺度| 69av一区二区三区| 日韩三级电影网| 久久6精品影院| 精品日本视频| 国产精品久久久久久久久久久不卡| 欧美视频二区欧美影视| 欧美一区二区在线视频观看| 亚洲最好看的视频| 免费在线观看91| 综合国产在线| 91制片厂毛片| 韩国三级在线一区| wwwwxxxx国产| 亚洲午夜视频在线| 国产成人无码精品亚洲| 欧美人与性动xxxx| 精品亚洲成a人片在线观看| 欧美精品videosex极品1| 免费成人黄色网| 欧美重口乱码一区二区| 国产日本精品| 国产一线在线观看| 一区二区三区蜜桃| 一二三区在线播放| 国产午夜精品视频免费不卡69堂| a级片免费在线观看| 91久久精品国产91久久性色tv| 欧美一区电影| 久久久久久香蕉| 久久久久久免费网| 国产精品久久久久久久久久久久久久久久久 | 这里是久久伊人| 日本最黄一级片免费在线| 国产精品久久视频| 国产精品成人3p一区二区三区| 午夜精品一区二区在线观看的| 国产精品视区| 中文字幕影片免费在线观看| 婷婷综合五月天| 瑟瑟视频在线免费观看| 亚洲欧美制服中文字幕| 悠悠资源网亚洲青| 牛人盗摄一区二区三区视频| 一区二区三区国产盗摄| 黄色a一级视频| 欧美视频精品一区| 免费成人av电影| 久久影院在线观看| 亚洲成人1区| 国产树林野战在线播放| 国产精品996| 69精品久久久| 亚洲激情自拍图| 成人福利片网站| 91免费在线观看网站| 在线观看不卡| 久久国产精品无码一级毛片| 欧美三级免费观看| www.av在线| 亚洲www永久成人夜色| 一本一道久久综合狠狠老| 岛国大片在线免费观看| 亚洲国产精品久久人人爱| 日本毛片在线观看| 久久精品人人爽| 精品久久久久久久久久岛国gif| 久久久久久久久影视| 粉嫩av一区二区三区粉嫩| 成人一级黄色大片| 色偷偷久久一区二区三区| 国产在线一二三| 成人免费在线视频网址| 蜜乳av综合| 亚洲免费av一区| 亚洲国产一区在线观看| 男女污污视频在线观看| 成人性生交xxxxx网站| 国产精品大片免费观看| 51调教丨国产调教视频| 欧美精品xxxxbbbb| 国产精品四虎| 91香蕉嫩草影院入口| 日韩视频久久| 亚洲色图 激情小说| 欧美午夜www高清视频| 国产福利小视频在线| 91在线高清视频| 国产精品亚洲欧美| 免费黄色国产视频| 亚洲第一福利网| 九九九精品视频| r级无码视频在线观看| 国产乱人伦偷精品视频不卡 | 成人三级在线| 中文字幕一区二区三区欧美日韩| 又黄又色的网站| 欧美色视频在线观看| av在线网页| 日日噜噜噜夜夜爽爽| 94色蜜桃网一区二区三区|