精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling 原創(chuàng)

發(fā)布于 2025-5-8 06:48
瀏覽
0收藏

在《??多模態(tài)大模型輕量化探索-視覺大模型SAM的視覺編碼器???》介紹到,縮小視覺編碼器的尺寸,能夠有效的降低多模態(tài)大模型的參數(shù)量。再來看一個(gè)整體的工作,從視覺側(cè)和語言模型側(cè)綜合考量模型參數(shù)量的平衡模式,進(jìn)一步降低參數(shù)量,甚至最小達(dá)256M參數(shù)量,推理時(shí)顯存占用<1GB。下面來看看,僅供參考。

模型架構(gòu)

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

SmolVLM 架構(gòu)。圖像被分割成子圖像,從視頻中采樣幀,然后編碼成視覺特征。這些特征首先通過像素重排,然后通過MLP投影映射到LLM輸入空間作為視覺標(biāo)記。然后,視覺標(biāo)記與文本嵌入(橙色/紅色)連接/交錯(cuò)。這個(gè)組合序列被傳遞給LLM進(jìn)行文本輸出。

那么,如何設(shè)計(jì)一個(gè)高效的小型多模態(tài)模型架構(gòu)?

Q1: 如何在視覺和語言模型之間分配計(jì)算?

傳統(tǒng)大型VLMs(如Flamingo)將90%以上參數(shù)分配給語言模型(LM),但SmolVLM發(fā)現(xiàn):小規(guī)模LM需重新平衡視覺與語言的計(jì)算資源。

研究方法:將三種不同規(guī)模的SmolLM2變體(135M、360M和1.7B參數(shù))與兩種SigLIP編碼器(一個(gè)緊湊的93M SigLIP-B/16和一個(gè)較大的428M SigLIP-SO400M)進(jìn)行配對。

發(fā)現(xiàn):通常情況下,較大的VLM會不均衡地將參數(shù)分配給語言模型,但在小型模型中,這種分配方式不再適用。當(dāng)使用大型編碼器與最小的LM(135M)時(shí),性能顯著下降,表明這種配置效率低下。在中等規(guī)模的LM(360M)中,較大的編碼器可以提高性能,但會增加66%的參數(shù)。只有在最大的LM(1.7B)中,較大的編碼器僅增加10%的參數(shù)。

結(jié)論:緊湊的多模態(tài)模型受益于平衡的編碼器-LM參數(shù)分配,使得較小的視覺編碼器在效率上更具優(yōu)勢。即:模型越小,視覺編碼器應(yīng)更輕量,避免“頭重腳輕”。當(dāng)使用具有最小LM(135M)的大編碼器時(shí),性能顯著下降,突顯了編碼器-LM平衡效率低下。在中等LM規(guī)模(360M)時(shí),較大的編碼器將性能提高了11.6%,但這也伴隨著參數(shù)增加了66%,使得緊湊型編碼器更可取。只有在最大的LM規(guī)模(1.7B)時(shí),較大的編碼器僅代表參數(shù)增加了10%。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

Q2: 如何有效地將圖像傳遞給語言模型?

如何支持長上下文與對視覺token進(jìn)行壓縮?為了提高模型的上下文處理能力,采用了自注意力架構(gòu),其中視覺Token與文本token連接,并由語言模型共同處理。這種方法需要比SmolLM2的2ktoken限制更多的上下文。

研究方法:通過增加RoPE基數(shù)從10k到273k來擴(kuò)展上下文容量,并在長上下文數(shù)據(jù)(如Dolma書籍和The Stack)和短上下文數(shù)據(jù)(如FineWeb-Edu、DCLM和SmolLM2的數(shù)學(xué)數(shù)據(jù))上進(jìn)行微調(diào)。

發(fā)現(xiàn):擴(kuò)展上下文窗口對緊湊VLM有顯著的好處。對于1.7B的LM,微調(diào)在16ktoken時(shí)表現(xiàn)穩(wěn)定,但對于較小的模型(135M和360M),在超過8k token時(shí)表現(xiàn)不佳。因此,研究者們?yōu)镾molVLM采用了16k token的上下文,并為較小的變體設(shè)定了8k token的限制。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

像素重排:重新排列編碼圖像,以增加通道深度為代價(jià)換取空間分辨率。這減少了視覺標(biāo)記數(shù)量,同時(shí)保持信息密度。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

原理:將2×2空間區(qū)域重組為通道維度(上圖),token數(shù)減少4倍(r=2時(shí))。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

較小的VLMs從更激進(jìn)的壓縮(r = 4)中受益,因?yàn)闇p少的token數(shù)減輕了注意力開銷并改善了長上下文建模

對比基線:InternVL等使用r=2,但SmolVLM證明小模型需更激進(jìn)壓縮。

結(jié)論:小型VLM顯著受益于擴(kuò)展的上下文長度。

Q3: 如何有效地編碼圖像和視頻?

在多模態(tài)建模中,平衡圖像和視頻之間的token分配至關(guān)重要。圖像通常需要更高的分辨率和更多的token來保持質(zhì)量,而視頻則需要更少的token來高效處理長序列。

研究方法:采用了一種圖像分割策略,靈感來自UReader和SPHINX,將高分辨率圖像分割成多個(gè)子圖像,并保留原始圖像的縮小版本。這種方法在不增加過多計(jì)算開銷的情況下保持了圖像質(zhì)量。

視頻處理:對于視頻,發(fā)現(xiàn)幀平均策略會負(fù)面影響性能(下圖)。因此,選擇不采用幀平均策略,而是將視頻幀重新縮放到圖像編碼器的分辨率。

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

結(jié)論:對于小型模型,圖像分割增強(qiáng)了視覺任務(wù)的表現(xiàn),而視頻幀平均則不適用。

數(shù)據(jù)策略

數(shù)據(jù)配比:最終訓(xùn)練集含14%文本、33%視頻、53%圖像

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

視覺(左側(cè))和視頻(右側(cè))的訓(xùn)練數(shù)據(jù)集詳情,按模態(tài)和子類別細(xì)分

性能

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

衍生模型-端到端的PDF解析多模態(tài)模型SmolDocling

模型結(jié)構(gòu):就是SmolVLM

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

訓(xùn)練數(shù)據(jù)(該模型核心):訓(xùn)練數(shù)據(jù)構(gòu)造上,引入了一種新的文檔標(biāo)記格式DocTags,用于標(biāo)準(zhǔn)化文檔轉(zhuǎn)換,這個(gè)是核心意義。DocTags定義了一個(gè)明確的標(biāo)簽和規(guī)則集,以分離文本內(nèi)容和文檔結(jié)構(gòu),從而提高圖像到序列模型的性能,如下圖:

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

對應(yīng)的語法

開源的輕量化VLM-SmolVLM模型架構(gòu)、數(shù)據(jù)策略及其衍生物PDF解析模型SmolDocling-AI.x社區(qū)

從上面類XML標(biāo)簽語法看來,感覺設(shè)計(jì)的非常冗余。整體上結(jié)合模型架構(gòu)也沒什么特殊的創(chuàng)新點(diǎn),并且,之前被自媒體吹得性能很強(qiáng),實(shí)際上,該模型還是demo玩具。個(gè)人使用后觀點(diǎn)。

參考文獻(xiàn):SmolVLM: Redefining small and efficient multimodal models,https://arxiv.org/pdf/2504.05299

開源地址:https://github.com/huggingface/smollm


公眾號大模型自然語言處理  作者:余俊暉

原文鏈接:??https://mp.weixin.qq.com/s/2ZQKauOyMCDdXkzbFoDMhw??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
已于2025-5-8 06:48:33修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
在线观看中文字幕的网站| 国产成人无码精品亚洲| 中文字幕男人天堂| 国语产色综合| 337p亚洲精品色噜噜噜| 老汉色影院首页| 手机在线精品视频| 蜜桃av一区二区三区| 欧美日韩高清区| 最新中文字幕视频| 9999精品视频| 疯狂欧美牲乱大交777| 欧美午夜欧美| www.桃色av嫩草.com| 免费欧美日韩| 欧美福利在线观看| 亚洲色图第四色| 极品束缚调教一区二区网站| 欧美专区日韩专区| a级黄色小视频| 欧美成人三区| 久久综合九色综合97婷婷女人| 九九热精品在线| 在线观看日本中文字幕| 国产精品nxnn| 亚洲男人天堂av| 欧美午夜精品久久久久免费视| 国产999久久久| 男男视频亚洲欧美| 51ⅴ精品国产91久久久久久| 欧美成人片在线观看| 欧美日韩有码| 亚洲精品视频在线观看视频| 欧美 日韩 亚洲 一区| 免费人成在线观看播放视频| 久久久亚洲精品石原莉奈| 91成人免费看| 久久这里只有精品国产| 久久伦理在线| 国产亚洲精品久久久久久牛牛 | 欧美成人一区二区三区片免费| 99草草国产熟女视频在线| 美女的胸无遮挡在线观看| 亚洲最快最全在线视频| 欧美三级午夜理伦三级老人| 一级毛片视频在线观看| 国产欧美日韩不卡| 日本一区二区三不卡| 国产成人综合欧美精品久久| 激情亚洲网站| 欧美激情视频给我| 欧美丰满艳妇bbwbbw| 仙踪林久久久久久久999| 原创国产精品91| 公肉吊粗大爽色翁浪妇视频| 欧美精品momsxxx| 亚洲色图美腿丝袜| 国产肥白大熟妇bbbb视频| 羞羞色国产精品网站| 日韩精品一区二区视频| 久久丫精品国产亚洲av不卡| 一区二区小说| 欧美精品 日韩| www.国产视频.com| 四虎精品一区二区免费 | 国产男女裸体做爰爽爽| 中文字幕一区二区三区欧美日韩 | 欧美高清视频一区| 可以直接在线观看的av| 国产欧美精品一区二区色综合| 日韩在线三区| 麻豆tv在线| 一区二区成人在线| 国产午夜福利100集发布| 惠美惠精品网| 欧美情侣在线播放| 国产精品专区在线| 在线视频超级| 欧美亚洲综合网| 五月六月丁香婷婷| 裤袜国产欧美精品一区| 欧美系列一区二区| 热久久久久久久久| 国产精品国产| 一区二区三区视频免费在线观看| 老司机深夜福利网站| 欧美日韩国产在线一区| 中文字幕亚洲欧美在线| √天堂中文官网8在线| 狠狠入ady亚洲精品| 欧美一区第一页| 91精品视频免费在线观看 | 97se亚洲综合| 欧美日韩国产综合视频| 中文字幕在线不卡国产视频| 久久久久久www| 福利视频亚洲| 亚洲福利在线看| 蜜臀久久99精品久久久久久| 国产精品v亚洲精品v日韩精品| 欧美一区二区.| 国产免费黄色网址| 久久久综合视频| 亚洲永久激情精品| 超碰中文在线| 樱花影视一区二区| 日韩有码免费视频| 中文字幕视频精品一区二区三区| 国产亚洲精品久久久| 精品少妇久久久久久888优播| 日本女人一区二区三区| 欧美一级高清免费播放| 国产理论视频在线观看| 91麻豆国产精品久久| 成年人三级视频| 欧美日韩视频免费观看| 一本大道av伊人久久综合| 亚洲天堂av一区二区| 蜜桃视频欧美| 久久久久五月天| 国产精品毛片一区视频播 | 免费黄色激情视频| 免播放器亚洲| 国产一区二区在线网站| 精产国品自在线www| 中文字幕一区二区三区不卡在线| 成人在线免费观看av| 日韩精品视频中文字幕| 日韩在线不卡视频| 国产一级一级国产| 青青草伊人久久| 精品国产福利| 欧美男男video| 51精品秘密在线观看| 日本成人午夜影院| 噜噜爱69成人精品| 久久国产精品久久精品国产| 黄色软件在线观看| 欧美日韩国产丝袜另类| 欧美激情 亚洲| 韩国亚洲精品| 国产福利一区二区三区在线观看| bt在线麻豆视频| 午夜精品久久久久久久| 亚洲av无码成人精品区| 欧美另类亚洲| 999国内精品视频在线| a毛片在线看免费观看| 欧美日本一道本在线视频| 日韩黄色中文字幕| 蜜臀99久久精品久久久久久软件| 日韩av在线一区二区三区| 日韩新的三级电影| 91精品国产综合久久久久久漫画 | 欧美视频免费| 国产精品久久久999| 国产三级在线| 欧美三级电影一区| 日韩免费av一区| 国产综合一区二区| 国产精品久久一区二区三区| 欧美性受ⅹ╳╳╳黑人a性爽| 精品国产髙清在线看国产毛片| 久久精品www人人爽人人| 成人激情视频网站| 国产91美女视频| 亚洲三级网页| 国产精品一区二区三| 1pondo在线播放免费| 欧美精品vⅰdeose4hd| 久久高清无码视频| 91亚洲男人天堂| 亚洲精品高清无码视频| 四季av在线一区二区三区| 亚洲最大的免费| 国模私拍一区二区国模曼安| 亚洲欧美第一页| 一二三区中文字幕| 亚洲一区二区三区爽爽爽爽爽 | 丝袜连裤袜欧美激情日韩| 国产91免费看片| 毛片在线看网站| 精品精品国产高清a毛片牛牛| 青青国产在线观看| 国产精品美女久久久久aⅴ国产馆| 亚欧美一区二区三区| 亚洲激精日韩激精欧美精品| 日本不卡二区高清三区| 国产一区二区| 热草久综合在线| 制服丝袜中文字幕在线| 亚洲精品中文字幕女同| 国产又粗又黄又爽| 午夜欧美2019年伦理| 日本黄区免费视频观看| 成人国产精品免费观看视频| 欧美伦理片在线看| 国语自产精品视频在线看8查询8| 日本午夜精品电影| 超碰cao国产精品一区二区| 国产成人精品一区二区在线| 日本高清在线观看| 亚洲一区二区精品| 亚洲免费黄色片| 欧美日韩在线不卡| 999这里只有精品| 一区二区在线看| 国产传媒在线看| 99九九99九九九视频精品| 色91精品久久久久久久久| 国产精品色网| 国产一级黄色录像片| 精品久久91| 精品一区二区三区自拍图片区| 96视频在线观看欧美| 欧美在线免费视频| 青青在线视频| 久久精品小视频| 一区二区自拍偷拍| 性感美女久久精品| 国产精品九九九九九九| 国产精品久久精品日日| 亚洲熟妇无码av| av资源网一区| 天堂va欧美va亚洲va老司机| 久久99精品久久久| 天天碰免费视频| 精品视频亚洲| 免费久久久一本精品久久区| 日本一区二区三区视频在线| 91精品国产色综合| 大香伊人久久| 精品中文字幕在线| 操你啦在线视频| 日韩三级成人av网| 日本蜜桃在线观看| 国产亚洲精品成人av久久ww| 免费播放片a高清在线观看| 亚洲激情免费观看| 天堂在线视频网站| 日韩成人在线免费观看| 超碰免费在线97| 日韩欧美精品在线| 亚洲第一页在线观看| 欧美一区二区女人| 国产高清不卡视频| 日韩精品一区二区三区在线观看| 国产sm主人调教女m视频| 制服丝袜亚洲精品中文字幕| 影音先锋黄色网址| 欧美久久久久久久久久| 一级做a爱片性色毛片| 欧美美女bb生活片| 国产sm主人调教女m视频| 欧美一区二区三区精品| 午夜精品久久久久久久99老熟妇| 日韩免费视频一区| 日韩中文字幕影院| 亚洲精品国产精品国自产在线| 视频午夜在线| 国产一区av在线| 日韩在线资源| 欧美伦理91i| 97人澡人人添人人爽欧美| 992tv在线成人免费观看| 国产精品迅雷| 国产专区欧美专区| 91亚洲精品在看在线观看高清| 国产热re99久久6国产精品| 日韩av懂色| 高清国产一区| 亚洲免费专区| 亚洲国产一区二区在线| 国产精品一区二区三区美女| 精品乱色一区二区中文字幕| 国产欧美日韩精品一区二区三区| 亚洲国产一区二区三区在线播| 亚洲欧美偷拍自拍| 99热久久这里只有精品| 午夜亚洲性色福利视频| 91看片在线免费观看| 国产一区二区h| 国产精品久久久久久久无码| 国产专区欧美精品| 精品一区二区三区四区五区六区| 91丨porny丨国产入口| 天天舔天天操天天干| 亚洲视频资源在线| 日本一级淫片免费放| 91国偷自产一区二区使用方法| 亚洲网站免费观看| 精品国一区二区三区| 国产一二三在线观看| 久久午夜a级毛片| bbw在线视频| 国产精品日韩在线一区| 亚洲电影一区| 日韩久久精品一区二区三区| 久久久久午夜电影| 久久久999视频| 国产综合色精品一区二区三区| 免费a级黄色片| 亚洲品质自拍视频网站| 影音先锋在线国产| 日韩色视频在线观看| 国产主播福利在线| 欧美激情一二三| 久久99国产精品二区高清软件| 精品免费视频123区| 亚洲女同一区| 九九热免费精品视频| www.欧美色图| 91嫩草丨国产丨精品| 91高清视频在线| 国产成人在线免费看| 大胆av不用播放器在线播放 | 黑人极品videos精品欧美裸| 怡春院在线视频| 日韩成人在线视频网站| 99视频免费在线观看| 国产精品日韩av| 日韩av三区| 91网站在线观看免费| 久久国产人妖系列| 先锋影音av在线| 日韩欧美亚洲综合| 欧美一区二区公司| 精品中文字幕在线2019| 国产资源一区| 日本在线播放一区| 亚洲免费综合| xxxx黄色片| 香港成人在线视频| 亚洲av无码乱码国产精品| 精品国产一区二区三区久久狼黑人 | 成年人国产精品| 欧美日韩精品在线观看视频 | 久久久久久久一区二区| 国产va免费精品观看精品| 亚洲 国产 日韩 综合一区| 欧美三级三级| av动漫在线观看| 99久久免费精品高清特色大片| 欧美日韩国产精品综合| 欧美一区午夜视频在线观看| 黄色精品在线观看| 成人精品一区二区三区电影免费| 日韩电影一区| 亚欧激情乱码久久久久久久久| 精品一区二区免费看| 粉嫩精品久久99综合一区| 色成人在线视频| 人妻丰满熟妇aⅴ无码| 久久麻豆精品| 亚洲 欧美 日韩系列| 国产婷婷色一区二区三区| 无码人妻av免费一区二区三区| 欧美日韩国产片| 91av资源在线| 国产伦精品一区二区三区精品视频| 欧美日韩中文一区二区| 午夜宅男在线视频| 中文字幕一区二区三区精华液 | 最新中文字幕av| 在线免费视频一区二区| 2017亚洲天堂1024| 91香蕉国产在线观看| 欧美性久久久| 人妻在线日韩免费视频| 91国产成人在线| 黄色在线论坛| 国产欧美一区二区三区另类精品| 国产一区二区三区久久久久久久久| 中文字幕一区二区三区人妻| 色综合激情久久| 91女主播在线观看| 97在线中文字幕| 国产色综合网| 三年中国中文观看免费播放| 欧美高清一级片在线| 亚洲第一图区| 欧美伦理一区二区| 麻豆国产精品777777在线| 激情五月婷婷小说| 亚洲免费小视频| 伊人久久大香| 亚洲色成人www永久在线观看| 久久尤物电影视频在线观看| 亚洲中文一区二区三区| 欧美激情一区二区久久久| 久久男人av| av中文字幕网址| 亚洲va韩国va欧美va精品| 99精品老司机免费视频| 成人在线视频网址| 久久中文精品| 丁香花五月激情| 亚洲欧美在线一区| 日韩中文字幕一区二区高清99| 日日碰狠狠躁久久躁婷婷|