精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計 原創(chuàng)

發(fā)布于 2025-9-19 09:36
瀏覽
0收藏

VLMs 性能的持續(xù)提升,視覺 token 的消耗呈指數(shù)級增長。例如,一張 2048× 1024 的圖片在 LLaVA 1.5中需要 576 個視覺 token,而在 Qwen2.5-VL中則需2678 個視覺 token。因此,避免過度使用視覺 token 顯得尤為重要。

大多數(shù)方法使用預(yù)定的Threshold 來修剪或合并固定數(shù)量的視覺 Token。然而,不同問題和圖像中的冗余程度各不相同。因此,是否真的應(yīng)該在所有場景中應(yīng)用統(tǒng)一的 Token 壓縮比例?下圖探討了簡單地降低了圖像分辨率以減少視覺 token 的數(shù)量,并評估了 Qwen2.5-VL 的在幾個基準上的性能。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

結(jié)論:

  • 左圖:在大多數(shù)一般場景中,即使將視覺 token 減少四倍,性能下降也微乎其微。然而,在OCR 相關(guān)基準上,token 壓縮會導(dǎo)致顯著的性能下降。
  • 右圖:VisionThink 在性能和效率上均顯著優(yōu)于之前的工作。

因此,如何讓模型自主選擇何時進行圖像token壓縮?VisionThink是一種新的視 覺 token 壓縮范式。從下采樣圖像開始,智能判斷其是否足以解決問題。否則,模型可以輸出一個特殊 token 以請求更高分辨率的圖像。與現(xiàn)有采用固定剪枝比例或閾值壓縮 token 的高效 VLM 方法相比,VisionThink 自主決定是否按情況壓縮 token。

本文看看VisionThink相關(guān)思路,僅供參考。

方法

目標:使VLMs能夠自主判斷給定圖像中的信息是否足以準確回答問題。如下圖,pipline首先處理低分辨率圖像以最小化計算成本。當降采樣圖像中的信息不足以回答問題時,它會智能地請求原始高分辨率輸入。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

VisionThink 的框架: (a) 左圖 VisionThink 處理分辨率降低4倍的圖像,其中 VLM 直接提供答案。(b) 右圖展示了模型檢測到信息不足并請求高分辨率圖像以回答問題的情況。

從上述可知,強化學(xué)習的設(shè)計目標變?yōu)椋?strong>使模型能夠判斷何時需要高分辨率。模型必須學(xué)會評估下采樣圖像是否包含足夠的信息來回答問題,或者是否需要原始高分辨率圖像。

RL設(shè)計

LLM作為評判評估器

傳統(tǒng)問題無法解決:rule-base的方法可以通過規(guī)則或精確匹配輕松定義和驗證真實答案。然而,這種方法在通用 VQA 情景中失效,因為有效答案的多樣性和分歧使得基于規(guī)則的驗證變得不可行。

因此,通過一個LLM作為評判評估器,僅評估模型響應(yīng)的純文本準確率。通過比較模型的答案與真實答案來實現(xiàn)

獎勵提示詞如下:可以看到,獎勵值是離散值0或1.

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

多輪GRPO算法

前面提到,pipline會首先將問題和下采樣圖像輸入到 VLM 中。如果信息不足以回答當前問題,模型將自主請求更高分辨率的圖像并生成新的響應(yīng)。這一過程本質(zhì)上是一種多輪交互。因此,將原始的 GRPO擴展為多輪 GRPO:

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

那么新問題來了,如何觸發(fā)高分辨率圖像進行輸入?樸素的方法:改提示詞,指示模型輸出特定的特殊 token。 提示必須確保模型能夠在 zero-shot 情景下的多輪展開中輸出所需的特殊 token。

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

獎勵函數(shù)設(shè)計

總體獎勵函數(shù)如下,由三部分組成:

通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

  • 準確率獎勵:LLM-as-Judge 方法,其中 0 表示錯誤答案,1 表示正確答案。
  • 格式獎勵:推理過程需包含在“< think>< /think>” 標簽內(nèi),最終答案置于 “< answer>< /answer>” 標簽中,且函數(shù)調(diào)用需符合規(guī)定的 JSON 格式。若其中任一格式有誤,則格式化得分為 0。只有當所有格式均正確時,模型才能獲得滿分的格式化得分 0.5。
  • 懲罰控制:由于使用高分辨率圖像通常能提升性能,若沒有任何懲罰,模型傾向于始終請求高分辨率圖像。為防止這種情況,最初遵循 Search-R1對依賴高分辨率圖像的正確回答施加了 0.1 的懲罰。然而,這種方法導(dǎo)致模型偏好直接回答,引發(fā)模型僅依賴直接回答的崩潰現(xiàn)象,如下圖中的紫色線所示。原因在于,即使是模糊的低分辨率圖像有時也能讓模型猜出正確答案,而 0.1 的懲罰無意中強化了這種直接回答的偏好。引入一個閾值來控制這種現(xiàn)象。當使用低分辨率圖像正確回答的概率較低時,對直接答案施加 0.1 的懲罰,以鼓勵高分辨率請求;反之,當概率較高時,對高分辨率請求施加 0.1 的懲罰。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

實驗性能

  • 推理模型推理時間成本與基準性能對比。Qwen-RL 和 Qwen-RL (1/4) 分別表示在Qwen2.5-VL-Instruct 模型上利用 LLM-as-Judge 進行全分辨率圖像和 1/4 分辨率圖像的推理。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)
  • 與傳統(tǒng)高效 VLM 方法的比較通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)
  • VisionThink 智能地確定高分辨率圖像的比率。應(yīng)用調(diào)整大小表示模型自主請求查看原始高分辨率圖像,而直接回答則表示模型僅使用 1/4 大小的圖像即可回答問題。通過強化學(xué)習讓多模態(tài)大模型自主決策圖像token壓縮的新思路-VisionThink實現(xiàn)思路及獎勵函數(shù)設(shè)計-AI.x社區(qū)

參考文獻:VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning,https://arxiv.org/pdf/2507.13348repo:https://github.com/dvlab-research/VisionThink

本文轉(zhuǎn)載自???大模型自然語言處理??   作者:余俊輝

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
日本不卡在线观看视频| 国产精品久久久久久久久久久久冷| 亚洲国产欧美视频| 成人久久网站| 亚洲激情一二三区| 久久久www免费人成黑人精品| 国产一卡二卡三卡| 中文字幕亚洲精品乱码| 亚洲国产天堂久久综合网| 日日躁夜夜躁aaaabbbb| 久久久久黄久久免费漫画| 91蜜桃在线观看| 91丨九色丨国产在线| 狠狠人妻久久久久久| 羞羞答答成人影院www| 日韩电影免费观看中文字幕| 午夜精品免费看| 国产精品电影| 中文字幕在线观看一区二区| 久久久99国产精品免费| 99热这里只有精品9| 久久看片网站| 欧美成人剧情片在线观看| 久久久久亚洲av无码专区桃色| 国产成人免费av一区二区午夜 | 久久久亚洲综合网站| 国产原创中文av| 鲁大师影院一区二区三区| 欧美噜噜久久久xxx| 美国黄色特级片| 五月综合久久| 精品国产区一区| 1314成人网| 777午夜精品电影免费看| 午夜av一区二区三区| 人人妻人人澡人人爽精品欧美一区 | 亚洲欧美日韩国产综合精品二区| 美女精品视频一区| 貂蝉被到爽流白浆在线观看| 久久最新网址| 亚洲美女www午夜| 菠萝菠萝蜜网站| 丁香5月婷婷久久| 欧美一级一级性生活免费录像| 国产理论在线播放| 性欧美超级视频| 欧美日韩国产精品专区 | 精灵使的剑舞无删减版在线观看| 中文字幕一区二区三区av| 亚洲精品一区二区三| 国产高清在线| 亚洲国产高清在线| 性高潮久久久久久久久| 成人在线观看免费| 久久精品视频免费| 欧美精品v日韩精品v国产精品| 风流少妇一区二区三区91| 粉嫩蜜臀av国产精品网站| 古典武侠综合av第一页| 欧美一区二区三区成人片在线| 国产成人午夜片在线观看高清观看| 亚洲一区亚洲二区| xxxx国产精品| www.欧美日韩| 麻豆av一区二区三区久久| 三级黄视频在线观看| 久久综合久久综合久久综合| 欧美一区二区在线视频观看| h网站视频在线观看| 国产精品热久久久久夜色精品三区| 亚洲高清乱码| 最新日本在线观看| 亚洲成av人片一区二区| 精品一区二区中文字幕| 欧美日韩在线精品一区二区三区激情综合 | 精品欧美午夜寂寞影院| 亚洲精品一区二区三区婷婷月| 国产成人av一区二区三区不卡| 欧美色女视频| 欧美老女人在线视频| 日韩av在线播| 日日夜夜一区二区| 亚洲一区二区日本| 天堂成人在线视频| 亚洲国产精品激情在线观看| 91制片厂免费观看| 国产高潮在线| 欧美区在线观看| jjzzjjzz欧美69巨大| 国产精品一区二区av日韩在线| 日韩在线中文字| 欧美三级 欧美一级| 999亚洲国产精| 国产精品欧美日韩久久| 亚洲AV无码乱码国产精品牛牛 | 欧洲在线视频一区| 菠萝菠萝蜜在线视频免费观看| 亚洲成av人片一区二区三区 | 日本精品网站| 日韩精品综合一本久道在线视频| 国产交换配乱淫视频免费| 亚洲色图网站| 日韩美女视频免费看| 99精品视频在线播放免费| 91女神在线视频| 午夜探花在线观看| 二区三区不卡| 精品国产99国产精品| 一本色道久久88| 一区二区日本视频| 亚洲最大的网站| av在线之家电影网站| 午夜精品影院在线观看| 艹b视频在线观看| 日韩aaa久久蜜桃av| 久久福利网址导航| 一区二区视频免费| 91麻豆免费观看| 男人添女荫道口喷水视频| 黑人一区二区三区| 亚洲欧洲在线观看| 日本视频www| 国产一区二区三区四区五区美女| 欧美一区亚洲二区| 在线最新版中文在线| 日韩视频在线你懂得| 奇米网一区二区| 免费视频久久| 精品蜜桃一区二区三区| 青草视频在线免费直播| 欧美日韩日日骚| 无码人妻精品一区二区中文| 亚洲三级视频| 国产精品永久入口久久久| 顶级网黄在线播放| 欧美一区二区高清| 国精产品一区一区二区三区mba| 日韩成人免费电影| 日韩欧美精品一区二区三区经典 | 欧美99久久| 成人在线视频福利| 1024视频在线| 欧美三区在线观看| 免费黄色在线网址| 蜜桃精品视频在线观看| 日韩亚洲视频| 日韩av一级| 中文字幕精品一区久久久久| 日批视频免费观看| 欧美高清在线视频| 日韩中文字幕a| 97在线精品| 成人性生交大片免费观看嘿嘿视频 | 国产污污视频在线观看| 91在线观看免费视频| 欧美大片在线播放| 亚洲免费观看高清完整版在线观| 26uuu亚洲国产精品| 日本福利午夜视频在线| 色偷偷久久一区二区三区| 久久精品国产亚洲av麻豆| 西西裸体人体做爰大胆久久久| 欧美日韩亚洲综合一区二区三区激情在线 | 人妻内射一区二区在线视频| 影视先锋久久| 国产精品激情自拍| 老司机精品视频在线观看6| 欧美一级高清片| 国产一级中文字幕| 2014亚洲片线观看视频免费| 日本www.色| 亚洲国产一成人久久精品| 91视频免费在线观看| 2020国产在线| 亚洲一级免费视频| 国产精品爽爽久久| 亚洲不卡av一区二区三区| 波多野结衣 在线| 美女网站一区二区| 91成人综合网| 国产一区二区三区网| 国产在线视频不卡| 黑人玩欧美人三根一起进| 精品无人国产偷自产在线| 中文字幕在线观看免费| 一区二区理论电影在线观看| 亚洲天堂成人av| 精油按摩中文字幕久久| 欧美精品久久久久久久久久久| 欧美极品中文字幕| 69174成人网| 欧美色网一区| 欧美激情网友自拍| a黄色在线观看| 亚洲国产精品999| 中文无码av一区二区三区| 亚洲夂夂婷婷色拍ww47 | 成人av无码一区二区三区| 五月天精品一区二区三区| 91禁男男在线观看| av午夜一区麻豆| 色噜噜狠狠一区二区三区狼国成人| 亚洲三级观看| 精品一区二区三区毛片| 国产亚洲电影| 国产成人女人毛片视频在线| 成人精品国产亚洲| 欧美专区在线视频| 欧美激情成人动漫| 菠萝蜜影院一区二区免费| 五月天婷婷在线观看| 7777精品伊人久久久大香线蕉经典版下载 | 欧美高清视频手机在在线| 国产一区二区三区奇米久涩| 亚洲狼人在线| 国产91在线播放| caoprom在线| 欧美大片va欧美在线播放| 春暖花开成人亚洲区| 亚洲精品久久久久久久久久久| 国产成年妇视频| 欧美三级中文字幕| 久久精品国产成人av| 亚洲午夜影视影院在线观看| 日韩免费av一区| 国产欧美日韩另类视频免费观看 | 中文字幕第一区综合| 久久久久国产精品无码免费看| 国产一区欧美一区| 手机免费av片| 久久er99热精品一区二区| 欧美日韩一区二区在线免费观看| 亚洲精选91| 被灌满精子的波多野结衣| 欧美日韩少妇| 黄色一级片国产| 国产精品v欧美精品v日本精品动漫| 国产精品av免费| 欧美xxav| 中文字幕乱码一区二区三区| 日本欧美国产| 亚洲午夜精品一区二区| 波多野结衣在线播放一区| 日韩欧美在线一区二区| 欧美日韩在线观看视频小说| 欧美中文娱乐网| 欧美另类69xxxxx| 亚洲欧美日本国产有色 | 91欧美一区二区| 少妇毛片一区二区三区| 久久午夜色播影院免费高清 | 亚洲欧美另类久久久精品| 2014亚洲天堂| 亚洲欧美激情小说另类| 欧美色图亚洲天堂| 亚洲成人免费在线| 久久久久久少妇| 91成人看片片| 中文字幕一区二区人妻| 欧美精品一级二级| 精品国产伦一区二区三| 精品99999| 你懂的在线网址| 综合国产在线视频| 黄色网在线免费看| 久久久久久久97| 在线看片福利| 国产精品美女久久| japansex久久高清精品| av一本久道久久波多野结衣| 成人爽a毛片免费啪啪红桃视频| 久久久久资源| 日韩精品午夜| 大胆欧美熟妇xx| 一区二区日韩免费看| 亚洲一区在线不卡| 国产乱子轮精品视频| av2014天堂网| 国产精品黄色在线观看| 国产在线拍揄自揄拍| 欧美午夜美女看片| 97视频免费在线| 亚洲福利视频专区| 成人影院免费观看| 欧美激情图片区| 91亚洲精品| 国产精品一区二区免费看| 精品国产一区二区三区小蝌蚪| 日本高清xxxx| 久久精品一区二区三区中文字幕 | jlzzjlzz亚洲日本少妇| 免费成人深夜天涯网站| 亚洲一区在线播放| 亚洲精品一区二三区| 日韩免费成人网| chinese偷拍一区二区三区| 欧美激情极品视频| 成人综合网站| 蜜桃狠狠色伊人亚洲综合网站| 日韩精品91| 日韩中文字幕在线视频观看| 狠狠色丁香久久婷婷综合丁香| 亚洲国产欧美视频| 亚洲综合一区二区精品导航| 国产精品午夜一区二区| 精品久久久久一区| 秋霞午夜在线观看| 日本欧美中文字幕| 成人直播在线观看| 日韩不卡一二区| 日本欧美一区二区在线观看| 999精品免费视频| 亚洲精选一二三| 怡红院男人的天堂| 亚洲精品中文字幕女同| 丰满诱人av在线播放| 91久热免费在线视频| 欧美一区二区三区激情视频| 大j8黑人w巨大888a片| 国产精品一区专区| 国产精品成人69xxx免费视频| 在线观看一区日韩| 五月色婷婷综合| 久久久在线观看| 亚洲无线观看| 欧美日韩中文字幕在线播放| 久久99精品国产.久久久久 | 久久精品99久久无色码中文字幕| 国产成人在线免费看| 成人精品电影在线观看| 久久亚洲av午夜福利精品一区| 91精品国产aⅴ一区二区| 日本三级在线播放完整版| 国产国产精品人在线视| 九热爱视频精品视频| 成年人视频网站免费观看| 成人av综合一区| 国产大片中文字幕| 欧美精品一区二区三区久久久| а√天堂资源地址在线下载| 91精品视频播放| 五月激情久久久| 久久久久久久久久久久久久久国产 | 老**午夜毛片一区二区三区 | 亚州欧美日韩中文视频| 福利电影一区| 啊啊啊一区二区| 久久综合999| 337p粉嫩色噜噜噜大肥臀| 亚洲午夜未删减在线观看| 精品123区| 亚洲欧洲国产精品久久| 久久97超碰色| 五月天丁香激情| 欧美草草影院在线视频| 国产乱妇乱子在线播视频播放网站| 成人91视频| 在线亚洲国产精品网站| 手机免费看av| 欧美日韩国产经典色站一区二区三区| av中文字幕一区二区三区| 成人精品久久久| 欧美日韩ab| 国产精品一区二区入口九绯色| 懂色av影视一区二区三区| 国产在线观看高清视频| 国产免费一区二区三区在线观看| 98精品视频| 久草免费资源站| 欧美午夜精品在线| 视频一区二区三区不卡 | 国产精品一区二区三区av麻| 久久人人爽av| 亚洲一区二区三区四区中文字幕| 色呦呦中文字幕| 国产精品电影久久久久电影网| 欧美一区不卡| 女~淫辱の触手3d动漫| 欧美日韩二区三区| 678在线观看视频| 日韩久久久久久久| 国产99精品国产| 久久久成人免费视频| 久久亚洲精品中文字幕冲田杏梨| 国产精品极品在线观看| 成人黄色一区二区| 一区二区三区国产精品| 蜜桃视频在线免费| 91精品视频在线播放| 日韩图片一区| 欧日韩不卡视频| 亚洲精品第一页| 亚洲欧洲专区| 男人天堂网视频| 亚洲女与黑人做爰| 欧美zzoo| 国产欧美亚洲日本| 久久99久久精品| www.伊人久久| 久久久久久91|