精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗 原創

發布于 2025-9-11 09:13
瀏覽
0收藏

VLMs已具備調用圖像中心工具的能力,稱為“thinking-with-image”(以圖思考),通過支持細粒度推理提升模型對復雜視覺場景的理解能力。然而,開源VLMs在“需要試錯探索的復雜視覺搜索任務”中存在顯著短板,表現兩大問題:

  1. 復雜任務上準確率極低
    高難度視覺搜索數據集熵(如DeepEyes)的準確率遠低于實際應用需求。
  2. 推理模式單一 + 交互輪次有限
    現有開源模型(如DeepEyes)無法生成靈活的推理策略,僅能進行“單次定位-觀察”的簡單流程,而無法像OpenAI o3(閉源模型)那樣,采用“深度優先搜索”“試錯探索”“自我反思”等多樣化策略。例如,在尋找圖像中隱藏的小目標時,開源模型往往“一次裁剪錯誤即終止”,而o3會“回溯至原始圖像、嘗試其他區域、交叉驗證觀察結果”。在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區
  3. 不同交互回合數下正確軌跡的分布情況。Mini-o3 展現出更深層次的思考路徑和更強的性能表現。盡管在訓練階段上限較小(即 6 回合),其仍表現出測試時回合數的縮放特性:當最大回合數從 4 增加到 32 時,準確率持續上升。

下面看下這份“復現OpenAI o3風格行為”的技術食譜,包括數據集構建、數據收集 pipeline、強化學習優化策略三部分。

方法

Mini-o3 的交互遵循 “Thought(思考)-Action(動作)-Observation(觀察) ” 循環,直到輸出最終答案或達到上下文 / 輪次限制。

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

多輪 Agentic 圖像工具調用框架:在每一輪中,模型基于前一次的觀察(或輸入問題和圖像)迭代生成思考和動作。每一輪的觀察結果是根據相應動作所指示的參數獲取的。

  • Thought(T?) :模型基于歷史交互記錄(含輸入圖像、問題、過往觀察)生成的內部推理過程,用于指導下一步動作。核心目標是鼓勵“試錯探索”“回溯驗證”等多樣化推理模式,而非單一路徑。
  • Action(A?)  : 模型執行的具體操作,分為兩類:

     a.??bbox_2d??:歸一化邊界框(范圍[0,1]2),指定裁剪區域;

     b.??source??:操作對象,可選擇“原始圖像”或“歷史觀察結果”(支持跨輪次回溯)。

(1)Grounding:通過參數化指令調用圖像工具,裁剪特定區域。參數包括:

(2)輸出最終答案:當模型判斷已獲取足夠信息時,直接返回結果。

  • Observation(O?) : 執行Action后得到的環境反饋,即工具裁剪后的圖像 patch。該結果會被追加到交互歷史中,作為下一輪推理的輸入。

因此得出循環邏輯:用戶輸入(圖像+問題)→ 模型生成Thought→ 執行Action→ 獲得Observation→ 基于新歷史再次生成Thought→ …→ 輸出答案/終止。

兩階段訓練范式

為平衡“基礎能力初始化”與“復雜推理優化”,Mini-o3分階段訓練:

  • 階段1:SFT:讓模型掌握“合法的多輪交互軌跡生成能力”,即學會根據問題和圖像,生成符合邏輯的Thought-Action-Observation序列,避免無意義的工具調用或過早終止。
  • 階段2:帶可驗證獎勵的強化學習(RLVR):在SFT基礎上,通過強化學習優化模型的推理策略,提升復雜任務的成功率(如需要10+輪交互的視覺搜索)。

訓練數據構建

為解決現有視覺數據集任務簡單、無法激發復雜推理的痛點,構建兩類數據:“挑戰性任務數據集”與“多樣化交互軌跡數據集”。

設計邏輯:

現有開源模型推理能力薄弱的關鍵原因之一是:訓練數據多為“目標易定位、無需試錯”的簡單任務(如HR-Bench),模型僅需“單次圖像觀察”即可輸出答案,無需發展多輪推理策略。因此,Mini-o3的訓練數據構建圍繞兩大需求展開:

  1. 任務層面:提供“必須通過試錯探索才能完成”的高難度視覺搜索任務,迫使模型主動調用圖像工具進行多輪交互;
  2. 軌跡層面:提供“覆蓋多樣化推理策略”的多輪交互范例,幫助基座模型(Qwen2.5-VL-7B-Instruct)初始化“Thought-Action-Observation”循環能力。
兩類數據集情況
  1. 視覺探針數據集

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

為強化學習RL提供“需要試錯探索的挑戰性任務”,避免模型在簡單任務上形成“shortcut學習”(如直接定位目標,無需多輪推理),強制模型發展深度推理能力。任務形式:每條樣本為“高分辨率圖像+視覺搜索問題+標準答案”,例如:

  • 圖像:包含密集干擾物的集裝箱場景(分辨率7952×5304);
  • 問題:“‘67.200’下方的數字是什么?”;
  • 標準答案:“22G1”。

作用:為后續訓練提供需要復雜推理的任務基礎,確保強化學習階段模型能學到“試錯探索”“回溯驗證”等高級策略,而非簡單的“目標定位”能力。

  1. 多樣化冷啟動數據集

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

冷啟動數據采集pipline

解決基座模型(Qwen2.5-VL-7B-Instruct)的“能力初始化”問題:該模型未接觸過多輪圖像工具交互數據,直接用強化學習訓練會導致“軌跡過短”“推理模式單一”(如平均僅1輪交互)。因此,需通過冷啟動數據教會模型“如何生成合法、多樣的多輪交互軌跡”。

軌跡形式:每條軌跡為“輸入圖像+問題+多輪Thought-Action-Observation序列+最終答案”,例如:

  • 問題:“‘CINKER PICTURES’下方的文本是什么?”;
  • 軌跡:11輪交互,包含“裁剪A區域(未找到)→ 回溯原始圖像→ 裁剪B區域(未找到)→ 重新檢查A區域細節→ 定位目標”等步驟,每輪均附帶推理Thought(如“當前區域未發現目標,需嘗試右側區域”)。

強化學習策略

  1. 降低單圖像最大像素數

基座模型上下文長度固定為32K tokens,而高分辨率圖像(默認12M像素)會占用大量tokens,導致單輪圖像輸入后,剩余tokens僅能支持1-2輪交互,無法滿足復雜任務“多輪試錯”的需求。

將單圖像的最大像素數從12M降至2M。這一調整在不損失關鍵細節的前提下,大幅減少單輪圖像的token占用,使得32K上下文可支持6+輪交互,為試錯探索提供足夠的軌跡長度。

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

VisualProbe-Hard數據集準確率從36.1%(12M像素)提升至48.0%(2M像素),驗證了“更多有效交互輪次”對復雜任務的價值

  1. 翻轉掩碼策略

在標準GRPO中,若模型生成的軌跡“超過訓練輪次上限(6輪)”或“超出上下文長度”(即“超輪次軌跡”),會被標記為“無效軌跡”,獎勵設為0。經過獎勵歸一化后,這類軌跡會產生Negative Advantage,導致模型在訓練中被“懲罰”,進而傾向于“過早終止交互”(如3-4輪就輸出答案),抑制深度推理能力。

通過引入“Completion Mask”,對超輪次軌跡的損失進行“掩碼屏蔽”,避免其產生負向學習信號:

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

翻轉掩碼技術示意圖。不完整響應指的是超出交互輪次或上下文長度最大限制的響應

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

如上圖,引入“Completion Mask”效果:訓練時僅限制6輪,但測試時模型可自然擴展至32輪,且準確率隨輪次增加而提升。

性能

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

在開源模型上復現類似OpenAI o3的“thinking-with-image”能力:Mini-o3淺嘗-AI.x社區

參考文獻:Mini-o3: Scaling Up Reasoning Patterns and Interaction Turns for Visual Search,https://arxiv.org/pdf/2509.07969v1

本文轉載自??大模型自然語言處理??   作者:llmnlp

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-9-11 09:44:36修改
收藏
回復
舉報
回復
相關推薦
黄网动漫久久久| av色综合久久天堂av综合| 一区二区三区美女xx视频| 在线能看的av网站| 青青青草视频在线| 久久婷婷久久一区二区三区| 国产久一一精品| 精品无码人妻一区二区三区| 国产精品三级| 日韩欧美色综合| 日日碰狠狠躁久久躁婷婷| 精产国品自在线www| 91亚洲男人天堂| 国产区精品视频| 男人天堂中文字幕| 国产二区精品| 日韩国产欧美精品一区二区三区| 天天干天天综合| brazzers在线观看| 国产精品欧美精品| 韩国一区二区三区美女美女秀 | 美国成人毛片| 国产一区二区三区在线观看精品 | 精品一区二区三区亚洲| 精品国产老师黑色丝袜高跟鞋| 亚洲高清123| 天天爽夜夜爽夜夜爽| 国产麻豆成人精品| 国产剧情日韩欧美| 无码人妻丰满熟妇精品| 亚洲国产一区二区三区高清| 久久亚洲精品毛片| 99久久99久久精品免费看小说.| 豆花视频一区二区| 日韩一区二区三区三四区视频在线观看| 国产97在线 | 亚洲| 四季久久免费一区二区三区四区| 日本一区免费视频| 秋霞在线观看一区二区三区| 免费看国产片在线观看| 国产乱国产乱300精品| 国产精品夜色7777狼人| 亚洲黄色免费观看| 国产精品日本| 午夜精品免费视频| 91精品国产高潮对白| 一区二区不卡| 欧美另类极品videosbestfree| 日本少妇xxxxx| 精品少妇av| 亚洲欧美另类自拍| 免费黄色在线视频| 亚洲免费观看高清完整版在线观| 亚洲国产成人一区| 日本五十肥熟交尾| 国产欧美自拍一区| 亚洲护士老师的毛茸茸最新章节| 国产+高潮+白浆+无码| 国产精品2023| 亚洲第一页中文字幕| 人妻激情偷乱频一区二区三区 | 美乳视频一区二区| 美国一级片在线免费观看视频 | 国产极品国产极品| 伊人情人综合网| 色综合久久88| 日韩男人的天堂| 精品福利电影| 人体精品一二三区| 久久久久久亚洲av无码专区| 日本亚洲欧美天堂免费| 成人a级免费视频| 国产ts变态重口人妖hd| 高清av一区二区| 国内精品视频免费| 日本ー区在线视频| 国产精品丝袜一区| 久久久成人精品一区二区三区 | 免费观看的毛片| 91热门视频在线观看| 日韩欧美亚洲区| 黄色网页在线看| 亚洲自拍偷拍综合| 爱福利视频一区二区| 91精品店在线| 日韩欧美中文字幕公布| 成人性生活免费看| 日韩电影二区| 久久久久久久网站| 天堂网中文字幕| 精品在线视频一区| 国产一区二区黄色| 999在线视频| 亚洲一区二区三区视频在线 | 欧美电影网址| 欧美日韩美少妇| 91精品啪在线观看国产| 成人情趣视频网站| 欧美高清视频在线观看| 91视频久久久| 成人免费av资源| 性欧美.com| av影片在线| 欧美日韩在线直播| 亚洲最大免费视频| 综合视频在线| 国产大片精品免费永久看nba| 国产激情视频在线播放 | 日韩视频一区在线观看| 国产又粗又猛又爽视频| 欧美精品国产| 国产精品久久久久一区二区| 黄色av中文字幕| 国产精品水嫩水嫩| 内射国产内射夫妻免费频道| av在线成人| 亚洲一级一级97网| 黄色大片网站在线观看| 国产精品一区一区三区| 色噜噜色狠狠狠狠狠综合色一| japanese色国产在线看视频| 在线电影院国产精品| 亚洲av无码一区二区三区人 | 欧美猛男同性videos| 欧美另类xxx| 亚洲中文字幕一区二区| 久久久久久久久久久久久夜| 国产一区二区三区乱码| 高清精品久久| 日日狠狠久久偷偷四色综合免费| 日韩欧美一级视频| jlzzjlzz亚洲日本少妇| 国产91porn| 国产午夜精品一区在线观看| 最近免费中文字幕视频2019| 日韩一级片中文字幕| 91视频在线观看免费| 成年女人18级毛片毛片免费| 国产一精品一av一免费爽爽| 中文字幕亚洲一区| 青青艹在线观看| 久久久久99精品一区| www.四虎成人| 秋霞影院一区二区三区| 性色av一区二区三区在线观看| av资源免费看| 尤物在线观看一区| 丰满少妇中文字幕| 欧美精品aa| av资源站久久亚洲| av资源中文在线天堂| 亚洲国产成人在线播放| 日本熟伦人妇xxxx| 99久久精品免费观看| 欧美黑人经典片免费观看| 老司机成人在线| 秋霞av国产精品一区| 免费在线看v| 欧美亚男人的天堂| 在线免费看视频| 精品亚洲欧美一区| 亚洲黄色网址在线观看| 亚洲福利合集| 午夜精品久久久久久久男人的天堂 | 成人性生交大片免费看无遮挡aⅴ| 久久精品一区二区国产| 日韩欧美99| 免费成人黄色网| 久久综合免费视频影院| 亚洲乱码在线观看| 欧美日韩加勒比精品一区| 成人乱码一区二区三区av| 日韩电影在线观看一区| 97超碰人人爱| 懂色av一区二区| 国产999在线观看| 九七久久人人| 精品国内二区三区| 国产在线观看黄色| 国产精品福利电影一区二区三区四区| 在线观看av免费观看| 国户精品久久久久久久久久久不卡| 好吊色欧美一区二区三区视频| 国产精欧美一区二区三区蓝颜男同| 国产一区二区三区在线视频| 国产人妻精品一区二区三区| 亚洲成av人片在线观看| 国产精品天天干| 国产一区二区三区免费| 成年人观看网站| 先锋资源久久| 久久99国产精品99久久| 色婷婷成人网| 91a在线视频| 精品国产丝袜高跟鞋| 精品偷拍各种wc美女嘘嘘| 91尤物国产福利在线观看| 狠狠色狠色综合曰曰| 免费看特级毛片| 久久久久久久久久久99999| 波多野结衣免费观看| 葵司免费一区二区三区四区五区| 日日噜噜夜夜狠狠久久丁香五月| 精品一区免费| 国产成人亚洲欧美| 五月天色综合| 午夜精品一区二区三区av| 91在线免费看| 亚洲精品在线视频| 成人h动漫精品一区二区无码| 91国产免费看| 日本熟女一区二区| 亚洲欧美成aⅴ人在线观看| 国产真实乱人偷精品人妻| 成人av免费在线观看| 五月天激情播播| 日日夜夜一区二区| 天堂…中文在线最新版在线| 欧美99久久| 亚洲视频电影| 国产成人三级| 九色一区二区| youjizz欧美| 亚洲一区二区中文| 最新亚洲国产| 国产精品日韩在线一区| 345成人影院| 91国产美女在线观看| 日本h片在线| 欧美成在线观看| 成人免费高清| 久久久精品久久久久| 性开放的欧美大片| 日韩在线视频播放| fc2在线中文字幕| 国产亚洲人成网站在线观看| 免费资源在线观看| 亚洲日本中文字幕免费在线不卡| 手机在线不卡av| 精品国一区二区三区| 黄色片一区二区| 亚洲国产天堂网精品网站| 亚洲精品一级片| 亚洲国产日韩一区| 污污网站免费在线观看| 亚洲国产精品va在线| 色一情一乱一区二区三区| 亚洲国产高潮在线观看| 天堂av2024| 亚洲精品一区二区三区婷婷月| 天天综合天天综合| 日韩久久精品成人| 国产大学生校花援交在线播放| 亚洲欧美在线磁力| 高清毛片在线看| 最新国产精品亚洲| h视频在线免费观看| 久久久久久av| 在线免费三级电影网站| 国产精品久久久久久久久久久新郎 | 日韩精品aaa| 国产乱理伦片在线观看夜一区| japan高清日本乱xxxxx| www.日韩在线| wwwwww日本| 中文字幕在线观看一区二区| 亚洲国产美女视频| 亚洲国产精品久久不卡毛片| 黄色片免费观看视频| 欧洲一区二区三区在线| 一级黄色片视频| 日韩精品一区二区三区中文精品| 黑人精品一区二区三区| 亚洲欧美精品一区二区| melody高清在线观看| 久久久精品久久| 欧美极品videos大乳护士| 国产精品免费一区| 欧美不卡在线观看| 久久久一本精品99久久精品| 成人系列视频| www.国产在线视频| 久久天堂成人| 老司机av网站| 久久久久国色av免费看影院| 色欲一区二区三区精品a片| 亚洲综合一二三区| 国产污视频网站| 91麻豆精品国产91| 亚洲色图欧美视频| 精品久久久91| 美女高潮视频在线看| 成人国产精品久久久久久亚洲| 超碰一区二区三区| 正在播放一区二区三区| 日韩一级不卡| 国产精品久久久久久久av福利| 成人av在线一区二区三区| 99在线视频免费| 亚洲成av人在线观看| 国产一区二区在线播放视频| 精品视频在线播放色网色视频| a篇片在线观看网站| 国产精品久久久久影院日本| 黑色丝袜福利片av久久| 国产高潮呻吟久久久| 久久午夜av| 欧产日产国产精品98| 亚洲三级电影网站| 中文在线观看免费高清| 日韩电影网在线| 四虎亚洲精品| 成人性生交大片免费观看嘿嘿视频| 日韩伦理一区二区三区| 国产精品久久国产| 蜜桃精品视频在线| 波多野结衣a v在线| 亚洲成a人片在线观看中文| 国产男男gay网站| 日韩中文字幕在线观看| 成人午夜精品| 久久久久久一区| 激情欧美国产欧美| 丰满饥渴老女人hd| 亚洲欧美日韩人成在线播放| 丰满人妻一区二区三区四区| 亚洲欧美国产精品va在线观看| 2024最新电影免费在线观看 | 成人观看免费完整观看| 丁香另类激情小说| 国产一区二区视频在线观看免费| 欧美性一二三区| 国产在线网站| 国产成人啪精品视频免费网| 欧美日韩xxxx| 凹凸日日摸日日碰夜夜爽1| 久久这里只精品最新地址| 欧美亚洲精品天堂| 日韩精品中文字| 亚洲永久av| 欧美日韩一区二| 丝袜国产日韩另类美女| 黄免费在线观看| 欧洲亚洲国产日韩| www.在线视频.com| 国产日韩换脸av一区在线观看| 日韩理论电影| 久久久国产欧美| 国产精品美女一区二区| 97超碰人人草| 久久夜色精品国产欧美乱| 久久av偷拍| 成人av在线播放观看| 成人自拍视频在线| 国产精品xxxx喷水欧美| 亚洲精品少妇网址| 九色成人搞黄网站| www亚洲国产| 国产福利91精品一区二区三区| 免费在线视频一区二区| 亚洲а∨天堂久久精品9966| 日韩脚交footjobhd| 日本亚洲自拍| 精一区二区三区| 国产精品99无码一区二区| 日韩av网站电影| 456亚洲精品成人影院| 一本久道久久综合| 国产suv精品一区二区883| 波多野结衣国产| 一区二区在线视频| 蜜桃在线一区| 日韩av一二三四区| 中文字幕永久在线不卡| 丰满人妻一区二区三区四区53 | 国产精品探花一区二区在线观看| 亚洲激情成人| 麻豆av免费观看| 欧美日韩成人激情| jizz一区二区三区| 欧洲亚洲一区二区| 国内精品写真在线观看| 日本一区二区三区免费视频| 亚洲视频在线观看| 91麻豆精品| 国产精品自拍片| 国产精品久久三区| 手机av在线免费观看| 国产精品视频自拍| 亚洲激情另类| 女人黄色一级片| 亚洲а∨天堂久久精品9966| jizz亚洲女人高潮大叫| 99久久国产综合精品五月天喷水| 久久久久久电影| 亚洲女同志亚洲女同女播放| 国产精品日日做人人爱| 亚洲美女一区| 中文字幕电影av| 亚洲欧洲一区二区三区在线观看|