精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式

發(fā)布于 2025-10-20 07:46
瀏覽
0收藏

背景介紹

盡管目前VLM在多模態(tài)任務上表現(xiàn)突出,但訓練過度依賴人工標注的數(shù)據(jù)與精心設計的強化學習獎勵。這種依賴帶來數(shù)據(jù)稀缺問題:多模態(tài)標注成本高昂,限制了訓練數(shù)據(jù)的規(guī)模與多樣性。同時存在知識天花板:模型能力受人類監(jiān)督邊界限制,難以突破人類已有知識和策略。曾經(jīng)AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變?yōu)閿?shù)據(jù)的同時消除了對人工監(jiān)督的依賴,這使得它能夠持續(xù)推動模型進步并突破人類能力上限。但是受制于VLM的多模態(tài)特性,目前鮮有對自博弈在VLM上應用的系統(tǒng)性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環(huán)境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數(shù)據(jù),而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續(xù)的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優(yōu)化的自博弈策略優(yōu)化算法(Iterative-SPO),這一算法解決了傳統(tǒng)自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數(shù)據(jù)做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

從棋盤到現(xiàn)實:AlphaGo 自博弈思想的泛化

自博弈作為 OpenAI 早期的重要技術路線之一,也是人工智能發(fā)展歷程中多項里程碑事件的關鍵推動力。典型代表包括 2016 年 AlphaGo 戰(zhàn)勝李世石,以及 2019 年 OpenAI Five 在 Dota 2 上擊敗世界冠軍 OG 戰(zhàn)隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現(xiàn)實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環(huán)境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件 (1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環(huán)境應當不斷提高難度,使得越來越強的智能體能夠涌現(xiàn),而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發(fā),研究團隊設計了一套完備的自博弈規(guī)則以解決上述難題,具體規(guī)則如下:

(1)游戲中有 n 名平民和 1 名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據(jù)線索結合自己的圖片,投票找出臥底。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

此游戲具有高度策略性與挑戰(zhàn)性,臥底需要根據(jù)他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰(zhàn)也會越來越大,并被激發(fā)出更強的視覺理解與推理能力。

領域無關的數(shù)據(jù)輸入

此游戲僅需要兩張有細微差異的圖片對作為輸入即可啟動,得益于目前強大的圖片編輯工具如ChatGPT或nano banana,數(shù)據(jù)的構建極其簡單并且成本低廉,因此此框架的應用場景非常廣泛。研究團隊使用了三種完全不同的場景圖片輸入作為訓練數(shù)據(jù):

(1)CLEVR 合成場景:使用 CLEVR 渲染器自動生成了 2000 對圖像。原圖有 4–6 個隨機排列的物體,修改圖中有兩個物體在顏色和形狀上被改變。

(2)圖表數(shù)據(jù):從 ChartQA 訓練集隨機選取了 1000 張圖表作為原始圖像,并使用 Gemini2.5-Flash 隨機交換圖表中的數(shù)值屬性生成對應的修改圖像。

(3)真實世界圖片:從 ImgEdit 訓練集中隨機抽取了 1000 對圖像,該數(shù)據(jù)集包含高質量的真實世界單輪圖像編輯對。

從局部均衡到可持續(xù)提升

純自博弈訓練容易陷入局部平衡,難以探索新的推理路徑,而單獨的強化學習方法在掌握現(xiàn)有問題集后也易出現(xiàn)知識飽和。為緩解這些問題,作者團隊提出采用雙階段交替訓練:當決策階段表現(xiàn)顯示線索階段已飽和時轉向線索訓練提高難度,反之則切回決策階段。此方法被命名為Iterative Self-Play Policy Optimization。實驗表明,兩階段交替訓練性能明顯優(yōu)于單階段訓練,對比如下。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

實驗結果

強任務泛化能力。為了評估 Vision-Zero 框架下訓練的VLM是否能泛化到更廣泛的推理與數(shù)學任務,作者團隊在六個基準數(shù)據(jù)集上對模型進行測試(結果見表 1)。實驗表明,即使沒有使用標注數(shù)據(jù)做訓練,Vision-Zero 在各項基準上一致性得優(yōu)于其他需要標注的SOTA方法。其中,VisionZero-Qwen-7B(CLEVR、Real-World)較基線提升約 3%,VisionZero-Qwen-7B(Chart)提升約 2.8%,而目前最優(yōu)的基線方法僅約 1.9%。值得注意的是,基線方法需要大量數(shù)學與推理樣本訓練,而Vision-Zero 環(huán)境并未顯式包含數(shù)學任務,只通過自然語言策略博弈提升邏輯推理,并將所學能力有效遷移到更廣泛的數(shù)學與推理任務,甚至超過專門在大規(guī)模任務數(shù)據(jù)上訓練的模型。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

跨能力負遷移的緩解。VLM 后訓練的關鍵難題之一是跨能力負遷移,即在特定任務上訓練后,模型在其他任務上反而變差。表 2 顯示,基線模型在推理和數(shù)學數(shù)據(jù)上后訓練后,性能明顯下降,例如MM-Eureka-Qwen-7B 在ChartQA 上下降約10%。相比之下,Vision-Zero訓練的模型能有效緩解負遷移:VisionZero-Qwen-7B(CLEVR)在視覺任務上顯著提升,同時在四個圖表/OCR 任務上平均僅下降 0.2%;VisionZero-Qwen-7B(Chart)在全部圖表/OCR 基準上都有提升,并在視覺任務上平均再漲 1%。這表明 Vision-Zero 的多能力策略訓練顯著減輕了傳統(tǒng)單一任務訓練中的負遷移問題。

Vision-Zero:零數(shù)據(jù)VLM自我進化!陳怡然團隊提出零監(jiān)督訓練新范式-AI.x社區(qū)

啟示

Vision-Zero 證明了自博弈從單一任務走向通用任務的可行性與巨大潛力。通過構建開放、可擴展的博弈環(huán)境,它擺脫人工標注依賴,突破數(shù)據(jù)和知識瓶頸,使模型在無需特定任務訓練的前提下實現(xiàn)可持續(xù)的能力進化與跨領域泛化。同時,雙階段交替優(yōu)化有效避免自博弈常見的局部均衡問題。并且,通過自博弈訓練的VLM有效緩解了傳統(tǒng)的在單一任務上做訓練的跨能力負遷移問題。

https://github.com/wangqinsi1/Vision-Zero
https://huggingface.co/papers/2509.25541
https://arxiv.org/abs/2509.25541

本文轉載自??PaperAgent??

已于2025-10-20 07:46:51修改
收藏
回復
舉報
回復
相關推薦
精品成人久久av| 成人国产在线观看| 欧美另类第一页| 性欧美18—19sex性高清| 松下纱荣子在线观看| 国产目拍亚洲精品99久久精品| 成人在线观看视频网站| 动漫精品一区一码二码三码四码| 中文有码一区| 日韩一区二区视频| 男女午夜激情视频| a级影片在线观看| 久久嫩草精品久久久精品一| 91沈先生在线观看| 黄色片中文字幕| 欧美人与禽猛交乱配视频| 亚洲欧美一区二区三区久久| 午夜性福利视频| 久久爱.com| 亚洲午夜电影在线观看| 五月天亚洲综合| 特黄视频在线观看| 国产精品原创巨作av| 性色av一区二区三区红粉影视| 亚洲毛片亚洲毛片亚洲毛片| 欧美调教网站| 精品久久国产老人久久综合| 亚洲不卡视频在线| 美女91在线看| 亚洲六月丁香色婷婷综合久久 | 免费精品一区二区| 午夜精品婷婷| 久久天天躁狠狠躁夜夜躁| 大又大又粗又硬又爽少妇毛片 | 欧美日韩激情在线观看| 久久国产电影| 一本色道久久综合亚洲精品小说| 污片免费在线观看| 国产精品极品| 欧美videossexotv100| 91亚洲精品久久久蜜桃借种| av免费在线一区| 欧美性猛交xxxx富婆弯腰| 男人添女荫道口女人有什么感觉| 九七久久人人| 国产精品国产三级国产普通话99 | 毛片大全在线观看| 亚洲日本护士毛茸茸| 亚洲精品高清国产一线久久| 国产精品一级伦理| 久久久久亚洲蜜桃| 日本10禁啪啪无遮挡免费一区二区| 深夜视频在线免费| 超碰97久久国产精品牛牛| 欧美日韩情趣电影| 中文字幕 91| jizzyou欧美16| 精品视频一区 二区 三区| 九九视频精品在线观看| 韩国三级一区| 欧美日韩国产片| 91欧美一区二区三区| 成人污版视频| 日韩美女天天操| 欧美做受高潮中文字幕| 精品久久97| 国产视频久久久| 69精品无码成人久久久久久| 日韩精品久久| 久久视频中文字幕| 久草免费在线观看视频| 国产婷婷精品| 国产精品十八以下禁看| 国产毛片毛片毛片毛片| 国产成人在线色| 久久久久久久免费| аⅴ资源新版在线天堂| 最新国产の精品合集bt伙计| 91九色国产ts另类人妖| japanese色国产在线看视频| 欧美小视频在线观看| 国产九九在线观看| 狂野欧美xxxx韩国少妇| 日韩成人av在线| 日韩av片在线| 欧美三区在线| 国产不卡视频在线| 国产精品人妻一区二区三区| 波多野结衣在线一区| 日韩精品极品视频在线观看免费| 国产区在线观看| 精品人伦一区二区三区蜜桃网站 | 国产在线不卡一区| 国产主播一区二区三区四区| 国产毛片在线| 亚洲自拍偷拍图区| 欧美日韩亚洲一二三| 91精品国产经典在线观看| 日韩一区二区三区电影| 玖玖爱在线观看| 自拍偷拍欧美| 国产91九色视频| 午夜精品一区二区三| 国产无人区一区二区三区| 福利网在线观看| 自拍偷拍欧美视频| 日韩一区二区三区在线视频| 90岁老太婆乱淫| 国产专区一区| 国产精品色婷婷视频| 天堂av资源网| 亚洲精品国产第一综合99久久| 国产亚洲精品网站| 日韩在线视频一区二区三区| 国产亚洲精品美女久久久| 久久精品这里只有精品| 毛片av一区二区三区| 久久精品中文字幕一区二区三区 | 天堂资源中文在线| 亚洲伦理在线精品| 国产日韩欧美久久| 在线日韩一区| 91国产精品电影| 亚洲AV无码一区二区三区少妇| 国产欧美一区二区三区鸳鸯浴 | 亚洲精品www久久久久久广东| 日韩av网站在线播放| 久久午夜精品| 久久久久天天天天| 24小时免费看片在线观看| 日韩一区二区免费高清| 女人黄色一级片| 秋霞电影网一区二区| 日本三级中国三级99人妇网站| 免费高潮视频95在线观看网站| 日韩限制级电影在线观看| 日本爱爱小视频| 麻豆freexxxx性91精品| 青青草成人激情在线| 成人欧美大片| 精品一区二区三区四区| 国产午夜免费视频| 成人晚上爱看视频| 日本aa在线观看| 日韩美女在线| 久久手机免费视频| 精品女同一区二区三区| 亚洲蜜臀av乱码久久精品| 在线一区二区不卡| 伊人久久大香线蕉精品组织观看| 91丝袜美腿美女视频网站| 国产不卡在线| 日韩亚洲欧美中文三级| 欧美极品aaaaabbbbb| 高清国产午夜精品久久久久久| 免费在线看黄色片| 国产成人一二片| 91精品国产色综合久久不卡98口 | 黄色影院一级片| 欧美一区二区三区红桃小说| 欧美亚洲国产日本| 理论视频在线| 欧美视频完全免费看| 久久噜噜色综合一区二区| 国产一区二区影院| www.国产亚洲| 久久夜色电影| 国产精品高潮呻吟久久av野狼| av在线免费观看网站| 欧美人妇做爰xxxⅹ性高电影| 三级在线观看免费大全| 成人小视频免费在线观看| 鲁一鲁一鲁一鲁一色| 欧美久久综合网| 91九色在线视频| 9765激情中文在线| 亚洲少妇激情视频| 国产模特av私拍大尺度| 五月天激情小说综合| 国产精品久久久视频| 国产一区二区导航在线播放| 成人午夜视频在线观看免费| 婷婷综合一区| 国产在线视频不卡| а_天堂中文在线| 国产一区二区三区18| 国产浮力第一页| 偷拍日韩校园综合在线| 国产三级在线观看完整版| 国产一区二区精品久久91| 久久精品视频16| 欧美激情成人| 精品国产乱码久久久久软件| 成人高清一区| 97久久久免费福利网址| 91ph在线| 亚洲第一区第二区| 在线观看国产黄| 午夜视频一区二区| 日本激情视频一区二区三区| 波多野结衣91| 在线a免费观看| 亚洲欧美日韩综合国产aⅴ| 超碰97免费观看| 狠狠色丁香婷婷综合影院| 99久久99| 欧美高清免费| 日韩av电影院| h片在线观看视频免费| 爱福利视频一区| 欧美色综合一区二区三区| 日韩免费在线观看| 一级做a爱片久久毛片| 欧美视频精品一区| 九九热视频精品| 国产精品麻豆视频| 亚洲av无码国产精品久久| 国产电影一区二区三区| 高清av免费看| 久久综合狠狠| aa视频在线播放| 一区二区三区午夜视频| 亚洲无玛一区| 精品日韩一区| 免费在线观看一区二区| 成人台湾亚洲精品一区二区 | 国产人妖在线播放| 欧美手机在线视频| 中文字幕一区二区三区四区欧美| 亚洲成人一区二区| 久久精品www人人爽人人| 日韩美女视频19| 四虎地址8848| 国产精品你懂的在线欣赏| 久操视频免费看| 久久综合国产精品| 亚洲av成人片色在线观看高潮 | 日韩欧美视频一区二区三区四区 | 伊人久久大香线蕉成人综合网| 怕怕欧美视频免费大全| 久中文字幕一区| 亚洲第一福利社区| 欧美日韩一区二区三区免费| 日本在线中文字幕一区| 国产一区二区三区色淫影院| 国产三级精品三级在线观看国产| 国产日韩一区欧美| 精品资源在线| 精品亚洲欧美日韩| 欧美人与动xxxxz0oz| 精品国产综合| 国产一区二区电影在线观看| 日韩伦理一区二区三区av在线| 精品日产免费二区日产免费二区| 天堂精品视频| 99久久婷婷这里只有精品| 超碰在线免费观看97| 在线一区电影| 国产精品第157页| 国产日韩亚洲| 国产理论在线播放| 看国产成人h片视频| 中文 日韩 欧美| 懂色av噜噜一区二区三区av| 天天躁日日躁狠狠躁av| 91老司机福利 在线| 少妇无套高潮一二三区| 中文字幕一区二区三区四区| 欧美色图一区二区| 亚洲成人动漫av| 亚洲婷婷久久综合| 7777精品伊人久久久大香线蕉超级流畅 | 亚洲一区亚洲二区| 国产一区在线电影| 日本高清不卡三区| 亚洲国产精品久久久天堂| 日本免费a视频| 美女网站久久| 在线观看免费av网址| 成人av电影在线观看| 国产精品综合激情| 夜夜亚洲天天久久| 亚洲欧美精品一区二区三区| 欧美日韩精品一区视频| 亚洲精品国偷拍自产在线观看蜜桃| 亚洲精品国产精品国自产观看浪潮| 欧美日韩国产综合视频| 久久久av一区| 另类激情视频| 91香蕉亚洲精品| 亚洲国产精品嫩草影院久久av| 在线国产精品网| 国产毛片久久| av地址在线观看| 国产视频在线观看一区二区三区| 日韩女优一区二区| 色狠狠桃花综合| 丰满少妇一级片| 色视频www在线播放国产成人| 成人免费图片免费观看| 成人亚洲欧美一区二区三区| 天堂日韩电影| 日韩一级免费看| 人人狠狠综合久久亚洲| 国产一级黄色录像| 亚洲人成精品久久久久| 久久久久久不卡| 亚洲国产成人一区| 黄色国产网站在线播放| 热草久综合在线| 久草精品视频| 草草草视频在线观看| 美女一区二区久久| 中文字幕免费高清| 亚洲国产精品嫩草影院| 国产成人精品无码高潮| 亚洲天堂色网站| 91av久久| 国产a一区二区| 欧美jizzhd精品欧美巨大免费| 久久久国产欧美| 久久综合久久综合九色| 精品午夜福利视频| 欧美一区二区女人| 久草中文在线| 91久久久久久久| 婷婷亚洲五月色综合| 色悠悠久久综合网| 久久精品视频一区二区| 精品欧美一区二区三区免费观看 | 国内精品二区| 欧美三区在线| 国产精品熟妇一区二区三区四区| 综合电影一区二区三区| 中文字幕第31页| 中文字幕欧美日韩va免费视频| 久久爱91午夜羞羞| 蜜桃91精品入口| 天堂精品中文字幕在线| 国产ts丝袜人妖系列视频| 精品magnet| 日韩午夜影院| 日韩女在线观看| 欧美色爱综合| 久久久久国产一区| 国产精品久久久久久久久动漫 | 精品一区二区三区视频在线观看 | 亚洲成人资源在线| 熟妇人妻系列aⅴ无码专区友真希| **欧美日韩vr在线| 亚洲婷婷影院| 日本激情视频在线| 国产精品免费aⅴ片在线观看| 一区二区三区日| 欧美猛少妇色xxxxx| 伊人久久亚洲| 免费成人在线视频网站| 久久久久久久久久久99999| 成人一二三四区| 久久中文久久字幕| 国产视频一区二| 青青草国产精品视频| 2024国产精品| 亚洲天堂免费av| 欧美成人第一页| 农村少妇一区二区三区四区五区| 91黄色小网站| 日本一区二区三区四区在线视频 | 看一级黄色录像| 成人精品国产免费网站| 亚洲国产成人无码av在线| 中文欧美在线视频| 久久免费精品| 免费无码国产v片在线观看| 欧美高清在线精品一区| 国产精品一区二区三区在线免费观看| 久久久久国产精品www| 综合综合综合综合综合网| 狠狠躁狠狠躁视频专区| 亚洲精品网站在线观看| 日韩欧美亚洲系列| 成人欧美一区二区三区黑人孕妇| 亚洲黄网站黄| 国产精品1区2区3区4区| 亚洲电影免费观看高清| 国产私拍福利精品视频二区| 国产欧美久久久久| 国产欧美视频在线观看| 国产国语亲子伦亲子| 国产成人精品久久亚洲高清不卡| 在线免费观看日本欧美爱情大片| 菠萝菠萝蜜网站| 欧美一区二区日韩一区二区| 国模冰冰炮一区二区| 国产成人免费高清视频| 久久综合九色综合欧美98| 国产福利免费视频| 国产精品草莓在线免费观看 | 国产一区二区三区91| 黄页网站在线看|