精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練新范式

人工智能 新聞
研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero。

本文作者包括來自杜克大學的汪勤思、林閱千、李海教授、陳怡然教授,新加坡國立大學的劉博,馬里蘭大學的周天翼教授,和 Adobe 的研究員施靖、萬錕、趙文天。

  • 開源代碼&模型:https://github.com/wangqinsi1/Vision-Zero
  • 項目主頁:https://huggingface.co/papers/2509.25541
  • 論文鏈接:https://arxiv.org/abs/2509.25541

背景介紹

盡管目前VLM在多模態任務上表現突出,但訓練過度依賴人工標注的數據與精心設計的強化學習獎勵。這種依賴帶來數據稀缺問題:多模態標注成本高昂,限制了訓練數據的規模與多樣性。同時存在知識天花板:模型能力受人類監督邊界限制,難以突破人類已有知識和策略。曾經AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變為數據的同時消除了對人工監督的依賴,這使得它能夠持續推動模型進步并突破人類能力上限。但是受制于VLM的多模態特性,目前鮮有對自博弈在VLM上應用的系統性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數據,而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優化的自博弈策略優化算法(Iterative-SPO),這一算法解決了傳統自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數據做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。

從棋盤到現實:

AlphaGo 自博弈思想的泛化

自博弈作為 OpenAI 早期的重要技術路線之一,也是人工智能發展歷程中多項里程碑事件的關鍵推動力。典型代表包括 2016 年 AlphaGo 戰勝李世石,以及 2019 年 OpenAI Five 在 Dota 2 上擊敗世界冠軍 OG 戰隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件 (1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環境應當不斷提高難度,使得越來越強的智能體能夠涌現,而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發,研究團隊設計了一套完備的自博弈規則以解決上述難題,具體規則如下:

(1)游戲中有 n 名平民和 1 名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據線索結合自己的圖片,投票找出臥底。

此游戲具有高度策略性與挑戰性,臥底需要根據他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰也會越來越大,并被激發出更強的視覺理解與推理能力。

領域無關的數據輸入

此游戲僅需要兩張有細微差異的圖片對作為輸入即可啟動,得益于目前強大的圖片編輯工具如ChatGPT或nano banana,數據的構建極其簡單并且成本低廉,因此此框架的應用場景非常廣泛。研究團隊使用了三種完全不同的場景圖片輸入作為訓練數據:

(1)CLEVR 合成場景:使用 CLEVR 渲染器自動生成了 2000 對圖像。原圖有 4–6 個隨機排列的物體,修改圖中有兩個物體在顏色和形狀上被改變。

(2)圖表數據:從 ChartQA 訓練集隨機選取了 1000 張圖表作為原始圖像,并使用 Gemini2.5-Flash 隨機交換圖表中的數值屬性生成對應的修改圖像。

(3)真實世界圖片:從 ImgEdit 訓練集中隨機抽取了 1000 對圖像,該數據集包含高質量的真實世界單輪圖像編輯對。

從局部均衡到可持續提升

純自博弈訓練容易陷入局部平衡,難以探索新的推理路徑,而單獨的強化學習方法在掌握現有問題集后也易出現知識飽和。為緩解這些問題,作者團隊提出采用雙階段交替訓練:當決策階段表現顯示線索階段已飽和時轉向線索訓練提高難度,反之則切回決策階段。此方法被命名為Iterative Self-Play Policy Optimization。實驗表明,兩階段交替訓練性能明顯優于單階段訓練,對比如下。

實驗結果

強任務泛化能力。為了評估 Vision-Zero 框架下訓練的VLM是否能泛化到更廣泛的推理與數學任務,作者團隊在六個基準數據集上對模型進行測試(結果見表 1)。實驗表明,即使沒有使用標注數據做訓練,Vision-Zero 在各項基準上一致性得優于其他需要標注的SOTA方法。其中,VisionZero-Qwen-7B(CLEVR、Real-World)較基線提升約 3%,VisionZero-Qwen-7B(Chart)提升約 2.8%,而目前最優的基線方法僅約 1.9%。值得注意的是,基線方法需要大量數學與推理樣本訓練,而Vision-Zero 環境并未顯式包含數學任務,只通過自然語言策略博弈提升邏輯推理,并將所學能力有效遷移到更廣泛的數學與推理任務,甚至超過專門在大規模任務數據上訓練的模型。

跨能力負遷移的緩解。VLM 后訓練的關鍵難題之一是跨能力負遷移,即在特定任務上訓練后,模型在其他任務上反而變差。表 2 顯示,基線模型在推理和數學數據上后訓練后,性能明顯下降,例如MM-Eureka-Qwen-7B 在ChartQA 上下降約10%。相比之下,Vision-Zero訓練的模型能有效緩解負遷移:VisionZero-Qwen-7B(CLEVR)在視覺任務上顯著提升,同時在四個圖表/OCR 任務上平均僅下降 0.2%;VisionZero-Qwen-7B(Chart)在全部圖表/OCR 基準上都有提升,并在視覺任務上平均再漲 1%。這表明 Vision-Zero 的多能力策略訓練顯著減輕了傳統單一任務訓練中的負遷移問題。

啟示

Vision-Zero 證明了自博弈從單一任務走向通用任務的可行性與巨大潛力。通過構建開放、可擴展的博弈環境,它擺脫人工標注依賴,突破數據和知識瓶頸,使模型在無需特定任務訓練的前提下實現可持續的能力進化與跨領域泛化。同時,雙階段交替優化有效避免自博弈常見的局部均衡問題。并且,通過自博弈訓練的VLM有效緩解了傳統的在單一任務上做訓練的跨能力負遷移問題。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 09:10:00

2025-03-28 11:59:10

2022-11-28 14:00:24

人工智能

2025-08-14 09:00:00

模型訓練數據

2025-02-10 08:40:00

訓練數據模型

2025-05-12 14:29:16

絕對零外部數據訓練法

2025-09-01 09:09:00

2022-04-12 14:36:58

達摩院訓練模型

2025-09-05 10:11:01

2025-04-10 09:15:03

2024-11-28 10:40:26

零拷貝技術系統

2025-05-21 13:52:39

LLM模型

2025-09-10 09:15:00

AI模型數據

2023-09-19 15:46:05

人工智能數據中心

2023-09-07 15:49:06

人工智能數據中心

2020-10-12 06:33:18

Zero-Copy零拷貝CPU

2023-06-16 14:11:00

研究監督

2011-11-23 13:29:05

2023-09-07 14:47:48

人工智能數據中心
點贊
收藏

51CTO技術棧公眾號

97netav| 亚洲国产中文字幕在线观看| 一区二区精品在线观看| 国产又大又黄又爽| 精品69视频一区二区三区Q| 日韩成人高清在线| www.com黄色片| 欧美xxx黑人xxx水蜜桃| 久久亚洲精品国产精品紫薇| 成人写真福利网| 啦啦啦免费高清视频在线观看| 日本不卡二三区| 亚洲激情视频在线| 欧美性受xxxxxx黑人xyx性爽| 免费在线观看的电影网站| 国产欧美一区二区三区在线老狼| 3d动漫啪啪精品一区二区免费 | 国产又黄又粗又猛又爽的视频| av亚洲一区二区三区| 亚洲午夜在线电影| 亚洲蜜桃av| 国产精品无码自拍| 日韩免费va| 亚洲国产另类av| 日本特级黄色大片| 中文字幕+乱码+中文字幕明步| 欧美天天在线| 久久精品视频一| 少妇无套高潮一二三区| 高清精品xnxxcom| 欧美乱妇一区二区三区不卡视频| 男人天堂999| 俺来俺也去www色在线观看| 亚洲欧美在线视频观看| 日本一区二区三区视频在线观看| 手机看片福利在线| 国产电影精品久久禁18| 成人看片人aa| 中文字幕乱码人妻无码久久| 香蕉国产精品偷在线观看不卡| 欧美黄色性视频| chinese全程对白| 日韩理论电影大全| 亚洲一品av免费观看| 亚洲 欧美 日韩在线| 51精品国产| 日韩一区二区在线播放| 日韩精品aaa| 免费看一区二区三区| 69p69国产精品| 99re6在线观看| 91麻豆精品| 91精品蜜臀在线一区尤物| 9l视频白拍9色9l视频| 三上悠亚激情av一区二区三区| 欧美日韩在线一区| 爱福利视频一区二区| 在线一区av| 91成人免费在线| 无人在线观看的免费高清视频 | 伊人免费在线| 亚洲欧美在线aaa| a级网站在线观看| 中文在线观看免费| 亚洲.国产.中文慕字在线| 国产av人人夜夜澡人人爽麻豆| 波多野结依一区| 欧美性20hd另类| 一级特黄性色生活片| 国产成人精品一区二区三区在线 | 亚洲精品888| 欧美日韩福利在线观看| 日本熟伦人妇xxxx| 亚洲男人影院| 国产精品美女在线| 国产精品无码天天爽视频| 国产成人精品影视| 麻豆91蜜桃| av在线电影播放| 综合久久久久久久| 国内精品视频一区二区三区| 中文字幕在线看片| 欧美日韩在线一区二区| 制服下的诱惑暮生| 欧美男人操女人视频| 永久555www成人免费| 福利所第一导航| 亚洲一区二区免费看| 国产欧美一区二区三区四区| 免费观看黄色一级视频| 国产欧美1区2区3区| 免费成人深夜夜行网站视频| 黄色视屏在线免费观看| 欧美日韩精品一区二区| 日本道中文字幕| 国产一区二区在线| 久久综合伊人77777蜜臀| 日韩不卡在线播放| 免费观看在线综合| 国产一区二区三区高清视频| 在线日本中文字幕| 精品magnet| 91丝袜超薄交口足| 国产精品羞羞答答在线观看| 欧美大片在线看| 中文字幕日产av| av资源网一区| 亚洲最大免费| 一级毛片久久久| 日韩精品中午字幕| 国产又粗又长免费视频| 一本色道久久综合一区| 91在线观看免费高清| 久色视频在线| 婷婷久久综合九色综合伊人色| 天天干天天av| 精品国产一级毛片| 97不卡在线视频| www夜片内射视频日韩精品成人| 久久九九久久九九| 久久久999视频| 91成人午夜| 精品国内产的精品视频在线观看| 国产女主播喷水视频在线观看 | av福利导福航大全在线| 欧美精品18+| 熟女俱乐部一区二区| 国产伦精品一区二区三区在线播放 | 狠狠操综合网| 57pao国产成人免费| 亚洲成a人片77777精品| 亚洲天堂免费在线观看视频| 99热手机在线| 禁断一区二区三区在线| 欧美在线一级视频| 日韩国产福利| 天天综合天天做天天综合| 亚洲女则毛耸耸bbw| 国户精品久久久久久久久久久不卡| 国产精品一久久香蕉国产线看观看| 青青草在线免费观看| 黑人狂躁日本妞一区二区三区| 香蕉久久久久久av成人| 黑人一区二区| 国产经品一区二区| 国产深夜视频在线观看| 日韩精品中文字幕一区二区三区| 午夜爽爽爽男女免费观看| 久久超碰97中文字幕| 亚洲在线色站| 成人激情久久| 欧美巨乳在线观看| 亚洲精品成av人片天堂无码| 亚洲国产成人tv| 中文字幕乱码在线| 裸体素人女欧美日韩| 免费国产一区二区| 嫩草伊人久久精品少妇av杨幂| 中文字幕精品网| 97人妻精品一区二区三区软件 | 五月婷婷中文字幕| 久久一区二区三区国产精品| 美女网站免费观看视频| 日韩成人免费| 亚洲综合日韩在线| 好久没做在线观看| 亚洲激情视频网| a片在线免费观看| 国产精品久久久久久久久免费桃花 | 亚洲精品按摩视频| 精品久久久久久久久久久久久久久久久久 | 在线免费观看日韩欧美| 精品一区二区三区蜜桃在线| 狠狠色丁香久久婷婷综合丁香| 99视频精品全部免费看| 欧美激情影院| 国产精品丝袜高跟| 怡红院在线播放| 日韩av最新在线| 中文字幕 自拍偷拍| 一区二区高清免费观看影视大全| v天堂中文在线| 美女在线观看视频一区二区| 日韩一区二区高清视频| 亚洲天堂av影院| 一区二区三区四区视频| 成人福利小视频| 色欲综合视频天天天| 内射一区二区三区| 91亚洲精品久久久蜜桃| 日韩中文字幕a| 亚洲黄色三级| 亚洲7777| 群体交乱之放荡娇妻一区二区| 国产噜噜噜噜噜久久久久久久久| 丰满诱人av在线播放| 中文日韩在线观看| 人妻无码中文字幕| 欧美日韩电影在线| 天天综合网久久综合网| 最好看的中文字幕久久| 日韩乱码人妻无码中文字幕久久| 激情都市一区二区| 激情视频综合网| 精品96久久久久久中文字幕无| 色中色综合成人| 欧美影院天天5g天天爽| 91在线播放国产| 国产91亚洲精品久久久| 欧洲一区二区视频| 电影k8一区二区三区久久| www亚洲欧美| 美国一级片在线免费观看视频| 日韩欧美电影一区| 国产精品久久久久久69| 欧美影片第一页| 在线观看黄网站| 亚洲高清免费视频| 永久看片925tv| 国产精品免费免费| 国产又粗又猛又爽视频| 97se亚洲国产综合自在线不卡| 在线成人精品视频| 寂寞少妇一区二区三区| 91极品尤物在线播放国产| 免费日韩精品中文字幕视频在线| 欧美精品卡一卡二| 欧美午夜国产| 黄色一级大片免费| 欧美 日韩 国产 一区| 亚洲欧美日韩国产成人综合一二三区| 亚欧洲精品视频在线观看| 国产精品一区二区三区观看| caoporn-草棚在线视频最| 日韩在线免费高清视频| 浮生影视网在线观看免费| 欧美日韩在线精品一区二区三区激情| 日韩黄色在线播放| 欧美性猛xxx| 黄色片中文字幕| 欧美午夜片在线免费观看| 成人免费看片98欧美| 香蕉影视欧美成人| 日韩精品一区二区不卡| 午夜视频一区二区| 中文字幕在线观看免费视频| 午夜精品福利久久久| 日韩av无码中文字幕| 亚洲va国产天堂va久久en| 五月天婷婷网站| 欧美日韩免费一区| 免费的毛片视频| 在线观看成人免费视频| 这里只有久久精品视频| 欧美亚洲综合久久| 91女人18毛片水多国产| 欧美一区二区视频在线观看2022| 99精品免费观看| 精品91自产拍在线观看一区| 无码国产色欲xxxx视频| 亚洲九九九在线观看| 二区在线观看| 久久精品夜夜夜夜夜久久| 在线你懂的视频| 69视频在线播放| 九九热线视频只有这里最精品| 国产精品在线看| 亚洲精品成人网| 亚洲一区二区在线视频观看| 免费观看日韩电影| 日韩成人av免费| 国产成人精品免费在线| 精品人妻一区二区免费| 91视视频在线观看入口直接观看www | 中文字幕高清在线播放| 国产精品大陆在线观看| 91精品麻豆| 国产伦精品一区二区三区照片91 | 日韩免费大片| 国产高清在线一区| 精品99在线| 五月天男人天堂| 亚洲片区在线| 深夜黄色小视频| 国产91精品久久久久久久网曝门| 亚洲国产精品自拍视频| 中文字幕欧美三区| 久久综合久久鬼| 在线视频国内一区二区| 精品人妻无码一区二区| 亚洲久久久久久久久久久| 很黄的网站在线观看| 66m—66摸成人免费视频| 亚洲我射av| 欧日韩一区二区三区| 欧美+日本+国产+在线a∨观看| 久久久久久久久久久久久国产精品 | 老熟妇精品一区二区三区| 国产精品免费av| 国产精品男女视频| 日韩一区二区精品在线观看| 毛片在线能看| 欧美激情视频一区| 成人全视频在线观看在线播放高清| av成人在线电影| 色喇叭免费久久综合| 国产精品后入内射日本在线观看| 免费观看30秒视频久久| 国产精品无码网站| 亚洲精品国产品国语在线app| 樱花视频在线免费观看| 亚洲第一福利在线观看| 操你啦视频在线| 国产精品久久97| 亚洲+小说+欧美+激情+另类 | av影院在线| 5g国产欧美日韩视频| 大片网站久久| wwwxxx黄色片| 99这里只有久久精品视频| 一级片一级片一级片| 欧美色大人视频| 久久久资源网| 欧美性受xxxx黑人猛交| 久久免费视频66| 97超碰国产精品| 国产美女在线精品| 任我爽在线视频| 欧美日韩一级片在线观看| 精品亚洲综合| 欧洲成人免费aa| 欧美日韩夜夜| 青青艹视频在线| 99视频热这里只有精品免费| 久久99久久98精品免观看软件 | 青青草精品在线| 亚洲欧美二区三区| 99国产成人精品| 九九精品视频在线观看| 精品视频91| 日韩专区第三页| 成人精品国产一区二区4080| 亚洲一区在线不卡| 久久九九久精品国产免费直播| www欧美在线| 国产一区二区三区在线观看视频 | 激情六月婷婷久久| 潘金莲一级黄色片| 91麻豆精品91久久久久同性| 精产国品自在线www| 91精品网站| 亚洲精品欧洲| 色天使在线视频| 色丁香久综合在线久综合在线观看 | 国产成人精品一区二区三区网站观看| 欧美成人精品欧美一级私黄| 欧美精品一区二区三区很污很色的| 波多野结衣在线高清| 鲁鲁视频www一区二区| 久色成人在线| 日韩一区二区三区四区视频| 欧美精品免费视频| 在线电影福利片| 激情小说网站亚洲综合网 | 午夜久久电影网| 内衣办公室在线| 国产日韩欧美在线| 欧美精品观看| 欧美无人区码suv| 欧美性猛交xxxxxx富婆| 色老头视频在线观看| 亚洲精品欧美日韩| aa国产精品| 国产调教在线观看| 日韩一区二区三区观看| 国产理论在线| 亚洲高清资源综合久久精品| 国产一区久久久| 女人十八岁毛片| 色偷偷88888欧美精品久久久| 欧美三级一区| 青青在线视频观看| 亚洲色图视频网站| 无码h黄肉3d动漫在线观看| 国产日本欧美视频| 在线播放亚洲| sm捆绑调教视频| 亚洲电影免费观看高清| 久久精品超碰| 国产a级片网站| 国产精品国产a| 天堂中文在线8| 亚洲淫片在线视频| 久久人人超碰| 九九热只有精品| 色哟哟网站入口亚洲精品| 久久九九热re6这里有精品| 国产又黄又猛的视频| 欧美日韩激情视频| av色综合久久天堂av色综合在|