精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AGILE:視覺學(xué)習(xí)新范式!自監(jiān)督+交互式強(qiáng)化學(xué)習(xí)助力VLMs感知與推理全面提升

人工智能 新聞
AGILE 提出一種全新的自監(jiān)督學(xué)習(xí)范式,將「智能體交互」遷移至多模態(tài)大模型的強(qiáng)化學(xué)習(xí)訓(xùn)練中,通過「模型生成動(dòng)作代碼 + 視覺環(huán)境反饋」的循環(huán)式交互過程,讓模型像人一樣邊觀察、邊推理、邊學(xué)習(xí),從而顯著提升模型視覺感知與邏輯推理能力。

現(xiàn)有視覺語言大模型(VLMs)在多模態(tài)感知和推理任務(wù)上仍存在明顯短板:1. 對圖像中的細(xì)粒度視覺信息理解有限,視覺感知和推理能力未被充分激發(fā);2. 強(qiáng)化學(xué)習(xí)雖能帶來改進(jìn),但缺乏高質(zhì)量、易擴(kuò)展的 RL 數(shù)據(jù)。

AGILE 提出一種全新的自監(jiān)督學(xué)習(xí)范式,將「智能體交互」遷移至多模態(tài)大模型的強(qiáng)化學(xué)習(xí)訓(xùn)練中,通過「模型生成動(dòng)作代碼 + 視覺環(huán)境反饋」的循環(huán)式交互過程,讓模型像人一樣邊觀察、邊推理、邊學(xué)習(xí),從而顯著提升模型視覺感知與邏輯推理能力。

  • Title:Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models
  • Paper:https://arxiv.org/pdf/2510.01304
  • Project Page:https://yuzeng0-0.github.io/AGILE/
  • Dataset:https://huggingface.co/datasets/YuZeng260/AGILE
  • Code:https://github.com/yuzeng0-0/AGILE
  • 作者單位:中科大、上海 AI Lab、華東師大、港中文

圖 1:AGILE 主要工作框架

方法核心:交互式智能體 + 拼圖代理任務(wù)

為了克服數(shù)據(jù)瓶頸與可擴(kuò)展性問題,研究者們選擇「拼圖」作為一種高效的兼具感知和推理的代理任務(wù),提出 AGILE。將拼圖過程建模為「可控、可驗(yàn)證」的交互式形式:

  • 模型在每一步生成 Python 動(dòng)作代碼(Swap、Observe、Crop、Zoom);
  • 環(huán)境執(zhí)行代碼、返回視覺反饋;
  • 模型根據(jù)環(huán)境反饋繼續(xù)規(guī)劃調(diào)整拼圖,該循環(huán)重復(fù)至拼圖完成。

這一閉環(huán)交互形成了「觀察–交互–反饋–學(xué)習(xí)」的智能體訓(xùn)練范式,使 VLMs 能在自監(jiān)督方式下持續(xù)提升感知和推理能力。

AGILE 的完整流程分為兩個(gè)階段:

  • Cold-Start 階段,使用 Gemini 2.5 Pro 生成 1.6K 條高質(zhì)量專家拼圖交互軌跡,教會(huì)模型如何正確生成動(dòng)作代碼與交互邏輯,解決初期模型「不會(huì)動(dòng)手」的問題;
  • Reinforcement Learning 階段,在 15.6K 張圖像上訓(xùn)練拼圖任務(wù),采用 GRPO 算法,通過準(zhǔn)確率、格式規(guī)范與交互輪數(shù)三重獎(jiǎng)勵(lì)信號優(yōu)化策略。

圖 2:模型拼圖過程中激發(fā)出來的感知和推理行為

實(shí)驗(yàn)

研究者們進(jìn)行了大量實(shí)驗(yàn),驗(yàn)證了 AGILE 的有效性,并得到了多條富有啟發(fā)意義的結(jié)論:

  • 研究者們設(shè)計(jì)了系統(tǒng)的拼圖評估數(shù)據(jù)集,涵蓋不同難度(2×2、3×3)與不同初始正確塊數(shù)(L0–L7)。模型性能以兩種指標(biāo)衡量:Acc,所有塊完全放對的比例;Score,正確拼塊數(shù)占總拼塊數(shù)的比例。在最簡單的 2×2 任務(wù)中,AGILE 使準(zhǔn)確率從 9.5% 提升至 82.8%,比 Gemini 2.5 Pro 高出 36.4 個(gè)百分點(diǎn)。在更具挑戰(zhàn)性的 3×3 拼圖中,也從 0.4% 提升至 20.8%,標(biāo)志著模型感知和推理能力大幅躍升。

表 1:拼圖 Acc 結(jié)果。LN 表示難度級別,N 表示初始正確拼圖塊數(shù)。N 值越小,拼圖越亂,難度越高。最佳結(jié)果以粗體顯示,次佳結(jié)果以下劃線顯示。

  • 通用能力即泛化性評測:經(jīng)過拼圖訓(xùn)練,模型在 9 項(xiàng)通用視覺任務(wù)中(涵蓋真實(shí)世界場景、高分辨率場景、細(xì)粒度感知、幻覺和多模態(tài)推理)平均提升 3.1%,展現(xiàn)出強(qiáng)大的泛化能力。進(jìn)一步驗(yàn)證了拼圖任務(wù)作為代理任務(wù)對于通用視覺能力的泛化價(jià)值。

表 2:不同模型在 9 個(gè)基準(zhǔn)測試上的性能比較。縮寫:MME-RW (MME-RealWorld-Lite)、RWQA (RealWorldQA)、HRB4K (HRBench4K)、HRB8K (HRBench8K)、HalBench (HallusionBench)、MMMU (MMMU VAL),Avg. 表示所有 9 個(gè)基準(zhǔn)測試的平均性能。? 表示強(qiáng)化學(xué)習(xí)相對于基礎(chǔ)模型 Qwen2.5-VL-7B 獲得的相對性能提升。最佳結(jié)果以粗體突出顯示,次佳結(jié)果以下劃線標(biāo)出。

  • Scaling 實(shí)驗(yàn):數(shù)據(jù)規(guī)模帶來的持續(xù)增益。研究者們進(jìn)一步探究了拼圖數(shù)據(jù)規(guī)模對性能的影響。當(dāng)訓(xùn)練數(shù)據(jù)從 0 擴(kuò)展至 16K 時(shí):拼圖任務(wù)準(zhǔn)確率從 22.0% → 82.8%;HRBench4K 準(zhǔn)確率提升 +2.0%;RealWorldQA 提升 +1.8%。表明 AGILE 的訓(xùn)練在數(shù)據(jù)量擴(kuò)增下持續(xù)有效。由于拼圖環(huán)境可自動(dòng)生成,AGILE 的數(shù)據(jù)擴(kuò)展幾乎零成本、無限擴(kuò)容,為多模態(tài) RL 提供了可持續(xù)的自監(jiān)督范式。

圖 3:(左圖)訓(xùn)練數(shù)據(jù)規(guī)模的影響。左側(cè) y 軸表示 HRBench4K 和 RealWorldQA 的準(zhǔn)確率,右側(cè) y 軸表示拼圖任務(wù)的準(zhǔn)確率。(右圖)與常規(guī) QA 數(shù)據(jù)的比較,在兩種實(shí)驗(yàn)設(shè)置中,樣本總數(shù)始終保持在 20K。

  • 與常規(guī) QA 數(shù)據(jù)的對比實(shí)驗(yàn):研究者們替換 20K 常規(guī) QA 數(shù)據(jù)中的其中 10K 為拼圖數(shù)據(jù),發(fā)現(xiàn)模型可以表現(xiàn)出更好的性能。這說明拼圖任務(wù)提供了更強(qiáng)的結(jié)構(gòu)感知與監(jiān)督信號。這一發(fā)現(xiàn)凸顯了拼圖任務(wù)在緩解多模態(tài)強(qiáng)化學(xué)習(xí)數(shù)據(jù)稀缺方面的潛力,并為推進(jìn)多模態(tài)模型開發(fā)開辟了一個(gè)充滿前景的新方向。

意義與未來

AGILE = 交互式拼圖代理 + 自監(jiān)督 RL,在無需額外人工標(biāo)注的前提下,持續(xù)提升 VLMs 的感知與推理能力。它證明了「交互式拼圖代理任務(wù)」作為突破數(shù)據(jù)瓶頸、強(qiáng)化 VLMs 的可行性和自監(jiān)督強(qiáng)化學(xué)習(xí)范式的潛力。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-06-09 09:32:35

2022-11-03 14:13:52

強(qiáng)化學(xué)習(xí)方法

2025-07-16 10:42:32

2025-10-11 04:00:00

2020-04-15 16:44:38

谷歌強(qiáng)化學(xué)習(xí)算法

2025-06-27 10:10:43

AI模型技術(shù)

2025-06-11 14:45:57

強(qiáng)化學(xué)習(xí)訓(xùn)練模型

2024-09-18 10:37:00

強(qiáng)化學(xué)習(xí)AI模型

2025-10-08 10:26:04

2025-02-20 09:21:51

2025-06-03 03:15:00

2021-12-06 17:38:51

強(qiáng)化學(xué)習(xí)工具人工智能

2025-06-30 09:08:00

2025-07-09 01:22:00

AI強(qiáng)化學(xué)習(xí)監(jiān)督學(xué)習(xí)

2025-05-26 09:16:00

2025-08-21 09:10:00

2017-06-10 16:19:22

人工智能智能體強(qiáng)化學(xué)習(xí)

2025-06-25 09:28:38

2020-08-16 11:34:43

人工智能機(jī)器學(xué)習(xí)技術(shù)

2020-08-14 11:00:44

機(jī)器學(xué)習(xí)人工智能機(jī)器人
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

99福利在线| 日本一区二区三区久久| 成午夜精品一区二区三区软件| 亚洲尤物视频在线| 久久精品人成| 夜夜嗨av禁果av粉嫩avhd| 欧美日本一区| 亚洲欧美一区二区精品久久久| 久久这里只精品| 成人性生交大片免费看在线播放| 久久久久久夜精品精品免费| 亚洲在线视频观看| 99超碰在线观看| 亚洲国产不卡| 亚洲夜晚福利在线观看| 色黄视频免费看| 亚洲成人人体| 午夜伊人狠狠久久| 中文字幕制服丝袜在线| 四虎在线视频| 国产一区在线不卡| 国产精品99久久久久久久久 | 伦理中文字幕亚洲| 青青草视频播放| 精品一区二区三区免费看| 一道本成人在线| 成人免费a级片| aaa在线免费观看| 91老司机福利 在线| 亚洲一区中文字幕| 夜夜嗨aⅴ一区二区三区| 美女久久一区| 68精品国产免费久久久久久婷婷 | 亚洲成a人v欧美综合天堂下载| 亚洲欧洲一区二区在线观看| 日本一二三区在线视频| 国产69精品一区二区亚洲孕妇| 国产在线视频不卡| 99久久久无码国产精品免费蜜柚 | 中文字幕一区二区在线播放| 久久免费99精品久久久久久| 成人午夜免费福利| 国产激情一区二区三区桃花岛亚洲| 国产精品一区二区三区毛片淫片 | 黄色一级免费视频| 国产精品传媒精东影业在线| 在线观看91久久久久久| 玖玖爱在线观看| 欧美午夜寂寞| 日韩经典第一页| 免费的av网站| 秋霞影院一区二区三区| 精品国产乱码久久久久久老虎| 欧美一级免费在线| 精品视频在线一区| 日韩午夜av一区| 一个人看的视频www| 精品一区二区三区在线观看视频| 7777女厕盗摄久久久| 亚洲精品免费一区亚洲精品免费精品一区 | 国产欧美精品一区| 欧美在线播放一区二区| 国产乱视频在线观看| 久久精品一级爱片| 亚洲精品在线观看免费| 午夜视频在线| 亚洲欧美日韩国产一区二区三区 | av在线不卡观看| 性猛交富婆╳xxx乱大交天津| 国产福利视频一区二区三区| 国产精品视频500部| 亚洲av成人无码网天堂| 久久久久国产精品麻豆| 丝袜美腿玉足3d专区一区| 视频免费一区| 亚洲精品ww久久久久久p站| 国产精品视频一二三四区| 黄网站在线观| 色一区在线观看| www.se五月| 91成人噜噜噜在线播放| 亚洲精品在线91| 欧美激情精品久久久久久免费 | 欧美爱爱视频免费看| 中文字幕资源网在线观看免费| 色妹子一区二区| 国产美女18xxxx免费视频| 九九99久久精品在免费线bt| 亚洲第一在线视频| 国产精品久久免费观看| 自由日本语亚洲人高潮| 高清欧美性猛交xxxx黑人猛交| 男人日女人网站| 韩国理伦片一区二区三区在线播放| 亚洲最大av在线| 亚洲色偷精品一区二区三区| 国产精品水嫩水嫩| 亚洲理论电影在线观看| 经典三级一区二区| 日韩欧美中文字幕制服| 国精产品一区一区三区免费视频| 国产韩国精品一区二区三区| 久久久日本电影| 在线观看xxxx| 91影院在线免费观看| 婷婷视频在线播放| 亚洲黄色中文字幕| 日韩欧美一级二级三级久久久| 女~淫辱の触手3d动漫| 午夜国产精品视频| 国产精品日日摸夜夜添夜夜av| 黄色片一区二区三区| 欧美国产日本韩| 男人日女人逼逼| 免费观看亚洲天堂| 在线观看日韩欧美| 国产a∨精品一区二区三区仙踪林| 麻豆国产精品一区二区三区 | 一本一道久久a久久精品蜜桃| 538国产精品一区二区免费视频| 国产特黄一级片| 国产日韩欧美激情| 久久综合九色综合88i| 久久免费福利| 色婷婷**av毛片一区| 日韩一级在线视频| 99精品久久99久久久久| 真人做人试看60分钟免费| 久久精品国产精品亚洲毛片| 日韩黄色av网站| 日本中文字幕免费| 国产成人免费视频精品含羞草妖精| 性欧美.com| 日本另类视频| 亚洲一区二区久久久| 亚洲天堂一区在线| 播五月开心婷婷综合| 米仓穗香在线观看| 韩国一区二区三区视频| 日韩中文字幕视频在线观看| 中文在线最新版天堂| 国产午夜精品一区二区三区嫩草 | 亚洲精品视频网上网址在线观看 | 国内精品久久久久久野外| 欧美午夜片在线观看| 免费看污片的网站| 日韩精品一级中文字幕精品视频免费观看 | 亚洲av无码国产精品久久不卡| 中文字幕日本乱码精品影院| 色www免费视频| 日韩免费av| 成人福利在线视频| 免费av不卡| 欧美一区二区三区白人| 91在线播放观看| 国产精品综合久久| 国产亚洲黄色片| 91精品日本| 国模叶桐国产精品一区| 色婷婷激情五月| 欧美日韩中文字幕综合视频| xxxx日本免费| 美女免费视频一区二区| 天天综合中文字幕| 天堂av一区| 亚州欧美日韩中文视频| 男女网站在线观看| 欧美视频中文字幕| 成人免费视频网站入口::| 国产不卡视频在线播放| 男人日女人视频网站| 亚洲国产欧美日韩在线观看第一区| 热久久这里只有| 337p日本欧洲亚洲大胆鲁鲁| 91精品国产黑色紧身裤美女| 国产一级免费av| 26uuu欧美| 9l视频白拍9色9l视频| 欧美在线亚洲| 精品在线视频一区二区三区| 日韩经典一区| 久久6免费高清热精品| 性xxxx视频播放免费| 在线观看av一区二区| 天天操天天操天天操天天操天天操| 成人免费视频网站在线观看| 久久精品.com| 中文不卡在线| 欧美精品国产精品久久久| 日韩美香港a一级毛片| 久久久久久久av| 国产专区在线| 亚洲成人黄色在线| 亚洲性在线观看| 天天射综合影视| 人与动物性xxxx| 99re成人精品视频| 涩涩网站在线看| 亚洲欧美视频| 久久福利一区二区| 国产欧美日韩在线观看视频| 97视频资源在线观看| 九九热线视频只有这里最精品| 欧美国产日韩视频| 二区在线观看| 亚洲高清免费观看高清完整版| 一区二区三区黄色片| 欧美性猛交丰臀xxxxx网站| 日本高清不卡免费| 国产亚洲精久久久久久| 久久久久亚洲av成人网人人软件| 免费视频一区二区| 亚洲熟妇无码一区二区三区| 性欧美69xoxoxoxo| 青青成人在线| 理论片一区二区在线| 亚洲自拍偷拍在线| 久久69成人| 国产97免费视| 女海盗2成人h版中文字幕| 美女视频久久黄| 在线a免费看| 亚洲视频视频在线| 日本午夜在线视频| 亚洲精品按摩视频| 成人午夜福利视频| 精品精品国产高清a毛片牛牛| 国产又粗又黄又爽的视频| 在线视频观看一区| 青青草免费观看视频| 精品久久久久久亚洲国产300| 免费在线视频一区二区| 亚洲你懂的在线视频| а天堂中文在线资源| 欧美国产综合色视频| 黄色工厂在线观看| 99re这里都是精品| 影音先锋人妻啪啪av资源网站| 国产精品小仙女| 四川一级毛毛片| 国产麻豆91精品| 亚洲精品mv在线观看| 黑人精品欧美一区二区蜜桃| 国产精品v日韩精品v在线观看| 热久久免费视频| 在线观看的毛片| 日韩精品一卡二卡三卡四卡无卡| 欧美成人xxxxx| 久久看片网站| 91日韩视频在线观看| 日韩高清不卡一区二区| xxxx一级片| 美女一区二区三区| 欧美成人手机在线视频| 国产在线播精品第三| 两女双腿交缠激烈磨豆腐| 国产精品18久久久久久久久| 原创真实夫妻啪啪av| 懂色av中文一区二区三区| 95视频在线观看| 26uuu另类欧美| 91成人精品一区二区| 国产精品高潮呻吟久久| 小泽玛利亚一区二区免费| 一区二区三区在线视频免费观看| 久久久久久久久久久久久久久久久| 亚洲成av人影院在线观看网| 中文字幕亚洲精品在线| 91国偷自产一区二区开放时间| 中文字幕第一页在线播放| 69堂成人精品免费视频| 亚洲xxx在线| 亚洲免费视频在线观看| 98在线视频| 欧美日韩国产成人| 欧美成人ⅴideosxxxxx| 国产日韩视频在线观看| 一区二区三区四区精品视频| 狠狠色噜噜狠狠色综合久| 精品视频99| 今天免费高清在线观看国语| 99成人在线| 亚洲国产日韩欧美在线观看| 国产成a人无v码亚洲福利| 亚洲精品午夜视频| 亚洲精品视频在线观看免费| 日韩黄色一级大片| 欧美福利一区二区| 午夜成人免费影院| 精品国产一区二区三区久久狼黑人 | 久久视频一区二区| 中文字幕观看av| 精品久久久久久亚洲精品| 亚洲综合五月天婷婷丁香| 亚洲黄在线观看| 麻豆最新免费在线视频| 欧美在线日韩在线| 国产一区二区三区视频在线| 鲁丝一区二区三区免费| 中文无码久久精品| 国产免费视频传媒| 盗摄精品av一区二区三区| 五月天免费网站| 日韩欧美综合在线视频| www.天堂av.com| 中文字幕亚洲欧美日韩2019| caoporn视频在线| 91在线视频精品| 精品国产精品久久一区免费式| 9色porny| 国产真实乱子伦精品视频| 欧美图片第一页| 午夜精品一区二区三区电影天堂| 91久久国语露脸精品国产高跟| 日韩成人av网| 黄页网站在线| 91久久爱成人| 国产精品99久久| 五月婷婷狠狠操| 26uuu另类欧美| 好吊操这里只有精品| 日韩视频一区二区| 快射av在线播放一区| 国产精品久久久久91| 亚洲三级网址| 国产资源在线视频| 国产成人精品午夜视频免费 | 亚洲国产wwwccc36天堂| 99久久久国产精品无码网爆| 日韩有码片在线观看| 91福利精品在线观看| 日本高清不卡一区二区三| 亚洲免费网站| 超碰97在线资源站| 亚欧色一区w666天堂| 亚洲av无码一区二区三区dv | 成熟的女同志hd| 4438x成人网最大色成网站| 午夜激情在线观看| 国产日韩欧美在线| 亚洲天天影视网| 手机av在线网| 国产精品毛片无遮挡高清| 中文字幕 欧美激情| 最近2019中文字幕第三页视频 | 高清国语自产拍免费一区二区三区| 午夜国产一区二区| 日韩精品视频网址| 一区二区三区四区精品在线视频| 国产成人精品一区二三区四区五区| 麻豆国产va免费精品高清在线| 久久伊人久久| 亚洲爆乳无码精品aaa片蜜桃| 国产91精品在线观看| 久一视频在线观看| 亚洲国产成人一区| 成人香蕉视频| 日韩偷拍一区二区| 久久www免费人成看片高清| 视频国产一区二区| 日韩欧美区一区二| 99爱在线观看| 欧美不卡三区| 看国产成人h片视频| 亚洲天堂一级片| 欧美精品一区二区三区高清aⅴ| 涩涩视频在线播放| 亚洲不卡中文字幕| 久久se精品一区精品二区| 超碰在线国产97| 日韩av在线免费看| 中韩乱幕日产无线码一区| 在线看成人av电影| 成人精品视频一区二区三区尤物| 国产成人无码精品亚洲| 伊人久久大香线蕉av一区二区| 亚洲伊人伊成久久人综合网| 日韩av中文字幕第一页| 久久久美女艺术照精彩视频福利播放| 一区二区的视频| 欧美精品18videosex性欧美| 九色精品91| 日韩av影视大全| 欧美日韩加勒比精品一区| 在线观看a视频| 国产日韩一区二区| 青青草国产精品97视觉盛宴| 美女福利视频在线观看| 亚洲欧美日韩精品| 久久久国产精品入口麻豆| 国产黄色特级片| 亚洲精品v日韩精品| 国产小视频在线| 99在线观看视频网站| 久久九九国产| 国产精选第一页| 色诱女教师一区二区三区| 红杏一区二区三区| 毛片毛片毛片毛| 色就色 综合激情|