精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

純靠“腦補”圖像,大模型推理準確率狂飆80%丨劍橋谷歌新研究

人工智能 新聞
新框架利用GRPO對大型視覺模型進行后訓練,在多個代表性視覺導航任務中的性能表現都遠超基于文本的推理方法。

不再依賴語言,僅憑圖像就能完成模型推理?

大模型又雙叒叕迎來新SOTA!

當你和大模型一起玩超級瑪麗時,復雜環境下你會根據畫面在腦海里自動規劃步驟,但LLMs還需要先轉成文字攻略一格格按照指令移動,效率又低、信息也可能會丟失,那難道就沒有一個可以跳過“語言中介”的方法嗎?

圖片圖片圖片

于是來自劍橋、倫敦大學學院和谷歌的研究團隊推出了首次純粹依靠圖像進行推理的新范式——基于強化學習的視覺規劃(VPRL)。

圖片

新框架利用GRPO對大型視覺模型進行后訓練,在多個代表性視覺導航任務中的性能表現都遠超基于文本的推理方法。

準確率高達80%,性能超文本推理至少40%,首次驗證了視覺規劃顯著優于文本規劃,為直覺式圖像推理任務開辟了新方向。

目前相關代碼已開源,可點擊文末鏈接獲取。

圖片

以下是有關VPRL的更多細節。

VPRL更準確、更有效

現有的視覺推理基準都是將視覺信息映射到文本領域進行處理,整個推理過程都由語言模型完成。

純視覺規劃則是讓模型直接利用圖像序列,沒有中間商“賺差價”,推理效率直線UP。

由此團隊直接引入一個基于強化學習的視覺規劃訓練框架VPRL,基于群組相對策略優化(GRPO),利用視覺狀態之間的轉換來計算獎勵信號,同時驗證環境約束。

圖片

該框架可以分為兩個階段:

  • 策略初始化

通過環境中的隨機游走軌跡初始化模型,再對每條軌跡提取圖像對,并給定輸入前綴,此外通過最小化監督損失以鼓勵生成連貫的視覺輸出:

圖片

  • 強化學習優化

利用模型在隨機軌跡初始化后已具備的探索能力,通過生成下一視覺狀態模擬潛在動作結果,并引導模型執行有效規劃。

具體來說,就是基于GRPO計算組內相對優勢,每個候選的相對優勢為:

圖片

同時為引導模型生成更高優勢的響應,通過最大化以下目標函數更新策略模型:

圖片

在視覺規劃框架中,核心挑戰始終在于生成的視覺狀態能否正確反映規劃動作的意圖,因此需要通過獎勵函數評估動作有效性(獎勵進展動作、零獎勵非進展動作、懲罰無效動作),進度獎勵函數定義為:

圖片

除了VPRL,研究團隊還選用了幾種系統變體作為基線,分別是基于微調的視覺規劃 (VPFT)和文本中的監督微調 (SFT),以比較基于語言和基于視覺的規劃,同時評估強化學習的作用。

VPFT與VPRL在第一階段訓練架構一致,但用最佳規劃軌跡取代隨機軌跡;而SFT用一個預期動作序列的文本描述取代中間視覺結果。

視覺規劃vs語言規劃

實驗搭建

為了更直觀地比較兩種規劃效果,團隊選取了三個可以完全以視覺方式表達和執行的代表性任務:

  1. FrozenLake智能體需從起點安全導航至終點,過程中需要避開冰洞。
  2. Maze智能體需從起點(綠點)導航至終點(紅旗)
  3. MiniBehavior智能體需拾取打印機并放置到桌上,包含“拾取”和“放置”兩個附加動作。

圖片

在模型的選取上,選擇專門在視覺數據上訓練的模型LVM-3B,確保預訓練期間不接觸任何文本數據。

另外評估比較Qwen 2.5VL-Instruct在僅推理(Direct2和CoT)和訓練后設置(SFT)兩種模式下的文本規劃效果,以及將Gemini 2.0 FlashGemini 2.5 Pro作為多模態推理的參考模型。

圖片

評估指標采用精確匹配率(EM)和進展率(PR),前者衡量模型是否成功生成與最優路徑一致的完整規劃軌跡,后者則測量從開始到最優路徑的連續正確步數與總步數的比率。

實驗結果

圖片

實驗結果表明,視覺規劃顯著優于文本規劃

視覺規劃(VPFT和VPRL)在所有任務上都取得了最高分,如表所示,VPRL在三個任務中平均EM高達80.6%,遠超文本基線(如Gemini 2.5 Pro平均EM為43.7%)。

在強化學習的增益上,VPRL也相比監督基線VPFT提升超20%,尤其是在復雜任務MiniBehavior中EM更是高達75.8%

說明通過獎勵驅動,可以幫助模型自由探索不同行動并從結果中學習,從而有效提高規劃性能。

圖片

與此同時在魯棒性上,隨著網格尺寸增大(如FrozenLake從3×3到6×6),VPRL性能下降平緩(EM從97.6%降至82.4%),而Gemini 2.5 Pro從98.0%驟降至38.8%,充分體現了VPRL更強的穩定性。

與VPFT相比,VPRL也將無效失敗率降低了24%,從而幫助模型保持在有效的動作空間內。

圖片

綜上,實驗結果首次驗證了純視覺推理的可行性,通過研究團隊提出的新范式VPRL框架,可以在視覺導航任務中實現超越文本模型的推理性能,并展現出極強的泛化能力,推動多模態推理在未來朝著更直觀的圖像化方向發展。

值得一提的是,團隊成員長期致力于視覺推理研究,他們也曾研究通過多模態思維可視化(MVoT)生成視覺“思想”,以徹底改變AI推理方式,感興趣的小伙伴們可以持續關注團隊的研究進展~

圖片

論文鏈接:https://arxiv.org/abs/2505.11409

代碼鏈接:https://github.com/yix8/VisualPlanning

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-10-26 08:40:15

模型隱私推理

2023-10-19 08:30:56

模型搜索

2021-12-20 16:17:35

數據模型技術

2023-10-14 13:09:53

谷歌模型

2025-07-04 08:53:00

2020-11-20 17:03:11

AI 數據人工智能

2024-01-05 08:44:52

2023-11-08 08:38:43

2025-02-13 09:40:00

2023-10-23 10:02:00

模型技術

2025-05-26 08:33:00

2018-11-14 10:01:30

谷歌開源機器學習

2020-04-23 13:17:53

腦機接口機器翻譯人工智能

2025-04-18 08:42:52

模型推理AI

2025-09-03 09:05:00

AI模型框架

2020-09-14 14:10:04

開發技能代碼

2023-12-12 13:51:00

AI訓練

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2025-10-23 12:46:39

2016-01-27 13:37:53

機器學習數據模型算法
點贊
收藏

51CTO技術棧公眾號

黄色片一级视频| 国产欧美日韩综合精品二区| 日本理论中文字幕| 欧美成人aaa| 国产精品国产精品国产专区不蜜| 91在线无精精品一区二区| 九九热精品免费视频| 偷拍视屏一区| 91精品国产综合久久蜜臀| 成人黄色片免费| 男男激情在线| 国产一区二区三区日韩 | 亚洲欧美在线不卡| 成人日韩av| 亚洲狠狠丁香婷婷综合久久久| 久久亚洲一区二区| japanese国产| 人人狠狠综合久久亚洲| 韩剧1988免费观看全集| 91精品少妇一区二区三区蜜桃臀| 久久香蕉网站| 91精品午夜视频| 亚洲男人天堂色| 白浆视频在线观看| 亚洲女女做受ⅹxx高潮| 日本一区视频在线观看| 手机在线观看免费av| 韩国理伦片一区二区三区在线播放| 欧美一级片一区| 久久久久久久9999| 亚洲成人精品| 日韩视频一区在线| 免费看黄色三级| 国产精品片aa在线观看| 亚洲成人精品久久久| 4438x全国最大成人| 日韩一级二级| 色婷婷av一区| 97国产精东麻豆人妻电影| 美女网站视频在线| 亚洲免费电影在线| 一本二本三本亚洲码| av在线三区| 国产三级久久久| 美乳视频一区二区| 黄色av一区二区三区| 国产一区二区三区综合| 国产精品永久免费在线| 久久久999久久久| 日日夜夜精品视频天天综合网| 97在线免费观看视频| 免费人成在线观看| 国产精品久久| 久久久久久久久久久免费精品| 在线观看亚洲网站| 五月精品视频| 久久精品视频在线| 大地资源高清在线视频观看| 手机在线电影一区| 丝袜亚洲欧美日韩综合| 日本不卡一区视频| 久久久久亚洲| 欧美裸体xxxx极品少妇| 久草视频在线免费看| 欧美片第1页综合| 欧美激情一区二区久久久| 国产亚洲小视频| 亚洲青色在线| 欧美孕妇性xx| 嫩草影院一区二区三区| 日韩中文字幕不卡| 国产日韩精品电影| 国产高清免费av| 国产 日韩 欧美大片| 国产精品一区在线播放| 蜜桃久久一区二区三区| 久久久久国色av免费看影院| 日韩影视精品| 精品视频在线一区二区| 亚洲综合丁香婷婷六月香| 性欧美大战久久久久久久| 欧亚av在线| 色哟哟精品一区| av亚洲天堂网| 亚洲一区 二区| 亚洲精品国产精品国产自| 亚洲 小说 欧美 激情 另类| 欧美一站二站| 精品自拍视频在线观看| 国产在线观看黄色| 紧缚奴在线一区二区三区| 国产日韩三区| 99青草视频在线播放视| 一区二区三区美女| 久久久久国产精品熟女影院| 久久久91麻豆精品国产一区| 亚洲精品动漫久久久久| 中文字幕在线观看二区| 亚洲精品资源| 成人激情视频在线观看| 天天操天天干天天爱| 国产精品系列在线| 久久亚洲中文字幕无码| 日韩精品第二页| 亚洲国产精品推荐| 国产精品麻豆免费版现看视频| 国产精品豆花视频| 国产精品青青在线观看爽香蕉| 超碰在线观看99| 国产色综合久久| 国产成人一区二区三区别| 久久99久久99精品免观看软件| 69堂精品视频| 国产又粗又猛又爽又黄av| 精品动漫av| 国产色综合天天综合网| 天堂在线中文字幕| 亚洲免费观看高清完整版在线观看熊| 茄子视频成人免费观看| 一区二区日韩| 尤物yw午夜国产精品视频明星| 国产精品第72页| 国产一区二区毛片| 午夜精品短视频| 欧美一区国产| 亚洲精品中文字幕有码专区| 黄色一级片在线免费观看| 久久99深爱久久99精品| 欧美一区二区三区成人久久片| bbw在线视频| 日韩欧美中文字幕制服| 国产极品美女在线| 麻豆精品一区二区三区| 视频在线99| 成人日韩在线观看| 亚洲乱亚洲乱妇无码| 国产午夜视频在线播放| 国产成人在线影院| 日本中文字幕一级片| 国产一区一区| 久久精品国产69国产精品亚洲 | 模特精品在线| 国产一区二区高清不卡| 欧美xxxx黑人又粗又长| 欧美一级黄色片| 婷婷在线精品视频| 国产麻豆精品95视频| 久久久成人精品一区二区三区| 成人在线中文| xxx成人少妇69| 亚洲专区第一页| 中文字幕日韩精品一区| 婷婷激情小说网| 久久精品青草| 97se国产在线视频| sqte在线播放| 日韩av在线播放资源| 男人午夜免费视频| 久久免费美女视频| 亚洲免费看av| 香蕉国产精品| 成人av电影免费| rebdb初裸写真在线观看| 亚洲国产天堂久久国产91| 国产成人在线播放视频| 久久久美女毛片| 色综合色综合色综合色综合| 国产精品国产三级国产在线观看| 成人激情综合网| 日本性爱视频在线观看| 日韩高清欧美高清| 国产一区二区视频免费| 亚洲欧洲成人自拍| 极品白嫩的小少妇| 男人的天堂亚洲| 正在播放久久| 91蝌蚪精品视频| 欧美在线一级va免费观看| av在线免费一区| 欧美tickling网站挠脚心| 色婷婷在线观看视频| 国产欧美一区二区三区鸳鸯浴| 思思久久精品视频| 亚洲精品1区| 日韩精品欧美一区二区三区| 亚洲男人在线| 91国内在线视频| av女优在线| 精品国产网站在线观看| 波多野结衣黄色| 亚洲精品成人天堂一二三| 黄色性生活一级片| 韩国欧美国产一区| 午夜精品久久久久久久无码| 日韩在线看片| 狠狠色伊人亚洲综合网站色| 成人国产精品| 97在线看福利| xvideos国产在线视频| 亚洲美女av电影| 国产视频在线观看免费| 色噜噜狠狠色综合欧洲selulu| 国产在线一卡二卡| 亚洲国产精品精华液2区45| youjizz.com日本| 久久国产麻豆精品| 国产特级黄色大片| 91高清一区| 亚洲激情一区二区三区| 另类春色校园亚洲| 91在线网站视频| 日韩高清不卡| 97欧美精品一区二区三区| 成人无遮挡免费网站视频在线观看| 国产手机视频精品| 成人久久精品人妻一区二区三区| 欧美日韩精品一区二区三区四区| 国产在线视频你懂的| 国产精品免费免费| 久久精品国产亚洲AV熟女| 大白屁股一区二区视频| 久久久九九九热| 捆绑紧缚一区二区三区视频| 日韩中文字幕免费在线| 国产精品久久777777毛茸茸 | av免费在线免费观看| 国产亚洲精品91在线| 熟妇高潮一区二区三区| 日韩三级中文字幕| 国产精品人人爽| 欧美日韩视频在线第一区 | 精品国产国产综合精品| 久久精品欧美一区二区三区不卡 | jizzjizz欧美69巨大| 免费国产一区| 日韩成人午夜| 久久综合色一本| 欧美亚洲国产日韩| 精品日本一区二区| 日韩有码一区| 久久av一区二区三区漫画| 另类ts人妖一区二区三区| 国产在线观看一区| 欧美日韩一区二区三区在线电影| 国产伦精品一区二区三区| 综合激情五月婷婷| 国产日韩二区| 亚洲激情77| 日本一区二区三区精品视频| 精品少妇av| 亚洲欧美久久234| 日韩欧美午夜| 正在播放久久| 午夜精品偷拍| 国产亚洲黄色片| 亚洲综合国产| 亚洲精品高清无码视频| 另类图片国产| 色片在线免费观看| 精品亚洲国产成人av制服丝袜 | 日日夜夜操视频| 日本黄色一区二区| 中文字幕乱码视频| 欧美群妇大交群的观看方式| 91尤物国产福利在线观看| 欧美一区二区三区四区久久| 精品久久久久成人码免费动漫| 日韩你懂的电影在线观看| 五月天福利视频| 一个人www欧美| gogo在线高清视频| 久久全球大尺度高清视频| 天堂av在线网| 国产欧美日韩高清| 中文久久电影小说| 久久久久久国产精品mv| 成人激情开心网| 四虎4hu永久免费入口| 亚洲美女色禁图| 国产91色在线观看| 成人丝袜高跟foot| 人妻视频一区二区| 一区二区免费看| 波多野结衣视频观看| 欧美一级二级三级蜜桃| 三级理论午夜在线观看| 久久精品国产免费观看| 国产欧洲在线| 青青在线视频一区二区三区| 免费欧美网站| 欧美日韩在线一二三| 午夜精品免费| 黄色三级视频片| 丁香六月久久综合狠狠色| 亚洲av毛片基地| 亚洲国产日韩一级| 影音先锋国产在线| 日韩av在线电影网| 国产黄色在线网站| 日韩av片电影专区| eeuss鲁片一区二区三区| 亚洲精品高清国产一线久久| 在线成人h网| 日韩av片免费观看| 91蝌蚪porny九色| 久久久久久久中文字幕| 欧美三级一区二区| 午夜成人免费影院| 欧美成年人在线观看| 欧美aaa大片视频一二区| 国产一区喷水| 欧美日韩精品| 欧美大片久久久| 国产午夜精品一区二区三区视频| 国产无套粉嫩白浆内谢| 69堂亚洲精品首页| 永久免费av片在线观看全网站| 欧美最猛性xxxx| 黄色欧美网站| 影音先锋成人资源网站| 美国毛片一区二区三区| 日本一级免费视频| 精品电影在线观看| 成人久久久精品国产乱码一区二区 | 国产欧美一区二区白浆黑人| 一区二区三区韩国免费中文网站| 亚洲精品无码国产| 国产99一区视频免费| 国产老头老太做爰视频| 欧美日韩不卡一区二区| av电影在线观看| 国产精品福利网站| 奇米色欧美一区二区三区| av天堂永久资源网| 91在线国内视频| 国产性猛交╳xxx乱大交| 亚洲精品wwww| 免费成人在线电影| 精品免费国产| 国产精品亚洲欧美| 亚洲av无码一区二区三区观看| 亚洲一区电影777| 亚洲欧美国产高清va在线播放| 欧美大片在线看免费观看| 日韩精品成人| www.国产在线视频| 成人国产在线观看| 国产精品suv一区二区| 亚洲第一级黄色片| 岛国av在线播放| 久久福利电影| 日韩在线a电影| a一级免费视频| 日韩三级视频在线看| 国产精品探花在线| 精品国产中文字幕| 香蕉成人久久| 国产一级久久久久毛片精品| 欧美日韩一区视频| 色爱综合区网| 精品高清视频| 噜噜噜在线观看免费视频日韩| 色一情一交一乱一区二区三区| 欧美色涩在线第一页| 蜜桃视频网站在线| 99精品在线直播| 亚洲国产精品一区制服丝袜| 亚洲av片不卡无码久久| 欧美影院午夜播放| 成人免费网址| 国精产品99永久一区一区| 日韩精品欧美成人高清一区二区| 欧美精品日韩在线| 精品日韩在线观看| 涩涩网在线视频| 亚洲人成网站在线播放2019| 国产精品亚洲视频| 久草手机在线视频| 久久伊人精品一区二区三区| 精品人人人人| www.com黄色片| 一区二区高清视频在线观看| 欧美日韩视频精品二区| 成人精品久久久| 亚洲三级色网| 美女av免费看| 精品对白一区国产伦| 福利一区视频| 免费在线观看视频a| 中文字幕国产一区二区| 欧美一级视频免费| 国产精品网红直播| 亚洲伦伦在线| 日韩精品一区二区三区在线视频| 亚洲第一男人天堂| 日本黄色成人| 18禁男女爽爽爽午夜网站免费 | 日韩大片免费在线观看| 日韩在线观看网址| 欧美一级二级三级视频|