精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓視覺語言模型像o3一樣動手搜索、寫代碼!Visual ARFT實現多模態智能體能力

人工智能 新聞
上海交大、上海 AI Lab、港中文、武漢大學的研究團隊最新推出的多模態智能體訓練方法?Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),專為賦予視覺語言模型(LVLMs)以「工具智能體」能力而設計。

在大型推理模型(例如 OpenAI-o3)中,一個關鍵的發展趨勢是讓模型具備原生的智能體能力。具體來說,就是讓模型能夠調用外部工具(如網頁瀏覽器)進行搜索,或編寫/執行代碼以操控圖像,從而實現「圖像中的思考」。

盡管開源研究社區在純文本的智能體能力方面(比如函數調用和工具集成)已取得顯著進展,但涉及圖像理解與操作的多模態智能體能力及其對應的評估體系仍處于起步階段。

因此,上海交大、上海 AI Lab、港中文、武漢大學的研究團隊最新推出的多模態智能體訓練方法 Visual-ARFT(Visual Agentic Reinforcement Fine-Tuning),專為賦予視覺語言模型(LVLMs)以「工具智能體」能力而設計。

并且,Visual-ARFT 項目已全面開源(包含訓練、評測代碼,數據和模型)。如果你對多模態模型、強化學習、視覺語言理解感興趣,不妨一起來探索更多可能性吧!

圖片

  • 論文標題:Visual Agentic Reinforcement Fine-Tuning
  • arXiv 地址:  https://arxiv.org/pdf/2505.14246
  • 代碼地址: https://github.com/Liuziyu77/Visual-RFT/tree/main/Visual-ARFT

Visual-ARFT 讓模型不僅能看圖、能理解,還能「動腦推理、動手操作」,主要包括以下三個方面的核心能力:

  • 模型能夠自動調用搜索引擎查資料或者編寫并執行 Python 代碼處理圖像;
  • 面對復雜任務,能夠自主拆解問題、規劃步驟、調用合適工具完成任務;
  • 支持多步推理、多模態輸入,具備強大的跨模態泛化能力!

如圖 1 所示,本文的方法編寫并執行 Python 代碼以精準讀取圖像中特定區域的文本(上圖),或者通過互聯網搜索回答多模態多跳問題(下圖)。

圖片

圖 1. 視覺智能體強化微調(Visual Agentic Reinforcement Fine-Tuning,簡稱 Visual-ARFT)在執行復雜的多模態推理任務中展現出顯著優勢,例如:(上圖)編寫并執行 Python 代碼以精準讀取圖像中特定區域的文本,以及(下圖)通過互聯網搜索回答多跳問題。

同時,為了評估模型的工具調用和多模態推理能力,團隊構建了智能體評測基準 MAT-Bench (Multimodal Agentic Tool Bench)。測試結果顯示,Visual-ARFT 在多個子任務中全面超越 GPT-4o,通過調用工具 ——「寫代碼 + 查資料」,展現出了完成復雜多模態視覺任務的強大潛力。

方法概覽

Visual-ARFT 基于強化微調的訓練策略,使用 GRPO 的算法來更新模型權重。團隊針對多模態智能體完成任務的流程,對 LVLM 的多步工具調用和問題回答設計了 rule-based verifiable reward。通過簡單高效的 reward 設計,驅動模型自主探索工具的使用方法和思考模式。

團隊在訓練中使用幾十到最多 1.2k 的訓練數據,通過少量數據實現了對模型的多模態智能體能力的訓練。

圖片

圖 2. Visual-ARFT 框圖。主要針對 Agentic Search 和 Agentic Coding 兩類任務的多步推理和工具調用能力進行優化。

Visual-ARFT 針對以下兩類高難度任務場景進行強化訓練:

  • Agentic Search:模型面對多模態的多跳復雜問題,先對視覺信息進行分析和推理,然后能夠主動進行任務分解、規劃信息檢索路徑,通過調用搜索引擎獲取外部知識并整合作答。
  • Agentic Coding:模型面對模糊、旋轉、曝光過強等復雜圖像,能主動生成 Python 代碼完成圖像修復,或剪裁圖像,提取關鍵區域,并據此完成視覺問答。

在這一過程中,模型并非簡單輸出結果,而是具備完整的推理結構:

每一步都以 <think> 思考引導、<search> 檢索信息、<code> 編寫程序、<answer> 給出結論,真正形成可解釋的多模態認知路徑。

MAT 基準

團隊發布了全新的多模態智能體評測基準:MAT(Multimodal Agentic Tool Bench),專門評估多模態工具調用能力:

  • MAT-Search:包含 150 道多跳視覺問答任務,人工標注 + 搜索推理;
  • MAT-Coding:包含 200 道復雜圖像問答任務。模型可以直接作答或通過調用代碼工具處理圖像,輔助作答。

這一基準填補了當前開源模型在「多模態智能體以及工具調用」方面的評估空白。

圖片

圖 3. MAT 數據標注過程。MAT-Search 采用人工標注方法構建多模態多跳推理 VQA 數據,MAT-Coding 采用自動化流程構造針對 Agentic Coding 任務的 VQA 數據。

Visual-ARFT 實驗結果

團隊基于 Qwen2.5-VL 模型在 MAT 上對本文方法進行了測試。結果顯示,無論在 MAT-Search 還是在 MAT-Coding 上,本文方法都較 baseline 有了顯著的提升,并擊敗了 GPT-4o 模型。

相較于 baseline 模型直接推理的方式,本文方法通過讓 LVLM 學會推理與調用工具,在解決復雜的多模態任務時,更加的得心應手。此外,團隊觀察到 OpenAI-o3 模型在一眾開源閉源中取得了遙遙領先的性能,尤其是在 MAT-Coding 上,憑借其多模態推理和工具調用能力,斷層式超越了 GPT-4o 模型。

圖片

表 1. MAT 測試結果。 Visual-ARFT 相較 baseline 取得了顯著性能提升,擊敗 GPT-4o。開閉源模型距離 OpenAI-o3 模型存在較大性能差距。

為了測試本文方法的泛化能力,團隊選取了 4 個 Out of Domain 的傳統 MultihopQA Benchmark 來測試他們的模型,包括 2wikimlutihopQA,HotpotQA,MuSiQue 和 Bamboogle。

結果顯示基于 Visual-ARFT 的 Qwen2.5-VL 模型雖然僅僅使用幾十條數據進行訓練,但是模型獲得在這些多跳推理數據集上展現出了顯著的性能提升,并擊敗了其他基于強化學習的方法。

圖片

表 2. 傳統 MultihopQA 測試結果。團隊在 Out of Domain 的多個 multihopQA 上測試了本文方法,展現出 Visual-ARFT 的強大泛化能力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-23 13:59:41

RustPython程序

2022-10-12 08:05:04

PlantUML代碼運行環境

2022-12-21 15:56:23

代碼文檔工具

2021-04-13 22:30:17

SpringBoot日志微服務

2023-02-15 08:17:20

VSCodeTypeScrip

2023-03-06 09:20:53

扁平化管理代碼

2011-10-24 13:07:00

2017-05-22 10:33:14

PythonJuliaCython

2025-08-18 18:19:34

AI視覺模型

2021-04-23 15:13:16

算法模型技術

2025-09-15 14:42:55

o3視覺推理開源

2024-11-13 09:39:13

2024-07-23 10:34:57

2023-09-22 11:56:57

模型駕駛

2009-12-08 14:26:13

大型網絡運維

2009-12-08 18:06:12

戴爾存儲動車組

2025-05-19 08:24:29

圖片加載開發

2022-07-12 14:56:30

AI模型研究

2025-04-23 08:30:05

2025-10-21 09:06:00

點贊
收藏

51CTO技術棧公眾號

中文天堂在线资源| 中字幕一区二区三区乱码| 国产探花在线观看| av爱爱亚洲一区| 国产精品狼人色视频一区| av在线免费播放网址| 亚洲一区二区三区免费| 欧美性生交xxxxx久久久| 亚洲精品在线视频观看| 亚洲第一色视频| 久久久蜜桃一区二区人| 欧美人与性动交| 久久久久亚洲av无码专区桃色| 日韩免费在线电影| 欧美日韩亚洲视频| 麻豆中文字幕在线观看| 亚洲欧美自偷自拍| 国产福利91精品一区二区三区| 欧美主播福利视频| 丝袜美腿小色网| 精品99久久| 亚洲精品一区二区三区精华液 | 亚洲先锋成人| 夜夜嗨av一区二区三区四区| 国产精品无码自拍| 日韩电影精品| 在线精品视频免费观看| 国产欧美日韩网站| 色老头在线观看| 国产精品成人在线观看| 欧美二级三级| 天堂在线观看免费视频| 国产一区二区看久久| 国产精国产精品| 日韩特黄一级片| 欧美在线网站| 欧美成人激情视频| 三级黄色片在线观看| 中文精品一区二区| 亚洲国产精品推荐| 91传媒理伦片在线观看| 日本免费一区二区三区视频| 欧美丝袜自拍制服另类| 成人一级片网站| 涩涩网在线视频| 无吗不卡中文字幕| 一本久道高清无码视频| 乱插在线www| 一区二区三区国产| 青青视频免费在线观看| 麻豆av在线免费看| 一区二区中文视频| 一级特黄录像免费播放全99| 成人综合影院| 日本一区二区免费在线| 日本日本精品二区免费| 国产系列电影在线播放网址| 久久久www免费人成精品| 欧美精品亚洲精品| 韩国中文免费在线视频| 国产欧美一区二区精品久导航| 欧美lavv| 成人精品一区二区三区免费| 欧美极品少妇xxxxⅹ高跟鞋 | 色综合天天综合网天天狠天天| 日本韩国欧美在线观看| 国产精品论坛| 欧亚洲嫩模精品一区三区| 日本新janpanese乱熟| 蜜桃视频成人m3u8| 欧美日韩在线免费视频| 污视频网址在线观看| 成人免费观看49www在线观看| 欧美一区二区三区性视频| 婷婷中文字幕在线观看| 中文字幕一区日韩精品| 亚洲精品国产综合区久久久久久久| 一级欧美一级日韩片| 国产麻豆精品久久| 久久精品国产v日韩v亚洲 | 欧美日韩加勒比精品一区| 国产精品va无码一区二区| 中文字幕av一区二区三区佐山爱| 欧美日韩五月天| 中文字幕第10页| 日本一区福利在线| 综合久久五月天| 久久久久成人片免费观看蜜芽| 亚洲激情综合| 国产精品男人爽免费视频1| 国产美女自慰在线观看| 不卡视频一二三四| 午夜一区二区三视频在线观看| 黄网站在线播放| 亚洲成人你懂的| 熟妇人妻无乱码中文字幕真矢织江 | 中文字幕亚洲在| 欧美成人高潮一二区在线看| 日本综合视频| 欧美刺激午夜性久久久久久久| 在线免费观看黄色小视频| 欧美国产偷国产精品三区| 欧美黑人性猛交| 销魂美女一区二区| 国产成人综合网| 日韩久久精品一区二区三区| 亚洲羞羞网站| 欧美自拍偷拍午夜视频| 一二三区视频在线观看| 成人免费av| 欧美一区二区三区免费观看| 国产成人精品毛片| 国产天堂亚洲国产碰碰| 人人妻人人做人人爽| 欧美高清免费| 亚洲品质视频自拍网| 国产一级在线观看视频| 韩国女主播成人在线观看| 欧美污视频久久久| a'aaa级片在线观看| 91精品在线一区二区| xxxx日本黄色| 国产精品亚洲综合久久| 国产99在线免费| 欧美成人高清在线| 欧美亚洲一区三区| 国产又黄又粗又猛又爽的视频 | 日韩av系列| 欧美老女人性视频| 97超碰中文字幕| 国产精品免费久久| 亚洲 中文字幕 日韩 无码| 露出调教综合另类| 欧美激情综合亚洲一二区| 国产乱码久久久| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产最新视频在线观看| 图片区小说区国产精品视频| 无码人妻一区二区三区精品视频| 夜间精品视频| 91影视免费在线观看| 老司机在线视频二区| 欧美日韩国产中文| 日韩一区二区三区四区视频| 奇米影视在线99精品| 婷婷精品国产一区二区三区日韩| 亚洲永久av| 亚洲视频999| jizz国产在线| 久久亚洲二区三区| 粗暴91大变态调教| 精品国产aⅴ| 国产精品欧美日韩一区二区| 国产中文在线| 欧美日韩亚洲综合在线 | 日本欧美视频| 国产日本欧美一区| 欧美边添边摸边做边爱免费| 欧美久久久久中文字幕| 欧美特级一级片| 丁香婷婷深情五月亚洲| 日韩国产一级片| 神马日本精品| 国产精品国产自产拍高清av水多 | 理论片在线不卡免费观看| 国产精品无码久久久久成人app| 亚洲日本在线看| 蜜桃色一区二区三区| 宅男噜噜噜66一区二区| 欧美精品国产精品久久久| 国产成人午夜性a一级毛片| 色吧影院999| 99久久久国产精品无码网爆| 亚洲午夜免费视频| 在线免费观看麻豆| 久久成人精品无人区| ijzzijzzij亚洲大全| 91国内精品白嫩初高生| 热久久这里只有| 丝袜美腿美女被狂躁在线观看| 欧美日本在线观看| www.av视频在线观看| 久久视频一区二区| 日本中文字幕观看| 99国产精品视频免费观看一公开 | 亚洲一级中文字幕| 久久激情综合网| 日韩一级免费看| 久久爱www成人| 91中文字幕在线观看| www555久久| 亚洲视频在线播放| 99热这里精品| 色综合咪咪久久| 免费一级肉体全黄毛片| 久久精品视频在线看| 热久久久久久久久| 亚洲免费中文| 日本道在线视频| 亚洲人成网亚洲欧洲无码| 91日韩在线视频| 厕沟全景美女厕沟精品| 久久夜色精品亚洲噜噜国产mv | 最近中文字幕av| 亚洲一区二区三区精品在线| 久久丫精品忘忧草西安产品| 国产精品456| 免费看污污网站| 亚洲国产免费看| 久久av喷吹av高潮av| 久久不见久久见免费视频7| 91久久偷偷做嫩草影院| 亚洲电影有码| 78色国产精品| 欧美性受ⅹ╳╳╳黑人a性爽| 夜夜嗨av色一区二区不卡| 蜜桃91麻豆精品一二三区| 欧美三级在线播放| 三级黄色在线视频| 亚洲综合一区在线| 成年人一级黄色片| 国产精品高潮久久久久无| 国产艳俗歌舞表演hd| 国产91丝袜在线播放0| 午夜激情av在线| 久久久久国产精品一区三寸 | 自由日本语热亚洲人| 欧美第一淫aaasss性| 欧美边添边摸边做边爱免费| 亚洲一级黄色片| 男操女在线观看| 精品小视频在线| 亚洲日本国产精品| 欧美精品一区二区三区蜜桃| 国产夫妻自拍av| 在线不卡一区二区| 亚洲图片在线播放| 欧美性做爰猛烈叫床潮| 一级黄色大片视频| 午夜精品久久久| 青青操免费在线视频| 亚洲一区二区影院| 九九视频在线观看| 一区二区三区美女| 免费在线观看国产精品| 亚洲最快最全在线视频| 久久综合加勒比| 亚洲午夜成aⅴ人片| 久久免费视频6| 亚洲国产精品自拍| 日韩精品国产一区二区| 亚洲国产成人av网| 日韩精品在线不卡| 午夜精品久久久久久久久| 午夜精品三级久久久有码| 精品日本美女福利在线观看| 日韩欧美中文字幕一区二区| 五月婷婷欧美视频| 久久国产黄色片| 色就色 综合激情| 中文字幕av片| 欧美日韩成人综合天天影院 | 国产乱淫av一区二区三区| 九九九九九九九九| 国产成人综合网站| 亚洲av成人片色在线观看高潮| 97精品电影院| 蜜桃久久精品成人无码av| 中文字幕欧美激情一区| 亚洲少妇xxx| 亚洲综合精品久久| 国产精品午夜影院| 欧美色图天堂网| 国产黄色一区二区| 亚洲娇小xxxx欧美娇小| 九色在线播放| 久久国产精品偷| 国产欧美一区二区三区精品酒店| 国产精品国产亚洲伊人久久 | 日韩电影第一页| 国产尤物视频在线| 欧美成人第一页| 少妇视频在线观看| 91免费国产网站| 久久午夜影院| 亚洲国产精品一区二区第一页| 欧美va天堂| 免费午夜视频在线观看| 精品一区二区国语对白| 国产一级黄色录像| 国产精品日韩精品欧美在线| 久久国产在线观看| 欧美视频中文一区二区三区在线观看| 国产视频在线观看视频| 国产视频精品va久久久久久| 免费的黄网站在线观看| 午夜精品福利电影| 亚洲高清影院| 欧美日韩精品免费看| 自拍欧美日韩| 国产免费又粗又猛又爽| 丁香亚洲综合激情啪啪综合| 成人性视频免费看| 黑丝美女久久久| 国产欧美综合视频| 亚洲人成毛片在线播放| 国产亚av手机在线观看| 国产精品一区电影| 欧美日韩破处| 成人午夜免费剧场| 美女视频黄a大片欧美| 国产精品久久不卡| 亚洲欧美一区二区三区久本道91| 久久精品无码av| 精品成人一区二区三区四区| 日日夜夜精品一区| 日韩av片永久免费网站| 成人性生交大片免费看96| 中文字幕成人一区| 欧美a级一区二区| 无码人妻精品一区二区三应用大全| 亚洲色图视频网站| 少妇又紧又色又爽又刺激视频| 日韩福利视频在线观看| 性爱视频在线播放| 成人欧美一区二区三区在线| 精品国产一区二区三区av片| 91黄色在线看| 国产成人av电影在线观看| 欧美视频一区二区在线| 色婷婷一区二区三区四区| 手机亚洲第一页| 97免费视频在线| 国产精品久久久久av蜜臀| 在线观看18视频网站| 国产一区视频在线看| 女同久久另类69精品国产| 欧美性受极品xxxx喷水| 黄网在线免费| 国产精品极品美女在线观看免费| 亚洲va久久久噜噜噜久久| a级黄色一级片| 成人av免费观看| 青青草av在线播放| 日韩精品亚洲视频| 蜜桃视频在线网站| 欧美日韩国产精品一区二区| 性高湖久久久久久久久| www.久久av| 在线日韩av片| 亚洲麻豆精品| 成人中文字幕+乱码+中文字幕| 亚洲成人国产| 中文字幕av一区二区三区人妻少妇| 亚洲精品免费电影| xxxx国产精品| 欧美风情在线观看| 精品自拍偷拍| 99久久激情视频| 中文字幕av免费专区久久| 91麻豆一区二区| 欧美极品美女视频网站在线观看免费| 一区二区三区四区精品视频| 日本欧美视频在线观看| 久久综合给合久久狠狠狠97色69| 欧美a视频在线观看| 最近2019中文字幕第三页视频| **精品中文字幕一区二区三区| 伊人久久在线观看| eeuss国产一区二区三区| 黄色片网站在线免费观看| 一本色道久久88精品综合| 亚洲欧美专区| 无码粉嫩虎白一线天在线观看| 2017欧美狠狠色| 一级黄色大片免费观看| 欧美成人四级hd版| 欧美日韩夜夜| 亚洲综合av在线播放| 亚洲大型综合色站| 久草福利在线视频| 91传媒视频在线观看| 国产精品色网| 久久国产高清视频| 亚洲国产天堂久久综合网| 91综合国产| 青青草成人免费在线视频| 国产日韩欧美亚洲| 99久久夜色精品国产亚洲| 欧亚精品中文字幕| 亚洲人体av| 久久精品国产亚洲AV熟女| 91精品国产色综合久久| 中文字幕乱码中文乱码51精品| 中日韩在线视频| 91免费视频网| 99国产揄拍国产精品| 青青精品视频播放| 女同性一区二区三区人了人一 | 国产精品久久久久国产a级|