精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個開源多模態Deep Research智能體,超越多個閉源方案

人工智能 新聞
WebWatcher不僅在單一任務維度實現領先,更在復合型任務、跨模態復雜推理及真實信息檢索等方面,奠定了新一代開源多模態Agent的領先地位。

首個開源多模態Deep Research Agent來了。

整合了網頁瀏覽、圖像搜索、代碼解釋器、內部 OCR 等多種工具,通過全自動流程生成高質量推理軌跡,并用冷啟動微調和強化學習優化決策,使模型在任務中能自主選擇合適的工具組合和推理路徑。

假設你讓一個 AI 回答這樣一個問題:

“在這張圖所示動物的 Wikipedia 頁面上,2020 年之前帶有 ‘visual edit’ 標簽的修訂次數是多少?”

聽起來不復雜,但要得到正確答案,需要經過多個環節:

1 從圖像中識別出動物(它是一只海鸚Atlantic puffin,而不是外形相似的鵜鶘、企鵝或海鷗)。2 找到對應的 Wikipedia 頁面并進入歷史版本記錄。3 篩選出 2020 年之前帶有 “visual edit” 標簽的版本,并進行精確計數。

從上面案例可以看出,要解決這類問題,光有感知和理解還不夠,Agent還需要能夠制定計劃、靈活調用不同工具、在推理過程中不斷驗證和修正方向。

這類跨模態、跨工具、多步驟的任務,需要具備深度研究(Deep Research)能力的Agent才能有效應對。

WebWatcher 的核心方法

WebWatcher 的技術方案覆蓋了從數據構建到訓練優化的完整鏈路,核心目標是讓多模態Agent在高難度多模態深度研究任務中具備靈活推理和多工具協作能力。整個方法包含三大環節:

1 多模態高難度數據生成:構建具備復雜推理鏈和信息模糊化的訓練數據;

2 高質量推理軌跡構建與后訓練:生成貼近真實多工具交互的推理軌跡,并通過監督微調(SFT)完成初步能力對齊。然后利用 GRPO 在復雜任務環境中進一步提升模型的決策能力與泛化性;

3 高難度基準評測:構建并使用 BrowseComp-VL 對模型的多模態深度推理能力進行驗證。

1. 多模態高難度數據生成

現有大多數 VQA 數據集集中于單步感知任務,缺乏規劃性與深度推理需求,難以支撐多模態深度研究代理的訓練。為此,研究團隊設計了一個全自動多模態數據生成流程,目標是在真實互聯網知識分布下生成復雜、跨模態、鏈路不確定的任務樣本。

隨機游走收集跨模態知識鏈研究團隊在多源網頁(文本、圖片、混合頁面)中進行隨機游走采樣,構建多領域實體圖譜。不同于傳統的線性多跳問答鏈,這種圖譜連接稠密、路徑不固定,問題的解決路線難以預設,逼迫模型探索性地組合視覺信息。

信息模糊化提升不確定性在生成問題時,研究團隊刻意隱藏關鍵信息(如將“2019 年”替換為“21 世紀初”、將實體名改為描述性短語),并在視覺部分引入模糊指代詞描述,使得模型無法依賴簡單模式匹配,必須進行跨模態推理。

文本-視覺聯合轉換所有復雜問題(QA) 樣本通過 QA-to-VQA 轉換模塊擴展為多模態版本,將圖譜中的部分實體或關系替換為圖片、圖表或網頁截圖,使問題天然依賴跨模態理解能力。經過多階段過濾,包括語義合理性檢查、視覺相關性驗證、推理鏈長度控制,研究團隊得到了一個大規模、高質量的多模態推理數據集,能夠覆蓋多種復雜推理模式。

2. 高質量推理軌跡構建與后訓練

在高難度訓練數據的基礎上,模型還需要學習如何調用工具和如何在推理中動態切換策略。然而,現有推理模型在長鏈多工具任務中存在兩個問題:

1 思維鏈條冗長、模板化,缺乏跨任務的適應性;2 工具調用格式和角色差異大,直接采集到的軌跡難以直接用于訓練。

為此,研究團隊提出了Action-Observation 驅動的軌跡生成方法

  • 收集真實的多工具交互軌跡;
  • 保留其 Action-Observation 結構,但控制 Thought 部分,確保每一步推理都簡潔、行動導向,而非冗長的模板化解釋;
  • 使用規則過濾與 LLM 輔助審查,剔除低質量軌跡。

隨后,研究團隊基于這些高質量軌跡進行監督微調(SFT),讓 WebWatcher 在訓練初期快速掌握多模態 ReAct 式推理和工具調用的基本模式,為后續的強化學習階段打下基礎。

在完成冷啟動后,WebWatcher進入強化學習階段,用GRPO進一步提升多模態Agent在復雜環境下的決策能力。模型嚴格結合格式正確性與答案準確性雙重標準設計獎勵,對多步工具調用的連貫性和最終答案的準確性均予以關注,從而提升多模態決策鏈的可靠性。

3. BrowseComp-VL:多模態深度研究基準

為了全面驗證 WebWatcher 的能力,研究團隊提出了BrowseComp-VL,它是 BrowseComp 在視覺-語言任務上的擴展版本,設計目標是逼近人類專家的跨模態研究任務難度。該基準具有以下特點:

- 任務長且信息模糊化:問題往往包含多個模糊實體描述,需要跨網頁、跨模態搜索與整合;- 多工具協作必要性:任務無法僅靠感知或文本檢索完成,必須結合網頁瀏覽、圖像檢索、OCR、代碼執行等多種工具;- 真實網絡環境:測試樣本來自真實網頁與圖像資源,保持復雜性與不可預測性。

實驗結果:刷新多模態推理與信息檢索新紀錄

在多輪嚴格評測中,WebWatcher 在四大核心領域全面領先于當前主流的開源與閉源多模態大模型,顯示出其在復雜推理、信息檢索、知識整合以及聚合類信息尋優等任務上的強勁實力。

復雜推理(HLE-VL)在人類終極考試(Humanity’s Last Exam,HLE-VL)這一多步復雜推理基準上,WebWatcher以13.6%的Pass@1分數一舉奪魁,大幅領先于GPT-4o(9.8%)、Gemini2.5-flash(9.2%)、Qwen2.5-VL-72B(8.6%)等代表性模型。充分證明了其在高難度知識融合與鏈式決策中的推理能力。

信息檢索能力(MMSearch)在更貼近真實多模態搜索的MMSearch評測中,WebWatcher 同樣表現卓越,Pass@1得分高達55.3%,相比Gemini2.5-flash(43.9%)和GPT-4o(24.1%)等大幅領先,展現了極高的檢索精準性和復雜場景下的信息聚合能力。

知識+檢索整合(LiveVQA)LiveVQA是知識推理與外部信息獲取深度協同的典型場景。WebWatcher的Pass@1成績達到58.7%,領先Gemini2.5-flash(41.3%)、Qwen2.5-VL-72B(35.7%)和GPT-4o(34.0%),充分體現了其在知識調用、事實核查與實時信息融合等多維技能上的系統性優勢。

信息尋優與聚合(BrowseComp-VL)在最具綜合挑戰的BrowseComp-VL基準(信息聚合型任務)上,WebWatcher 以27.0%的平均得分(Pass@1)遙遙領先,于GPT-4o(13.4%)、Gemini2.5-flash(13.0%)、Qwen2.5-VL-72B(11.5%)、Claude-3.7(11.2%)等國內外主流旗艦模型,成績提升超過一倍。該基準涵蓋了跨網頁、多實體、模糊表達等嚴苛考驗,彰顯了WebWatcher 在復雜信息尋優與聚合領域的絕對能力優勢。

綜合來看,WebWatcher不僅在單一任務維度實現領先,更在復合型任務、跨模態復雜推理及真實信息檢索等方面,奠定了新一代開源多模態Agent的領先地位。

arxiv:https://arxiv.org/abs/2508.05748
github倉庫:https://github.com/Alibaba-NLP/WebAgent

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-06 14:17:11

模型訓練AI

2025-06-17 15:28:03

智能體AI開源

2025-09-17 14:47:51

2024-11-19 15:00:00

模型開源

2025-08-12 08:58:03

2025-07-25 10:31:52

2025-06-17 06:28:08

2025-07-04 16:50:07

工具AI模型

2025-11-06 09:03:00

2025-03-19 09:30:00

2025-04-10 09:15:00

模型AI數據

2025-05-06 08:40:00

2025-09-23 03:00:00

2024-10-15 17:28:05

2025-06-26 09:01:14

2025-07-08 09:22:31

2025-02-06 15:07:27

2025-05-26 09:49:59

多模態智能體RAG

2025-08-07 02:00:00

點贊
收藏

51CTO技術棧公眾號

亚洲图区在线| 欧美人与禽性xxxxx杂性| 模特精品在线| 久久精品视频导航| 亚洲一区二区在线免费| 欧美舌奴丨vk视频| 亚洲女人小视频在线观看| 国产日韩精品推荐| 最新中文字幕第一页| 欧美大片一区| 亚洲午夜色婷婷在线| 久久久久久久久久毛片| 亚洲精品mv| 一区二区三区在线看| 乱一区二区三区在线播放| 国产乱淫a∨片免费视频| 亚洲尤物在线| 欧美夫妻性视频| 污污视频网站在线免费观看| 精品精品精品| 日韩视频免费观看高清在线视频| 精品www久久久久奶水| 欧美极品少妇videossex| 欧美国产禁国产网站cc| 国产欧美一区二区三区不卡高清| 一级黄色大毛片| 午夜综合激情| 高清欧美电影在线| 国产精品国产精品88| 精品国产一区二区三区久久久樱花| 亚洲第一精品夜夜躁人人躁| 亚洲成人av免费观看| 成人精品国产| 色婷婷一区二区三区四区| 隔壁人妻偷人bd中字| 国产原厂视频在线观看| 国产精品天天摸av网| 免费av在线一区二区| 搡老岳熟女国产熟妇| 国产乱淫av一区二区三区| 国产精品一区二区三区在线播放| 一级成人黄色片| 国产亚洲在线| 午夜精品久久久久久久99热浪潮| 欧美成人精品欧美一级私黄| 亚洲欧美色图| 久久久999精品| 精品伦精品一区二区三区视频密桃 | 无码国产精品96久久久久| 久久99精品国产91久久来源| 国产精品久久久久秋霞鲁丝 | 天使萌一区二区三区免费观看| 97福利一区二区| 日本一级一片免费视频| 在线不卡亚洲| 91av在线看| 秋霞精品一区二区三区| 裸体素人女欧美日韩| 青青a在线精品免费观看| av图片在线观看| 久久综合九色| 国产欧美日韩精品丝袜高跟鞋| 亚洲中文一区二区三区| 国产一区二区成人久久免费影院| 91超碰rencao97精品| 性中国古装videossex| 国产不卡在线视频| 精品国产第一页| 黄色免费在线播放| 中文字幕一区二区三区乱码在线 | 欧美区在线观看| 国产欧美激情视频| av在线亚洲色图| 日韩精品在线影院| 六月婷婷七月丁香| 国产精品毛片久久| 欧美激情在线观看| 国产农村妇女aaaaa视频| 日日夜夜精品免费视频| 国产综合福利在线| 亚洲乱码国产乱码精品精软件| 91在线国产观看| 亚洲国产精品久久久久久女王| 含羞草www国产在线视频| 亚洲高清视频中文字幕| 国产精品亚洲αv天堂无码| 成人国产精品| 精品久久久久久久久久久久包黑料 | 亚洲经典一区二区三区| 99精品桃花视频在线观看| 日韩视频精品| 欧洲在线视频| 欧美性猛片xxxx免费看久爱| 免费不卡av网站| 亚洲国产合集| 欧美日韩不卡合集视频| 亚洲 欧美 中文字幕| 韩国欧美国产1区| 欧美1o一11sex性hdhd| 黄色成人在线| 在线免费视频一区二区| www日本在线观看| 欧美男gay| 久久久久久久一| 一区二区三区亚洲视频| 91色视频在线| 激情六月天婷婷| 国产成人福利夜色影视| 亚洲激情视频在线| 破处女黄色一级片| 日欧美一区二区| 黄色国产精品一区二区三区| 欧美性videos| 欧洲精品视频在线观看| 在线免费看黄色片| 亚洲一级淫片| 国产欧亚日韩视频| 欧美日韩在线中文字幕| 亚洲高清在线视频| 国产成人av免费观看| 成人精品久久| 日本精品免费一区二区三区| 国产小视频一区| 日韩美女久久久| 中文字幕一区二区三区四区在线视频| 清纯唯美亚洲经典中文字幕| 色与欲影视天天看综合网| 一区二区的视频| 国产人成亚洲第一网站在线播放| 97视频久久久| 精品一区二区男人吃奶| 久久久久久久激情视频| 精品国产999久久久免费| 最新热久久免费视频| 国产喷水theporn| 狠狠操综合网| 国产精品劲爆视频| 成人精品一区| 欧美视频在线一区二区三区| 国产伦理片在线观看| 久久成人精品| 欧美成熟毛茸茸复古| 九色porny自拍视频在线播放| 日韩欧美国产麻豆| 久久伊人成人网| 国产成人精品三级| 大荫蒂性生交片| 红杏成人性视频免费看| 欧美高清视频在线| 人妻无码中文字幕免费视频蜜桃| 亚洲国产欧美一区二区三区丁香婷| 日本一区二区免费视频| 伊人蜜桃色噜噜激情综合| 国产精品免费视频一区二区| av老司机在线观看| 日韩成人中文字幕| 亚洲熟女综合色一区二区三区| 久久人人超碰精品| 亚洲最大综合网| 99精品综合| 69174成人网| 麻豆成全视频免费观看在线看| 亚洲男人天堂2023| 中文字幕乱码视频| 日韩毛片精品高清免费| 日本精品一二三区| 国产一区91| 五月天亚洲综合| 精品中文在线| 97国产在线视频| 国产露出视频在线观看| 欧美日韩一区二区三区视频| 日韩一级片av| 91在线国产福利| 91福利国产成人精品播放| 91精品国产自产在线观看永久∴| 99国产在线视频| 成人影院网站| 久久亚洲精品国产亚洲老地址| 高潮一区二区三区乱码| 日韩欧美在线中文字幕| 亚洲女人久久久| 波多野结衣在线aⅴ中文字幕不卡| 人妻有码中文字幕| 婷婷精品进入| 精品无人区一区二区三区竹菊 | 亚洲经典自拍| 色噜噜狠狠一区二区三区| www.久久草.com| 91po在线观看91精品国产性色| a视频网址在线观看| 欧美一区二区在线看| 精品在线播放视频| 亚洲色大成网站www久久九九| 国产精品成人99一区无码| 日本成人在线一区| 国产真人做爰毛片视频直播| 日韩综合网站| 精品久久久久久乱码天堂| 色噜噜成人av在线| 欧美在线视频免费| www免费在线观看| 亚洲人高潮女人毛茸茸| 亚洲精品字幕在线观看| 欧美美女一区二区| 免费污污视频在线观看| 一区二区在线免费观看| 国产一级久久久久毛片精品| 国产91丝袜在线播放| 羞羞的视频在线| 久久久久国产精品一区三寸| 无码人妻精品一区二区蜜桃网站| 日韩中文欧美| 日本一区二区视频| 欧美成人基地| 成人3d动漫一区二区三区91| 久久精品国产精品亚洲毛片| 欧美最猛性xxxx| 超碰成人av| 久久久久一本一区二区青青蜜月| 国产激情视频在线观看| 中日韩美女免费视频网站在线观看 | 精品亚洲精品福利线在观看| 成人免费观看在线视频| 91精品在线免费观看| 欧美brazzers| 一本色道久久综合亚洲91| 日韩欧美性视频| 亚洲第一成年网| 久久久夜色精品| 亚洲精品视频免费看| chinese全程对白| 国产精品国产自产拍高清av| 色欲狠狠躁天天躁无码中文字幕 | 中文字幕一区二区三区手机版 | 99国产成人精品| 欧美精品v国产精品v日韩精品 | 男人的天堂免费在线视频| 久久免费视频网站| 爱看av在线入口| 久久久亚洲天堂| 成人高潮aa毛片免费| 欧美激情国产精品| wwwwxxxx在线观看| 国模吧一区二区| 99在线视频影院| 欧美一级电影在线| 色婷婷综合久久久中字幕精品久久| 2019中文字幕在线免费观看| 天堂√中文最新版在线| 欧美综合在线第二页| 欧美www.| 国产综合香蕉五月婷在线| 久久综合给合| 动漫一区二区在线| 久久资源综合| 欧美日韩一区二区视频在线| 欧美日韩在线网站| 中文字幕一区二区三区精彩视频| 亚洲国产精品综合久久久 | 日韩欧美一区在线| 亚洲精品一级片| 亚洲精品aⅴ中文字幕乱码 | 国产人成亚洲第一网站在线播放| 国产jizz18女人高潮| 亚洲精品中文字幕在线观看| 欧美成人三级在线观看| 香港成人在线视频| 国产在线一级片| 91麻豆精品91久久久久久清纯 | 亚洲熟妇av乱码在线观看| 欧美疯狂做受xxxx富婆| 成人免费公开视频| 亚洲视频在线免费看| 免费网站看v片在线a| 欧美大片在线影院| 欧美片第一页| 亚洲在线免费观看| 中文有码一区| 日韩国产精品毛片| 亚洲深爱激情| 污污的视频免费| kk眼镜猥琐国模调教系列一区二区 | 丝袜老师办公室里做好紧好爽 | 欧美性猛交xxxxx水多| 又污又黄的网站| 精品国产精品一区二区夜夜嗨| 高清性色生活片在线观看| 欧美国产视频一区二区| 国产高清不卡| 91久久偷偷做嫩草影院| 伊人久久大香线蕉综合网蜜芽| 中文字幕一区二区三区四区五区人| 亚洲清纯自拍| 激情在线观看视频| 久久久久久综合| 国产无遮挡免费视频| 欧美日韩五月天| 亚洲欧洲国产综合| 九色精品美女在线| 国产精品亚洲d| 国产视频一区二区三区四区| 日本电影一区二区| 青青青免费在线| 国产高清不卡二三区| 美国美女黄色片| 精品久久久久久久久久久久久| 国产一区二区三区中文字幕 | 人人妻人人澡人人爽| 婷婷夜色潮精品综合在线| 国产特级aaaaaa大片| 在线激情影院一区| 性欧美18xxxhd| 国产精品视频入口| 久久精品青草| 2025韩国理伦片在线观看| 97久久精品人人做人人爽| 欧美精品videos极品| 欧美猛男超大videosgay| 国产高清免费av在线| 欧美与黑人午夜性猛交久久久| 一区二区三区国产好| 欧美一级特黄aaaaaa在线看片| 美国欧美日韩国产在线播放| brazzers精品成人一区| 午夜精品久久久久久久| 丰满人妻妇伦又伦精品国产| 欧美成人激情视频| 先锋影音一区二区| 四虎永久国产精品| 日韩av一区二区三区四区| 泷泽萝拉在线播放| 欧美视频一二三| 天堂资源中文在线| 68精品久久久久久欧美| 精品福利一区| 国产视频九色蝌蚪| 91麻豆国产自产在线观看| 国产精品久久久久久久妇| 精品在线小视频| 深夜av在线| 欧美高清视频一区二区三区在线观看| 亚洲欧美卡通另类91av| 双性尿奴穿贞c带憋尿| 精品久久中文字幕| 日本v片在线免费观看| 青青在线视频一区二区三区| 久久99国产精品视频| 精品www久久久久奶水| 国产精品毛片久久久久久久| 一本久道久久综合无码中文| 久久久999精品免费| 国产精品日本一区二区不卡视频| 国产日韩欧美大片| 国产成人免费视频网站高清观看视频 | 国产剧情在线观看一区| 爱情岛论坛成人| 日本一区二区成人| 一级片aaaa| 欧美巨大黑人极品精男| 97se亚洲| 成年人黄色片视频| 国产精品妹子av| 99久久免费国产精精品| 久久久久国产视频| 蜜桃国内精品久久久久软件9| 精品久久久久久中文字幕2017| 国产精品欧美综合在线| www.黄色av| 欧美一区二三区| 97人人精品| av天堂一区二区| 91福利视频网站| av在线免费播放| 久久久久久久久久久久久9999| 日韩二区三区在线观看| 91插插插插插插| 亚洲精品日韩久久久| 四虎精品一区二区免费| 免费在线黄网站| 欧美激情在线一区二区| 午夜精品久久久久久久96蜜桃| 国产91精品久久久久久久| 日本欧美视频| 制服丝袜在线第一页| 欧美手机在线视频| 多野结衣av一区| 亚洲人体一区| 99天天综合性| 国产精品呻吟久久| 欧美又大又粗又长| 伊人久久大香线蕉综合四虎小说 | 日本不卡一区在线| 亚洲午夜激情av| 欧美videos极品另类| 久久青青草原一区二区| 国产一区二区三区黄视频| 懂色av蜜臀av粉嫩av分享吧最新章节| 欧美成人黑人xx视频免费观看| 国产午夜一区|