精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

阿里智能體多輪推理超越GPT-4o,開源模型也能做Deep Research

人工智能 新聞
WebDancer 通過系統化的訓練范式——涵蓋從數據構建到算法設計的全流程——為構建具備長期信息檢索能力的智能體提供了明確路徑。

能夠完成多步信息檢索任務,涵蓋多輪推理與連續動作執行的智能體來了。

通義實驗室推出WebWalker(ACL2025)續作自主信息檢索智能體WebDancer。

WebDancer 通過系統化的訓練范式——涵蓋從數據構建到算法設計的全流程——為構建具備長期信息檢索能力的智能體提供了明確路徑。

同時,該框架也為在開源模型上復現Deep Research系統提供了可行的指導。團隊將進一步在更開放的環境中、結合更多工具,持續拓展和集成Agentic能力,推動通用智能體的落地與演進。

圖片

一、背景:信息檢索的新需求與挑戰

在信息爆炸的時代,傳統的搜索引擎已難以滿足用戶對深層次、多步驟信息獲取的需求。從醫學研究到科技創新,從商業決策到學術探索,復雜問題的解決需要深入的信息挖掘和多步推理能力。這催生了對能夠自主思考、自主決策的智能體的需求。

然而,構建這樣的智能體面臨諸多挑戰:

  • 理解復雜網頁內容:智能體需要具備解析和理解多樣化網頁結構和內容的能力。
  • 多步決策與推理:能夠進行任務分解、知識回溯和反復驗證,完成復雜的信息檢索任務。
  • 適應開放動態環境:面對不斷變化的網絡環境,智能體需要具備強大的適應能力。
  • 自主行動:智能體應能自主采取行動并進行自我修正。

二、突破訓練數據難獲得問題

在自主信息檢索領域,高質量的訓練數據至關重要。然而,現有的數據集如2WIKI,HotpotQA多為淺層次問題,難以支持復雜多步推理的訓練需求。

為解決數據稀缺問題,WebDancer提出了兩種創新的數據合成方法:

  • CRAWLQA:通過模擬人類瀏覽行為,從權威網站(如arXiv、GitHub、Wikipedia等)中爬取網頁信息,生成復雜的問答對,確保數據的多樣性和真實性。這一技術方案與中稿在ACL2025的WebWalker類似。
  • E2HQA:采用“由簡到難”的策略,從簡單問題出發,逐步增加問題的復雜度,構建多步推理的問答對,促進智能體能力的逐步進化。為了保證QA對的合法驗證保持答案不變,對問題進行改寫。

ReAct框架與思維鏈蒸餾

ReAct框架是WebDancer 的基礎。一個ReAct軌跡包含多個思考-行動-觀察 (Thought-Action-Observation) 循環。智能體生成Thought(自由形式的思考),Action(結構化的行動,用于與環境工具互動),并接收Observation(來自環境的反饋)。這個過程迭代進行,直到任務完成,最終行動是 answer??赡艿男袆影╯earch,visit和answer。

思考鏈 (Chain-of-Thought, CoT) 對于智能體的執行至關重要,它使得高層工作流規劃、自我反思、信息提取和行動規劃成為可能。

論文探索了構建短CoT和長CoT的方法。對于短CoT,直接使用強大的模型(如 GPT-4o)在ReAct框架下生成軌跡。對于長CoT,則順序地向推理模型 (LRM) 提供歷史行動和觀察,讓其自主決定下一步行動,并記錄其中間推理過程作為當前的Thought。

在獲得問答對后,WebDancer利用ReAct框架,結合閉源的GPT-4o和開源的QwQ模型,進行長短思維鏈的蒸餾,生成高質量的agentic數據。這種方式簡潔高效,滿足了對Agentic Model的需求。

數據過濾與質量提升

為了確保數據質量,WebDancer采用了多階段的數據過濾策略:

  • 有效性控制:剔除不符合指令的數據。
  • 正確性驗證:僅保留結果正確的數據。
  • 質量評估:通過規則過濾掉出現嚴重repetition或思考冗余的數據,確保數據的多樣性和邏輯性。

這些嚴格的過濾策略,確保了訓練數據的高質量,為智能體的高效學習提供了保障。

圖片

三、解決開放網絡環境難訓練

在開放環境中訓練智能體是一項極具挑戰性的任務。網絡環境的動態變化和部分可觀測性,使得智能體需要具備強大的適應能力和泛化能力。

為應對這些挑戰,WebDancer采用了兩階段的訓練策略:

  • 監督微調(SFT)在高質量軌跡數據上進行微調,使智能體快速適應任務需求,掌握在復雜環境中進行推理和決策的能力。為了避免外部反饋(Observation)的干擾,損失函數會屏蔽掉 Observation 的貢獻,只計算智能體自主決策步驟(Thought 和 Action)的損失。這已被證明能提高性能和魯棒性。
  • 強化學習(RL)通過與環境的交互,智能體不斷試錯,學習在復雜多變的環境中做出最優決策。WebDancer采用了先進的DAPO算法,動態采樣未被充分利用的數據對,提高數據效率和策略的魯棒性。DAPO 通過最大化一個目標函數來進行策略更新,該目標函數考慮了候選軌跡的獎勵和優勢項。優勢項基于批次內的原始獎勵值進行歸一化計算。

WebDancer通過動態采樣機制,優先采樣那些未被充分利用的數據對,確保數據的高效利用,增強了智能體的泛化能力。

強化學習階段的高計算成本和時間開銷一直是開放環境訓練的一大難題。WebDancer通過優化算法和硬件資源的高效利用,顯著降低了強化學習的成本。

圖片

四、實驗與結果

WebDancer的創新策略在多個信息檢索基準測試中得到了充分驗證。

GAIA 數據集

GAIA數據集旨在評估通用人工智能助手在復雜信息檢索任務上的表現。WebDancer在GAIA數據集上的表現尤為突出,在不同難度的任務中均取得了高分,展現了其強大的泛化能力。

WebWalkerQA 數據集

WebWalkerQA數據集專注于深度網絡信息檢索。WebDancer在該數據集上的表現同樣出色,尤其是在中等難度和高難度任務中,其性能提升更為明顯。

圖片

表現最佳的模型在GAIA基準測試中達到了61.1%的Pass@3分數,在WebWalkerQA基準測試中達到了54.6%的Pass@3分數。

BrowseComp 數據集

在更具挑戰性的BrowseComp(英文)和BrowseComp-zh(中文)數據集上,WebDancer同樣展現出了強大的性能,進一步證明了其在處理復雜信息檢索任務方面的魯棒性和有效性。

圖片

五、深入分析:Agent模型的訓練

實驗一分析:

強化學習(RL)在提升普通指令模型(Instruction Model)性能方面表現顯著,尤其在提升Pass@1采樣準確率方面效果突出,其效果甚至可接近Pass@3。

然而,對于如QwQ這類以推理為核心的模型,RL的提升效果相對有限,主要體現在采樣結果的穩定性上。這一差異可能與agentic 任務中決策軌跡較長、推理過程更復雜有關。

圖片

實驗二分析:

Agentic數據的質量遠比數量更為關鍵。

團隊在QwQ模型上僅使用約6000條高質量、具備長思維鏈的訓練數據,就在GAIA任務中取得了優異的效果,表明精細構造的思維軌跡在復雜任務中的價值遠高于海量但粗糙的數據。

圖片

實驗三分析:

長短思維鏈的模式在不同類型模型之間并不具備良好的可遷移性。

盡管長思維鏈對指令模型和推理模型均能帶來性能提升,但其同時也顯著增加了非法生成(如重復內容)的概率,尤其在參數規模較小的模型上更為嚴重。這表明在設計長思維鏈訓練數據時,需要在有效性與體驗感之間做好平衡。

圖片

六、未來展望

更多工具的集成

目前,WebDancer僅集成了兩種基本的信息檢索工具,未來計劃引入更多復雜的工具,如瀏覽器建模和Python沙盒環境,使智能體能夠執行更復雜的任務。

任務泛化與基準擴展

目前的實驗主要集中在短答案信息檢索任務上,未來WebDancer將擴展到開放域的長文本寫作任務,對智能體的推理能力和生成能力提出更高的要求。

在本研究中,致力于從頭訓練一個具備強大Agent能力的模型,重點探索如何在開源體系中構建高效的Agentic模型架構。這不僅有助于推動智能體模型的開源進程,也對于理解智能體在開放環境中如何涌現與擴展(scale)其能力具有基礎性意義。

采用原生的ReAct框架,強調簡潔性與通用性,體現了“大道至簡”的工程理念。所謂Agentic模型,指的是那些天生支持推理、決策及多步工具調用的基礎模型(foundation models)。能夠僅憑任務描述提示,即可展現出如規劃、自我反思、行動執行等一系列突現能力(emergent capabilities),從而在交互式環境中表現出近似智能體的行為。

近年來,系統如DeepSearch和DeepResearch顯示出強大底層模型如何作為智能體核心,通過其原生支持的工具調用與迭代式推理,完成自主的網絡環境交互。然而,考慮到網絡環境的動態性與部分可觀測性,強化學習(RL)在提升智能體的適應性與魯棒性方面起到了關鍵作用。

因此,團隊的目標是通過針對性的后訓練(post-training),在開源基礎模型中激發出更具通用性與自主性的Agent能力,從而為構建可持續、可控的智能體生態奠定基礎。

論文鏈接:https://arxiv.org/pdf/2505.22648
代碼鏈接:https://github.com/Alibaba-NLP/WebAgent

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-04 08:42:27

2025-08-18 08:30:00

AI模型開源

2024-12-26 07:10:00

2024-08-30 14:35:00

2025-11-06 08:55:00

2024-09-06 13:00:29

2024-11-11 09:47:00

AI開源

2025-08-07 14:05:40

OpenAI大模型開源

2025-08-21 16:01:58

2024-10-06 09:00:00

AI訓練數據

2024-11-12 14:00:00

AI編程

2024-11-22 14:10:00

AI智能體

2025-04-11 09:10:00

模型開源AI

2025-08-05 09:15:15

2025-04-08 02:26:00

2025-06-27 16:06:55

AI網絡模型

2024-09-29 13:07:16

2025-05-26 09:05:00

2025-06-17 15:28:03

智能體AI開源

2024-08-14 14:30:00

AI訓練
點贊
收藏

51CTO技術棧公眾號

久久精品亚洲一区二区三区浴池| 午夜宅男久久久| 欧美一卡二卡在线| 青青草国产免费| 蝌蚪视频在线播放| 激情综合色播激情啊| 欧美国产日本在线| 巨胸大乳www视频免费观看| 91天天综合| 亚洲国产日韩综合久久精品| 日产精品久久久一区二区| 国产精品无码专区av免费播放| 亚洲第一毛片| 日韩一二三在线视频播| 中文字幕在线播放一区| 国产精品1区| 91国在线观看| 精品少妇人欧美激情在线观看| av中文字幕在线| av一二三不卡影片| 91亚洲精品久久久| 亚洲欧美日韩激情| 亚洲激情亚洲| 欧美大片va欧美在线播放| 国产精品高清无码在线观看| 成人黄色av网址| 91精品视频网| 伊人国产在线视频| 东京一区二区| 午夜精品久久久久久| 欧美日韩视频免费在线观看| 国产永久免费高清在线观看| proumb性欧美在线观看| 91情侣偷在线精品国产| 成人黄色三级视频| 老司机一区二区三区| 九九精品视频在线| 极品久久久久久| 天天影视综合| 综合网日日天干夜夜久久| 蜜桃精品成人影片| 欧美亚洲色图校园春色| 精品黑人一区二区三区久久| 日本黄色福利视频| 青娱乐极品盛宴一区二区| 日韩欧美极品在线观看| 国产成人在线免费看| 国产蜜臀在线| 午夜亚洲福利老司机| 99久久免费观看| 天堂8中文在线| 一区二区三区色| 波多野结衣av一区二区全免费观看| 黄色网页在线免费观看| 中文字幕在线不卡国产视频| 一本色道久久综合亚洲二区三区| 丁香在线视频| 欧美激情一区二区三区在线| 亚洲成人自拍视频| gogogo高清在线观看免费完整版| 国产欧美日韩另类视频免费观看| 快播日韩欧美| 深夜福利在线视频| 久久亚洲春色中文字幕久久久| 蜜桃网站成人| av在线日韩国产精品| 国产精品成人免费| 国产日韩第一页| 精灵使的剑舞无删减版在线观看| 午夜精品成人在线视频| 人人妻人人添人人爽欧美一区| 亚洲女同志freevdieo| 欧美日韩亚洲天堂| 日韩中文字幕组| 欧美一级免费| 欧美成人精品3d动漫h| 国产精品日日摸夜夜爽| 色婷婷久久久| 中文字幕精品av| 九九热国产精品视频| 亚洲精品乱码| 国产精品极品美女粉嫩高清在线| 夜夜躁很很躁日日躁麻豆| 国产91综合一区在线观看| 精品国产免费一区二区三区| 国产视频第一区| 亚洲免费在线电影| 日韩少妇内射免费播放18禁裸乳| 99re久久| 精品国精品国产| 亚洲最大成人综合网| 国产精品videosex性欧美| 韩国v欧美v日本v亚洲| 青青视频在线免费观看| 激情国产一区二区| 欧美精品一区二区视频| 五月婷婷在线观看| 午夜在线成人av| 亚洲综合av在线播放| 盗摄牛牛av影视一区二区| 在线丨暗呦小u女国产精品| 波多野结衣不卡视频| 久久综合狠狠| 国产精品一区二区三区精品| 国产理论电影在线观看| 亚洲女爱视频在线| 无码人妻丰满熟妇区毛片| 久久一级大片| 一区二区国产精品视频| 久草视频免费播放| 秋霞成人午夜伦在线观看| 春色成人在线视频| 调教视频免费在线观看| 欧美日韩国产一区中文午夜| 手机看片一级片| 日韩深夜福利| 欧美极品欧美精品欧美视频| 中文字幕在线视频第一页| 不卡一区在线观看| 樱空桃在线播放| 欧美性生活一级| 亚洲一区www| 国产精品午夜影院| 国产精品白丝jk黑袜喷水| 无遮挡亚洲一区| 大胆人体一区二区| 亚洲精品第一页| 青青草成人免费| 九色porny丨国产精品| 日产精品一线二线三线芒果 | 亚洲色图色老头| 国产香蕉在线视频| 国产suv精品一区二区6| 黑人巨大国产9丨视频| 国产精品原创视频| 有码中文亚洲精品| 亚洲中文字幕无码爆乳av| 99久久国产综合精品女不卡| 亚洲理论电影在线观看| 51精品国产| 久久久久久久电影一区| 亚洲第九十九页| 亚洲综合成人网| 国产裸体视频网站| 午夜精品剧场| 成人欧美一区二区三区视频 | 91精品国产91久久久久久久久| av老司机久久| 亚洲综合丝袜美腿| 风韵丰满熟妇啪啪区老熟熟女| 综合亚洲视频| 91久久国产综合久久蜜月精品| 性xxxfreexxxx性欧美| 欧美一卡二卡三卡| 麻豆国产尤物av尤物在线观看| 国产精品2024| 国产在线xxxx| 欧美国产极品| 国产成人自拍视频在线观看| 国产精品视频一区二区久久| 欧洲激情一区二区| 性少妇xx生活| 国产精品影视网| 青青在线免费观看| 日韩精品丝袜美腿| 日韩av电影手机在线观看| 国产剧情在线观看| 欧美乱妇15p| 久久久久久久久久99| 成人一区二区三区视频在线观看| 熟女少妇在线视频播放| 国产亚洲欧美日韩在线观看一区二区| 国产精品免费久久久久影院| 米奇精品一区二区三区| 精品国产亚洲一区二区三区在线观看| 97超碰人人干| 国产欧美一区二区精品忘忧草| 中文字幕精品一区二区三区在线| 国产精品v亚洲精品v日韩精品 | 色综合久久久久综合体桃花网| www.av天天| 国产在线国偷精品免费看| 91视频 - 88av| 精品一区亚洲| 亚洲已满18点击进入在线看片| 大香伊人久久| 中文字幕日韩欧美精品在线观看| 国产成人精品亚洲精品色欲| 午夜久久久久久电影| 蜜桃av免费在线观看| 国产精品538一区二区在线| 国产白丝袜美女久久久久| 久久精品不卡| 精品国产综合久久| 亚洲热av色在线播放| 久久久久久伊人| 1pondo在线播放免费| 亚洲第一区在线观看| 中文字幕理论片| 午夜伊人狠狠久久| tube国产麻豆| 欧美激情一区三区| 自拍视频一区二区| 国产乱码精品一区二区三区av| 国产乱子夫妻xx黑人xyx真爽| 亚洲精品888| 天天爽天天狠久久久| 欧美福利在线播放网址导航| 亚洲精品免费一区二区三区| 国产精品高清乱码在线观看| 欧美放荡办公室videos4k| 91在线直播| 亚洲男人天堂久| 亚洲精品无amm毛片| 欧美日韩视频在线第一区| 日韩三级小视频| 亚洲午夜影视影院在线观看| 女同久久另类69精品国产| 国产视频一区二区在线| 99精品一区二区三区无码吞精| 久久99精品久久久久久动态图| 亚洲熟妇av一区二区三区| 国产精品xvideos88| 中文字幕久久一区| 国内黄色精品| 欧美另类一区| 香蕉视频一区| 久久手机视频| 香蕉国产成人午夜av影院| 久久99精品久久久久久秒播放器 | 日韩精品一区二区三区四| 久久亚洲影视| 亚洲欧美日产图| 欧美色女视频| 台湾成人av| 日韩系列欧美系列| 亚洲狠狠婷婷综合久久久| 国产91一区| 欧美主播一区二区三区美女 久久精品人| 成午夜精品一区二区三区软件| 亚洲综合中文字幕在线| 国产专区精品| aaa级精品久久久国产片| 精品91福利视频| 亚洲一区二区三区在线免费观看| 国产免费区一区二区三视频免费 | 老牛影视av一区二区在线观看 | 久久精品不卡| 91手机视频在线| 欧美在线播放| 青青在线免费观看| 国产精品三上| 黑森林福利视频导航| 久久精品观看| 在线观看亚洲色图| 精品一区二区三区视频在线观看| 污污网站在线观看视频| 国产精品99久| 欧美图片自拍偷拍| 波多野结衣中文字幕一区| 国产福利在线观看视频| 久久美女艺术照精彩视频福利播放| 日韩乱码人妻无码中文字幕久久| 久久久久久久免费视频了| 色婷婷国产精品免| 综合久久久久综合| 久草免费新视频| 欧美性xxxx极品hd满灌| 国产情侣免费视频| 91精品国产福利| 欧美亚洲精品在线观看| 亚洲欧美国产精品| 国产精品久久麻豆| 97久久精品国产| 成人在线不卡| 国产精品xxxx| 欧洲视频一区| 欧洲精品在线播放| 日日摸夜夜添夜夜添国产精品| 中文字幕中文在线| aaa欧美日韩| 午夜国产福利视频| 亚洲高清不卡在线| 少妇无套内谢久久久久| 日韩欧美一二三区| 国产永久av在线| 欧美精品videossex性护士| 欧美色网一区| 91成人免费视频| 欧美日韩xxxx| 日本男女交配视频| 青青草原综合久久大伊人精品优势| 婷婷激情小说网| 久久一二三国产| 国模无码国产精品视频| 日韩人在线观看| 国内精品久久久久久久久久久| 精品视频www| 神马午夜伦理不卡| 国产欧美精品xxxx另类| 欧美精品中文| 免费极品av一视觉盛宴| 日av在线不卡| 大地资源二中文在线影视观看| 成人欧美一区二区三区黑人麻豆| 中文字幕精品三级久久久| 日韩一区二区在线播放| 95在线视频| 日本视频久久久| 国产精品白丝一区二区三区| 在线视频一区观看| 日韩一区精品视频| 香蕉视频黄色在线观看| 亚洲影视在线播放| 国产精品欧美激情在线| 亚洲午夜精品视频| 高清在线视频不卡| 91精品久久香蕉国产线看观看| 久久综合av| 波多结衣在线观看| 久久久久久毛片| 亚洲天堂av片| 日韩av影片在线观看| 欧美寡妇性猛交xxx免费| 成人春色激情网| 91综合网人人| 日本中文字幕精品—区二区| 久久精品欧美一区二区三区不卡 | 青青草原免费观看| 欧美另类久久久品| 日韩美女网站| 国产精品视频久久久久| av资源久久| 激情五月婷婷久久| 国产日韩欧美亚洲| 天堂网一区二区| 中文字幕国产精品久久| 成人日韩av| 亚洲a∨一区二区三区| 日韩电影在线一区二区| 日本少妇高潮喷水xxxxxxx| 色婷婷av一区二区| av网站在线播放| 国产欧美久久久久久| 青草国产精品| 人人爽人人爽av| 亚洲精品日日夜夜| 亚洲av无码乱码在线观看性色| 欧美成人h版在线观看| 清纯唯美激情亚洲| 国产精品精品国产| 99久久精品久久亚洲精品| www.久久久.com| 国产欧美视频一区二区三区| 国产午夜精品美女视频明星a级| 欧美牲交a欧美牲交aⅴ免费下载| av中文在线| 日韩精品亚洲aⅴ在线影院| 亚洲免费在线视频| 视频一区二区视频| 91九色国产在线播放| 欧美视频第一页| 国产日韩欧美久久| 中文字幕一区二区三区四区久久| 亚洲成人教育av| 成人欧美一区二区三区黑人一| 国产精品a级| 国产自摸综合网| 午夜18视频在线观看| 亚洲女人****多毛耸耸8| 日韩手机在线观看视频| 在线日韩成人| 日韩网站在线观看| 无码人妻精品一区二区三区9厂| 国产精品99久| 福利在线小视频| 久久麻豆视频| 国产一区二区欧美日韩| 国产香蕉视频在线| 粉嫩aⅴ一区二区三区四区| 久久久国产精华液999999| 国产综合色区在线观看| 日韩精品视频免费专区在线播放| 少妇愉情理伦三级| 牛牛影视一区二区三区免费看| 亚洲欧美激情一区| 日韩网红少妇无码视频香港| 国产不卡一区视频| www.欧美黄色| 成人性生交大片免费看96| 久久久久成人网| 亚洲精品久久久狠狠狠爱| 亚洲一区二区欧美日韩| 无码人妻久久一区二区三区蜜桃| 欧美日韩18| 久久久综合亚洲91久久98| 偷拍视频一区二区三区| 日韩在线观看网站| 国产手机av在线| 婷婷综合久久一区二区三区|