精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

「邊思考、邊搜索、邊寫作」WebThinker開啟AI搜索&研究新紀元!

人工智能 新聞
深度研究智能體?WebThinker?賦予 LRM 在推理中自主搜索網絡、導航網頁及撰寫報告的能力。

李曉熙目前就讀于中國人民大學高瓴人工智能學院,博士二年級,導師為竇志成教授,研究方向主要包括檢索增強生成、大語言模型推理等。在國際頂級會議和期刊如 AAAI,SIGIR,TOIS 等發表多篇論文,代表工作包括 Search-o1, WebThinker, RetroLLM, GenIR-Survey, CorpusLM, UniGen 等。共同第一作者還包括人大高瓴博士生金佳杰和董冠廷。本文的通信作者為人大竇志成教授。

大型推理模型(如 OpenAI-o1、DeepSeek-R1)展現了強大的推理能力,但其靜態知識限制了在復雜知識密集型任務及全面報告生成中的表現。為應對此挑戰,深度研究智能體 WebThinker 賦予 LRM 在推理中自主搜索網絡、導航網頁及撰寫報告的能力。WebThinker 集成了深度網頁探索器,使 LRM 能自主搜索、導航并提取信息;自主思考 - 搜索 - 寫作策略無縫融合推理、信息收集與實時報告寫作;并結合強化學習訓練優化工具調用。實驗表明,WebThinker 在 GPQA、GAIA、WebWalkerQA、HLE 等復雜推理基準及 Glaive 研究報告生成任務中展現出強大性能,顯著提升了 LRM 在復雜場景下的適用性與可靠性,為構建更強大、通用的深度研究系統奠定了堅實基礎。

圖片

  • 論文標題: WebThinker: Empowering Large Reasoning Models with Deep Research Capability
  • 論文鏈接: https://arxiv.org/abs/2504.21776
  • 代碼倉庫: https://github.com/RUC-NLPIR/WebThinker

Demo

1. OpenAI 有哪些模型?它們有什么區別?

2. 2025 年我能投稿哪些 AI 頂會?

研究動機:賦予推理模型深度研究能力

大型推理模型如 OpenAI-o1 和 DeepSeek-R1 在數學、編程和科學等領域展現了卓越的推理能力。然而,當面對需要廣泛獲取實時網絡信息的復雜任務時,這些僅依賴內部參數知識的模型往往力不從心。特別是在需要深度網絡信息檢索和生成全面、準確的科學報告時,這一局限性尤為明顯。

WebThinker 應運而生,它是一個深度研究智能體,使 LRMs 能夠在推理過程中自主搜索網絡、導航網頁,并撰寫研究報告。這種技術的目標是革命性的:讓用戶通過簡單的查詢就能在互聯網的海量信息中進行深度搜索、挖掘和整合,從而為知識密集型領域(如金融、科學、工程)的研究人員大幅降低信息收集的時間和成本。

推理中自主調用工具:擺脫傳統預定義 RAG 工作流

現有的開源深度搜索智能體通常采用檢索增強生成(Retrieval-Augmented Generation, RAG)技術,依循預定義的工作流程,這限制了 LRM 探索更深層次網頁信息的能力,也阻礙了 LRM 與搜索引擎之間的緊密交互。

圖片

WebThinker 突破了傳統 RAG 工作流的限制,實現了范式的升級:

1. 傳統 RAG: 僅進行淺層搜索,缺乏思考深度和連貫性

2. 進階 RAG: 使用預定義工作流,包括查詢拆解、多輪 RAG 等,但仍缺乏靈活性

3. WebThinker: 在連續深思考過程中自主調用工具,實現端到端任務執行

WebThinker 使 LRM 能夠在單次生成中自主執行操作,無需遵循預設的工作流程,從而實現真正的端到端任務執行。

WebThinker 框架:自主的深度搜索與報告撰寫

圖片

WebThinker 框架包含兩種主要運行模式:

1. 問題解決模式:賦予 LRM 深度網頁探索器(Deep Web Explorer)功能,當遇到知識缺口時,LRM 可以自主發起網絡搜索,通過點擊鏈接或按鈕導航網頁,并在繼續推理前提取相關信息。

2. 報告生成模式:實現自主思考 - 搜索 - 寫作(Autonomous Think-Search-and-Draft)策略,將推理、信息搜索和報告撰寫無縫整合。LRM 可以使用專門的工具來草擬、檢查和編輯報告部分,確保最終報告全面、連貫且基于收集的證據。

整個過程是端到端的,LRM 可以在思考過程中自主搜索、深度探索網頁和撰寫研究報告,擺脫了傳統預定義工作流的局限。

核心組件:

1. 深度網頁探索:解決復雜推理問題

這一模塊使 LRM 能夠進行網絡搜索和導航,深度收集、遍歷和提取網頁上的高質量信息:

  • 搜索能力:能夠基于當前查詢生成搜索意圖,從搜索引擎獲取初步結果
  • 導航能力:能夠點擊鏈接或按鈕,深入探索初始搜索結果之外的內容
  • 信息提取:基于當前查詢的搜索結果,LRM 可以發起后續搜索并遍歷更深層次的鏈接,直到收集所有相關信息

2. 自主的思考 - 搜索 - 寫作:生成完整的研究報告

該策略將報告撰寫與 LRM 的推理和搜索過程深度整合:不同于在搜索后一次性生成整個報告,WebThinker 使模型能夠實時撰寫和尋求必要知識。具體來說,WebThinker 為 LRM 配備三種專門工具:(1)撰寫特定章節內容;(2)檢查當前報告已寫內容;(3)編輯 / 修改報告。這些工具使 LRM 能夠通過保持全面性、連貫性和對推理過程中新發現信息的適應性來自主增強報告質量

3. 基于強化學習的訓練策略:全面提升 LRM 調用研究工具的能力

為了進一步釋放 LRM 骨干模型的深度研究潛力,WebThinker 開發了基于強化學習的訓練策略:

  • 利用配備工具的 LRM 從復雜任務中采樣大規模推理軌跡
  • 根據推理的準確性、工具使用準確性、以及最終輸出答案或報告的質量,構建在線直接偏好優化(DPO)訓練的偏好對
  • 通過迭代、在線策略訓練,模型逐步提高感知、推理和有效交互研究工具的能力

實驗結果

圖片

實驗結果:真實世界的復雜推理任務

WebThinker 在四個知識密集型復雜推理基準上進行了評估:

1. GPQA:PhD 級別的科學問題回答數據集,覆蓋物理、化學和生物學

2. GAIA:評估 AI 助手在復雜信息檢索任務上的能力

3. WebWalkerQA:專注于深度網絡信息檢索,需要導航和提取信息

4. 人類最終考試(HLE):極具挑戰性的跨學科問題數據集

圖片

圖片

從實驗結果中可以發現:

1. 基礎推理模型和傳統 RAG 的局限:基礎推理模型雖然在某些任務上表現不錯,但在需要實時外部知識的場景中明顯力不從心;傳統 RAG 方法雖有改進,但在復雜任務中提升有限;

2. 自主搜索的優勢:而引入自主搜索能力的模型則帶來了顯著提升。WebThinker 憑借其深度網頁探索器,能夠更全面地獲取和整合網絡信息,在所有基準測試中都取得了明顯優勢。

3. RL 訓練的改進:特別是經過強化學習訓練的 WebThinker-32B-RL 版本,不僅在同等參數量模型中達到了最佳表現,甚至在某些任務上超越了參數量更大的專有模型。

實驗結果:科學研究報告生成

圖片

在 Glaive 科學報告生成任務的評估中:

1. 生成報告的質量:從完整性、徹底性、事實性和連貫性四個維度評估,WebThinker 生成的研究報告均獲得高分,整體表現優于傳統 RAG 方法和其他先進的深度研究系統;

2. 生成報告的信息邊界:特別在報告的完整性和徹底性方面表現尤為突出,通過 t-SNE 可視化分析可見,WebThinker 生成的報告內容覆蓋更廣,視角更多元,能夠從多個維度深入探索和綜合信息,為用戶提供更全面、更深入的調研。

實驗結果:適配 DeepSeek-R1 系列模型

圖片

通過在不同規模的 DeepSeek-R1 模型上進行實驗(7B, 14B, 32B),驗證了 WebThinker 框架的適應性。在不同模型規模下,都能顯著提升各類任務的性能,遠超直接推理和標準 RAG 方法,展現了該框架在增強 LRM 深度研究能力方面的通用性和有效性。

實驗結果:消融實驗

圖片

消融實驗評估了 WebThinker 各關鍵組件的貢獻。結果顯示,深度網頁探索器以及自主 「思考 - 搜索 - 寫作」 策略中的報告生成組件(尤其是自主報告起草)是確保高性能問題解決和高質量報告生成的基石,其缺失會導致性能顯著下降。強化學習訓練則主要增強了問題解決能力,對報告生成的影響相對有限。

總結與未來展望

WebThinker 框架成功地賦予了大型推理模型深度研究能力,解決了它們在知識密集型真實世界任務中的局限性。通過深度網頁探索器和自主思考 - 搜索 - 寫作策略,WebThinker 使 LRM 能夠自主探索網絡并通過連續推理過程生成全面輸出。

未來,為持續提升深度研究模型的能力,仍有很多方向值得探索:

1. 多模態深度搜索:WebThinker 基于文本推理模型,難以處理圖像等其他模態的信息。未來可以擴展到圖像、視頻等多模態內容的深度研究,來利用網頁中的多模態信息。

2. 工具學習與擴展:當前支持有限的研究工具,未來可以通過工具學習來不斷優化工具使用策略,并擴展更多工具,來支持更復雜的任務。

3. GUI 網頁探索:通過 GUI 網頁探索能力,讓模型能夠更好地理解和操作網頁界面,實現更復雜的交互任務,如訂機票、指定旅游路線圖、等等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-27 23:41:35

豆包搜索AI

2018-12-13 12:03:59

閃存

2025-02-19 08:00:00

SpringBootOllamaDeepSeek

2023-05-11 07:45:28

谷歌人工智能

2012-09-05 09:35:38

云計算微軟IT平臺

2015-08-26 13:37:51

戴爾云計算

2014-11-07 17:29:04

2012-12-04 15:47:45

2019-08-15 09:00:00

AI人工智能

2023-11-29 18:56:43

圖像搜索FAISS

2024-10-23 15:40:00

2020-12-09 15:02:10

IBM

2019-06-10 15:58:30

數據分析流量采集

2025-03-27 17:26:39

Testin云測
點贊
收藏

51CTO技術棧公眾號

国产免费中文字幕| 亚洲人成人77777线观看| 日韩av男人天堂| 蜜桃tv一区二区三区| 在线一区二区三区做爰视频网站| 亚洲一区二区三区免费看| 性一交一乱一伧老太| 亚洲永久网站| 美女视频黄免费的亚洲男人天堂| 朝桐光av一区二区三区| 欧美aaa级| 亚洲午夜精品在线| 亚洲二区自拍| 特黄视频在线观看| 激情成人午夜视频| 欧美一区二粉嫩精品国产一线天| 黄色录像一级片| 在线日韩一区| 日韩一级大片在线| 国产视频一区二区三区在线播放| 欧美性爽视频| 欧美激情一区二区三区蜜桃视频| 国产精品久久久久久久久婷婷| 日韩免费av网站| 最新日韩av| www.欧美三级电影.com| 99久久久久久久久久| 亚洲一区二区三区免费| 欧美日韩一级片在线观看| 女性女同性aⅴ免费观女性恋| 国产精品久久麻豆| 日本一区二区三区四区在线视频| 国产精品视频免费一区| 欧美超碰在线观看| 国产日韩欧美一区| 欧美精品精品精品精品免费| 日本少妇aaa| 欧美日韩一二三四| 亚洲欧美一区二区三区情侣bbw| 男人的天堂免费| 国语精品视频| 91精品国产欧美一区二区18 | 国产精品夜色7777狼人| 超碰中文字幕在线| 亚洲人成人一区二区三区| 欧美国产日韩一区二区在线观看| 女同久久另类69精品国产| 欧美精品久久久久久| 亚洲另类图片色| 成人在线电影网站| 国产福利资源一区| 亚洲国产精品小视频| 久久久久久久久久影视| 99香蕉久久| 精品处破学生在线二十三| wwwxxxx在线观看| 精品网站999| 日韩一区二区三区视频在线观看| 伊人国产精品视频| 祥仔av免费一区二区三区四区| 欧美丝袜自拍制服另类| 亚洲一区在线不卡| 99久久久国产| 日韩网站在线看片你懂的| 男男受被啪到高潮自述| 中文字幕一区图| 亚洲国产三级网| 国产伦精品一区二区三区妓女 | 国产一区二区中文字幕| 91精品综合视频| 午夜精品一二三区| 99v久久综合狠狠综合久久| 精品欧美一区二区在线观看视频 | 国产亚洲福利社区一区| 色噜噜狠狠一区二区三区| 福利片在线看| 亚洲特级片在线| 欧美这里只有精品| 中文字幕不卡三区视频| 欧美亚洲图片小说| 亚洲综合中文网| 日韩精品丝袜美腿| 在线观看视频99| 日韩福利小视频| 亚洲精品偷拍| 国产精品va在线| 99久久精品无免国产免费| 北条麻妃一区二区三区| 欧美三日本三级少妇三99| 最新国产在线观看| 亚洲午夜久久久| 午夜精品在线免费观看| 国产aa精品| 精品视频—区二区三区免费| 青青操在线播放| 一本久道久久综合婷婷鲸鱼| 国产精品高潮视频| 成人av无码一区二区三区| 久久久亚洲精品石原莉奈| 中文字幕制服丝袜在线| 爱搞国产精品| 91精品福利在线一区二区三区| 国产一级伦理片| 99精品综合| 9.1国产丝袜在线观看| 亚洲网站免费观看| 久久综合色综合88| 草草草视频在线观看| 欧美一区 二区 三区| 精品国产污污免费网站入口 | 91久久国产婷婷一区二区| 西西人体44www大胆无码| 中文字幕字幕中文在线中不卡视频| 人妻久久久一区二区三区| 日韩黄色三级在线观看| 亚洲精品色婷婷福利天堂| 欧美日韩免费做爰视频| 捆绑调教一区二区三区| 欧美日韩国产高清视频| 电影在线观看一区| 日韩欧美一区二区不卡| 国产精品1区2区3区4区| 亚洲在线一区| 国产一区二区三区四区五区加勒比| 免费高清在线观看| 欧美综合一区二区| 亚洲最大成人网站| 亚洲免费高清| 99中文字幕| 成人黄色网址| 欧美丰满少妇xxxxx高潮对白| 成人免费看aa片| 国产毛片久久| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 麻豆精品新av中文字幕| 欧美成人dvd在线视频| heyzo在线欧美播放| 日韩一级高清毛片| 极品魔鬼身材女神啪啪精品| 麻豆精品新av中文字幕| 亚洲精品一区二区毛豆| jizz久久久久久| 亚洲一区二区久久| 波多野结衣一区二区三区在线| 久久综合久久综合亚洲| 久久综合色视频| 亚洲精品国模| 国产成人亚洲综合91| 国产日产精品久久久久久婷婷| 色综合色狠狠综合色| avtt香蕉久久| 天堂一区二区在线| 日韩欧美第二区在线观看| 成人在线网站| 日韩在线资源网| 一级黄色片在线观看| 国产精品超碰97尤物18| www.污污视频| 午夜精品婷婷| 成人国产一区二区| 蜜桃视频动漫在线播放| 亚洲男女性事视频| 97人妻一区二区精品视频| 国产精品网曝门| 午夜免费福利视频在线观看| 欧美 日韩 国产一区二区在线视频| 亚洲自拍偷拍网址| av蜜臀在线| 亚洲精品网址在线观看| 伊人亚洲综合网| 日韩一区日韩二区| 国产精品嫩草69影院| 在线亚洲观看| 亚洲精品在线免费看| 亚洲黑人在线| 久久久女人电视剧免费播放下载| 性xxxx视频播放免费| 日本韩国欧美国产| 国产传媒免费在线观看| 成人国产精品免费观看视频| 男人亚洲天堂网| 四季av一区二区三区免费观看| 成人免费91在线看| 欧美动物xxx| 久久伊人精品一区二区三区| 欧美天堂在线视频| 欧美日韩一级黄| 久久丫精品久久丫| 国产欧美日韩另类一区| 中文字幕久久久久久久| 可以看av的网站久久看| 久久天天东北熟女毛茸茸| 人人精品亚洲| 91系列在线播放| 午夜影院在线播放| 久久精品国产精品亚洲| 色播色播色播色播色播在线| 欧美日韩国产综合一区二区三区| 久久久久亚洲av片无码下载蜜桃| 久久久www成人免费毛片麻豆| 欧美大片久久久| 可以免费看不卡的av网站| 狠狠干视频网站| 日本久久黄色| 久久久久国产精品视频| 精品一区91| 国产精品白嫩初高中害羞小美女| 欧美黄色视屏| www.亚洲人.com| 麻豆导航在线观看| 欧美成人高清电影在线| 中文字幕在线观看视频一区| 欧美日韩在线另类| 久一视频在线观看| 亚洲欧洲成人精品av97| 国精产品一区二区三区| 成人黄色国产精品网站大全在线免费观看| 污污网站免费看| 久久亚洲电影| 男人日女人下面视频| 欧美影院一区| 中文字幕成人一区| 精品一级毛片| 日本不卡免费新一二三区| 久久1电影院| 99久re热视频这里只有精品6| 日本国产亚洲| 国产精品一区二区三区久久| 欧美一级大片| 91po在线观看91精品国产性色| 日本理论片午伦夜理片在线观看| yellow中文字幕久久| a中文在线播放| 亚洲天堂一区二区三区| 日本五码在线| 亚洲乱码av中文一区二区| 无码精品黑人一区二区三区 | 欧美视频日韩| 国产成人三级视频| 亚洲精品成人| 裸体裸乳免费看| 午夜久久tv| 大地资源网在线观看免费官网| 综合精品一区| 久久香蕉视频网站| 激情婷婷亚洲| 日韩亚洲欧美视频| 国产日本精品| 茄子视频成人免费观看| 鲁大师影院一区二区三区| 欧美日韩在线视频一区二区三区| 国产午夜久久| 日韩视频免费在线播放| 免费成人美女在线观看| 亚洲欧美aaa| 黄页视频在线91| 亚洲综合在线一区二区| 国产99精品在线观看| 亚洲成年人在线观看| 91在线小视频| 亚洲一区二区三区蜜桃| 中文av一区特黄| 亚洲色婷婷一区二区三区| 一级特黄大欧美久久久| 黄色片视频网站| 欧美在线free| 国产女18毛片多18精品| 亚洲精品在线免费观看视频| 婷婷国产在线| 中文字幕日韩有码| 中文字幕在线观看播放| 国产69精品久久久久久| 8av国产精品爽爽ⅴa在线观看| 91精品视频免费观看| 2021年精品国产福利在线| 久久综合久久久| 99久久亚洲精品| www..com日韩| 日韩精品一二三区| 激情成人在线观看| av成人老司机| 毛片久久久久久| 亚洲精品国产精品乱码不99 | 欧美寡妇性猛交xxx免费| 欧美中文字幕在线观看| 日韩专区视频| 精品一区二区久久久久久久网站| 国产真实有声精品录音| 特级西西人体www高清大胆| 久久久久网站| 三级黄色片免费观看| 91尤物视频在线观看| 国产视频精品免费| 精品福利一区二区| 91国内精品久久久| 日韩禁在线播放| av片在线观看| 国产精品久久久久久av福利软件| 97久久亚洲| 亚洲精品人成| 久久精品午夜| 国产精品91av| 国产精品初高中害羞小美女文| 国产视频91在线| 欧美一区二区三区在线电影| 久久电影中文字幕| 性色av一区二区三区免费 | 日本欧美一区二区| 97精品人妻一区二区三区蜜桃| 国产精品网友自拍| 黄色av一级片| 亚洲激情 国产| 特级毛片在线| 成人免费观看网址| 欧洲毛片在线视频免费观看| 女人和拘做爰正片视频| 成人精品视频.| 欧美 日韩 国产 一区二区三区| 在线免费视频一区二区| 天天操天天干天天爱| 九九九久久国产免费| 日韩久久一区| 日韩在线三级| 日产国产欧美视频一区精品| 欧美做受喷浆在线观看| 亚洲国产精品麻豆| 国产浮力第一页| 久久成人精品视频| 成人网av.com/| 亚洲综合欧美日韩| 日本不卡一区二区| 卡一卡二卡三在线观看| 色哟哟一区二区三区| 亚洲av成人无码网天堂| 国模私拍一区二区三区| 99re热精品视频| 欧美这里只有精品| 成人免费高清视频| 久视频在线观看| 亚洲成人a级网| 爱看av在线入口| 精品999在线观看| 亚洲综合99| 午夜时刻免费入口| 在线观看国产一区二区| av在线免费观看网| 成人福利视频网| 亚洲午夜精品一区 二区 三区| 亚洲制服中文字幕| 亚洲乱码日产精品bd| 亚洲精品一区二区三区区别| 久久久久久久999精品视频| 国产成人一二片| 国产免费毛卡片| 久久色.com| 一级全黄少妇性色生活片| 久久久99免费视频| 永久免费精品视频| 18禁免费无码无遮挡不卡网站 | 久久精品色妇熟妇丰满人妻| 欧美日韩免费一区二区三区| 久热国产在线| 国产精品久久久久久久久久久久午夜片 | 亚洲色图另类专区| 免费的黄色av| 热99在线视频| 99成人在线视频| 一区二区在线免费观看视频| 午夜精品爽啪视频| 国产亚洲依依| 亚洲一区二区日本| 国产一区二区三区成人欧美日韩在线观看| 日韩av一二区| 欧美日本在线视频| 色老头在线观看| 欧美精品七区| 国产在线看一区| 久久久久久久久久影院| 国产一区二区av| 亚洲开心激情| 男人的天堂日韩| 亚洲免费看黄网站| 少妇精品视频一区二区| 国产精品看片资源| 欧美午夜免费影院| 欧美 日韩 成人| 精品盗摄一区二区三区| 欧洲精品一区二区三区| a级片一区二区| 国产欧美一区二区三区在线看蜜臀 | 日韩欧美资源站| 成人性生活视频| 日韩视频一二三| 国产网站一区二区三区| 精品人妻无码一区二区| 国产精品第七十二页| 黄色av一区| 国产男女猛烈无遮挡在线喷水| 日韩av在线播放资源| 日韩在线亚洲|