精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Agentic Deep Research新范式,推理能力再突破,可信度增加,螞蟻安全團隊出品

人工智能 新聞
OpenAI 和 Google 的研究者們總結了 Agentic Deep Researcher 的幾大優勢:(1)深入的問題理解能力。

盡管 LLM 的能力與日俱增,但其在復雜任務上的表現仍受限于靜態的內部知識。為從根本上解決這一限制,突破 AI 能力界限,業界研究者們提出了 Agentic Deep Research 系統,在該系統中基于 LLM 的 Agent 通過自主推理、調用搜索引擎和迭代地整合信息來給出全面、有深度且正確性有保障的解決方案。

OpenAI 和 Google 的研究者們總結了 Agentic Deep Researcher 的幾大優勢:(1)深入的問題理解能力(Comprehensive Understanding):能夠處理復雜、多跳的用戶提問;(2)強大的信息整合能力(Enhanced Synthesis):能夠將廣泛甚至沖突的信息源整合為合理的輸出;(3)減輕用戶的認知負擔(Reduced User Effort):整個 research 過程完全自主,不需要用戶的過多干預。

現存最先進的 Agentic Deep Research 系統往往基于由可驗證結果獎勵指導的強化學習訓練,盡管該訓練范式帶來了顯著的性能收益,但仍存在以下核心問題:

  • 梯度沖突(Gradients Conflicts):在基于可驗證結果獎勵的強化學習范式中,即使中間的推理過程或研究策略是有效的,只要最終答案錯誤,整個推理軌跡都會受到懲罰。這種粗粒度的獎勵設計在中間推理步驟與最終答案之間引入了潛在的梯度沖突,阻礙了模型發現更優的推理能力和研究策略,從而限制了其泛化能力
  • 獎勵稀疏(Reward sparsity):基于結果的強化學習僅依賴最終答案生成獎勵,導致每個訓練樣本只能提供稀疏的反饋信號。這嚴重限制了策略優化的效率,因為它增加了對更大規模訓練數據和更長訓練周期的依賴。

以上兩個限制限制了 Agentic Deep Research 系統的性能上線,為決解這兩大限制,來自螞蟻安全與智能實驗室團隊提出了 Atom-Searcher,進一步推動了 Agentic Deep Research 系統的性能邊界。


  • 論文標題:Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward
  • 論文:https://arxiv.org/abs/2508.12800
  • Github: https://github.com/antgroup/Research-Venus
  • Huggingface: https://huggingface.co/dikw/Atom-Searcher

方法介紹

本研究提出了一種創新性的 Agentic Deep Research 系統訓練框架 Atom-Searcher,結合監督微調(SFT)與基于細粒度獎勵的強化學習構建強大的 Agentic Deep Research 系統。

與現存 Agentic Deep Research 訓練框架相比,Atom-Searcher 創新地提出了 Atomic Thought 推理范式,引導 LLM 進行更加深入、可信和可解釋的推理;然后引入 Reasoning Reward Model(RRM)對 Atomic Thought 式的推理過程進行監督,構建細粒度的 Atomic Thought Reward(ATR);進而提出一種課程學習啟發的獎勵融合策略將 ATR 與可驗證結果獎勵進行聚合;最后基于聚合獎勵進行強化學習訓練。

Atomic Thought 推理范式

針對 Agentic Deep Research 系統中 LLM 生成的推理軌跡(<think>)包含過多冗余 tokens 且推理深度欠缺的問題,Atomic Thought 范式將 <think> 分解為更加細粒度的 “功能單元”,如 <Verification>、<hypothesis > 等,該范式有助于引導 LLM 的推理過程更加符合人的認知行為,且高度模塊化的方式能大大減少無意義 tokens。更進一步,為激發 LLM 自主將 < think > 分解為 Atomic Thoughts(<Verification>、<hypothesis > 等)的能力,作者們精心構建了 1000k 高質量 Atomic Thought 指令微調數據,對 LLM 進行 SFT。

細粒度 Atomic Thought Reward 構建

在 Agentic Deep Research 系統中,直接使用 Reasoning Reward Model(RRM)對推理過程進行監督,往往因為 < think > 中的低信噪比(過多冗余 tokens)而效果不佳。而 Atomic Thought 的提出,很好地解決了該問題,除了減少了 < think > 中的冗余 tokens,Atomic Thoughts(<Verification>、<hypothesis > 等)還為 RRM 提供了監督錨點,清晰的模塊化結構使得 RRM 能夠準確地評估每個功能單元的質量。因此,作者們引入 RRM 對 Atom-Thoughts 進行監督,從而得到細粒度的 Atomic Thought Reward,用于緩解強化學習訓練中的梯度沖突和獎勵稀疏問題。

課程學習啟發的獎勵聚合策略

基于可驗證結果的獎勵的 Agentic Deep Research 系統之所以存在梯度沖突問題,是由于基于結果的獎勵在 token 級別的獎勵分配上過于粗糙。具體來說,它將中間推理步驟的正確性完全歸因于最終答案,常常在不考慮各步驟實際貢獻的情況下對其進行獎勵或懲罰。這種錯位在優化過程中會引發梯度沖突。為解決這一問題,我們將 ATR 與結果獎勵相結合,利用 ATR 作為輔助信號來校準結果獎勵,從而緩解梯度沖突。

然而,使用靜態的獎勵加權系數無法與訓練動態保持一致。具體而言,在訓練初期,模型能力尚有限,難以生成完全正確的答案,但更有可能探索出對最終正確解有貢獻的有用 “原子思維”。如果此階段僅依賴基于結果的獎勵,這些有益的原子思維可能因最終答案錯誤而遭到不公正的懲罰;相反,一些有害的原子思維也可能被錯誤地強化,導致嚴重的梯度沖突,因而需要 ATR 進行較強的校準。隨著訓練的推進,模型能力逐步提升,其推理軌跡與正確答案的對齊程度也日益提高。因此,梯度沖突逐漸減弱,而來自 ATR 的過度校準可能會引入不必要的噪聲,反而損害最終的準確性。

強化學習訓練

基于混合獎勵,本文采用了 GRPO 算法進行強化學習訓練。并使用了 Loss Masking 策略保證訓練的穩定性。具體而言,在原始的 GRPO 框架中,損失函數會計算整個推理路徑中所有 token 的梯度。但在 Atom-Searcher 中,模型的輸出路徑包含由外部環境檢索得到的內容(如搜索結果),這些內容不是模型生成的,也不可訓練。為了避免模型在訓練時被這些靜態、不可控的內容誤導,本文采用了 Loss Masking 機制,將檢索結果部分的 token 排除在損失計算之外。

實驗效果

主實驗

Atom-Searcher 在 In-Domain 和 Out-of-Domain 上的性能表現均十分亮眼。在 In-Domain Benchmarks (NQ、 TQ、HotpotQA、2Wiki)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 8.5% 的平均性能提升,在 Out-of-Domain Benchmarks(Musique、 Bamboogle、 PopQA)上 Atom-Searcher 相較于最優 baseline——DeepResearcher 取得了 2.5% 的性能提升。

消融實驗

作者們證明了 Atom-Searcher 中 Atomic Thought 范式和 ATR 的貢獻,并證明了相較于傳統的 < think > 推理范式 Atomic Thought 范式為 RRM 提供了有效的監督錨點,從而帶來了性能提升

案例分析

作者們通過案例分析對比了 Atom-Searcher 與最優 baseline——DeepResearcher 的推理過程。展示了 Atom-Searcher 的優勢:(1)Atom-Searcher 在其推理過程中自主生成了 Atomic Thoughts,展現出更接近人類的認知行為,例如問題分析、提出解決方案假設、預測錯誤以及規劃下一步操作,使其推理過程更加深入且清晰;(2)Atom-Searcher 會觸發更多的搜索調用,從而獲取更豐富的外部信息,以確保答案的正確性。這些優勢表明,Atom-Searcher 在更復雜的 Deep Research 任務中具有巨大潛力。

  


責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-20 09:54:36

數據管理大數據

2009-08-26 18:46:38

網絡威脅Web安全Blue Coat

2010-09-09 13:57:25

網絡威脅

2025-06-09 09:32:35

2012-02-29 15:06:10

2021-03-23 11:56:47

安全工程師職業

2025-05-29 03:00:00

混合推理模型LHRMAI

2017-06-08 23:02:10

安全代碼DevOps

2013-04-26 17:30:40

2024-03-01 11:58:26

MLLMs大語言模型人工智能

2023-07-07 06:48:18

2014-04-08 13:17:42

2018-10-09 12:25:00

2018-08-20 07:09:22

2013-02-28 11:58:42

2020-06-03 10:58:49

機器學習工具人工智能

2023-07-14 16:10:09

惡意軟件

2025-07-02 08:29:38

2020-10-13 15:31:55

人工智能機器學習技術
點贊
收藏

51CTO技術棧公眾號

羞羞视频在线观看一区二区| 五月婷婷丁香花| 婷婷伊人综合| 精品精品国产高清一毛片一天堂| 欧美深夜福利视频| 国产免费av高清在线| 久久国产剧场电影| 97视频免费在线看| 东京热无码av男人的天堂| 欧美久久亚洲| 在线精品视频免费观看| 日韩一区二区高清视频| 成年人视频在线观看免费| 国产成人在线电影| 国产精品久久久久免费a∨大胸| 动漫性做爰视频| 久久不见久久见免费视频7| 欧美一区二区福利视频| 欧美精品成人网| 欧美性受ⅹ╳╳╳黑人a性爽| 久久精品一区蜜桃臀影院| 成人精品一二区| 中文字幕在线观看国产| 亚洲国产日韩欧美一区二区三区| 中文字幕亚洲综合久久| 精品国产人妻一区二区三区| 日韩免费大片| 色哟哟精品一区| 日本福利视频一区| 国产福利在线播放麻豆| 国产亚洲一区二区三区四区| 国产一区免费视频| www.好吊色| 久久99久久久欧美国产| 国产成人免费91av在线| 日韩成人在线免费视频| 午夜日韩视频| 久久伊人精品天天| 网爆门在线观看| 欧美色图一区| 亚洲天堂av在线播放| 久久一区二区电影| 红杏aⅴ成人免费视频| 日韩一区二区高清| 性欧美在线视频| 激情久久99| 欧美偷拍一区二区| 欧美成人免费高清视频| jizz内谢中国亚洲jizz| 精品欧美激情精品一区| 免费国产黄色网址| 国产黄大片在线观看| 亚洲国产成人高清精品| 日本福利视频在线观看| 午夜dj在线观看高清视频完整版| 亚洲欧美影音先锋| 中文字幕久久综合| 久操视频在线| 亚洲天堂精品在线观看| 波多野结衣三级在线| 国产乱视频在线观看| 国产日韩欧美综合在线| 日韩在线国产| 98在线视频| 国产精品白丝在线| 日本精品免费视频| 黄色在线看片| 午夜精品免费在线观看| 国产二区视频在线播放| 亚洲成av在线| 欧美福利视频导航| 黄页网站在线看| 精品国内亚洲2022精品成人| 精品一区二区三区四区在线| 女人又爽又黄免费女仆| 成人情趣视频网站| 久久久99免费视频| 国产中文字字幕乱码无限| 夜久久久久久| 国产精品露脸av在线| 国产超碰人人模人人爽人人添| 国产精品夜夜嗨| 国产亚洲欧美另类一区二区三区| 亚洲av成人无码网天堂| 国产精品麻豆网站| 日韩精品一区二区在线视频 | 图片婷婷一区| 亚洲人成电影网站色xx| 波多野结衣久久久久| 亚洲国产高清视频| 国产精品大陆在线观看| 狠狠躁狠狠躁视频专区| 变态另类ts人妖一区二区| 欧美午夜精彩| 欧美成人免费播放| 天天综合网久久综合网| 九九热在线视频观看这里只有精品| 91久久国产自产拍夜夜嗨| 天天综合在线视频| 国产精品国产三级国产aⅴ入口| 99国产精品白浆在线观看免费| 在线天堂资源www在线污| 欧美精品色一区二区三区| 国产精品一区二区人妻喷水| 日本一区二区在线看| 性欧美长视频免费观看不卡| 亚洲综合精品在线| va亚洲va日韩不卡在线观看| 亚洲视频在线二区| 白浆视频在线观看| 91精品国产丝袜白色高跟鞋| 亚洲精品理论片| 欧美午夜不卡影院在线观看完整版免费| 欧美一级黑人aaaaaaa做受| 99久久久久久久| 国产女同性恋一区二区| xxxx18hd亚洲hd捆绑| 成人在线视频观看| 国产视频欧美视频| 国产系列精品av| 国产一区二区三区在线观看免费 | 成人看片免费| 色又黄又爽网站www久久| 欧美丰满熟妇bbb久久久| 日韩精品欧美| 国产va免费精品高清在线| 好吊色视频一区二区| 最新欧美精品一区二区三区| 国产激情在线观看视频| 婷婷亚洲成人| 国内精品视频一区| 蜜桃av鲁一鲁一鲁一鲁俄罗斯的 | www.-级毛片线天内射视视| 精品国产第一福利网站| 亚洲国产欧美一区二区丝袜黑人| 欧美精品入口蜜桃| 国产一区二区成人久久免费影院| 亚洲精品中文字幕在线| 亚洲一二三四| 亚洲美女av网站| 成人免费a视频| 99久久亚洲一区二区三区青草| www.夜夜爱| 一区中文字幕电影| 欧美激情亚洲精品| 亚洲第一页综合| 夜夜精品视频一区二区| 99热这里只有精品2| 久久精品青草| 亚洲一区二区三区视频播放| 成人ww免费完整版在线观看| 91精品婷婷国产综合久久性色| 欧美日韩国产一二三区| 久久精品久久99精品久久| 亚洲欧美日本国产有色| 欧美一级免费| 久热爱精品视频线路一| av中文字幕观看| 一区二区免费在线| 91丝袜在线观看| 久久亚洲不卡| 亚洲欧美在线网| 白嫩亚洲一区二区三区| 久久天天躁狠狠躁夜夜爽蜜月| 国产欧美一级片| 亚洲午夜精品网| av2014天堂网| 免费日韩av| 亚洲无玛一区| 日本综合精品一区| 91精品国产精品| 成人好色电影| 欧美一级二级三级蜜桃| 黄色一级片在线免费观看| 成人黄色a**站在线观看| 国产精品自拍片| 精品国内自产拍在线观看视频 | 亚洲中文字幕无码专区| 国产一区二区三区电影在线观看| 国产伦精品免费视频| 中文av资源在线| 日韩成人久久久| 亚洲影视一区二区| 亚洲国产wwwccc36天堂| 女人十八毛片嫩草av| 国产麻豆午夜三级精品| 欧美网站免费观看| 亚洲国产精品成人| 麻豆精品传媒视频| 99精品女人在线观看免费视频| 国内精久久久久久久久久人| 国产精品秘入口| 日韩一级在线观看| 无码人妻丰满熟妇精品区| 一区视频在线播放| 国产呦小j女精品视频| 国产真实乱偷精品视频免| 鲁一鲁一鲁一鲁一澡| 天天射综合网视频| 蜜桃999成人看片在线观看| 国产精品99久久免费| 欧洲美女免费图片一区| av片哪里在线观看| 亚洲人成自拍网站| 午夜精品在线播放| 精品视频免费在线| 91香蕉在线视频| 一区二区三区在线免费| 色一情一交一乱一区二区三区| 国产不卡视频在线播放| 国内自拍视频网| 国产精品日本| 91亚洲精品国产| 久久久久久久久丰满| 欧美亚洲爱爱另类综合| 国产精品极品| 97超碰人人看人人| 青青国产精品| 国产成人欧美在线观看| 女人高潮被爽到呻吟在线观看| 蜜臀久久99精品久久久无需会员| 超碰免费97在线观看| 国产手机视频精品| 四虎在线视频免费观看| 精品欧美乱码久久久久久1区2区| 一级视频在线播放| 欧美伊人久久久久久久久影院 | 大吊一区二区三区| 久久久久久免费| 人妻熟女aⅴ一区二区三区汇编| 国产99久久久国产精品免费看| 久久久精品高清| 久久国产免费看| 午夜久久久精品| 日本美女一区二区三区视频| 无码无遮挡又大又爽又黄的视频| 一本久道久久综合狠狠爱| 高清欧美精品xxxxx| 国产中文一区| 日本阿v视频在线观看| 黄色成人在线网址| 性高湖久久久久久久久aaaaa| 国产精品99一区二区| 国产日韩欧美大片| 一区二区三区网站| 特级黄色录像片| 91精品国产乱码久久久久久久| 在线免费观看一区二区三区| 日韩a一区二区| 自拍偷拍99| 欧美jjzz| 久久国产精品网| 国产日韩欧美三区| 久久久久久久久久久久久国产精品| 国产亚洲毛片| 超碰影院在线观看| 美腿丝袜亚洲色图| 亚洲色图偷拍视频| 国产成人自拍高清视频在线免费播放| 精品无码av一区二区三区不卡| 成熟亚洲日本毛茸茸凸凹| 国产激情第一页| 国产日韩在线不卡| 搜索黄色一级片| 亚洲综合自拍偷拍| 日韩精品在线观看免费| 91黄色在线观看| 亚洲天堂视频在线| 日韩欧美国产综合| 亚洲aaa在线观看| 视频在线观看99| 午夜激情在线| 奇门遁甲1982国语版免费观看高清| 日本精品不卡| 91色在线视频| 国产精品国产| 无码免费一区二区三区免费播放| 午夜精品毛片| 人人妻人人添人人爽欧美一区| 老司机精品久久| 亚洲一级片免费观看| 99久久伊人精品| 91制片厂在线| 亚洲成av人片| 国产一区二区麻豆| 亚洲国产精品人久久电影| 超碰免费在线观看| 久久久亚洲网站| 成人看片在线观看| 国产精品免费一区二区三区观看| 亚洲综合图色| 真人做人试看60分钟免费| 亚洲欧美春色| √天堂资源在线| 久久亚洲免费视频| 亚洲 欧美 变态 另类 综合| 精品国产1区2区| 91福利在线观看视频| 日韩不卡在线观看| av免费在线网站| 国产精品久久99久久| 大伊香蕉精品在线品播放| 日韩久久久久久久| 麻豆视频免费在线播放| 久久99精品视频| 醉酒壮男gay强迫野外xx| 综合中文字幕亚洲| 无码人妻精品一区二区蜜桃色欲| 欧美一级免费观看| 91欧美在线视频| 欧美亚洲在线播放| aaa国产精品| 久久久国产精华液999999| 久久九九免费| 国产精品成人99一区无码 | 久久xxx视频| 久久99精品久久久久久水蜜桃| 91精品国产成人观看| 冲田杏梨av在线| 久久久久久久久一| 日本一区二区欧美| 日韩精品一区二区三区视频| 在线观看麻豆蜜桃| 国产精品18久久久久久首页狼| 国产一区二区三区亚洲| 日韩欧美一级在线| 久久99精品国产麻豆不卡| 免费看黄色三级| 91久久精品网| 欧美日韩国产亚洲沙发| 91精品国产乱码久久久久久蜜臀| 538任你躁精品视频网免费| 黄色一级片网址| 狠狠色2019综合网| 亚洲激情图片网| 欧美精品高清视频| 欧美69xxxx| 91久久精品日日躁夜夜躁国产| 91视频精品| 中文字幕66页| 日韩毛片高清在线播放| 亚洲一区在线观| 日韩视频在线免费观看| 日本一区二区中文字幕| 亚洲一区免费看| 九九视频精品免费| 欧产日产国产v| 精品国产一区久久| av免费不卡| 欧美在线一二三区| 视频一区二区欧美| 伊人影院综合网| 欧美精品三级在线观看| dy888亚洲精品一区二区三区| 亚洲xxxx在线| 99在线精品免费视频九九视| 国产精品300页| 在线免费观看不卡av| 成人在线免费看| 成人精品久久av网站| 欧美成人亚洲| 午夜剧场免费看| 欧洲另类一二三四区| 日本在线免费| 99影视tv| 亚洲综合好骚| 国产视频123区| 欧美一级片免费看| 国产精品一二三产区| 日韩激情视频| 国产精品18久久久久久久久| 日本中文字幕免费| 亚洲欧美精品一区二区| 欧美aaaaaa| 男人天堂a在线| 91视频免费看| 亚洲视频在线观看一区二区 | 91九色综合久久| 你懂的网址国产 欧美| 中文乱码人妻一区二区三区视频| 亚洲国产一区二区视频| 懂色av中文在线| 国产在线观看精品| 海角社区69精品视频| 51调教丨国产调教视频| 欧美性大战久久久久久久蜜臀| 久草中文在线| 国产欧美一区二区三区四区| 欧美日韩国产综合网| 亚洲第九十七页| 欧美一区二区免费| 美女网站在线看| 99久久久无码国产精品性色戒| 成人中文字幕电影| 亚洲最大成人在线视频| 久久久久国产精品免费| 日韩在线观看| 精品久久久久久无码人妻| 在线亚洲+欧美+日本专区| 最新国产在线拍揄自揄视频|