精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Claude團隊大揭秘!如何調動多智能體搞深度搜索

人工智能
在這篇文章中,它詳細展示了如何構建一個有效的多智能體研究系統,這是一個架構,其中主代理(The Lead Agent)會生成和協調子代理(Subagents),以并行方式探索復雜查詢,內容涵蓋系統架構、提示工程以及評估方法等。

如何用多智能體的方法構建深度搜索?

現在,Claude團隊把自家最新的心得,對外分享了。

在這篇文章中,它詳細展示了如何構建一個有效的多智能體研究系統,這是一個架構,其中主代理(The Lead Agent)會生成和協調子代理(Subagents),以并行方式探索復雜查詢,內容涵蓋系統架構、提示工程以及評估方法等。

圖片

Claude數據顯示了不同行業領域使用此功能的比例——專業領域軟件系統開發占比10%,開發和優化專業和技術內容、開發業務增長和創收策略皆占比8%,協助學術研究和教育材料開發占比7%,研究和審核信息占比5%。

網友們點評:

Anthropic團隊對AI模型的理解真是killer級別啊。

圖片

一起來看看這篇干貨教程。

關鍵架構:協調器-工作器架構

Claude團隊使用了協調器-工作器架構,專門用于管理多個智能體之間的任務分配與協作。下圖展示了多智能體架構運行情況。

圖片圖片

此外,該系統使用多步搜索而非靜態檢索,動態地查找相關信息,適應新的發現,并分析結果來形成高質量的答案。

圖片圖片

上圖展示了團隊多智能體研究系統完整工作流程。

該系統允許Claude利用網絡、工作空間和自定義工具集成,動態規劃、搜索和合成大型語料庫中的高質量答案。

主代理分解查詢,啟動專門的子代理(每個子代理擁有自己的工具、提示和內存),并整合他們的結果。

這種并行、廣度優先的設計極大地提高了研究任務中順序LLM使用的性能。

與單個代理的Claude相比,它在內部評估中成功率達到90%更高,比如,以Claude Opus 4為領導智能體、Claude Sonnet 4為子智能體的多智能體系統,在團隊的內部研究評估中比單智能體Claude Opus 4表現高出90.2%。

而通過將工作分配給多個代理和上下文窗口,Claude的系統高效擴展了推理能力,并增加了并行推理的容量。

最新的Claude模型在token使用上起到了巨大的效率提升作用,升級到Claude Sonnet 4帶來的性能提升,比在Claude Sonnet 3.7上翻倍token預算還要大。

這導致token成本比標準聊天高出15倍。因此多智能體架構能有效擴展token使用,以應對超出單個智能體限制的任務,但是,只適用于高價值查詢

提示工程:啟發式方法

Anthropic通過提示設計迭代優化了代理行為。他們使用了用于任務復雜度擴展、委托清晰度、工具選擇和思維策略的啟發式方法

團隊引導代理顯性地展現其思考過程,擴展其思維軌跡,使Claude能在生成中輸出額外的token。主代理會利用這一思考機制來規劃整體策略,評估任務所需工具,判斷查詢的復雜度,決定是否需要調用子代理,以及如何分配每個子代理的具體角色。

具體方式如下:

了解代理準確心理模型:團隊使用控制臺構建了模擬,使用了系統中的確切提示詞和工具,然后逐步觀察智能體的工作。這立即驗證了,有效的提示詞依賴于了解智能體行為的準確心理模型,能夠揭示最關鍵、最具影響力的優化路徑。

分配任務:在系統中,主代理(The Lead Agent)將查詢分解為子任務,描述清晰的目標、預期的輸出格式、可使用的工具和信息來源指引以及明確的任務邊界,將子任務傳遞給子代理。

調整工作規模:為了讓代理能準確判斷不同任務所需的合理工作量,團隊在提示中嵌入了指導方針——規模調整規則,加以引導。例如,簡單的信息收集任務通常只需1個子代理,并調用工具3至10次;而復雜的研究類任務則可能涉及10個以上的子代理,且需進行明確的角色劃分與職責分工。

工具設計與選擇:團隊給代理提供了明確的啟發式方法:例如,首先檢查所有可用工具,將工具使用與用戶意圖匹配,進行廣泛的網絡搜索以探索外部信息,或優先選擇專業工具而非通用工具。

自我改進:團隊創建了一個工具測試智能體——當給定有缺陷的MCP工具時,它會嘗試使用該工具,然后重寫工具描述以避免失敗。這幫助智能體在之后的工作任務中大幅提升準確率,完成任務時間減少了40%。

搜索范圍聚焦:團隊通過提示代理先從簡短、寬泛的查詢開始,評估可用資源,再逐步縮小關注范圍來抵消這種傾向。

并行工具調用:團隊引入了兩種并行策略:(1)主智能體不再順序生成子智能體,而是同時創建3–5個子智能體;(2)每個子智能體同時調用3個以上的工具進行信息檢索與分析。這些優化使復雜查詢的處理時間縮短了高達90%,原本需要數小時完成的研究任務現在可在幾分鐘內完成,且覆蓋的信息范圍更廣,超越了其他系統的處理能力。

評估:方法靈活,保證結果

良好的評估對于構建可靠的智能體至關重要。傳統評估方法常遵循固定路徑,而多智能體系統無法確定“正確步驟”。

團隊使用以下方法,既能判斷智能體是否達成了正確的成果,又能確保其遵循了合理的流程。

小樣本評估:團隊認為,先使用幾個例子進行小規模測試,而不是等到能夠構建更全面的評估時再開始會更好。比如,早期智能體開發中,一個提示詞的微調可能將成功率從30%提升至80%。

使用LLM作為評判者:團隊使用一個LLM作為“評判者”,依據預設評分標準對每個輸出進行評估,具體維度包括:

事實準確性:論斷是否與參考來源一致?

引用準確性:引用內容是否真實反映了所引資料?

完整性:是否覆蓋了所有任務要求的要點?

來源質量:是否優先使用了一手資料,而非低質量的二手來源?

工具效率:是否合理、高效地使用了相關工具?

團隊嘗試過多個評判者對各部分進行評估,但實驗發現:通過單次LLM調用,輸出0.0–1.0的評分與通過/不通過判斷,是效果最穩定、與人工評價最一致的方法

借助LLM自動評估機制,研究者能夠以可擴展的方式高效評估數百個復雜輸出,顯著提升了評估工作的速度與一致性。

人工評估:人工評估人員常常能識別出自動評分難以察覺的異常行為,比如模型在面對不尋常查詢時產生的幻覺回答、系統性故障,或更微妙的偏見以及偏向特定類型的信息來源。

即使在高度自動化的評估體系中,人工測試仍是不可替代的關鍵環節,能夠持續發現盲區并提升系統的整體可靠性。

除此之外,還需注意,多智能體系統具有典型的涌現行為——這些行為并非源于特定的編程邏輯,而是在多個智能體相互作用中自然產生的。比如說,對主智能體的一處微小改動,可能會以不可預測的方式改變子智能體的行為。

因此,要構建成功的多智能體系統,關鍵在于理解它們的交互模式

這也意味著,針對智能體的最佳提示不僅僅是嚴格的指令,更是定義勞動分工、問題解決方法和努力預算的合作框架

要實現這一合作框架,需要精心設計提示與工具,建立可靠的啟發式方法,實現可觀察性,并建立緊密的反饋循環。

團隊在Cookbook中開源了部分提示以及示例。

問題與挑戰:小改動引發“蝴蝶效應”

智能體系統中微小改變會引發一系列聯動,產生“蝴蝶效應”,引發大的行為改變和后果。

智能體會保持“狀態”,且錯誤會累積。團隊構建了能夠在錯誤發生時從智能體當時所處位置恢復的系統,并利用模型智能性來處理問題,并與重試邏輯和定期檢查點等確定性安全措施相結合。比如,在工具失敗時通知智能體并讓它適應,效果十分不錯。

調試需要新的方法。團隊引入了完整的生產環境追蹤機制,系統性地定位代理失敗的具體原因并加以修復。除了常規的可觀察性指標,團隊還監控智能體的決策路徑和交互結構——這些過程均不涉及對具體對話內容的監控,以確保用戶隱私。這種高層級、結構化的觀察能力使團隊能夠識別根本問題、發現異常行為,并及時修復系統中的常見故障。

更新需要仔細協調。團隊需要防止版本更新時,破壞系統當前運行狀態。團隊使用彩虹部署策略來避免中斷運行中的智能體,逐步將流量從舊版本引導至新版本,同時保持兩個版本同時運行。

同步執行存在瓶頸。同步執行會在代理之間造成信息流瓶頸,即主代理無法引導子代理,子代理無法協調,造成搜索被迫中止問題。團隊嘗試異步執行:能夠實現額外的并行運行,代理可以同時工作并在需要時創建新的子代理。但異步執行方式也會帶來結果協調、狀態一致性和子代理之間的錯誤傳播等問題。團隊預計,異步執行帶來的性能提升將超過其處理復雜性。

額外建議

對在多回合中改變狀態的智能體進行終態評估。團隊發現專注于終態評估而非逐回合分析效果更好。這種方法承認智能體可能會找到到達同一目標的替代路徑,同時仍然確保能實現預期結果。對于復雜的業務流程,不要試圖驗證每個中間步驟,將評估分解為離散的檢查點,觀察在這些檢查點中應該發生的特定狀態變化。

長時程對話管理。生產代理通常參與持續數百輪的對話,需要精心設計上下文管理策略。團隊實現代理總結已完成的工作階段,并將關鍵信息存儲在外部內存中,然后再進行新任務的模式。

子代理將輸出寫入文件系統以減少“電話游戲”現象。不同于主代理與子代理的引導-傳遞模式,可通過專業代理創建輸出,子代理調用工具將工作存儲在外部系統,然后將輕量級引用傳遞回協調器,從而提高保真度和性能。

這防止了多階段處理中的信息丟失,并減少了通過對話歷史復制大型輸出的token開銷。該模式特別適用于代碼、報告或數據可視化等結構化輸出,其中子代理的專業提示產生的結果比通過通用協調器過濾更好

在構建智能體系統時,在開發者機器上運行的工作代碼庫需要大量的工程工作才能成為可靠的生產系統。一個步驟的失敗可能導致智能體朝著完全不同方向的去探索,從而產生不可預測的結果。

團隊已經表明諸多原因,并表示原型系統與可供用戶成熟使用的生產系統之間的差距往往比預期要大得多。

當單個智能體的能力接近上限時,多智能體系統就成為突破邊界、實現“智能倍增”的關鍵手段。

參考鏈接

[1]https://www.anthropic.com/engineering/built-multi-agent-research-system

[2]https://x.com/omarsar0/status/1933941558815887400

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-08-28 06:52:29

2024-07-08 09:49:54

2025-09-29 10:41:26

2018-12-26 10:08:23

WOT AI峰會

2025-05-21 08:47:00

2025-11-06 01:44:00

2024-06-13 09:20:26

2025-01-03 11:02:38

OpenAIAgent大模型

2010-03-29 09:03:44

Windows Pho

2024-07-23 14:10:48

2025-04-25 02:30:00

機械臂大模型多模態

2024-10-15 17:28:05

2025-03-03 11:16:18

2024-03-11 00:40:00

AI研究

2025-05-14 07:10:00

智能體AI人工智能

2025-10-10 03:00:00

多輪智能體Tree-GRPOLLM

2012-08-14 09:44:02

谷歌團隊

2025-11-04 01:22:00

2025-11-04 01:55:00

多智能體系統中間件
點贊
收藏

51CTO技術棧公眾號

91黄视频在线观看| 97国产精品videossex| 日韩网站免费观看| 免费观看一区二区三区| 在线天堂中文资源最新版| 国产日韩欧美高清| 99久久99| 做爰视频毛片视频| 在线观看日韩av电影| 亚洲三级黄色在线观看| 日韩免费毛片视频| eeuss影院www在线播放| 国产二区国产一区在线观看| 欧美日韩国产999| 天堂www中文在线资源| 日本少妇一区| 欧美国产日韩一二三区| 亚洲最大av网站| 四虎精品永久在线| 久久视频国产| 亚洲精品国产精品乱码不99按摩| 丰满少妇在线观看| 欧美黑人猛交| 国产日韩精品一区二区三区| 91深夜福利视频| 亚洲欧美在线观看视频| 亚洲人成精品久久久 | 最近在线中文字幕| 综合婷婷亚洲小说| 久久精品国产第一区二区三区最新章节| 中文有码在线播放| 99视频一区| 久久伊人精品天天| 亚洲av成人无码久久精品| 中文无码日韩欧| 欧美日韩视频在线一区二区| 欧美亚洲精品一区二区| 黄网站在线免费| 久久婷婷色综合| 俄罗斯精品一区二区| 一本色道久久综合熟妇| 亚洲一区二区三区免费在线观看 | 91福利在线导航| youjizz.com亚洲| 亚欧洲精品视频| 国内欧美视频一区二区| 日本精品在线视频| 国产一级一片免费播放放a| 亚洲影院天堂中文av色| 日韩色视频在线观看| 午夜免费看视频| 欧美粗大gay| 亚洲欧美日韩中文播放| 欧美综合激情| 亚洲 精品 综合 精品 自拍| 高潮精品一区videoshd| av一区二区三区在线观看| 国产乱子伦精品无码码专区| 日本成人在线不卡视频| 欧美在线国产精品| 女人十八岁毛片| 亚洲毛片网站| 91国产视频在线播放| 久久久久久免费观看| 国产精品99久久精品| 色妞在线综合亚洲欧美| 高潮毛片无遮挡| 久操精品在线| 亚洲午夜av久久乱码| 国产又黄又粗视频| 国产亚洲欧美日韩在线观看一区二区| 亚洲精品在线视频| 91成人破解版| 国产一区二区亚洲| 一区二区三区视频在线| 少妇无套高潮一二三区| 日韩啪啪电影网| 神马国产精品影院av| 国产在线免费av| 久久国产成人午夜av影院宅| 俺也去精品视频在线观看| 久久免费看少妇高潮v片特黄| 亚洲国产精品综合久久久| 欧美成人午夜激情在线| 国产精品a成v人在线播放| 中文字幕人成人乱码| 国a精品视频大全| www.日本精品| 蜜臀久久久99精品久久久久久| 国产精品亚洲网站| 国产xxxx在线观看| 成人av免费在线| 欧美13一14另类| √新版天堂资源在线资源| 国产精品午夜在线观看| 黄色免费高清视频| 波多野结衣乳巨码无在线观看| 午夜欧美大尺度福利影院在线看| 国产午夜伦鲁鲁| 成人综合网站| 欧美mv日韩mv国产网站app| yjizz视频| 欧洲杯足球赛直播| 欧美成人午夜激情| 亚洲av中文无码乱人伦在线视色| 免费在线看成人av| 成人欧美一区二区| 韩国精品视频| 一区二区三区四区蜜桃| 亚洲精品无码久久久久久| 国产精品久久久久77777丨| 91精品国产高清一区二区三区| 国产人妻精品午夜福利免费| 亚洲精品3区| 另类图片亚洲另类| 久久国产黄色片| 国产又粗又猛又爽又黄91精品| 国产一区福利视频| 999在线视频| 亚洲国产一区二区a毛片| 杨幂毛片午夜性生毛片 | 色婷婷激情综合| 小日子的在线观看免费第8集| 香蕉久久精品日日躁夜夜躁| 爱福利视频一区| 久久国产视频一区| 国产不卡视频在线播放| 亚洲人成人77777线观看| 91老司机福利在线| 欧美妇女性影城| 97超碰在线资源| 精品99视频| 成人免费视频在线观看超级碰| 人妻少妇精品无码专区| 亚洲欧洲日产国码二区| 日韩精品一区二区三区久久| 伊人精品综合| 久久精品视频导航| 真实新婚偷拍xxxxx| 91免费在线视频观看| aaa人片在线| 三级欧美在线一区| 国产伦精品一区二区三区免费视频 | 国产91色在线免费| a天堂中文在线观看| 国产精品日产欧美久久久久| 黑人糟蹋人妻hd中文字幕| 极品一区美女高清| 久久久久久久亚洲精品| 国产乱码精品一区二区| 国产精品白丝在线| 182午夜在线观看| 欧美精品一区二区三区中文字幕 | 欧美三级日本三级| 久久精品免费看| 亚洲精蜜桃久在线| 怡红院成人在线| 亚洲男人的天堂在线播放| 日韩欧美亚洲视频| av网站免费线看精品| 国产精品久久..4399| 最新国产精品精品视频| 欧美床上激情在线观看| 国产毛片毛片毛片毛片| 国产精品国产三级国产有无不卡 | 日韩精品最新网址| 久久久久久久久久久久久女过产乱| 黄色小说综合网站| 在线国产精品网| 日日狠狠久久| 精品国模在线视频| 国产精品免费无遮挡| 亚洲嫩草精品久久| 曰本三级日本三级日本三级| 午夜精品网站| 国产精品制服诱惑| 理论不卡电影大全神| 亚洲精品少妇网址| 日本黄色中文字幕| 国产精品久久久久久久第一福利 | 麻豆91小视频| 偷拍盗摄高潮叫床对白清晰| 亚洲综合资源| 欧美激情国内偷拍| 欧美在线精品一区二区三区| 高跟丝袜一区二区三区| 国产毛片久久久久久久| 日本网站在线观看一区二区三区| 亚洲高清视频一区二区| 日本一区二区乱| 久久久久久久色| 国产精品麻豆一区二区三区| 欧美美女一区二区| 美女视频黄免费| 99精品1区2区| 99久久国产宗和精品1上映| 99精品视频在线观看免费播放| 92裸体在线视频网站| 国产自产自拍视频在线观看| 亚洲欧洲在线视频| 99热这里只有精品66| 五月综合激情日本mⅴ| 美女脱光内衣内裤| 国模少妇一区二区三区| 欧美视频在线免费播放| 精品国产乱码久久久久久果冻传媒 | 污污的视频在线观看| 亚洲激情视频在线| 日本三级一区二区三区| 亚洲在线免费播放| 久久久久久国产免费a片| 成人夜色视频网站在线观看| 那种视频在线观看| 亚洲字幕久久| 欧美精品一区二区三区四区五区| 欧美男女视频| 69av在线播放| h片在线播放| 亚洲欧美激情四射在线日| 99精品人妻无码专区在线视频区| 精品国产电影一区| 少妇高潮在线观看| 91麻豆国产精品久久| 三级网站免费看| 日本大胆欧美人术艺术动态| 日韩一级片免费视频| 日韩激情一区| 蜜桃av噜噜一区二区三| 亚洲一区二区三区中文字幕在线观看| 国产精品成人播放| 欧美一卡二卡| 久久中文字幕在线视频| 激情在线视频| 亚洲精品国产品国语在线| 国产人妖在线播放| 91久久一区二区| 日韩精品一区二区不卡| 曰韩精品一区二区| 午夜激情视频在线播放| 久久精品男人天堂av| 西西大胆午夜视频| 国产宾馆实践打屁股91| www.久久av.com| 热久久一区二区| 91激情视频在线| 欧美亚洲免费| 99视频在线免费播放| 狠狠入ady亚洲精品| 致1999电视剧免费观看策驰影院| 激情综合网站| 奇米影视首页 狠狠色丁香婷婷久久综合 | 国产免费视频一区二区三区| 欧美午夜视频网站| 日韩av女优在线观看| 亚洲一区二区视频| 久草视频免费播放| 亚洲主播在线观看| 91aaa在线观看| 亚洲女同女同女同女同女同69| 美女网站视频色| 国产精品女主播av| 夫妇交换中文字幕| 日本一区二区免费在线观看视频| 鲁丝一区二区三区| 久久综合久久综合久久| 日韩人妻一区二区三区| 国产视频一区二区三区在线观看| 亚洲午夜福利在线观看| 久久久国产精品午夜一区ai换脸| 91精品人妻一区二区三区蜜桃欧美| 久久久久久亚洲综合影院红桃| 丰满少妇在线观看资源站| 91视频国产资源| 蜜桃传媒一区二区亚洲| 中文字幕久久午夜不卡| 中文字幕乱码av| 亚洲欧美日本韩国| 久久免费公开视频| 黄色精品一区二区| 男人天堂视频网| 欧洲精品一区二区三区在线观看| 中文字幕在线天堂| 欧美日韩国产天堂| 亚洲综合精品在线| 91精品国模一区二区三区| 国产视频在线免费观看| 精品久久国产老人久久综合| 四虎影视2018在线播放alocalhost| 亚洲天堂av女优| 欧美激情视频在线播放| 精品中文字幕在线| 神马久久午夜| 国产成人精品av在线| 精品免费av一区二区三区| 国产精品av网站| 91麻豆精品一二三区在线| 亚洲最大成人网色| 国产精品网站在线看| 欧美日韩综合久久| 婷婷亚洲五月色综合| 菠萝蜜视频在线观看入口| av成人黄色| 在线观看的毛片| 国产精品一区一区三区| 亚洲 欧美 日韩在线| 久久免费美女视频| 性生交大片免费全黄| 一区二区三区四区国产精品| www.av88| 亚洲大胆人体在线| 婷婷在线视频观看| 97久久久久久| 亚洲人成网站在线在线观看| 国产一区二区三区色淫影院| 欧美韩国日本在线观看| 无码专区aaaaaa免费视频| 精品夜夜嗨av一区二区三区| 在线精品一区二区三区| 亚洲同性同志一二三专区| 少妇一级淫片免费放中国| 538在线一区二区精品国产| 欧美精品久久久久久久久久丰满| 久久综合国产精品台湾中文娱乐网| 日本午夜大片a在线观看| 91在线网站视频| 欧美军人男男激情gay| 国产主播自拍av| 国产麻豆一精品一av一免费 | 国产精品日本一区二区三区在线| 欧美日韩在线一二三| 在线观看不卡| 91丨porny丨九色| 国产精品毛片久久久久久| 国产精品男女视频| 亚洲成成品网站| 影音先锋男人资源在线| 成人性教育视频在线观看| 在线日本制服中文欧美| 日本中文字幕亚洲| 国产成人综合精品三级| 国产成人av免费在线观看| 欧美日韩在线播放三区四区| 蝌蚪视频在线播放| 欧美在线观看网站| 加勒比色老久久爱综合网| 天堂а√在线中文在线| 日欧美一区二区| 在线中文字日产幕| 亚洲女人****多毛耸耸8| 一本到在线视频| 久久精品视频99| 国产精品视频一区视频二区 | 成人淫片在线看| 久久高清精品| 天天摸天天舔天天操| 一区二区中文视频| 国产又粗又长又大视频| 日韩视频中文字幕| 91视频成人| 99中文字幕在线观看| 国产美女久久久久| 四虎永久免费在线| 日韩一区二区不卡| 成人av福利| 91嫩草视频在线观看| 欧美日韩三区| 久久精品女同亚洲女同13| 午夜精品免费在线| 三区在线观看| 国产精品18久久久久久麻辣| 国产尤物久久久| 免费看污污网站| 成人免费一区二区三区在线观看| 国产精品伦一区二区三区| 麻豆国产va免费精品高清在线| 久久伊人精品| 国产69精品久久久久999小说| 99久久精品国产精品久久| 日本中文在线播放| 日韩精品视频三区| 欧美极品影院| 一区二区三区四区欧美| 国产精品亚洲一区二区三区在线| 欧美激情一区二区视频| 亚洲护士老师的毛茸茸最新章节| 英国三级经典在线观看| 日韩电影天堂视频一区二区| 久久99精品国产麻豆不卡| 欧美日韩偷拍视频| 日韩福利在线播放| 精品福利在线| 996这里只有精品| 久久久不卡网国产精品二区| 一区二区三区免费在线视频| 欧美国产日韩视频| 国产欧美日韩影院| 制服.丝袜.亚洲.中文.综合懂| 天天影视涩香欲综合网| 福利视频在线导航| 99视频在线播放|