精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic 工程實踐《如何構建多智能體研究系統》

發布于 2025-6-19 06:43
瀏覽
0收藏

一、多智能體系統的優點

  1. 應對研究工作的不可預測性:研究工作通常面臨開放性問題,難以提前預知所需步驟。多智能體系統能夠根據調查過程中出現的新線索動態調整研究方向,與人類研究者類似,自主決策探索路徑,適應復雜多變的研究主題,避免了線性、一次性流程的局限性。
  2. 促進信息壓縮與專注:子智能體通過并行處理不同問題方面,利用各自獨立的上下文窗口,同時探索問題的多個維度,之后提煉出重要信息傳遞給主研究智能體,實現對海量信息的高效壓縮,同時各子智能體獨立運行,減少路徑依賴,保障研究的全面性與獨立性。
  3. 性能擴展優勢:當個體智能達到一定水平后,多智能體系統通過協同合作可實現性能的指數級增長,如同人類社會在信息時代因集體智慧和協作能力而取得的飛速發展。內部評估顯示,以 Claude Opus 4 為主智能體、Claude Sonnet 4 為子智能體的多智能體系統,在處理需要同時探索多個獨立方向的廣度優先查詢任務時,性能超出單智能體 Claude Opus 4 達 90.2%。
  4. 充分利用令牌資源:分析發現,在 BrowseComp 評估中,令牌使用量可解釋 80% 的性能差異,多智能體架構通過將任務分配給具有獨立上下文窗口的多個智能體,增加并行推理能力,有效擴展令牌使用,最新 Claude 模型在提升令牌使用效率方面也發揮了顯著的乘數效應。

二、架構概述

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 編排 - 工作者模式:采用主智能體協調、子智能體并行工作的架構。用戶提交查詢后,主智能體分析查詢、制定策略并創建子智能體,子智能體同時探索問題的不同方面,充當智能過濾器,通過迭代使用搜索工具收集信息并返回給主智能體,最終由主智能體整合結果并生成最終回答,區別于傳統靜態檢索的檢索增強生成(RAG)方法,該架構通過多步搜索動態發現相關信息。
  2. 詳細工作流程:以 LeadResearcher 為主智能體,先在內存中保存計劃,避免上下文窗口超限時丟失計劃,然后創建多個子智能體,子智能體獨立進行網絡搜索、評估工具結果并返回發現,LeadResearcher 根據返回結果決定是否需要進一步研究,可創建更多子智能體或優化策略,最終將所有發現傳遞給 CitationAgent 處理引用,確?;卮饻蚀_引用來源。

三、提示工程與智能體評估

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 像智能體一樣思考:通過模擬工具觀察智能體基于提示和工具的每一步操作,及時發現智能體的錯誤模式,如過度搜索、查詢過于冗長等,以準確的心理模型為基礎,針對性地優化提示。
  2. 教會協調者如何分配任務:主智能體需將查詢分解為子任務并清晰描述給子智能體,包括目標、輸出格式、工具和來源使用指南及任務邊界等,避免子智能體重復工作或遺漏信息,早期因任務描述簡單模糊導致子智能體誤解任務或執行相同搜索,后來通過詳細描述提升了任務分配的有效性。
  3. 根據查詢復雜度調整努力程度:在提示中嵌入努力程度的調整規則,明確不同類型任務所需的智能體數量和工具調用次數,使主智能體能高效分配資源,防止在簡單查詢上過度投入。
  4. 工具設計與選擇至關重要:智能體與工具的接口如同人機接口般關鍵,為智能體提供明確的工具使用啟發式規則,如優先檢查所有可用工具、匹配工具使用與用戶意圖等,同時確保工具描述清晰準確,以避免智能體因工具描述不佳而誤用工具。
  5. 讓智能體自我改進:Claude 4 模型具備優秀的提示工程能力,可診斷智能體失敗原因并提出改進建議,通過創建工具測試智能體,發現工具關鍵細節和問題,優化工具描述,顯著縮短后續智能體完成任務的時間。
  6. 先廣泛搜索再逐步縮小范圍:引導智能體采取與專家人類研究員類似的搜索策略,先進行簡短、廣泛的查詢,評估可用信息后再逐步聚焦,避免智能體直接使用過長、過于具體的查詢導致結果過少。
  7. 引導思考過程:利用擴展思考模式作為可控的草稿紙,主智能體借助思考規劃方法,子智能體在工具結果后進行交錯思考,評估質量、識別差距并優化下次查詢,提升智能體在適應任務方面的效果。
  8. 并行工具調用的優勢:復雜研究任務涉及多信息源探索,早期智能體的串行搜索效率低下,引入主智能體并行創建多個子智能體以及子智能體并行使用多個工具的方式,大幅縮短了復雜查詢的研究時間,提高了信息覆蓋范圍。

四、對智能體的有效評估

  1. 立即開始小樣本評估:在智能體開發早期,小規模測試案例就能顯著展現提示調整等變更的影響,及時發現低垂果實般的顯著提升效果,避免因等待大規模評估而延誤優化時機。
  2. 大規模有效利用大型語言模型(LLM)作為評判者:研究輸出通常為自由形式文本且答案不唯一,LLM 適合用于評判輸出,可依據評分標準評估輸出的準確性、引用準確性、完整性、來源質量和工具效率等多方面,通過單次 LLM 調用輸出分數和通過 / 失敗等級,實現與人類判斷高度一致且可擴展的評估方式。
  3. 人工評估彌補自動化不足:人工測試能發現自動化評估遺漏的邊緣情況,如智能體在特殊查詢上產生幻覺答案、系統故障或存在細微的來源選擇偏差等,有助于針對性地優化智能體的提示等,完善智能體的行為表現。

五、生產可靠性與工程挑戰

Anthropic 工程實踐《如何構建多智能體研究系統》-AI.x社區

  1. 智能體的狀態保持與錯誤處理:智能體在長時間運行中需保持狀態,為此要可靠地執行代碼并處理錯誤,構建可在錯誤發生后從中斷處恢復的系統,并借助模型的智能讓智能體在工具失敗等情況下靈活適應,結合重試邏輯和定期檢查點等確定性保障措施。
  2. 調試新方法的需求:智能體的動態決策和非確定性增加了調試難度,添加全面的生產追蹤功能,監測智能體的決策模式和交互結構等,幫助診斷智能體失敗原因,系統性地解決問題。
  3. 部署的協調問題:智能體系統是高度狀態化的持續運行系統,部署更新時需防止新代碼破壞正在運行的智能體,采用彩虹部署策略,逐步將流量從舊版本轉移到新版本,確保更新過程的平穩過渡。
  4. 同步執行的瓶頸與異步執行的挑戰:目前主智能體的同步執行方式造成信息流瓶頸,而異步執行雖能增加并行性,卻也帶來了結果協調、狀態一致性和錯誤傳播等新的挑戰,未來隨著模型能力提升,異步執行的性能優勢將更受重視。

六、總結

構建多智能體系統從原型到生產面臨諸多挑戰,如:代碼的生產化改造、錯誤的級聯效應、狀態管理等,但這些系統在開放式研究任務中展現出巨大價值。

通過精心的工程設計、全面的測試、細致的提示與工具設計、穩健的運營實踐以及跨部門協作,能夠可靠地大規模運行,為用戶解決復雜問題帶來變革,如發現商業機會、輔助醫療決策、解決技術難題等。

七、額外建議

  1. 具有狀態變化的智能體的最終狀態評估:評估多輪對話中修改持久狀態的智能體時,聚焦于最終狀態而非每輪交互,對于復雜工作流,可設置離散檢查點,確保各階段狀態變化符合預期。
  2. 長期對話管理:生產智能體在超長對話中需智能壓縮和存儲記憶,采用總結已完成工作階段、外部存儲關鍵信息等策略,必要時創建新子智能體并保持對話連貫性。
  3. 子智能體輸出至文件系統以減少信息失真:通過文件系統獨立存儲子智能體輸出,僅向協調智能體傳遞輕量級引用,避免信息在多階段處理中丟失,同時降低對話歷史中的令牌開銷,特別適用于結構化輸出的生成。

本文轉載自????CourseAI????,作者:CourseAI

收藏
回復
舉報
回復
相關推薦
欧美日韩一区综合| 日韩欧美中文一区| 水蜜桃一区二区| 国产一区二区在线播放视频| 午夜激情一区| 亚洲国产精品热久久| 欧美二区在线视频| 欧美性猛交xxx乱大交3蜜桃| 久久99国内精品| 久久久久久香蕉网| 国产全是老熟女太爽了| 亚洲视频自拍| 粉嫩av一区二区三区免费野| 一本色道久久综合亚洲精品婷婷| 午夜精品久久久久久久96蜜桃| 日韩午夜黄色| 久久激情视频免费观看| 少妇户外露出[11p]| 999久久久国产999久久久| 欧美日韩国产黄| 精品一区二区成人免费视频| 四虎影视在线观看2413| 国产麻豆日韩欧美久久| 国产成人avxxxxx在线看| 激情五月婷婷在线| 日韩情爱电影在线观看| 香蕉视频网站在线| 一本色道精品久久一区二区三区 | 亚洲天天做日日做天天谢日日欢| 国产chinese精品一区二区| 狠狠躁夜夜躁人人爽天天高潮| 日韩国产一区二区三区| 精品视频—区二区三区免费| avtt中文字幕| 99综合久久| 欧美日韩精品系列| 欧洲黄色一级视频| 丁香花在线观看完整版电影| 最新国产精品久久精品| 亚洲精品9999| 国产精品天堂| 国产亚洲精品中文字幕| 免费在线一区二区| 婷婷五月综合激情| 9色porny自拍视频一区二区| 91在线免费看片| 国产a级免费视频| 精品在线免费视频| 国产一区香蕉久久| 国产精品国产三级国产aⅴ| 日本成人中文字幕| 国产精品视频午夜| 伊人网综合在线| 日韩主播视频在线| 国产精品电影久久久久电影网| 国产91精品一区| 一区二区三区四区五区精品视频 | 亚洲精品视频在线播放| 香港三日本8a三级少妇三级99| 哺乳挤奶一区二区三区免费看 | 国产精品久久久久久久久久三级 | 国产成人无码精品久久久久| 在线成人www免费观看视频| 欧美激情一区二区三区成人| 玖玖爱免费视频| 亚洲区国产区| 69av在线视频| 国产一卡二卡三卡| 久久机这里只有精品| 91免费国产网站| 国产农村妇女毛片精品久久| 国产一区二区三区四| 亚洲一区二区三区乱码aⅴ| 国产农村妇女毛片精品| 成人avav影音| 欧洲精品久久| 国产剧情在线| 亚洲午夜久久久久久久久电影网| 伊人成色综合网| 亚洲不卡系列| 欧美成人精品高清在线播放| 亚洲国产精品自拍视频| 欧美日韩性在线观看| 久久偷看各类女兵18女厕嘘嘘| 亚洲精品一区二区三区四区| 国产酒店精品激情| 国产精品果冻传媒潘| 色偷偷在线观看| 午夜精品福利在线| 亚洲狠狠婷婷综合久久久| 国产精品涩涩涩视频网站| 波多野结衣在线观看| 粉嫩av一区二区三区免费野| 一区二区三区 日韩| 亚洲精品a区| 亚洲精品中文字幕女同| 中文字幕第69页| 精品动漫3d一区二区三区免费| 青青草国产精品一区二区| 国产孕妇孕交大片孕| 不卡欧美aaaaa| 亚洲欧洲久久| 久久www人成免费看片中文| 在线视频综合导航| 成人免费看片载| 欧美日中文字幕| 国内揄拍国内精品| 国产又粗又猛又爽又黄91| 91女厕偷拍女厕偷拍高清| 一区二区不卡在线视频 午夜欧美不卡'| 国产传媒在线播放| 欧洲精品中文字幕| 亚洲啪av永久无码精品放毛片| 欧美日韩高清| 7m精品福利视频导航| 国产婷婷在线视频| 亚洲国产精品黑人久久久| 国产av麻豆mag剧集| 国产午夜久久av| 中文字幕日韩av电影| 亚洲国产成人精品激情在线| 国产·精品毛片| 亚洲一区二区三区免费观看| 国模套图日韩精品一区二区| 精品精品国产高清a毛片牛牛| 国产人与禽zoz0性伦| 久久一区二区三区四区五区| 国产伦视频一区二区三区| 国产91在线视频蝌蚪| 欧美日韩免费不卡视频一区二区三区| 特级西西人体4444xxxx| 一区二区视频欧美| 91免费看蜜桃| 国产丝袜在线| 欧美日韩第一区日日骚| 天堂在线中文视频| 视频一区在线播放| 日本精品二区| 日韩欧美看国产| 国产视频久久久久| 九九精品免费视频| 99国产精品一区| 99热自拍偷拍| 丝袜美腿综合| 日本精品一区二区三区在线 | 日韩欧美国产系列| 永久av免费网站| 美国毛片一区二区| 亚洲综合欧美日韩| 九九久久国产| 色狠狠久久aa北条麻妃| 亚洲特级黄色片| 国产精品久久久久久久久久免费看 | 久久这里精品| 亚洲亚洲人成综合网络| 香蕉久久久久久av成人| 欧美午夜一区| 国产精品免费一区二区| 草美女在线观看| 日韩av在线高清| 日韩精品1区2区| 久久久久国产免费免费| 国内外免费激情视频| 亚洲中文一区二区三区| 中文字幕乱码亚洲精品一区| www.亚洲天堂| 波多野结衣激情视频| 欧美韩国日本综合| 在线观看国产福利| 亚洲精品成人| 国产另类自拍| 欧美大片免费高清观看| 亚洲一区999| 97人妻人人澡人人爽人人精品| 亚洲欧美乱综合| 国产污在线观看| 免费在线观看成人av| 亚洲精品一区二区毛豆| 欧美电影院免费观看| 韩国三级日本三级少妇99| 青青青草原在线| 精品视频在线免费看| 永久免费看黄网站| 99久久夜色精品国产网站| 亚洲成熟丰满熟妇高潮xxxxx| 久久亚洲国产| 国产一区二区三区高清视频| 亚洲a∨精品一区二区三区导航| 久久精品99久久香蕉国产色戒| 亚洲国产精品久久人人爱潘金莲 | 精品国产91亚洲一区二区三区婷婷| 久久久久久久极品内射| 久久久www免费人成精品| 91亚洲精品久久久蜜桃借种| 在线日本高清免费不卡| 日韩欧美在线观看强乱免费| 久久的色偷偷| 国产高清在线不卡| 牛牛精品在线| 中文字幕精品网| 少妇高潮一区二区三区69| 欧美一a一片一级一片| 精品午夜福利在线观看| 欧美国产日韩亚洲一区| 中国黄色片视频| 免费不卡在线视频| 亚洲不卡中文字幕无码| 欧美激情成人| 欧美日韩亚洲免费| 北条麻妃一区二区三区在线| 国产精品视频久久| 超碰aⅴ人人做人人爽欧美| jizzjizz欧美69巨大| 欧美一级艳片视频免费观看| 国产亚洲精品码| 国产日韩欧美不卡| 日本精品一二三区| 免费在线视频一区| 国产极品尤物在线| 亚洲精品国产首次亮相| 免费观看成人高| 91国内精品白嫩初高生| 国产精品一区二区三| 蜜桃视频m3u8在线观看| 久久成人这里只有精品| av资源种子在线观看| 日韩大陆欧美高清视频区| 国产女人18毛片18精品| 欧美日韩在线播放三区| 国产午夜免费福利| 亚洲成人精品一区二区| 欧美三级日本三级| 成人免费一区二区三区在线观看| 国产美女精品久久| 97se亚洲国产综合自在线| 国产精品日日摸夜夜爽| 韩国毛片一区二区三区| 污版视频在线观看| 日韩精品一二区| www黄色av| 亚洲另类自拍| 欧美一级视频免费看| 欧美午夜不卡影院在线观看完整版免费| 中文字幕中文字幕99 | 欧美一区二区福利视频| 一级黄色大片免费| 欧美日本免费一区二区三区| 中文字幕在线网址| 欧美日韩国产一级二级| 在线观看免费观看在线| 欧美日韩免费观看一区三区| 91精品国产乱码久久| 7777精品伊人久久久大香线蕉的| 91久久精品无码一区二区| 欧美日韩在线播放三区四区| 91成人一区二区三区| 欧美精品成人一区二区三区四区| 丰满熟女人妻一区二区三| 欧美亚洲高清一区二区三区不卡| 欧美 亚洲 另类 激情 另类| 欧美日韩成人在线播放| 色播视频在线播放| 亚洲一区二区av电影| 妺妺窝人体色www在线下载| ...中文天堂在线一区| 国产午夜精品理论片在线| 成人欧美一区二区三区视频网页 | 欧美理论电影在线精品| 国产三级精品在线不卡| 噜噜噜91成人网| 精品乱色一区二区中文字幕| 哺乳一区二区三区中文视频| 国产精品一区二| 日本亚洲不卡| 日韩精品一区二区三区色偷偷 | 欧美激情导航| 欧美一级精品片在线看| 亚洲一区二区在线看| 无码国产精品96久久久久| 91精品国产aⅴ一区二区| 性做久久久久久久久久| 日韩风俗一区 二区| 国产三级视频在线看| 久久手机免费视频| 超碰成人av| 国产精品视频一| 国产精品sss在线观看av| 欧美成人第一区| 久久久久久久久久久妇女| 国产精品无码人妻一区二区在线| 日韩中文字幕亚洲一区二区va在线| 粉色视频免费看| 成人aa视频在线观看| 日本高清黄色片| 亚洲1区2区3区视频| 精品乱码一区内射人妻无码| 精品国产自在久精品国产| 精品三级久久久久久久电影聊斋| 久久精品视频一| 在线一区av| 亚洲最大福利视频网| 国产精品一国产精品| 欧美另类videos| 老司机午夜免费精品视频| 69久久精品无码一区二区| 久久久天堂av| 久久香蕉精品视频| 欧美日韩国产系列| 日本大片在线观看| 欧美黑人性视频| 巨大黑人极品videos精品| 狠狠色综合色区| 中文字幕一区二区三三| 欧美一级裸体视频| www.成人在线| 久久久.www| 欧美日韩成人综合天天影院| 蜜桃视频在线免费| 欧美精品videos| 国内精品视频| 亚洲一区3d动漫同人无遮挡 | 精品日本12videosex| 999一区二区三区| 狠狠色狠狠色合久久伊人| 级毛片内射视频| 精品久久久久久久久中文字幕| av中文字幕免费| www.国产精品一二区| 日韩三区免费| 欧美性天天影院| 先锋影音久久久| 女尊高h男高潮呻吟| 午夜精品一区在线观看| 丰满少妇高潮在线观看| 欧美老女人性生活| 精品一区二区三区亚洲| 99亚洲精品视频| 国产专区综合网| 91久久久久久久久久久久久久| 欧美在线观看视频一区二区三区| 午夜小视频在线播放| 韩国三级电影久久久久久| 岛国在线视频| 日韩精品免费在线视频| 国内在线免费视频| 99re国产在线播放| 黄色欧美日韩| 亚洲色偷偷色噜噜狠狠99网| 亚洲精品视频在线观看免费 | 91麻豆精品国产91久久久久| av在线中文| 国产免费观看久久黄| 午夜欧美性电影| 亚洲色图图片| 一区二区三区在线视频111| 秋霞午夜av一区二区三区| 99久久久无码国产精品衣服| 91高清视频在线| 国产视频在线看| 国产精品h在线观看| 成人亚洲一区| 亚洲另类第一页| 亚洲男人的天堂一区二区| www.超碰97.com| 亚洲色图一区二区三区| 精品乱子伦一区二区| 久久久久九九九九| 日韩成人午夜| 青青青在线视频免费观看| 国产欧美精品一区| 国产一区二区在线播放视频| 欧美国产亚洲精品久久久8v| 久久精品国产亚洲5555| 日韩毛片在线免费看| 国产精品久久毛片av大全日韩| 国产免费一区二区三区最新不卡| 欧美激情喷水视频| 亚洲欧美综合另类在线卡通| 美国一级黄色录像| 欧美日韩国产电影| 中文国产字幕在线观看| 国产日本一区二区三区| 久久久久国产精品一区三寸| 永久免费毛片在线观看| 这里只有精品免费| 成年网站在线视频网站| 久中文字幕一区| 精品一二三四区| 日韩经典在线观看| 最近2019免费中文字幕视频三| 精品一区二区三区中文字幕 | 国产一线在线观看| 在线观看欧美日本| 亚洲婷婷噜噜| 日韩久久久久久久久久久久久| 国产一区二区三区在线观看免费视频 | 亚洲精品久久久久久国产精华液| 精品国产无码AV| 7777精品久久久久久| 国产精品精品国产一区二区|