精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MetaGPT開源自動生成智能體工作流,4.55%成本超GPT-4o

開源 人工智能
MetaGPT 開源了 AFLOW,它使用 MCTS 進行 Agentic Workflow 的自動搜索,可以完全自動地構建與優化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調試提示詞。

AFLOW 作者團隊來自于 MetaGPT 開源社區。AFLOW 論文共同第一作者為香港科技大學(廣州)的博士生張佳釔和 DeepWisdom 研究員向勁宇,共同通訊作者為 DeepWisdom 創始人兼 CEO 吳承霖(MetaGPT 代碼作者、論文通訊作者)和香港科技大學(廣州)的助理教授駱昱宇。作者還包括中國人民大學的于兆洋、滕楓蔚和程信,南京大學 LAMDA 實驗室博士生陳雄輝,復旦大學的陳家祺和鄭炳南,阿卜杜拉國王科技大學的博士生諸葛鳴晨(MetaGPT 論文共同一作),DeepWisdom 研究員洪思睿(MetaGPT 論文共同一作)和王金淋,蒙特利爾大學與 MILA 實驗室的助理教授劉邦。

對于 LLM 從業者來說,讓 LLM 落地應用并發揮作用需要手動構建并反復調試 Agentic Workflow,這無疑是個繁瑣過程,一遍遍修改相似的代碼,調試 prompt,手動執行測試并觀察效果,并且換個 LLM 可能就會失效,有高昂的人力成本。許多公司甚至專職招聘 Prompt Engineer 來完成這一工作。

現在,Agentic Workflow 也有自己的自動優化工具了。

MetaGPT 開源了 AFLOW,它使用 MCTS 進行 Agentic Workflow 的自動搜索,可以完全自動地構建與優化 Agentic Workflow 問題,讓我們不再需要手寫代碼、調試提示詞。

圖片

AFLOW 通過蒙特卡洛樹搜索優化工作流,極低成本實現 GPT-4o 級能力

這是對提示詞自動優化的進一步探索,通過蒙特卡洛樹搜索,完全接管了 Agentic Workflow 的生成與優化過程,表現遠超其他工作流自動優化工作,甚至超越了對比的所有手工工作流基線。

圖片

  • 論文標題:AFlow: Automating Agentic Workflow Generation
  • 論文地址:https://arxiv.org/abs/2410.10762
  • 項目地址:https://github.com/geekan/MetaGPT/tree/main/examples/aflow

什么是自動工作流優化問題?

現有的 Agentic Workflow 自動生成工作難以生成有效的工作流,它們往往需要人工介入初始設置,且無法全面捕捉到完成任務所需的工作流多樣性。為了克服這些挑戰,研究人員提出了 AFLOW 框架。利用蒙特卡洛樹搜索(MCTS)技術來系統地探索和優化 LLM 的工作流。AFLOW 通過將工作流定義為代碼可表示的節點和邊,從而有效地捕捉 LLMs 調用之間的復雜交互。通過引入操作符的概念,AFLOW 進一步簡化了搜索空間,提高了搜索效率。在多個基準數據集上的實驗結果表明,AFLOW 能夠自動發現和優化工作流,顯著提高了任務執行的性能,同時減少了對人工干預的依賴。

圖片

AFLOW 的動態演示。通過不斷迭代的選擇、擴展、評估和反向傳播實現工作流的自動化生成和優化

AFLOW 首先將工作流優化問題重新構建為一個搜索問題,其中工作流被表示為代碼化的節點序列,每個節點代表 LLM 的一個具體操作,節點之間的邊定義了操作的邏輯、依賴關系和執行流程。這種表示方法將工作流轉化為一個可以搜索和優化的圖結構。具體來說,工作流 W 被定義為一個 LLM 調用節點序列圖片,其中每個節點圖片包含模型 M,提示 P,溫度,輸出格式 F(如 xml、json、markdown、raw)四個參數。節點通過邊連接,邊可以由各種結構表示,如圖,神經網絡,代碼。

自動化工作流優化的目標是在給定任務 T 和評估函數 G 的情況下,發現一個工作流 W ,使得 G(W,T) 最大化。這可以被表述為一個搜索過程,其中算法 A 探索搜索空間 S 來確定最優的工作流配置。搜索空間 S 包括所有可能的節點參數和邊結構的配置。

圖片

Node、Operator 和 Edge 示例。此處展示 Node 的可選參數、Operator 常見結構和 Edge 的常見表示

AFLOW 如何自動優化工作流?

AFLOW 利用蒙特卡洛樹搜索(MCTS)來自動化地生成和優化 Agentic Workflow。在 AFLOW 框架中,Operator 扮演著至關重要的角色,它們是預定義的、可重用的節點組合,代表常見的智能體操作(比如審查,投票,生成)。這些 Operator 作為構建工作流的基礎構件,被集成到搜索空間中,確保探索過程可以利用已知的有效智能體操作模式。引入 Operator 能夠顯著提升 AFLOW 框架的搜索效率和工作流的優化效果,減少在龐大搜索空間中的盲目探索。

AFLOW 的目標是在給定任務和評估函數的情況下,發現一個能夠最大化任務性能的工作流。AFLOW 算法開始于初始化模板工作流,這個模板提供了一個基本的工作流框架,包括 LLM 節點的調用和 Operator 的使用。然后,算法通過 MCTS 的四個主要步驟進行迭代:選擇(Selection)、擴展(Expansion)、評估(Evaluation)和反向傳播(Backpropagation)。

圖片

AFLOW 整體框架:通過設置一個由僅具有靈活 prompt 參數的節點、給定的運算符集和表示邊的代碼組成的搜索空間,AFLOW 在此空間內執行基于 MCTS 的搜索。通過為工作流優化而設計的 MCTS 變體,AFLOW 迭代執行軟混合概率選擇、基于 LLM 的擴展、執行評估和經驗反向傳播的循環,直到達到最大迭代次數或滿足收斂標準

選擇階段 AFLOW 使用軟混合概率選擇機制來選擇一個節點進行擴展。這種機制結合了均勻概率分布和基于分數的加權概率分布,以平衡探索和利用,避免陷入局部最優解。選擇過程中,AFLOW 會考慮候選節點的得分和探索的需要,從而選擇一個既有可能帶來性能提升又具有探索價值的節點。

擴展階段 AFLOW 使用 LLM 作為優化器來生成新的工作流。優化器利用選定工作流的經驗來生成新的提示或通過修改代碼來改變節點連接,從而產生新的工作流變體。這些新的工作流變體是通過對現有工作流的微小調整來實現的,例如添加、修改或刪除節點和邊。

評估階段 AFLOW 直接執行生成的工作流以獲得反饋。由于推理任務具有明確的評估函數,AFLOW 可以通過在驗證集上多次運行工作流來計算平均分和標準差,從而獲得更準確的優化器反饋。

反向傳播階段 工作流的性能信息被反向傳播到 MCTS 的樹結構中,用于更新節點的得分,并指導未來的搜索迭代。這些信息包括工作流的執行結果和相對于其父工作流的優化成功與否。通過這種方式,AFLOW 能夠從每次迭代中學習,并逐漸改進工作流的性能。

為了避免在優化達到極限后繼續執行的不必要成本,當連續幾輪中分數優先的前 k 個工作流沒有改進時,AFLOW 將停止上述迭代過程。

AFLOW 帶來的 Agentic Workflow 變革

顯著的性能優勢 AFLOW 選取了六個文本推理的任務,覆蓋了代碼(HumanEval, MBPP),數學(GSM8K, MATH),知識問答(HotpotQA, DROP)三個場景。相比現有手動方法平均提升 5.7%,較其他自動化方法更是提升了 19.5%。在所有六個任務中,AFLOW 展現出全面的領先優勢,證明了其在不同任務類型上的穩定性和適應性。

圖片

與其他方法的性能比較。為了評估該方法的性能,我們在不同的數據集中采用了各種指標:Math 和 GSM8K 的求解率、HotpotQA 和 DROP 的 F1 分數以及 HumanEval 和 MBPP 的 pass@1。我們的 AFLOW(以黃色突出顯示)在所有六個基準測試中始終優于所有自動工作流程優化和手動設計的方法

顯著成本降低 AFLOW 為 Agent 領域帶來的最大變革在于其顯著的成本降低。較小尺寸的模型通過 AFLOW 找出的工作流,僅需 GPT-4o 推理成本的 4.55% 就能實現同等性能。這一突破意味著企業可以用更小的模型實現大模型的效果,為 AI 應用的規模化部署提供了經濟可行的解決方案。

圖片

成本(Cost)指執行分割后 HumanEval 測試集的總費用。AFLOW(模型)指 AFLOW 使用該模型執行工作流,獲得反饋。圖例中的顏色代表在測試數據集中執行工作流所使用的不同 LLM

自動化的效率提升 AFLOW 徹底改變了傳統的人工調試模式。通過自動化的工作流生成與優化機制,顯著減少了人工參與的需求。開發者不再需要花費大量時間進行反復調試和優化,系統能夠自動發現最優的工作流組合,大幅縮短了開發周期。

廣泛的適用性 實驗結果表明,AFLOW 展現出優秀的遷移能力。它不僅支持多種主流 LLM 模型,還能適應不同類型的任務需求。在問答、代碼生成、數學問題求解等多個領域的測試中,AFLOW 都表現出色,證明了其作為通用優化框架的價值。此外,用戶可以通過簡單的提供數據集與 Evaluation Function 來將 AFLOW 使用在自己的任務上。

展望

AFLOW 提出了一種有效生成 Agentic Workflow 的方法,并全面展示了其在降低人力與推理成本上的驚人能力。這一研究成果有望加速 Agent 在各個領域落地的速度,將 Agentic Workflow 的構建過程從專家手工構建轉變為小白自動構建。

使用

目前,作者已在 GitHub 上開源了完整代碼。用戶可通過自定義 Benchmark 與數據集,快速為個性化任務搜索最佳性能或性能成本平衡的工作流方案,幫助個人和企業節省大量時間。

圖片

AFLOW 的 Github 指南??梢詤⒄辗植街改吓渲煤瓦\行 AFLOW,高效生成和優化工作流

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-26 09:05:00

2025-06-06 14:17:11

模型訓練AI

2025-11-04 08:42:27

2025-04-15 08:01:12

2024-12-04 15:57:56

2025-04-08 02:26:00

2024-08-14 14:30:00

AI訓練

2024-05-17 09:35:55

GPT-4o模型OpenAI

2025-07-23 09:32:02

2025-08-07 14:05:40

OpenAI大模型開源

2024-06-27 12:45:30

2025-07-07 09:05:00

AI數據模型

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-07-07 08:49:00

2024-11-22 14:10:00

AI智能體

2025-02-17 12:24:43

2024-09-06 13:00:29

2025-03-31 08:50:00

AI生成模型

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI
點贊
收藏

51CTO技術棧公眾號

久久夜靖品2区| 中文字幕第一页在线视频| 瑟瑟在线观看| 日韩电影在线免费观看| 久久好看免费视频| 国产高清成人久久| ww久久综合久中文字幕| 亚洲精品一二三区| 久久婷婷开心| 国产又大又粗又硬| 亚洲精品日本| www.亚洲一区| 绯色av蜜臀vs少妇| 国产私拍福利精品视频二区| 亚洲激情中文1区| 女同一区二区| 亚洲av无码国产精品永久一区| 欧美亚洲自偷自偷| 欧美精品一区二区免费| 99久久久无码国产精品性| 日韩高清在线观看一区二区| 色88888久久久久久影院按摩| 日本成人在线不卡| 国产综合在线观看| 成人精品国产免费网站| 国产精品美女在线| 自拍偷拍欧美亚洲| 午夜激情一区| 丝袜美腿精品国产二区| 久久久国产精品无码| 激情综合五月| 欧美日韩aaaaaa| 黄色av免费在线播放| 超碰在线网站| 一区二区三区四区视频精品免费| 亚洲精品国产一区| 青青色在线视频| gogogo免费视频观看亚洲一| 999视频在线免费观看| 亚洲天堂手机在线| 视频一区二区欧美| 欧美在线观看网址综合| 国产亚洲精久久久久久无码77777| 欧美电影《轻佻寡妇》| 中文字幕精品久久久久| 久久只有这里有精品| 亚洲传媒在线| 亚洲美女精品成人在线视频| 第四色在线视频| silk一区二区三区精品视频| 日韩手机在线导航| 国产精欧美一区二区三区白种人| xxxxx.日韩| 欧美三电影在线| 韩国视频一区二区三区| 亚洲一区二区三区四区| 一本到三区不卡视频| 精品国产免费av| 亚洲黄色中文字幕| 一本到一区二区三区| 久久精品香蕉视频| 欧美韩国亚洲| 欧美视频一区二| 亚洲三级视频网站| 精品自拍视频| 5858s免费视频成人| 特级西西444www| 免费欧美网站| 精品久久一区二区三区| 国产老熟女伦老熟妇露脸| 女同久久另类99精品国产| 日韩风俗一区 二区| 久久久久久久久久久国产精品| 日韩欧美天堂| 亚洲无限av看| 国产成人免费在线观看视频| 91精品国产91久久久久久黑人| 欧美成人精品一区| 国产网友自拍视频| 免费看黄裸体一级大秀欧美| 国产黑人绿帽在线第一区| 免费看av在线| 国产一区二区剧情av在线| 成人做爰66片免费看网站| 天堂成人在线观看| 国产日产欧产精品推荐色 | 五月天中文字幕| 麻豆免费看一区二区三区| 亚洲japanese制服美女| 无码国产精品一区二区色情男同| 久久久五月婷婷| 欧美日韩视频免费在线观看| 国产盗摄精品一区二区酒店| 日本丶国产丶欧美色综合| 在线免费看污网站| 台湾佬综合网| www.国产精品一二区| 久久久久99精品成人片毛片| 久久久蜜桃一区二区人| 91精品久久久久久久久久久久久| 黑人精品一区二区三区| 亚洲国产精品精华液2区45| 国产女教师bbwbbwbbw| 欧美黑人疯狂性受xxxxx野外| 欧美日本在线观看| 国产一级伦理片| 国产精品久久久久久久久久10秀| 久久久久这里只有精品| 中文字幕一区二区久久人妻| www.爱久久.com| 亚洲一区二区精品在线观看| 水蜜桃在线视频| 欧美一区二区在线免费播放| 人妻体内射精一区二区| 欧美另类综合| 国产精品爽黄69| 天天操天天射天天| 一区二区三区在线免费| 中文字幕亚洲乱码| 奇米狠狠一区二区三区| 欧美日本中文字幕| 在线观看免费观看在线| 2欧美一区二区三区在线观看视频| 国产树林野战在线播放| 国模一区二区| 日韩av在线网址| 久草成人在线视频| 韩国女主播成人在线| 欧美重口乱码一区二区| 国产美女精品写真福利视频| 日韩欧美一级二级三级久久久| 老司机福利在线观看| 另类图片国产| 国产在线一区二区三区四区 | 香蕉久久夜色精品国产更新时间| 欧美裸体男粗大视频在线观看| 国产精品51麻豆cm传媒 | av软件在线观看| 欧美色区777第一页| 亚洲av无码一区二区三区人| 99精品欧美| 国产精品麻豆免费版| h片在线播放| 欧美一区二区三区四区五区| 日韩在线一卡二卡| 蜜桃一区二区三区在线观看| 色噜噜一区二区| 成人mm视频在线观看| 中文字幕欧美日韩在线| 中文字幕欧美人妻精品一区蜜臀| 国产欧美日韩久久| 黄大色黄女片18第一次| 天天久久综合| 91性高湖久久久久久久久_久久99| 天天影视久久综合| 欧美日韩黄视频| 亚洲国产精品一区二区久久hs| 美女视频黄频大全不卡视频在线播放 | 在线免费观看高清视频| 日本一区二区免费在线 | 成人全视频在线观看在线播放高清| 亚洲欧美激情一区| 秋霞av一区二区三区| 国产三级精品在线| 亚洲免费999| 一本精品一区二区三区| 成人激情av| 俺来也官网欧美久久精品| 亚洲黄页网在线观看| 免费观看成人毛片| 国产婷婷色一区二区三区| 久久久久久久久久久久久国产精品| 国产毛片一区二区三区| 国产精品夜间视频香蕉| 青青草原国产在线| 精品视频一区在线视频| 国产性生活视频| 欧美激情一区在线观看| 亚洲黄色片免费看| 伊人久久综合| 日本在线成人一区二区| www.欧美视频| 久久久久在线观看| 超碰国产在线| 精品美女被调教视频大全网站| 欧美日韩精品区| 国产精品家庭影院| 人妻激情偷乱频一区二区三区| 久久精品123| 97超碰免费观看| 免费看久久久| 国产欧美日韩免费看aⅴ视频| 日韩伦理av| 国产视频精品自拍| 99久久久久久久| 欧美午夜性色大片在线观看| 一级性生活免费视频| 国产 日韩 欧美大片| 男女视频一区二区三区| 欧美另类视频| 亚洲乱码一区二区三区| 高清精品视频| 国产在线日韩在线| 综合日韩av| 欧美多人乱p欧美4p久久| 精品福利视频导航大全| 欧美变态口味重另类| 中文字幕a级片| 欧美日韩国产丝袜另类| 美女的奶胸大爽爽大片| 国产亚洲女人久久久久毛片| 黑人玩弄人妻一区二区三区| 蜜桃视频第一区免费观看| 69堂免费视频| 国产精品久久| 正在播放91九色| 在线看成人短视频| 国产精品免费区二区三区观看| 亚洲日本免费电影| 国产精品69av| 日韩激情电影| 久久久免费精品视频| 米奇777四色精品人人爽| 亚洲天堂网站在线观看视频| 日韩中文字幕免费在线观看| 欧美一级免费观看| 亚洲综合网av| 欧美影院精品一区| 黄色av网站免费| 欧美日韩在线视频观看| 久久精品国产亚洲AV无码麻豆| 中文字幕一区二| 香蕉成人在线视频| 国产亚洲自拍一区| 中国美女乱淫免费看视频| 国产成人av电影免费在线观看| 999久久久精品视频| 久久99精品网久久| 一区二区在线免费看| 丝袜美腿亚洲一区二区图片| 日本女优爱爱视频| 日日夜夜精品免费视频| 黄色一级免费大片| 三级精品在线观看| 亚洲免费av一区二区三区| 三级欧美韩日大片在线看| av免费在线播放网站| 欧美亚洲专区| 少妇高清精品毛片在线视频 | 一区二区在线免费看| 麻豆成人免费电影| 亚洲娇小娇小娇小| 美女爽到高潮91| 在线观看免费不卡av| 国内成人自拍视频| 丰满少妇一区二区三区专区| 国产成人免费xxxxxxxx| 香蕉视频在线观看黄| 国产传媒一区在线| 国产精品无码电影| 久久婷婷久久一区二区三区| 日本高清www| 国产欧美一区二区精品久导航| 国产在线免费av| 亚洲人成在线播放网站岛国 | 色偷偷一区二区三区| 欧美男人天堂网| 在线播放欧美女士性生活| av加勒比在线| 亚洲第一精品自拍| 日本一区高清| 一本色道久久综合狠狠躁篇的优点 | 欧美激情黑白配| 日本高清免费不卡视频| 一区二区三区精| 日韩精品最新网址| 日韩偷拍自拍| 日韩色av导航| 国产理论电影在线| 日本乱人伦a精品| 日韩福利影视| 国产精品香蕉视屏| 精品国产一区二区三区四区| 特级黄色录像片| 日韩午夜精品| 亚洲一级免费观看| 丁香亚洲综合激情啪啪综合| 一级片视频免费看| 一区二区三区中文字幕精品精品| 韩国av中文字幕| 欧美日韩国产三级| 深夜福利免费在线观看| 久久精品视频播放| 欧美日韩国产观看视频| 国产日韩欧美黄色| 免费看成人人体视频| 在线视频精品一区| 亚洲伊人观看| 韩国三级在线播放| 国产欧美日韩激情| 精品处破女学生| 欧美亚一区二区| 神马久久久久久久久久| 精品国产一区二区三区四区在线观看| 国产高潮在线| 亚洲伊人一本大道中文字幕| 国产99亚洲| 97免费视频观看| 日韩av中文字幕一区二区| 免费看毛片的网站| 亚洲日本va在线观看| 午夜精品免费观看| 精品美女一区二区| 黄色免费在线看| 国产成人精品国内自产拍免费看| 国产精品x8x8一区二区| 欧美 日韩 国产 在线观看| 日韩专区欧美专区| 美女又爽又黄免费| 亚洲国产欧美在线| 国产片在线播放| 中文字幕一区二区精品| 日韩伦理三区| 九九九九精品| 韩日精品在线| 日韩精品视频网址| 国产精品不卡一区二区三区| 天天干天天操天天操| 精品视频久久久久久| а_天堂中文在线| 97人人模人人爽人人喊38tv| 亚洲精彩视频| mm131国产精品| 国产精品卡一卡二卡三| 99re热视频| 亚洲日韩中文字幕在线播放| sm久久捆绑调教精品一区| 国产精品久久久久免费| 国产精品99一区二区| 午夜啪啪小视频| 中文字幕在线不卡视频| 亚洲系列第一页| 视频一区视频二区国产精品| 青草综合视频| 中文字幕一区二区三区乱码| 久久av资源站| 亚洲女人久久久| 9191久久久久久久久久久| 麻豆av在线免费看| 国产精品视频地址| 欧美大人香蕉在线| 中文字幕剧情在线观看| 亚洲精品五月天| www.黄色一片| 久久久免费精品视频| 欧美黄色影院| 国产精品天天av精麻传媒| 国产三级精品三级在线专区| 曰批又黄又爽免费视频| 久久精品视频播放| 综合伊人久久| 免费在线a视频| 久久九九99视频| 一级黄色大片免费| 欧美精品免费在线| 欧美wwwwww| 91人人澡人人爽人人精品| 国产精品全国免费观看高清| 亚洲综合网av| 欧美精品电影免费在线观看| 噜噜噜天天躁狠狠躁夜夜精品| 欧美精品色婷婷五月综合| 国产欧美日韩一区二区三区在线观看| 在线免费观看高清视频| 欧美多人乱p欧美4p久久| 香蕉久久精品日日躁夜夜躁| 日本特黄a级片| 亚洲最色的网站| 青青草视频在线观看| 国产日韩av在线| 在线日韩电影| 一级片视频免费看| 日韩午夜在线观看视频| 伊人久久视频| 国产av第一区| www日韩大片| 国产男女无套免费网站| 91成人在线播放| 国产精品久久久久9999赢消| 国产精品久久无码| 欧美精品亚洲一区二区在线播放| japanese色国产在线看视频| 日本在线视频一区| 国产999精品久久| 欧美另类高清videos的特点| 久久久免费观看视频| 日韩av自拍| 亚洲第一黄色网址| 欧美精品久久99久久在免费线| 99爱在线视频|