精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用AI自動設計智能體,數學提分25.9%,遠超手工設計

人工智能 新聞
基于 ADAS 所發現的智能體的性能大大優于最先進的手工設計的基線。

基礎模型 (FM) 如 GPT 和 Claude ,正在成為通用智能體的強有力支持,被越來越多的用于多種推理和規劃任務。

然而,在解決問題時,需要的智能體通常是具有多個組件的復合智能體系統,而不是單片模型查詢 。此外,為了使智能體能夠解決復雜的現實世界任務,它們通常需要訪問外部工具,例如搜索引擎、代碼執行和數據庫查詢。

因此,人們提出了許多有效的智能體系統構建塊,例如思維鏈規劃和推理、記憶結構、工具使用和自我反思。盡管這些智能體已經在各種應用中取得了顯著的成功,但開發這些構建塊并將它們組合成復雜的智能體系統通常需要特定領域的手動調整以及研究人員和工程師的大量努力。

然而,機器學習的歷史告訴我們,手工設計的解決方案最終會被模型學習到的解決方案所取代。

本文,來自不列顛哥倫比亞大學、非營利人工智能研究機構 Vector Institute 等的研究者制定了一個新的研究領域,即智能體系統的自動化設計(ADAS,Automated Design of Agentic Systems),并提出了一種簡單但有效的 ADAS 算法,名為元智能體搜索(Meta Agent Search),以證明智能體可以通過代碼編程來發明新穎而強大的智能體設計。

該研究旨在自動創建強大的智能體系統設計,包括開發新的構建塊并以新的方式組合它們。

實驗表明,基于 ADAS 所發現的智能體的性能大大優于最先進的手工設計的基線。例如,本文設計的智能體在 DROP 的閱讀理解任務中將 F1 分數提高了 13.6/100(與基線比),在 MGSM 的數學任務中將準確率提高了 14.4%。此外,在跨域遷移后,它們在 GSM8K 和 GSM-Hard 數學任務上的準確率分別比基線提高了 25.9% 和 13.2%。

與手工設計的解決方案相比,本文算法表現出色,這說明 ADAS 在自動化智能體系統設計方面的潛力。此外,實驗表明,所發現的智能體不僅在跨相似領域遷移時表現良好,而且在跨不同領域遷移時也表現出色,例如從數學到閱讀理解。

  • 論文地址:https://arxiv.org/pdf/2408.08435
  • 項目地址:https://github.com/ShengranHu/ADAS
  • 論文主頁:https://www.shengranhu.com/ADAS/
  • 論文標題:Automated Design of Agentic Systems

新研究領域:智能體系統的自動化設計(ADAS)

該研究提出了一個新的研究領域 —— 智能體系統的自動化設計(Automated Design of Agentic Systems,ADAS),并描述了 ADAS 算法的三個關鍵組成部分——搜索空間、搜索算法、評估函數。ADAS 使用搜索算法跨搜索空間來發現智能體系統。

圖片

搜索空間:搜索空間定義了哪些智能體系統可以在 ADAS 中被表征并被發現。例如,像 PromptBreeder (Fernando et al., 2024) 這樣的工作僅改變智能體的文本提示,而其他組件(例如控制流)保持不變。因此,在搜索空間中,無法表征具有與預定義控制流不同控制流的智能體。

搜索算法:搜索算法定義了 ADAS 算法如何探索搜索空間。由于搜索空間通常非常大甚至無界,因此應考慮探索與利用的權衡(Sutton & Barto,2018)。理想情況下,該算法既可以快速發現高性能智能體系統,又可以避免陷入局部最優。現有方法包括使用強化學習(Zhuge et al., 2024)或迭代生成新解決方案的 FM(Fernando et al., 2024)作為搜索算法。

評估函數:根據 ADAS 算法的應用,可能需要考慮不同的優化目標,例如智能體的性能、成本、延遲或安全性。評估函數定義如何評估候選智能體的這些指標。例如,為了評估智能體在未見過的數據上的表現,一種簡單的方法是計算任務驗證數據的準確率。

該研究提出的簡單但有效的 ADAS 算法——元智能體搜索的核心概念是指示元智能體迭代地創建有趣的新智能體,評估它們,將它們添加到智能體存儲庫中,并使用此存儲庫幫助元智能體在后續迭代中創建更有趣的新智能體。與現有的利用人類興趣概念的開放式算法類似,該研究鼓勵元智能體探索有趣的、有價值的智能體。

元智能體搜索的核心思想是采用 FM 作為搜索算法,基于不斷增長的智能體存儲庫來迭代編程有趣的新智能體。該研究為元智能體定義了一個簡單的框架(100 行代碼以內),為其提供了一組基本功能,例如查詢 FM 或格式化提示。

因此,元智能體只需要編寫一個「前向」函數來定義一個新的智能體系統,類似于 FunSearch 中的做法(Romera-Paredes et al., 2024)。該函數接收任務信息并輸出智能體對任務的響應。

如圖 1 所示,元智能體搜索的核心思想是讓元智能體在代碼中迭代地編程新的智能體。下面顯示了元智能體程序新智能體程序的主要提示,其中提示中的變量高亮顯示。

圖片

實驗

所有實驗結果表明本文發現的智能體大大優于基線最先進的手工設計的智能體。值得注意的是,該研究發現的智能體在 DROP 閱讀理解任務上比基線提高了 13.6/100(F1 分數),在 MGSM 數學任務上比基線提高了 14.4%(準確率)。此外,研究者發現的智能體在從 GPT-3.5 遷移到 GPT-4 后,在 ARC 任務上的表現比基線提高了 14%(準確率),在從 MGSM 數學任務遷移到 GSM8K 和 GSM-Hard 中的 held-out 數學任務后,準確率分別提高了 25.9% 和 13.2%。

案例研究:ARC 挑戰

如圖 3a 所示,元智能體搜索可以有效且逐步地發現性能優于最新手工設計的智能體。文本框中突出顯示了重要的突破。

此外,圖 3b 顯示了發現最好的智能體,其中采用了復雜的反饋機制來更有效地細化答案。仔細觀察搜索進度就會發現,這種復雜的反饋機制并不是突然出現的。

圖片

推理和問題 - 解決域

跨多個域的結果表明,元智能體搜索可以發現表現優于 SOTA 手工設計的智能體(表 1)。

圖片

泛化性以及可遷移性

研究者進一步展示了所發現智能體的可遷移性和可泛化性。

如表 2 所示,研究者觀察到搜索到的智能體(searched agent)始終優于手工設計的智能體,并且差距很大。值得注意的是,研究者發現 Anthropic 最強大的模型 Claude-Sonnet 在所有測試模型中表現最佳,使基于該模型的智能體在 ARC 上實現了近 50% 的準確率。

如表 3 所示,研究者觀察到元智能體搜索的性能與基線相比具有類似的優勢。值得注意的是,與基線相比,本文的智能體在 GSM8K 和 GSM-Hard 上的準確率分別提高了 25.9% 和 13.2%。

圖片

更令人驚訝的是,研究者觀察到在數學領域發現的智能體可以遷移到到非數學領域(表 4)。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-08-20 13:30:17

2025-01-13 12:58:44

2025-10-09 09:05:00

谷歌智能體開發者

2025-08-08 02:15:00

2025-05-20 02:00:15

2025-05-22 06:59:53

2025-10-09 11:36:57

2025-05-15 09:08:00

2024-11-26 00:14:08

2025-03-12 12:21:27

2017-12-11 16:25:25

2025-08-04 01:55:00

2024-11-18 19:06:21

2024-12-25 14:10:00

AI人工智能設計

2024-05-11 08:27:41

Agent智能體GPT

2025-04-27 01:05:00

AI智能日志

2025-11-19 09:27:32

2024-11-04 08:47:00

2023-07-29 16:01:15

智能體模型任務
點贊
收藏

51CTO技術棧公眾號

久久久视频精品| 欧洲日韩一区二区三区| 国产91亚洲精品一区二区三区| 黄色在线观看免费| 任我爽精品视频在线播放| 狠狠躁18三区二区一区| 中文字幕在线观看一区二区三区| 午夜精品一区二区三| 老鸭窝亚洲一区二区三区| 久久精品国产欧美激情| 在线天堂www在线国语对白| 日韩高清在线| 午夜免费久久看| 亚洲最新在线| 日本人妖在线| 国产精品一区二区在线播放| 日本精品va在线观看| 国产精品嫩草影院俄罗斯| 日韩电影在线观看完整免费观看| 69av一区二区三区| 亚洲中文字幕久久精品无码喷水| 亚洲图区一区| 国产精品久久久久久久第一福利| 狠狠色噜噜狠狠色综合久| 亚洲天堂手机在线| 久久一区国产| 91av国产在线| 久久午夜鲁丝片午夜精品| 日韩成人三级| 亚洲人午夜精品免费| 在线黄色免费网站| 亚州一区二区| 91精品久久久久久蜜臀| 午夜视频你懂的| 原纱央莉成人av片| 婷婷国产v国产偷v亚洲高清| 国产精品视频一二三四区| 欧美成人精品一区二区男人看| 99精品热视频| 懂色av一区二区三区在线播放| 亚洲天堂一二三| 奇米精品一区二区三区在线观看 | 永久免费看片视频教学| 精品国产一区二区三区四区| 精品视频久久久| xxxx黄色片| 欧美成人基地| 亚洲精品99久久久久| 在线精品视频一区二区| 国产伦精品一区二区三区免费视频| 国产suv精品一区二区33| 宅男噜噜噜66一区二区| 性欧美xxxx交| 五月天综合激情| 宅男噜噜噜66国产日韩在线观看| 国内外成人免费激情在线视频网站| 久久97人妻无码一区二区三区| 欧美影院一区| 久久久久久久av| 日韩欧美激情视频| 欧美亚洲一级| 国产成人一区二区三区| 亚洲午夜在线播放| 久久丁香综合五月国产三级网站| 成人免费午夜电影| 亚洲第一天堂在线观看| 成人av在线一区二区三区| 好吊妞www.84com只有这里才有精品| 色窝窝无码一区二区三区| 91首页免费视频| 日本午夜精品电影| 男人的天堂在线视频免费观看| 国产精品久久久久久久午夜片| 欧美aaa在线观看| 污污视频在线看| 精品国产鲁一鲁一区二区张丽| 91免费视频网站在线观看| 日韩av超清在线观看| 欧美精品久久99| 国产成人精品一区二区在线小狼| 精品按摩偷拍| 中文字幕成人精品久久不卡| 欧美黄色免费观看| 香蕉久久国产| 91系列在线观看| 亚洲 欧美 激情 另类| 国产喂奶挤奶一区二区三区| 日本女人高潮视频| 福利影院在线看| 欧美三区在线观看| 中文字幕99页| 女厕嘘嘘一区二区在线播放 | 亚洲精品国产精品国自| 欧美在线播放| 日本一区二区不卡| 国产毛片在线视频| 91亚洲精品久久久蜜桃网站| 亚洲精品在线观看免费| 99热99re6国产在线播放| 在线观看国产一区二区| 初高中福利视频网站| 亚洲图片久久| 久久久久久久久久久国产| 亚洲高清视频免费观看| 成人免费三级在线| 欧美国产日韩一区二区三区| 日本黄色a视频| 欧洲精品二区| 99在线|亚洲一区二区| 日韩美女在线看| 精品人妻久久久久一区二区三区| 久久综合久久综合久久| ijzzijzzij亚洲大全| 吉吉日韩欧美| 日韩欧美一区在线| 熟女少妇内射日韩亚洲| 在线国产日韩| 亚洲aaa激情| 国产专区在线| 天天操天天色综合| 99热这里只有精品2| 欧美日韩激情| 国产成人av在线| 欧洲av在线播放| 亚洲女人的天堂| 深夜黄色小视频| 国产成人影院| 26uuu另类亚洲欧美日本一| 精品欧美一区二区精品少妇| 国产精品成人午夜| 中文久久久久久| 久久不见久久见中文字幕免费| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 国产精品久久777777| 国产一级不卡毛片| 日韩在线麻豆| 欧美中文在线免费| 手机看片一区二区三区| 亚洲午夜精品在线| jjzz黄色片| 亚洲无线视频| 成人91免费视频| 欧洲精品二区| 欧美精品一区男女天堂| 成人免费毛片东京热| 国产一区二区免费看| 亚洲免费视频播放| 精品久久亚洲| 色综合久久88色综合天天看泰| 国产露脸国语对白在线| 专区另类欧美日韩| 91香蕉视频在线观看视频| 91精品一区二区三区综合在线爱| 成人在线激情视频| yellow91字幕网在线| 日韩一区二区免费视频| 久久黄色小视频| 成人免费毛片app| 欧美 日韩 亚洲 一区| 国产精品久久久久av蜜臀| 97超碰色婷婷| 黄色av网址在线免费观看| 在线免费一区三区| 色偷偷www8888| 风间由美一区二区三区在线观看| 欧美一区二区视频在线播放| 欧美毛片免费观看| 国产精品99一区| 在线视频1区2区| 日韩一区二区三区免费看 | 欧美一级片在线免费观看| 今天的高清视频免费播放成人| 国产九色精品| 在线视频cao| 最近2019免费中文字幕视频三| 国产男男gay体育生白袜| 玉米视频成人免费看| 私密视频在线观看| 麻豆精品在线看| 99热这里只有精品免费| 在线看成人短视频| 成人有码在线播放| 伊人久久国产| 另类色图亚洲色图| 亚州精品国产精品乱码不99按摩| 在线观看av一区二区| 成年人av电影| 久久影院电视剧免费观看| 91av视频免费观看| 亚洲激情精品| 在线视频福利一区| 欧美一区 二区| 成人h片在线播放免费网站| 国产精品蜜芽在线观看| 中文字幕视频一区二区在线有码| www日本高清| 欧美性大战久久| 久久亚洲AV无码| 国产亚洲精品精华液| 欧美老女人bb| 麻豆国产精品777777在线| 欧美午夜小视频| 91视频综合| 久久久一本精品99久久精品| 99久久伊人网影院| 三级a三级三级三级a十八发禁止| 欧美日本不卡| 日日骚一区二区网站| av男人一区| 国产精品久久久久久久久粉嫩av | 国产精品毛片久久久久久久| 欧洲熟妇的性久久久久久| 久久精品国产77777蜜臀| 欧美 日韩 国产 高清| 国产精品99一区二区三区| 欧美黑人xxxxx| 成人在线视频中文字幕| 91精品国产综合久久香蕉922| 天堂电影一区| 欧美激情一区二区久久久| 免费在线看a| 亚洲视频视频在线| 五月激情六月婷婷| 日韩欧美视频一区| 97视频国产在线| 日韩精品一区不卡| 亚洲五码中文字幕| 看片网站在线观看| 中文字幕一区二区在线观看| wwwwww日本| 99久久99久久久精品齐齐| 欧美图片自拍偷拍| 国产麻豆精品95视频| 中文字幕 91| 日本免费新一区视频| 国产麻花豆剧传媒精品mv在线| 日韩一区二区久久| www.国产在线播放| 中文字幕免费一区二区| 欧美日韩一级在线| 97国产精品| 在线精品亚洲一区二区| 欧美国产美女| 亚洲午夜精品久久| 欧美疯狂party性派对| 中文字幕中文字幕在线中一区高清| sdde在线播放一区二区| 日韩国产一区久久| 欧洲grand老妇人| 亚洲一区二区三区涩| 欧美电影免费播放| 一区二区在线观看网站| 欧美aaaa视频| 国产奶头好大揉着好爽视频| 亚洲一区二区三区| 97在线免费视频观看| 国产精品草草| 黄色免费福利视频| 久久动漫亚洲| 国产色视频在线播放| 韩国成人福利片在线播放| 波多野结衣网页| 成人性生交大合| 少妇毛片一区二区三区| 久久久久久久久岛国免费| 国产黄色片在线| 亚洲欧美日韩系列| 一区二区三区免费高清视频| 精品久久久久久久久久国产| 亚洲大尺度在线观看| 成人看片黄a免费看在线| 污污免费在线观看| 91丨porny丨最新| 免费黄色在线网址| 伊人开心综合网| 国产成人自拍视频在线| 色菇凉天天综合网| 国产精品久久久国产盗摄| 欧美电视剧在线看免费| 头脑特工队2免费完整版在线观看| 欧美日韩一区二区三区在线看 | 国产综合 伊人色| 亚洲三级网页| 中文字幕精品一区日韩| 激情久久婷婷| www.99av.com| 丁香婷婷深情五月亚洲| 特级西西www444人体聚色| 亚洲欧美色图小说| 国产中文字幕视频| 777亚洲妇女| 日韩有码电影| 日韩一区二区三区xxxx| av影院在线| 国产日韩av在线| 日本成人a网站| 三年中国中文在线观看免费播放| 99精品视频免费全部在线| 亚洲综合色在线观看| 成人精品视频.| 中日韩一级黄色片| 欧美日韩在线影院| 国产情侣在线播放| 亚洲人成网站999久久久综合| a级毛片免费观看在线| 国产成人精品久久亚洲高清不卡| 国产精久久一区二区| 日本10禁啪啪无遮挡免费一区二区| 欧美视频日韩| 免费在线观看污网站| 久久老女人爱爱| 中文字幕第28页| 欧美一区二区三区精品| 丁香在线视频| 4388成人网| 成人直播在线观看| 2021狠狠干| 久久伊人亚洲| 蜜桃传媒一区二区亚洲av| 亚洲一区二区不卡免费| 国产精品无码免费播放| 在线精品91av| 唐人社导航福利精品| 国内精品视频免费| 国产主播精品| 国产又黄又嫩又滑又白| 国产精品福利电影一区二区三区四区| aaa在线视频| 亚洲欧美国产另类| 蜜桃麻豆影像在线观看| 97视频中文字幕| 欧美aⅴ99久久黑人专区| 最新国产黄色网址| 国产精品免费视频一区| 亚洲国产无线乱码在线观看| 亚洲欧洲av一区二区| 91精品产国品一二三产区| 久久精品日产第一区二区三区精品版 | 国产又黄又粗视频| 精品人伦一区二区三区蜜桃网站 | 91在线观看免费视频| 精国产品一区二区三区a片| 欧美精品一级二级三级| av基地在线| 国产精品自拍网| 久久婷婷蜜乳一本欲蜜臀| 校园春色 亚洲色图| 国产精品美女久久久久aⅴ国产馆| 伊人网综合在线| 日韩在线不卡视频| 国产中文欧美日韩在线| 四虎4hu永久免费入口| 国产一区二区电影| 精品少妇久久久久久888优播| 欧美videos大乳护士334| 丁香花电影在线观看完整版| 国产精品一区二区三区观看 | 久久久久女教师免费一区| 大型av综合网站| 日本精品www| 亚洲国产成人自拍| 国产免费不卡av| 久久99精品国产99久久6尤物| 亚洲精品v亚洲精品v日韩精品| 久久av综合网| 久久久久久亚洲综合影院红桃| 69视频免费看| 日韩中文字幕在线免费观看| 国产精品久久久久久久久久久久久久久 | 成人午夜影视| 成人激情视频小说免费下载| 韩国久久久久| 在线观看福利片| 在线播放日韩导航| ririsao久久精品一区| 日本不卡久久| 国产美女一区二区| 国产 欧美 日韩 在线| 国产一区二区三区高清在线观看| 热久久久久久| 成年人午夜视频在线观看| 国产欧美日韩在线| 国产人妻精品一区二区三| 91国产高清在线| 日韩久久视频| 88av在线播放| 欧美日韩一区在线观看| 不卡的av影片| 亚洲国产一区二区三区在线播| 国产成人亚洲精品青草天美| 日韩欧美在线观看免费| 久久影视免费观看| 亚洲图片久久| 亚洲三级在线视频| 一本一本大道香蕉久在线精品| free性欧美hd另类精品| 欧美在线一二三区| 国产成人a级片| 亚洲影院一区二区三区| 2018日韩中文字幕|