精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MetaGPT開源SELA,用AI設計AI,效果超越OpenAI使用的AIDE

人工智能 新聞
SELA 提出了一種讓 AI 自主設計和持續優化自身的方法,并全面地展示了其取得的不俗效果。研究者們認為,該工作表明了 AI 在這一方向的潛力,將為未來的相關研究提供有價值的參考。

SELA 由 MetaGPT 開源社區合著,作者分別來自 DeepWisdom、UC Berkeley、港科廣、UCSD、華師、Stanford、港中深、Montreal & MILA 等機構。共同一作池一舟與林義章分別任職 DeepWisdom 實習研究員與研究員,他們均畢業于 UC Berkeley,林義章也是 Data Interpreter 的共同一作。共同通訊作者為 DeepWisdom 創始人兼 CEO 吳承霖(MetaGPT 代碼作者、論文通訊作者)和蒙特利爾大學與 MILA 實驗室的助理教授劉邦。

圖片

AI 智能體可以設計 AI 嗎?

當然可以!

SELA 用 MCTS 設計 AI 效果在 20 個數據集上達到了 SoTA。它可以自己從歷史設計與實驗中學習,設計出比之前更好的 AI,并且完全開源。

  • arxiv:https://arxiv.org/abs/2410.17238
  • 代碼:https://github.com/geekan/MetaGPT/tree/main/metagpt/ext/sela

過去,AI 模型的設計和優化依賴大量專業知識和人力,過程耗時,易受個人經驗影響。盡管 AutoML 技術有所進展,但現有系統只會對預定義的搜索空間進行組合搜索,與人類行為不一致。人類會提出動態搜索空間并求解。隨著大模型技術的發展,我們看到了大模型能自主設計和調優 AI 模型的希望。然而,實現這一目標面臨自主設計和持續調優兩大挑戰。

過去幾個月,MetaGPT 團隊開源的 Data Interpreter 能夠自主完成多項機器學習任務,通過增強任務規劃、工具集成和推理能力,提升了成功率,但缺乏持續性調優。weco.ai 團隊的 AIDE 引入了結果反饋,在 OpenAI 發布的 MLE-bench 中表現優異,但由于采用貪婪搜索,往往只收斂到次優結果。

SELA 由 MetaGPT 團隊聯合多所頂尖機構推出,是一個可以進行自動實驗的智能體。它全面超越了 AIDE 和 Data Interpreter ,在多項機器學習測試中表現卓越,展現出自動化設計與優化 AI 模型的巨大潛力。

相比于傳統 AutoML 框架和基于 LLM 的自動機器學習系統,SELA 可以動態地構造搜索空間,而不是基于一個固定的搜索空間進行搜索,在動態流水線構造表現出了顯著優勢。

同時,就像 AlphaGo 會根據棋局中對手的動作不斷提升,SELA 也會逐漸在多步中完成機器學習代碼,解決了 AIDE 只能進行一步優化的問題。

圖片

下方動圖展示了 SELA 在醫療數據集(smoker-status)上的搜索過程,我們可以清晰地看到 SELA 在機器學習任務的各個階段進行了多次深入探索。隨著探索輪次的增加,節點的顏色逐漸加深,這象征著得分的持續提升。

具體來看,SELA 從最初的解決方案 94.3(根節點)出發,通過探索性數據分析,敏銳地捕捉到數據集中潛藏的異常值,并通過數據預處理環節,移除了這些異常值,將得分提升至 96.3。隨后,SELA 在另一次實驗中,通過相關性分析,精準地剔除了冗余特征并降低了數據維度,使得得分躍升至 97.2。

SELA 是如何實現這樣的效果的?

SELA 通過將問題描述和數據集信息輸入 LLM,生成潛在解決方案的搜索空間,并由 Monte Carlo Tree Search(MCTS)進行探索。LLM Agent 進一步規劃、編碼和執行實驗,利用模擬反饋優化搜索,形成迭代過程,最終產生優化的實驗管道。這種方法模擬了人類專家的迭代和反饋驅動過程,提升了機器學習任務的性能和適應性。

圖片

在上面的流程中,研究者們提出了三個重要組件,分別是 1)基于 LLM 的 Insight Proposer;2)基于 MCTS 的搜索策略;3)執行實驗方案的 LLM Agent,下面我們會詳細展開組件設計:

基于 LLM 的 Insight Proposer 

Insight Proposer 負責接收問題描述和數據集信息,將機器學習過程細分為探索性數據分析、數據預處理、特征工程、模型訓練和模型評估五個關鍵階段。并利用大型語言模型為每個階段生成多樣化的 Insight。這些 Insight 被匯集在見解池中,構建起 SELA 的搜索空間。

圖片

基于 MCTS 的搜索策略

在 SELA 框架中,研究者們將解決機器學習問題的搜索空間看作一棵樹,每條從根到目標節點的路徑都表示一個由 Insight 組成的實驗配置。因此,尋找最佳解決方案的任務可以被視為在樹中搜索最優路徑。

SELA 采用蒙特卡洛樹搜索(MCTS)作為核心決策引擎,通過選擇、擴展、模擬和反向傳播四個關鍵步驟,高效地探索和優化解決方案。

  • 選擇

在每次迭代中,SELA 使用 UCT 算法的修改版本 UCT-DP ,從搜索樹中選擇一個節點。與傳統的 MCTS 不同,SELA 面臨的挑戰在于模型訓練等過程引入的大量計算時間,因此高效的節點探索至關重要。SELA 通過盡早優先探索更深入的節點,減少了探索每個未訪問節點的需要,允許在更少的迭代中到達更深的節點,使該方法更適合大規模機器學習實驗。

  • 擴展

在擴展階段,將從所選節點實例化一組子節點以進行模擬,子節點繼承了父節點的所有屬性,并在此基礎上增加了新的洞察,以進一步探索和優化解決方案。

  • 模擬

擴展結束后,SELA 將從擴展的子節點中隨機采樣一個節點進行模擬,SELA 將首先獲取這條路徑對應的配置。這些配置隨后被交給負責實驗的 Agent 執行,產生模擬分數,該分數作為反向傳播的反饋。

  • 反向傳播

在模擬結束后,SELA 會收集性能分數(例如,基于驗證集的分數),并通過樹結構進行反向傳播。這些分數從模擬節點傳遞到根節點,更新每個父節點的值和訪問計數,從而在未來的搜索中優先考慮那些代表更有前途解決方案的節點。同時,解決方案代碼也會反向傳播到樹中,并在更新期間根據父節點進行處理,保存為階段代碼。

圖片

執行實驗方案的 LLM Agent

SELA 設計了一個 LLM Agent 用于執行實驗方案,通過自然語言需求構建實用的 pipeline。Agent 首先將搜索模塊提供的 Insight 轉化為詳細計劃,然后根據計劃編寫并執行代碼,生成最終的 Pipeline 和執行分數。為提升效率,SELA 在階段級別進行代碼緩存,實現精細的代碼重用,避免重復勞動,并應對 LLM 的非確定性問題,確保實驗的一致性和可預測性。

實驗

基準測試

SELA 選取了 AutoML 的 13 個分類任務和 7 個回歸任務,以及 Kaggle 競賽的 20 個數據集進行評估。

所有數據集按相同比例切分,確保各框架接受相同數據?;?LLM 的框架(SELA、Data Interpreter 和 AIDE)采用相同配置和迭代次數。AutoGluon 和 AutoSklearn 均使用默認設置。由于 AutoGluon 結果是確定性所以只運行一次,其余實驗均運行三次。我們對每個數據集上不同框架的全部運行結果進行排名,以比較優劣。

圖片

圖中展示了多個自動機器學習框架在不同數據集上的預測表現,橫軸為與 SELA 最佳性能相比的標準化得分(NS)。結果顯示,SELA 在大多數數據集中表現優異,其他框架如 AutoSklearn、AIDE、AutoGluon 和 Data Interpreter 在某些數據集上有競爭力,但整體上 SELA 展現出更為一致的高性能和適應性。

圖片

SELA 在所有框架中取得了最高的平均標準化分數和最佳排名,證明了其在多種數據類型和任務上的穩健性和卓越表現。

消融實驗

圖片

圖片

研究者們設計了三個消融實驗,用來驗證 SELA 性能和策略的有效性。首先,是對探索次數的消融。實驗結果顯示,隨著探索次數的增加,SELA 有效利用了更多的探索機會,使平均性能顯著提升。

其次,LLM 的消融研究對比了 GPT-4o、Claude-3.5-Sonnet 和 DeepSeek-V2.5,結果表明 Claude-3.5-Sonnet 和 GPT-4o 表現穩定且適應性強,而 DeepSeek-V2.5 在某些數據集上略遜色,但在 Click prediction 和 boston 數據集上表現相近,充分說明 SELA 在不同模型上均有出色表現。

此外,研究者們進一步驗證了 SELA 所采用的 MCTS(蒙特卡洛樹搜索)策略的卓越有效性。相較于 DataInterpreter(無搜索)和隨機搜索,MCTS 策略展現出了顯著的優勢,這證明 SELA 最終采用的搜索策略是必要且有效的。

結語

SELA 提出了一種讓 AI 自主設計和持續優化自身的方法,并全面地展示了其取得的不俗效果。研究者們認為,該工作表明了 AI 在這一方向的潛力,將為未來的相關研究提供有價值的參考。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-02 13:19:15

模型AI

2024-05-16 17:07:04

紅帽AIRHEL AI

2023-12-14 11:19:52

開源AI

2023-11-13 19:35:12

訓練數據

2023-09-23 12:52:57

模型淑娟

2023-10-09 10:45:35

2025-05-09 08:35:00

2023-05-23 12:28:04

2025-05-16 10:15:06

2025-08-19 09:12:05

2023-07-04 08:35:52

MetaGPT開源

2018-02-25 17:09:30

視頻AI圖像

2025-02-07 12:09:37

2023-12-20 13:34:56

2025-07-07 13:42:57

大模型AI開源

2025-10-24 17:46:25

點贊
收藏

51CTO技術棧公眾號

欧美成人性福生活免费看| 中文字幕一区在线| 日韩免费观看视频| 国产真人真事毛片视频| 欧美久久亚洲| 欧美性色视频在线| 国产精品12p| 四虎精品成人影院观看地址| 美腿丝袜亚洲三区| 国语自产精品视频在线看抢先版图片 | 成人日日夜夜| 久久五月婷婷丁香社区| 亚洲影院污污.| 国产一级淫片a视频免费观看| 亚洲91中文字幕无线码三区| 日韩av网址在线| 中文字幕一区二区在线观看视频 | 午夜精品福利一区二区三区蜜桃| 婷婷久久伊人| 手机av在线免费观看| 九九在线精品视频| 日韩免费在线看| 精品在线视频观看| 99久久www免费| 精品丝袜一区二区三区| 日本一本在线视频| 成人黄色免费观看| 色素色在线综合| 福利视频免费在线观看| 国产剧情在线| 国产精品每日更新在线播放网址| 欧美一区二区三区四区五区六区| 国内爆初菊对白视频| 极品少妇一区二区| 国产精品视频不卡| 日韩黄色片网站| 亚洲一区久久| 91精品国产色综合| 日韩av片在线播放| 亚洲激情国产| 久久99久久99精品中文字幕| 国产性生活大片| 99久精品视频在线观看视频| 中文字幕亚洲精品| 懂色av粉嫩av浪潮av| 伊人春色之综合网| 国产视频久久久久| theav精尽人亡av| 亚洲理论电影| 精品爽片免费看久久| 一级特黄a大片免费| 国产三级精品三级在线观看国产| 日韩欧美一卡二卡| 中国特级黄色片| 99re6热只有精品免费观看| 欧美一区二区三区免费视频| 午夜激情影院在线观看| 精品午夜视频| 日韩欧美成人激情| 不许穿内裤随时挨c调教h苏绵| 精品91福利视频| 日韩精品一区二区三区蜜臀| 亚洲美女高潮久久久| 澳门久久精品| 亚洲精品网址在线观看| 日韩毛片无码永久免费看| 精品在线手机视频| 日韩中文字在线| 日韩一级片av| 亚洲黄色视屏| 国产成人精品视频在线| 中文字幕在线一| 韩国精品一区二区| julia一区二区中文久久94| 日韩在线视频免费| 久久综合九色综合97婷婷| 日产国产精品精品a∨| 天堂中文8资源在线8| 亚洲精选一二三| 欧美成人免费在线观看视频| 欧美电影h版| 欧美丰满高潮xxxx喷水动漫| 欧美熟妇精品一区二区| 小说区图片区色综合区| 色妞欧美日韩在线| 国产性一乱一性一伧一色| 性色av一区二区怡红| 国产精品视频永久免费播放| 国产黄色片网站| 久久久久久综合| 黄色影视在线观看| 亚洲色图官网| 欧美一区二区视频在线观看| 一区二区视频观看| 国产精品7m凸凹视频分类| 97免费中文视频在线观看| 久久精品99北条麻妃| 国产乱码精品一区二区三区五月婷 | 国产又粗又猛又黄视频| 激情欧美一区二区| 久久久久久国产精品mv| 精品视频在线一区二区| 欧美日韩国产中文字幕| 激情五月婷婷基地| 神马日本精品| 美日韩在线视频| 无码日韩精品一区二区| 懂色一区二区三区免费观看| 日韩三级电影免费观看| 菠萝蜜视频在线观看www入口| 欧美亚洲国产一区二区三区va| 中文字幕第九页| 国产精品二区不卡| 国产精品18久久久久久首页狼| 蜜桃av中文字幕| 亚洲视频在线观看一区| 欧美一级黄色影院| 免费成人三级| 欧美激情视频网| 国产特级黄色片| 国产精品你懂的| 日韩中文字幕免费在线 | 亚洲精品美女久久7777777| sm在线观看| 欧美一级二级在线观看| 国产麻豆a毛片| 日本不卡在线视频| 欧美三日本三级少妇三99| 久久99亚洲网美利坚合众国| 91精品免费在线观看| 毛片aaaaaa| 午夜一区不卡| 九九热久久66| a在线视频v视频| 精品国产91洋老外米糕| 希岛爱理中文字幕| 精品一区在线看| 一级特黄录像免费播放全99| 欧美在线va视频| 亚洲视频国产视频| 日本黄色一级视频| 久久久久久久久伊人| 国产亚洲综合视频| 亚洲人成亚洲精品| 青青草成人在线| 噜噜噜在线观看播放视频| 色综合视频在线观看| 黄色a一级视频| 美女精品一区| 亚洲精品一区二区三区樱花| 97人人做人人爽香蕉精品| 国产亚洲精品高潮| 综合久久中文字幕| 国产精品色呦呦| www.污污视频| 欧美久久影院| 92福利视频午夜1000合集在线观看 | www.亚洲在线| 国产69精品久久久久久久| 免费成人三级| 国产国语刺激对白av不卡| 国产高清视频在线观看| 欧美视频你懂的| 国产精品夜夜夜爽阿娇| 国产精品2024| 男人添女荫道口图片| 图片婷婷一区| 国产精品视频一区二区三区四| 老司机在线看片网av| 日韩一区二区三区三四区视频在线观看| 成人免费毛片东京热| 不卡一区二区在线| 熟妇人妻va精品中文字幕| 成人黄色av| 亚洲xxx大片| 黄毛片在线观看| 在线精品国产欧美| 亚洲av无码乱码在线观看性色| 亚洲动漫第一页| 在线视频第一页| 福利电影一区二区三区| 国产极品美女高潮无套久久久| 清纯唯美亚洲综合一区| 亚洲最大的成人网| 黑人巨大精品欧美一区二区桃花岛| 中文字幕亚洲情99在线| 欧美视频一二区| 欧美日韩视频一区二区| 久久免费播放视频| 欧美激情综合网| 日本天堂在线播放| 美女任你摸久久 | 精品国产国产综合精品| 粉嫩av一区二区三区| 88av.com| 黑丝一区二区三区| 亚洲成人自拍| 51精品国产| 国产精品美女免费看| 大桥未久在线播放| 中文字幕综合在线| 青青草在线视频免费观看| 欧美一卡二卡三卡| 中文字幕视频一区二区| 偷拍一区二区三区| 高h视频免费观看| 中文av一区特黄| 国产精品第七页| 国产福利一区二区三区在线视频| 手机看片福利日韩| 国产一区二区三区久久久久久久久| 中文字幕一区二区三区在线乱码 | 国产精品久久久久久妇女| 久久久久中文字幕2018| 黄网站app在线观看| 亚洲欧美中文在线视频| 少妇精品高潮欲妇又嫩中文字幕| 欧美日韩不卡在线| 国产一级片av| 天天免费综合色| 久草资源在线视频| 亚洲人成精品久久久久| youjizz亚洲女人| 久久综合久久综合九色| 久久精品无码专区| 韩国v欧美v亚洲v日本v| 邪恶网站在线观看| 老司机精品久久| av免费中文字幕| 亚洲一区视频| 国内外成人激情视频| 在线欧美福利| 成人免费在线视频播放| 亚洲中无吗在线| 免费观看黄色的网站| 日韩理论电影院| 亚洲一卡二卡三卡| 久久性感美女视频| 一本一道久久a久久综合精品| 成人毛片在线| 亚洲欧美久久久久一区二区三区| 精品国产中文字幕第一页| 狠狠色综合欧美激情| 麻豆国产欧美一区二区三区r| 国产精品swag| 国产一区福利| 精品国产一区二区三区麻豆免费观看完整版 | 久久黄色影院| 黄色片一级视频| 久久激情视频| 日本成人黄色网| 日韩电影在线免费看| 国产97色在线 | 日韩| 久热国产精品| av在线无限看| 精彩视频一区二区| 性生活一级大片| 国产91色综合久久免费分享| 91超薄肉色丝袜交足高跟凉鞋| 成人污视频在线观看| 蜜臀aⅴ国产精品久久久国产老师| 懂色av一区二区三区免费观看| 亚洲一区二区三区黄色| 99re在线视频这里只有精品| 一区二区三区四区免费| 国产欧美一区二区精品忘忧草| 日韩精品久久久久久久的张开腿让| 国产精品成人免费| 久久久久久国产精品视频| 亚洲成av人影院| 无码人妻精品一区二区蜜桃色欲| 欧美性欧美巨大黑白大战| 国产精品国产三级国产aⅴ | 国产白袜脚足j棉袜在线观看 | 四虎永久免费地址| 夜夜嗨av一区二区三区网页| 久久露脸国语精品国产91| 色域天天综合网| 一本到在线视频| 亚洲国产日韩欧美综合久久| 黄色毛片在线看| 欧美精品生活片| 成人私拍视频| 成人激情黄色网| 牛牛影视久久网| youjizz.com亚洲| 国产一区白浆| 在线观看中文av| 26uuu成人网一区二区三区| 人妻互换一区二区激情偷拍| 亚洲午夜私人影院| 久草热在线观看| 精品福利二区三区| 中文字幕日本在线观看| 欧美极品在线视频| 男人亚洲天堂| 精品日韩电影| 欧美高清不卡| 999精品视频在线| 成人免费av资源| 亚洲精品久久久久久国| 婷婷六月综合亚洲| 国产一区二区三区视频免费观看 | 日本成a人片在线观看| 97国产精品免费视频| 日韩毛片免费看| 蜜桃成人在线| 精品白丝av| 一区二区三区四区毛片| 久久精品男人天堂av| 国产香蕉在线视频| 欧美一区日韩一区| 蜜桃视频在线观看网站| 久久久久久久国产精品视频| 91视频亚洲| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲夜间福利| 91丨porny丨九色| 国产精品情趣视频| 色老头一区二区| 精品爽片免费看久久| bbw在线视频| 国产精品一区二区三区精品| 婷婷亚洲最大| 三上悠亚在线一区| 欧美国产精品一区二区三区| 黄色免费av网站| 亚洲精品美女在线| 国产传媒在线观看| 国产精品久久国产精品| 欧美黄色一区二区| 色婷婷综合在线观看| 国产精品久久久久久久久晋中 | 风间由美一区二区三区在线观看| 无码人妻精品中文字幕| 欧美三级电影网站| www.亚洲资源| 国产成人啪精品视频免费网| 亚洲精品3区| 国产男女无遮挡| wwwwww.欧美系列| 国产精品视频久久久久久久| 日韩成人性视频| 午夜影院一区| 欧美国产一二三区| 日韩综合一区二区| 国产综合精品久久久久成人av| 色先锋资源久久综合| 九色在线视频蝌蚪| 国产成人综合av| 青青草成人影院| 午夜精品久久久久久久99热影院| 国产精品不卡在线| 国产情侣一区二区| 久久久久久久久国产| 欧美日韩一本| 亚洲性生活网站| 一区二区中文字幕在线| 国产wwwwwww| 97久久超碰福利国产精品…| 九九视频精品全部免费播放| 爆乳熟妇一区二区三区霸乳| 国产精品丝袜久久久久久app| 中文字幕日韩经典| 久久影院在线观看| 国产精品调教视频| 亚洲精品中文字幕无码蜜桃| 中文字幕精品—区二区四季| 91肉色超薄丝袜脚交一区二区| 毛片精品免费在线观看| 澳门成人av| 中文字幕在线观看第三页| 亚洲日本在线天堂| 色一情一乱一乱一区91av| 日本高清视频精品| 97精品国产一区二区三区| 欧美日韩一区在线观看| 天天插天天射天天干| 色婷婷一区二区| 黄网站在线免费| 久久精品国产美女| 精品一区二区在线免费观看| 免费一级片视频| 亚洲天堂成人在线视频| 国产一区二区三区亚洲综合| 黄色av网址在线播放| 国产精品白丝在线| 手机看片福利在线| 国产精品私拍pans大尺度在线| 欧美日韩在线大尺度| 蜜桃无码一区二区三区| 日韩欧美专区在线| 激情开心成人网| av在线com| 中文字幕欧美区| 无码国产精品高潮久久99| 国产综合视频在线观看| 久久久久网站| 久久久久无码精品国产| 中国china体内裑精亚洲片|