精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI設計自己,代碼造物主已來!UBC華人一作首提ADAS,數學能力暴漲25.9%

人工智能 新聞
AI掌握自我設計的權力,將會怎樣?最近,來自UBC等機構研究人員提出了「智能體自動化設計」系統,讓元智能體使用搜索算法,自動構建強大的同類。

AI訓AI已經老生常談了,那么,AI能夠設計出更強的AI嗎?

這不,來自UBC等機構的研究人員提出了一種全新系統——智能體自動化設計(ADAS)。

圖片

ADAS就是為了讓AI自動創建強大的智能體,包括發明新的構建模塊,或以新的方式組合它們。

具體來說,作者提出了一個「元智能體搜索」簡單而有效的算法。

其中元智能體根據不斷擴大的數據庫,迭代編程出有趣的智能體。

圖片

論文地址:https://arxiv.org/pdf/2408.08435

鑒于圖靈完備性,新方法可以學習任何可能的智能體系統,包括新提示、工具使用、控制流程,以及組合。

再加上,ADAS本身就是一個智能體,因此也可以實現自身改進,從而讓「元智能體」自我進化。

實驗證明,新系統可以讓代碼自定義智能體,而且「元智能體」可通過代碼,來設計新的智能體。

而且,由「元智能體搜索」發明的新智能體,即便在跨領域/跨模型轉移時,仍保持優越性、穩健性。

正如論文所言,這項研究展示了,一個令人興奮的新研究方向的潛力,即自動設計越來越強的智能體系統。

AI設計強大的自己,真到了那天,或許AGI就不遠了。

圖片

那么,它是如何做到的呢?

AI自我設計,代碼造物主已來

機器學習史,指明AI方向

以往,研究人員投入了大量精力,開發強大通用智能體。

其中,基礎模型被用作智能體系統中的模塊,比如,思維鏈、自我反思、Toolformer等等。

然而,機器學習的歷史告訴我們,手動設計的解決方案,最終會被自我學習的方案所取代。

說來也巧,幾天前「AI科學家」研究也是出自Jeff Clune之手。

圖片

不列顛哥倫比亞大學CS教授,曾任OpenAI研究團隊負責人,DeepMind高級研究顧問

在上一篇研究中,展示了一個自動化研究流程,AI一口氣完成了十篇論文,部分還達到了機器學習頂會的接收的門檻。

關鍵是,AI的助力,直接將研究成本打了下來,每篇論文僅15美元。

圖片

那么,若是讓AI設計AI,不僅省事省力,而且AI還能自我迭代。

論文中,研究團隊提出的ADAS,由三個關鍵部分組成:

- 搜索空間:定義了ADAS可以創建的所有可能的智能體系統

- 搜索算法:ADAS用來在搜索空間中尋找優秀智能體設計的方法

- 評估函數:用于判斷創建的智能體的質量或性能

圖片

具體來說,ADAS就是涉及使用搜索算法,來發現搜索空間中的智能體系統,從而優化評估函數。

圖片

元智能體搜索

為了進一步實施想法,研究人員提出了「元智能體搜索」算法,用于演示代碼中定義和搜索智能體的方法。

元智能體搜索的核心思想是,讓基礎模型(FM)作為元智能體,根據不斷擴增的數據庫,迭代新智能體。

理論上,元智能體可以從頭開始編程任何可能的構建模塊和智能體系統。

圖片

不過,在實踐中,為避免元智能體提供任何基本功能(比如FM查詢API、現有工具)是低效的。

因此,論文中,作者為元智能體定義了一個簡單的框架(100行代碼以內),為其提供了一組基本的功能,如查詢FM或格式化提示。

結果,元智能體只需要編程一個「前向」函數來定義一個新的智能體系統,類似于FunSearch中的做法。

圖片

這個函數接收任務信息,并輸出智能體對任務的響應。

如下圖所示,作者展示了元智能體編程新智能體的主要提示,其中提示中的變量,被高亮顯示。

提示中,研究人員鼓勵元智能體基于不斷增長的先前發現檔案,探索有趣的新智能體。

另外,他們還在元智能體中采用了自我反思迭代,其中它對提案的新穎性和正確性進行兩次迭代的改進,并在運行代碼時出現錯誤時進行最多三次改進。

圖片

在生成新的智能體后,研究人員決定使用目標領域的驗證數據對其進行評估。

評估結果

ARC挑戰

抽象和推理語料庫(Abstraction and Reasoning Corpus,ARC)是一個非常具有挑戰性的基準,可以通過衡量人工智能系統有效獲取新技能的能力,來評估它們的一般智力。

圖片

ARC挑戰包括3個重要步驟:

-給AI系統展示多個視覺輸入輸出網格模式的例子

-AI系統從例子中學習網格模式的轉換規則

-在給定測試輸入網格模式的情況下,預測輸出網格模式

經研究團隊驗證,元智能體搜索能夠發現新的代理系統,并在ARC挑戰中,優于SOTA人工設計智能體。

圖片

推理和問題解決

接下來,元智能體需要接受在數學、閱讀和推理領域的考驗。

用于測試的是4個常用基準:用于評估閱讀理解能力的DROP、評估多語言環境下數學能力的MGSM 、評估多任務問題解決的MMLU,以及評估在科學領域解決研究生水平問題的GPQA。

結果表明,元智能體搜索可以發現性能優于SOTA人工設計的智能體——

圖片

元智能體搜索和SOTA人工設計智能體的性能比較,元智能體搜索在每個領域都發現了比基線更好的智能體

不得不強調的一點是,在閱讀理解和數學領域,自我學習的智能體把人工設計的智能體遠遠甩在身后:F1分數提高了13.6/100,準確率提高了14.4%。

元智能體搜索在多任務和科學領域的表現也優于基線,但二者差距沒有這么懸殊。

總的來說,不同領域的基準測試結果顯示出元智能體搜索在針對特定領域定制智能體方面的有效性。

泛化和可轉移性

至此,研究人員已經說明了元智能體搜索可以為各個任務找到有效的智能體,那么,這些新發現的智能體是否具有可轉移性和可推廣性呢?

這就需要進行新的實驗。

首先將發現的代理從GPT-3.5轉移到ARC上的其他FM中,以測試在使用一個FM執行元智能體搜索時發現的代理是否可以推廣到其他FM中。

團隊選擇了三種流行的模型進行轉移,Claude-Haiku、GPT-4和Claude-Sonnet。

依然采用與在ARC挑戰和MGSM中使用的相同的基線。

如下表所示,元智能體搜索到的智能體始終優于人工設計的智能體,而且,差距不小。

圖片

值得注意的是,Claude-Sonnet,這個 Anthropic最強大的模型,在所有測試模型中表現最好,使最好的智能體在ARC上達到近50%的準確率。

接下來,研究人員將元智能體所發現的智能體從MGSM領域轉移到其他數學領域,以測試新智能體是否可以在不同的領域進行泛化。

同樣,測試了MGSM的前3個智能體,并將它們轉移到四個流行的數學領域:GSM8K、GSM-Hard、SVAMP和ASDiv,以及在上一小節中除數學之外的三個領域。

如下表所示,與基線相比,元智能體搜索保持了性能優勢。

圖片

與基線相比,在GSM8K和GSM-Hard上的準確率分別提高了25.9%和13.2%。

更令人驚訝的是,在數學領域中發現的智能體可以被轉移到非數學領域。

圖片

雖然最初在數學領域中搜索的智能體的性能與專門為目標領域設計的智能體并不完全匹配,但它們仍然優于(在閱讀理解和多任務中)或(在科學中)SOTA人工設計的智能體基線。

這些結果表明,元智能體搜索可以發現可推廣的設計模式和智能體系統。

作者介紹

這篇論文的一作和二作是兩位華人,Shengran Hu和Cong Lu,他們目前都在不列顛哥倫比亞大學(UBC)就讀,師從Jeff Clune。

Shengran Hu

圖片

Hu現在是UBC的一名博士生,主要研究興趣是AI智能體和開放式學習系統。

Cong Lu

圖片

Cong Lu是UBC向量學院的博士后研究員,致力于開發安全、具有好奇心并能以開放式方式學習的自主智能體。

Lu之前在牛津大學獲得了博士學位,在攻讀博士學位期間,他對離線強化學習特別感興趣,包括對未見過的任務的泛化、離線世界模型的不確定性量化、像素學習以及強化學習的擴散合成數據。

Jeff Clune

圖片

如前所述,Jeff Clune現任UBC計算機科學的教授,同時也是CIFAR AI主席、向量學院成員,DeepMind高級顧問。

值得一提的是,CIFAR(加拿大高等研究院,發音為「see-far」)自1982年成立以來不斷發展,已從加拿大學者的一個小團體發展成為全球研究界的領導者,象征著全球性、跨學科性和無限性。

向量學院成立于2017年,是一所非盈利研究性機構,也是加拿大政府鼎力支持的AI研究中心,人工智能教父Geoffrey Hinton當年成為了這家機構的首席科學顧問。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-08-23 08:08:00

2023-06-19 09:36:16

AI矩陣

2025-03-03 09:00:00

2022-07-20 11:26:59

Web3.0去中心化投資

2024-12-03 10:15:00

2022-12-23 15:04:33

Meta模型

2023-11-16 15:58:00

訓練數據

2025-06-03 08:51:00

2021-05-26 09:13:35

Linux之父未來科技

2022-02-07 09:35:00

CUP細胞研究

2023-06-19 19:22:50

AI場景隨機數學

2021-10-29 22:45:47

大數據算法技術

2022-05-16 13:46:22

2D3D,AI

2025-09-01 02:00:00

AI署名論文推理

2025-02-17 14:34:52

2021-12-09 09:45:44

AI 數據神經網絡

2021-09-03 00:54:31

人工智能機器人工具

2023-10-19 08:27:31

AI模型
點贊
收藏

51CTO技術棧公眾號

一区二区三区日韩在线| 亚洲最大成人综合| 国产精品久久久久久一区二区| 国产又粗又黄又猛| 国产午夜亚洲精品一级在线| 亚洲自拍与偷拍| 欧美一区1区三区3区公司 | 成年人黄视频在线观看| 成人免费毛片片v| 日本韩国欧美精品大片卡二| 多男操一女视频| 欧美黑白配在线| 欧美日韩一区国产| 成人在线观看你懂的| 波多野结衣在线网站| 成人免费va视频| 国产精品揄拍一区二区| 久久精品视频久久| 91久久夜色精品国产按摩| 亚洲国产成人av在线| 一道本在线免费视频| 91资源在线观看| 中文字幕一区二区三区不卡在线| av成人午夜| 亚洲天堂avav| 久久大逼视频| 欧美黄网免费在线观看| 亚洲综合第一区| 欧美日韩麻豆| 精品国产乱码久久久久久久| 中文字幕第80页| 1区2区3区在线| 一区二区三区毛片| 亚洲日本精品一区| 国产区视频在线| 久久伊人蜜桃av一区二区| 国产精品对白刺激久久久| 国产乱子伦精品无码码专区| 日韩av网站在线观看| 91精品国产91久久久久久吃药 | 亚洲一卡二卡三卡四卡五卡| 亚洲欧洲精品一区二区| 免费在线观看一级毛片| 99久久精品情趣| 成人黄动漫网站免费| 国产哺乳奶水91在线播放| 蜜乳av一区二区| 国产精品激情av在线播放 | 亚洲一区二区网站| 欧美精品videosex牲欧美| 国产美女福利视频| 天天做天天爱天天爽综合网| 在线观看国产欧美| 最新中文字幕av| 小说区图片区色综合区| 亚洲精品99久久久久| 国产一卡二卡三卡四卡| 视频精品二区| 欧美成人高清电影在线| 久久久久99人妻一区二区三区| 久久精品免视看国产成人| 91精品国产综合久久蜜臀| 欧美日韩精品区别| 涩涩涩久久久成人精品| 欧美老人xxxx18| 天美一区二区三区| 视频精品二区| 亚洲国产天堂久久综合| 蜜桃精品成人影片| 欧美精品羞羞答答| 日韩在线欧美在线| h色网站在线观看| 欧美久久久久| 97人人爽人人喊人人模波多| 韩国av中文字幕| 亚洲欧美卡通另类91av| 国产精品成人播放| 国产精品久久久久久久久久久久久久久久久久 | aaaaaa毛片| 麻豆精品蜜桃视频网站| 国产又爽又黄的激情精品视频| 99国产精品99| 99久久精品情趣| 午夜精品区一区二区三| 超碰porn在线| 精品福利视频导航| 不卡av免费在线| 狂野欧美xxxx韩国少妇| 亚洲激情第一页| 国产人妻大战黑人20p| 91精品一区二区三区综合在线爱| 国a精品视频大全| 精品人妻一区二区三区潮喷在线| 韩国三级中文字幕hd久久精品| 国产精品美女黄网| 精品乱码一区二区三四区视频 | 青青草原在线免费观看| 伊人成人在线视频| 国产精品亚洲自拍| 色呦呦中文字幕| 国产精品初高中害羞小美女文| 日韩av在线播放不卡| 99精品国自产在线| 欧美精品一区男女天堂| 日本精品久久久久中文| 精品不卡视频| 国产日韩av高清| 无码国产伦一区二区三区视频| 国产欧美日韩精品a在线观看| 亚洲草草视频| 国产精品一区二区日韩| 欧美日韩国产成人在线91| 三级男人添奶爽爽爽视频| 欧美第十八页| 欧美一区二区三区……| 亚洲国产一二三区| 亚洲欧洲日韩在线| 日本精品久久久久中文字幕| 日韩精品一区二区三区中文在线| 国产亚洲精品久久久久久777| 久久久久久久久久久久久久免费看| 美女黄色成人网| 不卡视频一区| 成人影院在线观看| 在线观看一区日韩| 精品黑人一区二区三区观看时间| 欧美在线免费| 国产在线视频一区| 国产精品四虎| 日韩欧美国产一区二区| 香港三日本8a三级少妇三级99| 国产精品久久久久9999赢消| 日本高清+成人网在线观看| 亚洲男女视频在线观看| 亚洲美女在线一区| 91pony九色| 久久人人99| 国产精品香蕉av| 国产大片在线免费观看| 欧美午夜丰满在线18影院| 成熟妇人a片免费看网站| 欧美激情第二页| 91亚洲一区精品| 黄色在线免费看| 欧美日本高清视频在线观看| av永久免费观看| 日韩av一区二区三区四区| 蜜桃视频在线观看成人| 电影天堂国产精品| 在线亚洲男人天堂| 国产偷人爽久久久久久老妇app | 日本激情视频一区二区三区| 免费观看在线色综合| 亚洲不卡中文字幕| 欧美freesex| 亚洲丝袜一区在线| 一级片在线免费播放| 欧美韩国一区二区| 凹凸日日摸日日碰夜夜爽1| 亚洲欧美成人vr| 国产精品成人一区| 天堂中文а√在线| 91精品国产手机| 久久久久久久福利| 97久久久精品综合88久久| 成人免费毛片网| 欧美日韩国产高清电影| 国产精品视频地址| 欧美性天天影视| 日韩美女视频一区二区在线观看| 久久久一二三区| 91麻豆精东视频| 国产一区二区在线免费播放| 99久久.com| av资源站久久亚洲| 欧美18—19sex性hd| 日韩视频免费中文字幕| 丰满人妻一区二区| 欧美午夜www高清视频| 丁香激情五月少妇| 国产精品一区在线观看你懂的| 欧美狂野激情性xxxx在线观| 亚洲精品亚洲人成在线| 成人国产在线视频| √最新版天堂资源网在线| 亚洲天堂成人在线视频| 国产成人精品av在线观| 精品国产户外野外| 日本黄区免费视频观看| 成人免费视频国产在线观看| 亚洲人成色77777| 国产精品毛片久久| 国产一区二区三区高清视频| 欧美影视资讯| 久久91精品国产91久久久| 日韩午夜影院| 日韩一级成人av| 伊人中文字幕在线观看| 亚洲欧美另类久久久精品2019| 黄色a一级视频| 国内精品伊人久久久久av一坑| 免费一级特黄毛片| 日韩系列欧美系列| 国产精品我不卡| 91精品国产自产观看在线| 51精品国产黑色丝袜高跟鞋 | 国语自产精品视频在免费| 国产高清视频在线| 亚洲国产成人av在线| 国产毛片毛片毛片毛片| 欧美在线免费播放| 日本熟妇色xxxxx日本免费看| 中文字幕精品一区| 中文字幕一二三四区| 国产成人亚洲综合a∨婷婷图片| 在线观看av日韩| 在线亚洲免费| 欧美中文字幕在线观看视频| 三上亚洲一区二区| 日本不卡久久| 亚洲欧美tv| 国产精品一区二区在线观看| 国产一区一区| 成人性生交大片免费看小说 | 激情久久综合| 二级片在线观看| av一区二区高清| 久久久综合香蕉尹人综合网| 北条麻妃在线一区二区免费播放 | 国产精品欧美综合亚洲| 在线精品视频小说1| av黄色在线看| 欧美日韩国产专区| 日本三级午夜理伦三级三| 亚洲黄色免费电影| 欧美国产在线看| 亚洲欧美日韩中文播放| 亚洲 欧美 变态 另类 综合| 日本一区二区三区在线不卡| 国内精品久久99人妻无码| 99久久精品一区二区| 国产精品成人无码专区| 成人午夜碰碰视频| 国产伦精品一区二区三区88av| 国产一区二区福利视频| 久久无码人妻一区二区三区| 国产在线视频精品一区| 亚洲色图偷拍视频| 国产精品亚洲а∨天堂免在线| 日韩不卡的av| 国产福利91精品一区二区三区| 秋霞午夜鲁丝一区二区| 国产美女在线观看一区| 欧美一级片在线免费观看| 国产成人免费xxxxxxxx| 四虎永久免费观看| av动漫一区二区| 加勒比一区二区| 欧美国产精品久久| 久久国产波多野结衣| 一区二区视频在线| 国产网址在线观看| 精品国产91乱高清在线观看| 欧美brazzers| 欧美三级日韩在线| va视频在线观看| 亚洲国产第一页| 国产一二三在线观看| 中文字幕在线观看日韩| 中文字幕资源网在线观看| 欧美精品九九久久| 婷婷电影在线观看| 国产精品亚洲综合天堂夜夜| 日韩最新av| 欧美亚洲另类久久综合| 久久综合av| 欧美黄网在线观看| 久久这里只有| 亚洲在线观看网站| 播五月开心婷婷综合| 制服 丝袜 综合 日韩 欧美| 亚洲欧洲精品一区二区精品久久久 | 首页亚洲中字| 色就是色欧美| 国产主播精品| 久久精品视频91| 国产一区二区精品久久| 污污污www精品国产网站| 国产女主播一区| 欧美国产日韩综合| 在线视频欧美精品| www香蕉视频| 亚洲区在线播放| 日韩123区| 国产999精品久久久| 日韩精品一区二区三区中文字幕 | 亚洲二区在线| 亚洲xxxx2d动漫1| 成人毛片在线观看| a级黄色免费视频| 亚洲成av人片| 国产尤物在线观看| 精品中文视频在线| 色呦呦在线看| 国产精品入口福利| 日韩美脚连裤袜丝袜在线| 正在播放亚洲| 久久久久久黄| 中文字幕免费高清视频| 亚洲欧洲精品一区二区三区| 黄色片视频免费| 欧美精品一区男女天堂| a级影片在线| 国产精品狼人色视频一区| 国内视频在线精品| 国产日韩视频在线播放| 日韩av在线播放中文字幕| 国产草草浮力影院| 一区二区三区在线看| 中文在线最新版天堂| 亚洲美女久久久| 黄页网站大全在线免费观看| 成人精品一区二区三区电影免费| 精品日韩毛片| 欧美成人黑人猛交| 99国产麻豆精品| 精品少妇一二三区| 欧美一级爆毛片| 好吊日视频在线观看| 国产精品久久久久久久久久99| 四虎影视精品| 免费毛片网站在线观看| 国产·精品毛片| 青娱乐在线视频免费观看| 制服丝袜日韩国产| 日本中文字幕在线观看| 国产精品久久久久久久久久ktv | 中文字幕视频一区二区在线有码| 中文字幕乱码中文乱码51精品| 国产亚洲精品美女久久久m| 国产精品大片| 一区二区三区四区影院| 一区二区在线看| www国产一区| 久精品免费视频| 成人精品毛片| 日韩 欧美 视频| 粉嫩高潮美女一区二区三区| 青青草国产在线观看| 日韩欧美在线综合网| 日本一级理论片在线大全| 国产 高清 精品 在线 a| 激情av一区| 黄色污在线观看| 欧美性猛交99久久久久99按摩| 神马电影在线观看| 日韩美女在线观看一区| 成人直播大秀| 拔插拔插华人永久免费| 一区二区三区在线高清| 黄色aaa毛片| 欧美做受高潮电影o| 欧美日韩一二三四| 精品亚洲视频在线| 亚洲欧美激情小说另类| 好吊色一区二区三区| 18性欧美xxxⅹ性满足| 国产综合久久久| 在线播放av中文字幕| 亚洲香肠在线观看| 四虎在线免费观看| 国产精品爱久久久久久久| 91精品久久久久久久蜜月| 日本wwwwwww| 色综合天天综合网国产成人综合天 | 日韩一区二区三免费高清在线观看| 影音先锋欧美在线| 成人国产精品视频| 凹凸精品一区二区三区| 久久九九热免费视频| 成人自拍在线| caopor在线视频| 亚洲麻豆国产自偷在线| 天堂影院在线| 国产精品专区一| 好看的av在线不卡观看| 69精品无码成人久久久久久| 91精品国产欧美一区二区成人| av不卡高清| 中文视频一区视频二区视频三区| 高清国产一区二区| 日韩不卡高清视频| 欧美疯狂xxxx大交乱88av| 自拍自偷一区二区三区| 国产资源中文字幕| 色呦呦网站一区| 欧美草逼视频| 亚洲国产激情一区二区三区| 成人激情黄色小说| 96亚洲精品久久久蜜桃|