精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

搞強化學習還不了解AutoRL,牛津大學、谷歌等十余位學者撰文綜述

人工智能 機器學習 新聞
來自牛津大學、弗萊堡大學、谷歌研究院等機構的十余位研究者撰文綜述 AutoRL。

強化學習 (RL) 與深度學習的結合帶來了一系列令人印象深刻的成果,許多人認為(深度)強化學習提供了通向通用智能體的途徑。然而,RL 智能體的成功通常對訓練過程中的設計選擇高度敏感,可能需要繁瑣且容易出錯的手動調整。這使得將 RL 用于新問題具有挑戰(zhàn)性,同時也限制了 RL 的全部潛力。

在機器學習的許多其他領域,AutoML 已經(jīng)表明可以自動化此類設計選擇,并且在應用于 RL 時也產生了有希望的初步結果。然而,自動強化學習 (AutoRL) 不僅涉及 AutoML 的標準應用,還包括 RL 獨有的額外挑戰(zhàn),這使得研究者自然而然地產生了一些不同的方法。

AutoRL 已成為 RL 研究的一個重要領域,為從 RNA 設計到圍棋等游戲的各種應用提供了希望。由于 RL 中考慮的方法和環(huán)境具有多樣性,因此許多研究都是在不同的子領域進行的。來自牛津大學、弗萊堡大學、谷歌研究院等機構的十余位研究者撰文試圖統(tǒng)一 AutoRL 領域,并提供了通用分類法,該研究詳細討論了每個領域并提出未來研究人員可能感興趣的問題。

論文地址:https://arxiv.org/pdf/2201.03916.pdf

AutoRL 方法

強化學習理論上可以用于任何任務,包括世界模型未知的環(huán)境。然而,這種通用性也是有代價的,其最大的缺點就是智能體往往不能獲得環(huán)境的真實模型。如果智能體想在一個場景下使用模型,那它必須完全從經(jīng)驗中學習,這會帶來很多挑戰(zhàn)。智能體探索出來的模型和真實模型之間存在誤差,而這種誤差會導致智能體在學習到的模型中表現(xiàn)很好,但在真實的環(huán)境中表現(xiàn)得不好(甚至很差)。

該研究調查的目的是介紹 AutoRL 領域,AutoRL 可以應對各種挑戰(zhàn):一方面,RL 算法的脆弱性阻礙了其在新領域的應用,尤其是那些從業(yè)者缺乏大量資源來搜索最佳配置的領域。在許多情況下,對于完全不可見的問題,手動找到一組中等強度的超參數(shù)可能會非常昂貴。AutoRL 已被證明可以在這種情況下幫助解決重要問題,例如設計 RNA。另一方面,對于那些受益于更多計算的人來說,顯然增加算法的靈活性可以提高性能。著名的 AlphaGo 智能體已經(jīng)展示了這一點,該智能體通過使用貝葉斯優(yōu)化得到了顯著改進。

早在 1980 年代,AutoRL 算法就被證明是有效的。然而,最近 AutoML 的流行導致了更先進技術的新生應用。與此同時,最近元學習的流行導致了一系列旨在自動化 RL 過程的工作。

該論文試圖提供這些方法的分類,他們希望通過思想的交叉融合來開辟一系列未來的工作,同時也向 RL 研究人員介紹一套技術來提高他們的算法性能。該研究相信 AutoRL 在提高強化學習潛在影響方面發(fā)揮著重要作用,無論是在開放式研究和還是在現(xiàn)實應用中。

此外,該研究希望將對 AutoML 感興趣的研究人員吸引到 AutoRL 社區(qū),特別地,RL 具有非平穩(wěn)性(non-stationarity),因為智能體正在訓練的數(shù)據(jù)是當前策略的函數(shù)。此外,該研究還介紹了 AutoRL 針對特定 RL 問題的環(huán)境和算法設計。

該研究調查了 AutoRL 社區(qū)以及技術等內容。一般來說,AutoRL 方法大多數(shù)都可以通過組合內部循環(huán)和外部循環(huán)組織起來。每個循環(huán)都可以通過黑箱或基于梯度的方法進行優(yōu)化,然而外部循環(huán)的梯度和內部循環(huán)的黑箱不能組合在一起,因為內部循環(huán)黑箱設置將使梯度不可用,如表 2 和圖 2 所示:

如下表 3 所示,該研究按照大類總結了 AutoRL 方法的分類,方法分類將體現(xiàn)在第四章的每一小節(jié)

隨機 / 網(wǎng)格搜索驅動方法

該研究首先討論了最簡單的方法:隨機搜索和網(wǎng)格搜索。隨機搜索從搜索空間中隨機采樣超參數(shù)配置,而網(wǎng)格搜索將搜索空間劃分為固定的網(wǎng)格點,并對其進行評估。由于其簡單性,隨機搜索和網(wǎng)格搜索可用于選擇超參數(shù)列表,評估超參數(shù)并選擇最佳配置。事實上,網(wǎng)格搜索仍然是 RL 中最常用的方法,網(wǎng)格搜索在絕大多數(shù)情況下都會調整超參數(shù),但不應將其視為最有效的方法。但是這些經(jīng)典方法沒有考慮優(yōu)化問題的潛在非平穩(wěn)性,下圖 3 描述了這個問題:

提高隨機搜索性能的一種常見方法是使用 Hyperband,這是一種用于超參數(shù)優(yōu)化的配置評估。它專注于通過自適應資源分配和早停(early-stopping)來加速隨機搜索。特別的,Hyperband 使用「Successive Halving」將預算分配給一組超參數(shù)配置。Zhang 等人使用隨機搜索和 Hyperband 來調整其 MBRL 算法的超參數(shù)。

貝葉斯優(yōu)化

貝葉斯優(yōu)化(Bayesian Optimization ,BO)是迄今為止最流行的方法之一,主要用于工業(yè)應用和各種科學實驗。對于 RL 應用程序,BO 最突出的用途之一是調整 AlphaGo 超參數(shù),其中包括蒙特卡洛樹搜索 (MCTS) 超參數(shù)和時間控制設置。這導致 AlphaGo 在自我對弈中的勝率從 50% 提高到 66.5%。圖 4 展示了 RL 案例中貝葉斯優(yōu)化的一般概念:

演化算法

演化算法被廣泛應用于各種優(yōu)化任務,其機制如圖 5 所示:

演化算法經(jīng)常被用于搜索 RL 算法的超參數(shù)。Eriksson 等人使用實數(shù)遺傳算法 (GA),通過種群中每個個體的基因編碼 RL 算法的超參數(shù),以調整 SARSA 超參數(shù),研究者將該方法應用于控制移動機器人。Cardenoso Fernandez 和 Caarls 使用 GA 在簡單設置中調整 RL 算法的超參數(shù),并通過結合自動重啟策略以擺脫局部最小值,取得了良好的性能。Ashraf 等人使用 Whale 優(yōu)化算法(WOA),其靈感來自座頭鯨的狩獵策略,在各種 RL 任務中優(yōu)化 DDPG 超參數(shù)以提高性能。

用于在線調優(yōu)的元梯度

元梯度提供了一種替代方法來處理 RL 超參數(shù)的非平穩(wěn)性。元梯度公式的靈感來自元學習方法,例如 MAML,它使用梯度優(yōu)化了內部和外部循環(huán)。特別是,元梯度方法將其(可微分)超參數(shù)的子集指定為元參數(shù) η。在內部循環(huán)中,智能體使用固定的 η 進行優(yōu)化,采用梯度 step 來最小化(通常是固定的)損失函數(shù)。在外部循環(huán)中,通過采取梯度 step 來優(yōu)化 η,以最小化外部損失函數(shù)。內部和外部損失函數(shù)的每個特定選擇都定義了一個新的元梯度算法。

黑盒在線調優(yōu)

PBT 和元梯度的優(yōu)勢在于動態(tài)調整超參數(shù)的能力,然而,這并不是唯一的方法。事實上,研究者已經(jīng)考慮了各種其他方法,從黑盒方法到在線學習啟發(fā)方法。本節(jié)重點介紹在超參數(shù)不是可微的設置中動態(tài)適應的單智能體方法。

自適應選擇超參數(shù)的方法自 20 世紀 90 年代以來一直很重要。Sutton 和 Singh (1994) 提出了 TD 算法中自適應加權方案的三種替代方法,Kearns 和 Singh (2000) 推導出時序差分算法誤差上限,并使用這些邊界推導出 λ 的時間表。Downey 和 Sanner (2010) 使用貝葉斯模型平均來為 TD 方法選擇 λ bootstrapping 超參數(shù)。最近, White (2016) 提出了 λ-greedy 來適應 λ 作為狀態(tài)的函數(shù),并實現(xiàn)近似最優(yōu)的偏差 - 方差權衡,Paul 等人 (2019) 提出了 HOOF,它使用帶有非策略數(shù)據(jù)的隨機搜索來周期性地為策略梯度算法選擇新的超參數(shù)。

環(huán)境設計

環(huán)境設計是強化學習智能體自動學習的重要組成部分。從課程學習到合成環(huán)境學習和生成,到將課程學習與環(huán)境生成相結合,這里的目標是加快機器學習智能體通過環(huán)境設計的學習速度。如圖 7 所示:

混合方法

不可避免的是,一些方法不屬于單一類別。事實上,許多方法都試圖利用不同方法的優(yōu)勢,可稱之為混合方法。在該研究中,這些混合方法被定義為使用表 3 中不止一類技術的方法,例如 BOHB、DEHB 等。

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2020-04-20 10:55:57

大數(shù)據(jù)人工智能技術

2021-03-23 13:49:21

人工智能機器學習

2019-10-30 09:25:58

NginxApache 服務器

2024-09-10 15:10:00

智能強化學習框架

2022-03-28 13:14:50

機器學習語言訓練AI

2024-07-10 13:20:45

2024-05-21 09:41:15

3DLLM

2024-10-12 17:14:12

2017-07-25 16:04:31

概念應用強化學習

2021-07-28 15:35:58

谷歌神經(jīng)網(wǎng)絡AI

2024-02-21 12:20:00

AI訓練

2017-03-27 14:39:10

互聯(lián)網(wǎng)

2019-12-11 15:36:23

AI 數(shù)據(jù)人工智能

2019-01-14 14:41:27

Mysql存儲觸發(fā)器

2024-06-05 19:45:08

2022-09-30 11:55:36

AI算力

2022-04-11 11:37:13

AI研究NLP

2024-12-23 14:30:00

AI模型數(shù)據(jù)

2020-09-16 07:59:40

數(shù)組內存

2020-11-30 06:27:35

Java泛型Object
點贊
收藏

51CTO技術棧公眾號

亚洲精品一区二区三区樱花 | 亚洲综合色网| 91精品国产丝袜白色高跟鞋| 成人免费a级片| 欧美白人做受xxxx视频| 久久草av在线| 欧美性在线观看| 中文字幕电影av| 奇米777国产一区国产二区| 欧美这里有精品| 成年人看的毛片| 午夜视频成人| 91在线精品一区二区三区| 国产日韩av在线播放| 国产精品99re| 小小影院久久| 免费成人你懂的| 精品女同一区二区三区在线播放| 欧美日韩精品免费在线观看视频| 国产精品综合一区二区三区| 亚洲国产精品视频在线观看| 毛葺葺老太做受视频| 天堂av中文在线| 国产日韩欧美制服另类| 国产成人亚洲欧美| 一级成人免费视频| 亚洲一区黄色| 欧美猛男性生活免费| 日本一道本视频| 神马久久影院| 精品国产乱码久久久久久老虎 | 美国一级片在线观看| 九九热hot精品视频在线播放| 欧美日韩午夜在线| 四虎永久在线精品无码视频| 国产偷倩在线播放| 亚洲卡通欧美制服中文| 亚洲午夜高清视频| 搞黄视频免费在线观看| 2021国产精品久久精品| 国产日韩欧美一区二区三区四区| 国产又黄又粗又长| 另类专区欧美蜜桃臀第一页| 国产福利视频一区| 中文字幕亚洲乱码熟女1区2区| 黄色综合网站| 久久久久久久久亚洲| 中文字幕在线观看成人| 香蕉av一区二区| 久久久精品美女| 秋霞欧美一区二区三区视频免费| 久久激情电影| 日韩中文在线观看| 蜜桃av免费观看| 99精品在线免费在线观看| 在线观看日韩视频| 亚洲图片第一页| 日韩av在线中文字幕| 色综久久综合桃花网| 免费一级suv好看的国产网站| 欧美精品一二| 俺去亚洲欧洲欧美日韩| 午夜激情福利网| 女同性一区二区三区人了人一| 久久人人爽亚洲精品天堂| 欧洲美女女同性互添| 亚洲精品网址| 欧美精品videos| 欧美日韩中文字幕在线观看| 欧美精品一卡| 97久久精品人搡人人玩| 黄色片免费观看视频| 免费在线日韩av| 国产精品一区二区三| 亚洲一级在线播放| 国产精品888| 精品国产乱码久久久久| 男生女生差差差的视频在线观看| 欧美国产精品专区| 在线观看免费黄色片| 美女网站视频在线| 欧美午夜片欧美片在线观看| 欧美一级裸体视频| 日韩欧美激情| 亚洲成人av资源网| 欧美日本国产视频| 99久久久精品视频| 欧美7777| 欧美久久久久久久久中文字幕| 久久综合桃花网| 欧美18xxxx| 在线观看日韩av| 久久久无码一区二区三区| 国产欧美高清| 成人激情在线观看| 午夜影院免费视频| 国产精品不卡在线观看| 久无码久无码av无码| 欧美第一视频| 日韩美一区二区三区| 亚洲天堂成人av| 婷婷综合网站| 欧美在线精品免播放器视频| 国产精品久久久久久69| 26uuu另类欧美| 一级黄色片播放| 日韩电影av| 精品sm捆绑视频| 中文字幕有码在线播放| 欧美日韩网址| 国产精品视频免费在线| 日本xxxxwww| 自拍偷拍国产精品| 无码日韩人妻精品久久蜜桃| 91麻豆精品激情在线观看最新| 亚洲深夜福利网站| 日韩欧美国产亚洲| 国产成人av在线影院| 日韩欧美手机在线| 国产乱码午夜在线视频| 欧美一区二区三区在线观看 | 国语自产精品视频在线看| 在线观看国产小视频| 成人免费电影视频| 欧美日韩精品久久| 女人黄色免费在线观看| 欧美久久一区二区| 91l九色lporny| 一区二区三区国产盗摄| 成人资源视频网站免费| 老司机在线看片网av| 色婷婷香蕉在线一区二区| 日韩综合第一页| 欧美日韩三区| 成人免费在线一区二区三区| 免费网站成人| 欧美日韩黄色一区二区| 亚洲性猛交xxxx乱大交| 亚洲免费影院| 精品一区二区视频| a国产在线视频| 国产亚洲高清视频| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 888av在线视频| 日韩一区二区电影| 手机在线免费看片| 激情综合网最新| 亚洲伊人婷婷| 日韩黄色三级在线观看| 日韩在线国产精品| 亚洲系列在线观看| 亚洲色图欧洲色图婷婷| www激情五月| 狠狠综合久久av一区二区老牛| 成人在线观看av| 乱插在线www| 亚洲精品久久久久久久久久久久久 | 国产精品亚洲产品| 久久一区二区三区av| 91精品论坛| 在线观看91久久久久久| 中文字幕一区二区三区四区视频| 国产精品视频yy9299一区| 国产成年人视频网站| 97精品国产| 97人人干人人| 国产ktv在线视频| 亚洲美女免费精品视频在线观看| 亚洲第一网站在线观看| 国产精品久久99| 91精品人妻一区二区三区蜜桃2| 国产综合自拍| 欧美国产综合视频| 四虎国产精品免费久久5151| 美女国内精品自产拍在线播放| 亚洲成人黄色片| 久久资源中文字幕| 中文字幕久久午夜不卡| 黄色一级视频片| 国内精品久久久久久久影视简单| 国产日韩av在线| 高h视频在线播放| 亚洲欧美日韩直播| 国产精品女同一区二区| 香蕉久久一区二区不卡无毒影院| 一级黄色片大全| 国产乱码一区二区三区| 又粗又黑又大的吊av| 四季av在线一区二区三区| 成人女人免费毛片| 电影在线观看一区二区| 欧美大片免费看| 国产一二三在线观看| 欧美一区二区免费视频| 可以在线观看av的网站| 中文字幕综合网| 91视频啊啊啊| 久久av资源站| 狠狠爱免费视频| 欧美1区3d| 日韩理论片在线观看| 国产精品极品| 国产精品视频yy9099| 91高清视频在线观看| 色婷婷**av毛片一区| 日本黄视频在线观看| 欧美精品一二三| av黄色在线看| 亚洲成人www| 日韩精品第一| 欧美一区二区啪啪| 天堂网免费视频| 亚洲影院久久精品| 久久噜噜色综合一区二区| av在线这里只有精品| 亚洲综合激情视频| 久久欧美肥婆一二区| 欧美与动交zoz0z| 精品国产乱码久久久| 国产视频精品网| 麻豆国产精品| 成人久久一区二区| 亚洲承认视频| 91av在线精品| av2020不卡| 美女999久久久精品视频| 在线国产情侣| 一区二区三区回区在观看免费视频| 欧美 日韩 综合| 欧美变态凌虐bdsm| 精品人妻少妇嫩草av无码专区| 欧美日本视频在线| 久久精品99北条麻妃| 亚洲图片一区二区| 久久黄色小视频| 一区二区三区欧美视频| 91高清免费看| 亚洲欧洲综合另类| 一区二区国产精品精华液| 国产精品成人免费精品自在线观看| 永久免费毛片在线观看| 99视频在线精品| 在线观看国产免费视频| 成人黄色a**站在线观看| 三大队在线观看| 国产黄人亚洲片| 好吊操视频这里只有精品| 国产一区欧美日韩| 国内av免费观看| 国产成人av自拍| 9.1在线观看免费| 成人免费电影视频| 亚洲午夜av久久乱码| 久久久久亚洲av无码专区| 亚洲最快最全在线视频| 久久精品一级片| 亚洲1区2区3区视频| 可以免费在线观看的av| 91高清视频免费看| 亚洲天堂免费av| 91精品国产91久久综合桃花| 精品人妻少妇AV无码专区| 亚洲成人久久久久| 欧美女v视频| 中文字幕亚洲欧美日韩2019| 久久久久久国产精品免费无遮挡| 欧美成人精品在线观看| 3344国产永久在线观看视频| 茄子视频成人在线| 欧美xxxx性| 国产经品一区二区| 国产剧情在线观看一区| 亚洲欧洲免费无码| 亚洲私人影院| 天天影视综合色| 国产成人在线视频网址| 给我看免费高清在线观看| 国产视频911| 青青草国产在线观看| 亚洲第一av色| 九九热最新视频| 91精品国产综合久久香蕉麻豆| 女人18毛片一区二区三区| 亚洲欧美日韩爽爽影院| 精品国产白色丝袜高跟鞋| 国产做受69高潮| 在线成人视屏| 电影午夜精品一区二区三区| 妖精视频一区二区三区免费观看| 亚洲成人午夜在线| 国产精品va| 亚欧在线免费观看| 不卡av在线网| www.4hu95.com四虎| 亚洲成人激情av| 91 中文字幕| 亚洲国产精品专区久久| 欧美69xxx| 欧美综合在线第二页| 秋霞一区二区三区| 日本在线播放一区| 日韩一区二区久久| 亚洲一区二区三区四区精品| 久久色成人在线| 日本一级二级视频| 日本国产一区二区| 欧美一级做性受免费大片免费| 中文字幕在线亚洲| 免费毛片b在线观看| 97中文在线| 91欧美日韩| 日韩精品一区二区三区不卡| 最近国语视频在线观看免费播放| 色天天综合久久久久综合片| 国产高清免费av| 视频在线观看99| 97se综合| 精品国产乱码久久久久软件| 亚洲男女av一区二区| 欧美黑人又粗又大又爽免费| 成人黄色网址在线观看| 欧美精品乱码视频一二专区| 欧美日韩国产电影| 99视频在线观看地址| 欧美在线视频一二三| 欧美电影免费网站| www.xxx麻豆| 国产福利视频一区二区三区| 三级黄色录像视频| 欧美日韩国产bt| 91电影在线播放| 国产精品久久97| 精品大片一区二区| 久久精品视频91| 国产日韩欧美麻豆| 国产99免费视频| 亚洲日韩欧美视频| 色8久久影院午夜场| 久久亚洲高清| 亚洲综合另类| 精品人妻互换一区二区三区| 婷婷开心激情综合| 污视频在线免费观看| 69久久夜色精品国产69| 免费观看成人www动漫视频| 国产av人人夜夜澡人人爽麻豆| 成人免费毛片高清视频| 国产在线拍揄自揄拍无码视频| 欧美大黄免费观看| av剧情在线观看| 久久本道综合色狠狠五月| 先锋影音久久久| 亚洲成人黄色av| 欧美日韩在线直播| 久cao在线| av成人在线电影| 99国产精品久久久久久久| 丰满少妇一区二区三区| 在线精品视频免费播放| 亚乱亚乱亚洲乱妇| 99re6在线| 国产精品久久久久9999高清| 国产精品无码久久久久一区二区| 色噜噜久久综合| 欧美日韩在线看片| 国产91亚洲精品一区二区三区| 99精品99| 三级黄色片在线观看| 日韩欧美的一区| 欧亚av在线| 一区二区在线高清视频| 国产精品1024久久| 欧美bbbbbbbbbbbb精品| 色悠悠国产精品| 成人动态视频| 成人中文字幕av| 一区二区三区四区亚洲| 头脑特工队2免费完整版在线观看 头脑特工队2在线播放 | 国产精品爱啪在线线免费观看| 欧美国产一级| 亚洲久久久久久| 欧美日韩精品欧美日韩精品一综合| av网站在线免费看推荐| 久久精品第九区免费观看| 蜜臀a∨国产成人精品| 欧美极品视频在线观看| 亚洲女人天堂色在线7777| 96视频在线观看欧美| 欧美国产激情视频| 亚洲欧美日韩一区二区三区在线观看| 日本美女一级片| 成人精品视频久久久久| 国产视频一区在线观看一区免费| 亚洲区一区二区三| 亚洲精品视频在线播放| 精品国产18久久久久久二百| 农村妇女精品一二区| 亚洲自拍偷拍av| 午夜伦理在线| 蜜桃999成人看片在线观看|