精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepMind一次性開源3個新框架!深度強化學習應用落地即將迎來春天?

新聞 深度學習
深度強化學習(Deep Reinforcement Learning,DRL)一直是近年來人工智能的一些重大突破的核心。然而,盡管 DRL 有了很大的進步,但由于缺乏工具和庫,DRL 方法在主流解決方案中仍然難以應用。

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

深度強化學習(Deep Reinforcement Learning,DRL)一直是近年來人工智能的一些重大突破的核心。然而,盡管 DRL 有了很大的進步,但由于缺乏工具和庫,DRL 方法在主流解決方案中仍然難以應用。因此,DRL 仍然主要是以研究形式存在,并沒有在現實世界看到許多采用機器學習的應用方案;而解決這個問題就需要更好的工具和框架。

就在最近,DeepMind 發布了一系列新的開源技術,包括三種 DRL 框架:OpenSpiel、SpriteWorld 和 Bsuite,這些技術將有助于簡化 DRL 方法的應用。

[[277341]]

DRL 框架概述

作為一種新的深度學習技術,DRL 的采用面臨著簡單實現算法以外的挑戰。例如:用以簡化 DRL 技術應用的訓練數據集、環境、監控優化工具以及精心設計的實驗等。

考慮到 DRL 的機制不同于大多數傳統的機器學習方法,尤其對于 DRL 的情況,這種差異更甚。DRL 智能體試圖在給定的環境中通過反復試驗來實現對任務的掌握。在這種情況下,環境和實驗的穩健性在 DRL 智能體開發的知識中起著重要的作用。

為了實現 DRL 的重大突破,將其更好的應用于重大人工智能挑戰中,DeepMind 構建了許多專有工具和框架,以大規模簡化 DRL 智能體的訓練、實驗和管理。并且開放了三種 DRL 框架,包括:OpenSpiel、SpriteWorld 和 bsuite,以便其他研究人員可以使用它們來推進 DRL 方法的現狀。

下面是三種框架的介紹,并附有對應的開源地址。

OpenSpiel

與其他數據集不同,游戲本質上基于試驗和獎勵機制,可以用來訓練 DRL 智能體。然而,正如我們所看到的,游戲環境遠不是簡單的組裝。

[[277342]]

OpenSpiel 是一系列環境和算法的集合,用于研究一般強化學習和游戲中的搜索/規劃。OpenSpiel 的目的是在許多不同的游戲類型中促進通用多智能體的強化學習,其方式與通用游戲類似,但它重點是強調學習而不是競爭形式。當前版本的 OpenSpiel 包含 20 多種不同類型的游戲的實現,例如:完全信息、同步移動、不完全信息、網格世界游戲、博弈游戲和一些普通形式/矩陣游戲。

OpenSpiel 的核心實現是基于 C++和 Python 綁定,便于在不同的深度學習框架中采用。該框架包含了一系列游戲組合,允許 DRL 智能體掌握合作和競爭行為。類似地,OpenSpiel 包含了多種 DRL 算法組合,例如:搜索、優化和單一智能體等。OpenSpiel 還包括分析學習動態和其他常見評估指標的工具。

OpenSpiel 支持游戲類型

  • 單人和多人游戲

  • 完全可觀測(通過觀測)和不完全信息博弈(通過信息狀態和觀測)

  • 隨機性(盡管部分支持隱式隨機性,但主要為不確定事件)

  • n人普通形式的“一桿”游戲和(2人)矩陣游戲

  • 序貫和同時動作游戲

  • 零和、一般和和合作(相同收益)博弈

OpenSpiel 支持語言類型

  • C++ 11

  • Python 3

  • swift 中提供的部分語言

游戲和實用程序功能(例如:計算)是用 C++編寫的。這些也可以使用 pybind11 python(2.7 和 3)綁定。方法名稱位于 C++中的 CamelCase 和 Python 中的 SnaKeKY 情況(例如,在 C++中的 Apple 動作將是 Python 中的 Stest.Apple)。有關名稱之間的完整映射,請參見 open_spiel/python/pybind11/pyspel.cc 中的 pybind11 定義。

OpenSpiel 已經在 linux 上進行了測試(debian 10 和 ubuntu 19.04),但它還未在 MacOS 或 Windows 上進行測試,由于代碼使用了 MacOS 和 Windows 上也提供的免費工具,因此 DeepMind 預計在這些平臺下編譯和運行不會出現任何(重大)問題。

GitHub 地址:https://github.com/deepmind/open_spiel 

pybind11 地址:https://pybind11.readthedocs.io/en/stable/ 

SpriteWorld

幾個月前,DeepMind 發表了一篇論文,介紹了一種基于無監督式目標搜索和好奇心驅動的強化學習模型(Curious Object-Based seaRch Agent,COBRA),它通過使用強化學習來識別給定環境中的對象(相關論文可參考:https://arxiv.org/abs/1905.09275)。

該模型使用了一系列二維游戲進行訓練,在這些游戲中數字可以自由移動。用來訓練 COBRA 模型的環境就是最近 deepmind 開源 DRL 三大框架之一,SpriteWorld。

SpriteWorld 是一個基于 python 的強化學習環境,它由一個可以自由移動的簡單形狀的二維競技場組成。更具體地說,SpriteWorld 是一個二維方形競技場,有不同數量的彩色 Sprites,可以自由放置和渲染,但不會發生碰撞。SpriteWorld 環境基于一系列關鍵特征:

  • 多目標的競技場反映了真實世界的組成,雜亂的物體場景可以用于共享特征,同時也可以獨立移動。這也提供了測試與任務無關的特征/目標的穩健性和組合泛化的方法。

  • 連續點擊和推動動作空間的結構反映了世界空間和運動的結構。它還允許智能體在任何方向上移動任何可見對象。

  • 目標的概念并非以任何特權方式所提供(例如:操作空間中沒有特定目標的組件),并且完全可以由智能體發現。

SpriteWorld 為每個 DRL 智能體提供三項主要的訓練任務:

  • 目標搜索。智能體必須將一組目標(可通過某些功能識別,例如:綠色的目標)帶到屏幕上的隱藏位置,忽略干擾對象(例如:非綠色的目標);

  • 排序。智能體必須根據目標的顏色將每個目標帶到規定的位置;

  • 聚類。智能體必須根據目標的顏色將其分組排列在群集中。

SpriteWorld 也可以用于強化學習以外的其他目的。例如:它被用于生成具有控制因子分布的圖像數據集,如論文「Spatial Broadcast Decoder: A Simple Architecture for Learning Disentangled Representations in VAEs」(watters 等人,2019,https://arxiv.org/abs/1901.07017)。

它還可以很容易地擴展到生成與簡單物理力(如彈簧、重力等)相互作用的物體的數據集,這對于視覺動力學的無監督學習研究是有用的。

GitHub 地址:https://github.com/deepmind/spriteworld 

bsuite

我們試圖將 bsuite(Behaviour Suite for Reinforcement Learning,強化學習行為套件)打造成為強化學習領域 的 MNIST。

具體而言,bsuite 是一系列實驗,旨在突出智能體可擴展性的關鍵點。這些實驗都體現了一些基本的問題,例如「探索」或「記憶」,其實驗方式可以很容易地進行測試和迭代。bsuite 有兩個主要目標:

  • 收集清晰、信息量豐富且可擴展的問題,這些問題捕獲了高效和通用學習算法設計中的關鍵問題;

  • 通過在這些共享基準上的表現來研究智能體的行為。

bsuite 的當前實現可以在不同環境中自動執行手實驗,并收集了相應的指標,這些指標可以簡化 DRL 智能體的訓練。同時,因為 bsuite 是一系列實驗的集合,所以它在實驗子目錄中定義。每個子目錄對應一個實驗,包含:

  • 定義強化學習環境的一種文件,它可以配置為提供不同的難度等級或不同的隨機種子(for example);

  • 此環境的關鍵字參數序列,在實驗的 sweep.py 文件中的 settings 變量中定義;

  • 一個 analysis.py 文件,用于定義所提供的 jupyter 計算機中使用的繪圖;

當通過加載和記錄*函數加載環境時,bsuite 通過記錄每個環境中的結果來工作。這意味著任何實驗都將自動輸出正確格式的數據,以便使用計算機進行分析,而不受任何智能體或算法結構的限制。

GitHub 地址:https://github.com/deepmind/bsuite

 

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2021-06-25 15:36:37

框架AI開發

2025-08-15 09:00:00

AI編輯強化學習

2025-08-29 05:00:00

2020-05-06 16:07:05

百度飛槳

2020-11-12 19:31:41

強化學習人工智能機器學習

2020-01-16 15:57:36

AI 數據人工智能

2014-08-04 14:38:25

LinuxToken

2024-02-28 08:18:13

Java日志項目

2013-04-17 09:16:37

2021-07-26 09:56:19

AI 數據人工智能

2024-12-09 08:45:00

模型AI

2020-11-16 08:54:05

Google 開源技術

2022-11-02 14:02:02

強化學習訓練

2023-09-26 07:11:15

KubernetesJob節點

2021-08-12 09:48:21

Webpack Loa工具Webpack

2019-08-06 09:21:45

2025-03-03 09:12:00

2017-03-13 09:24:59

概念學習器學習字符

2021-09-17 15:54:41

深度學習機器學習人工智能

2009-12-25 14:46:53

Windows 7文件關聯
點贊
收藏

51CTO技術棧公眾號

毛片av免费在线观看| 精品乱码一区二区三区| 日本中文字幕免费在线观看| 玖玖玖电影综合影院| 亚洲国产欧美日韩另类综合| 久久久久久久久久久久久久一区 | 亚洲sss视频在线视频| 久久精品第九区免费观看| 一区二区视频免费| 国内久久视频| 正在播放国产一区| 台湾佬美性中文| 唐人社导航福利精品| 亚洲精品国产视频| 精品一区久久| 国产三级在线观看视频| 亚洲女人av| 美日韩精品免费观看视频| 日本黄色网址大全| 久久伊人影院| 欧美色精品天天在线观看视频| cao在线观看| h片在线播放| 国产亚洲午夜高清国产拍精品| 91精品国产91久久久久青草| 五月婷婷激情视频| 亚洲手机视频| 欧美成人免费一级人片100| 精品无码国产污污污免费网站| 视频免费一区二区| 欧美日本一区二区三区四区| 成人观看免费完整观看| 欧美黄色视屏| 亚洲男人都懂的| 日韩欧美三级一区二区| 婷婷在线免费视频| 国产精品白丝jk白祙喷水网站| 国产精品老牛影院在线观看| 97久久久久久久| 欧美日韩国产免费观看| 久久婷婷国产麻豆91天堂| 美女被到爽高潮视频| 日韩精品福利一区二区三区| 日韩欧美一区中文| 999热精品视频| 亚洲精品69| 欧美日韩精品福利| 2025韩国理伦片在线观看| 最新欧美电影| 91搞黄在线观看| 色诱视频在线观看| 高潮一区二区| 色狠狠桃花综合| 蜜臀久久99精品久久久酒店新书| 蜜桃视频在线观看播放| 岛国av一区二区在线在线观看| 久久亚洲精品无码va白人极品| 色操视频在线| 亚洲午夜精品网| 欧美一级欧美一级| 免费v片在线观看| 午夜精品久久久久久久久久| 久久综合九色综合88i| 天堂av在线| 在线中文字幕一区| 污色网站在线观看| 日韩免费在线电影| 91精品久久久久久久91蜜桃 | 九色|91porny| 91亚洲国产精品| 亚洲精品18在线观看| 成人免费视频一区二区| 久久大香伊蕉在人线观看热2| 十九岁完整版在线观看好看云免费| 26uuu国产在线精品一区二区| 欧美一区二区三区在线免费观看| 国产女主播在线写真| 欧美高清在线精品一区| 男插女免费视频| 国产桃色电影在线播放| 欧美日韩中文在线| 国产一二三四在线视频| 精品一区二区三区四区五区| 欧美精品一区二区精品网| 97人妻精品一区二区三区免| 精品国产一区二区三区久久久樱花 | 欧美三级理论片| 视频精品一区二区三区| 亚洲人av在线影院| 国产黄色录像片| 亚洲精品极品| 国产精品美乳一区二区免费 | 亚洲欧洲中文天堂| 永久免费未视频| 日韩视频精品在线观看| 国产精品久久久久久久久影视| 国产日韩免费视频| 久久久久久97三级| 免费看av软件| 在线男人天堂| 欧美一区二区三区喷汁尤物| 午夜一区二区三区免费| 天天综合精品| 人妖精品videosex性欧美| 97超碰资源站| 久久综合狠狠综合久久激情| 糖心vlog在线免费观看| 自拍偷拍亚洲视频| 日韩女优电影在线观看| 天天操天天舔天天射| 99伊人成综合| 亚洲一区精品电影| 国产无套粉嫩白浆在线2022年| 一区二区三区日韩欧美精品| 中文字幕网av| 国产探花一区二区| 性色av一区二区三区免费| 国产精品久久久久久久久毛片 | 日韩最新在线| 欧美大片va欧美在线播放| 一级久久久久久| 99精品视频一区| www.男人天堂网| 伊人久久大香线蕉综合影院首页| 亚洲男人av在线| 日韩欧美亚洲一区二区三区| 国产成人免费视频网站| 欧美亚洲视频一区| 成人国产精品| 亚洲情综合五月天| 国产香蕉视频在线| 成人ar影院免费观看视频| 欧美日韩一区二区三区电影| 国内精品伊人| 最近2019年中文视频免费在线观看 | 香港伦理在线| 欧美在线观看视频在线| 亚洲第一页av| 久久99伊人| 久久99精品久久久久久青青日本 | 欧美性xxxx18| aaaaa一级片| 日韩午夜高潮| 国产在线精品日韩| av免费不卡| 亚洲第一男人天堂| 日本在线视频免费| 91在线视频在线| 免费在线a视频| 亚洲精品小区久久久久久| 91国在线精品国内播放| 天天舔天天干天天操| 欧美日韩激情美女| wwwwxxxx国产| 丝袜亚洲另类欧美| 色999日韩自偷自拍美女| 精品裸体bbb| 日日骚久久av| 99国产精品一区二区三区| 亚洲精品视频在线观看免费| 一二三级黄色片| 亚洲一级淫片| 成人资源av| gogo高清午夜人体在线| 日韩精品中文字幕在线播放| 国产农村妇女aaaaa视频| 久久精品一级爱片| 亚洲污视频在线观看| 久久在线免费| 91中文字精品一区二区| 国产精品蜜臀| 亚洲日本欧美中文幕| 中文字幕一级片| 亚洲精品国产高清久久伦理二区| 日韩女优在线视频| 老司机久久99久久精品播放免费| 亚洲国产欧美一区二区三区不卡| 国产精品麻豆| 欧美最猛黑人xxxx黑人猛叫黄| 成人精品一区二区| 日韩亚洲欧美综合| xxxx.国产| 日韩毛片精品高清免费| 国产午夜在线一区二区三区| 蜜桃av综合| 日韩精品一区二区三区电影| 欧美在线关看| 国产欧美日韩中文字幕| 欧美videos另类精品| 亚洲毛片在线观看| 国产婷婷在线视频| 一本色道a无线码一区v| 国产精品精品软件男同| 26uuu精品一区二区在线观看| 玖玖爱视频在线| 在线免费高清一区二区三区| 天堂资源在线亚洲资源| 草莓视频一区二区三区| 国产精品久久久久久久久久新婚 | 国产精品久久久久av| 男男gaygays亚洲| 中国人与牲禽动交精品| 午夜成人免费影院| 91精品国产乱| 中文 欧美 日韩| 偷拍一区二区三区| 午夜国产福利一区二区| 欧美国产日韩一二三区| 国产激情第一页| 国产最新精品精品你懂的| 成人在线免费观看av| 欧美91精品| 亚洲不卡一卡2卡三卡4卡5卡精品| 日本精品视频| 国产在线一区二区三区| 日本综合字幕| 日韩专区一卡二卡| 亚洲国产精品999| 亚洲专区在线播放| 欧美午夜无遮挡| 久久久久久av无码免费网站| 国产精品国产自产拍高清av| 最新中文字幕视频| 成人h版在线观看| 精品人妻一区二区乱码| 久久狠狠亚洲综合| 欧美一级片中文字幕| 亚洲日本成人| 国产精品三级一区二区| 99成人在线视频| 水蜜桃一区二区三区| 日韩免费高清视频网站| 国产中文日韩欧美| 国产精品天堂蜜av在线播放 | 一级二级三级欧美| 国产欧美日韩免费观看| 欧美变态tickling挠脚心| 天天天干夜夜夜操| 在线亚洲成人| 黄色一级视频片| 影音先锋亚洲一区| 女人被男人躁得好爽免费视频| 国产韩国精品一区二区三区| 亚洲春色在线视频| 色喇叭免费久久综合网| 亚洲精品国产精品国自产| 国产剧情一区| 日韩和欧美的一区二区| 国产欧美日韩一区二区三区四区 | 午夜激情久久| 中文字幕在线亚洲精品| 99久久九九| 超薄肉色丝袜足j调教99| 欧美在线1区| 国产精品国三级国产av| 亚洲国产一区二区三区a毛片| 无码粉嫩虎白一线天在线观看| 亚洲经典自拍| 国产中文字幕免费观看| 久久激情久久| 国产主播中文字幕| 久久国产精品99精品国产| av中文字幕网址| 国产一区二区三区免费看| 成人三级做爰av| 亚洲高清在线观看视频| 在线播放中文字幕一区| 国产精选久久久| 精品国产一区二区在线观看| 少妇一级淫片免费看| 亚洲美女中文字幕| 成黄免费在线| 欧美成人h版在线观看| 高清电影在线免费观看| 欧美最猛性xxxxx(亚洲精品)| 亚洲精品555| 99理论电影网| 九九亚洲精品| 中文字幕在线亚洲精品| 亚洲国产精品第一区二区三区| 日韩中文字幕二区| 久久国产精品区| 国产51自产区| 中文字幕国产一区二区| 激情五月婷婷小说| 日韩欧中文字幕| 国产精品国产一区二区三区四区 | 日本视频在线播放| 欧美高清在线视频观看不卡| www.四虎成人| 91精品久久久久久久久久不卡| www精品久久| 美女视频一区在线观看| 国产69视频在线观看| 国产午夜精品一区二区| 国产女片a归国片aa| 日韩欧美第一页| 性生活三级视频| 一区二区欧美日韩视频| 久草免费在线色站| 国产精品视频地址| 久久视频在线观看| 制服诱惑一区| 亚洲一区成人| 免费看三级黄色片| 国产精品久久久久久福利一牛影视 | 国产97免费视| 亚洲精品一二三**| 色视频一区二区三区| 99精品国产一区二区青青牛奶| 亚洲少妇久久久| 99re成人精品视频| 欧美成人国产精品高潮| 欧美日韩精品高清| 国产三级视频在线看| 久久久久久国产免费| 欧洲精品久久久久毛片完整版| 精品一区二区三区日本| 欧美精品黄色| 999久久久精品视频| 欧美国产日韩一二三区| 欧美三级午夜理伦| 久久成人久久爱| 免费看成人片| 激情久久中文字幕| japan高清日本乱xxxxx| 综合精品久久久| 伊人精品在线视频| 亚洲网站视频福利| 在线毛片观看| 久久精品中文字幕一区二区三区 | 亚洲一本大道在线| 国产露脸国语对白在线| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | www视频在线看| 国产精品一二区| 欧美军人男男激情gay| 国产99久久九九精品无码| 国产xxx精品视频大全| 一区二区视频免费看| 欧美精品久久99久久在免费线| 在线观看美女网站大全免费| 国产精品99一区| 国产真实有声精品录音| 久久国产乱子伦免费精品| aaa亚洲精品| 天天操天天干视频| 亚洲成人网av| а√在线中文在线新版| 精品不卡在线| 国产婷婷精品| 性欧美13一14内谢| 在线观看日韩电影| 成人好色电影| 成人黄色中文字幕| 91成人免费| 动漫美女无遮挡免费| 性欧美大战久久久久久久久| 天堂av一区二区三区| 91精品国产高清久久久久久91| 任你弄精品视频免费观看| 久久无码高潮喷水| 国产日韩av一区二区| 中文在线观看免费高清| 久久精品一本久久99精品| 中文字幕一区图| 人妻久久久一区二区三区| 久久久久久**毛片大全| 中文字幕你懂的| 欧美成人合集magnet| 韩国精品福利一区二区三区| 337p粉嫩大胆噜噜噜鲁| 久久久久久一二三区| 91福利在线观看视频| 欧美大片欧美激情性色a∨久久| 精品福利网址导航| 无码aⅴ精品一区二区三区浪潮 | 国产人妖一区| 三级在线免费观看| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 国产精品香蕉av| 午夜日韩在线| 日韩乱码人妻无码中文字幕久久| 在线一区二区视频| 中文字幕中文字幕在线中高清免费版| 国产精品一区视频网站| 久久久久国产精品一区二区| 国产又色又爽又高潮免费| 精品国产一区二区国模嫣然| 校园春色亚洲色图| 91大学生片黄在线观看| 96av麻豆蜜桃一区二区| 夜夜嗨aⅴ一区二区三区| 欧美激情一级欧美精品| 欧洲杯什么时候开赛| 欧美人与性动交α欧美精品 | 97在线视频人妻无码| 国产91ⅴ在线精品免费观看| 香蕉国产精品| 怡红院一区二区三区|