精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

新聞 人工智能 算法
谷歌團隊在CoRL 2021上提出了一種隱式行為克隆 (Implicit BC) 算法,該方法在7項測試任務中的6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。

 [[440499]]

谷歌團隊在CoRL 2021上提出了一種隱式行為克隆 (Implicit BC) 算法,該方法在7項測試任務中的6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。Implicit BC在現實世界中表現也得特別好,比基線的顯式行為克隆(explicit BC)模型好10倍。

盡管過去幾年中,機器人學習取得了相當大的進步,但在模仿精確或復雜的行為時,機器人代理的一些策略仍難以果斷地選擇動作。

要讓機器人把桌子上的小滑塊精確地滑進一個插槽里。解決這個任務有很多方法,每種方法都需要精確的移動和修正。機器人只能采取這些策略選項中的一個,還必須在每次滑塊滑得比預期的更遠時及時改變策略。

人類可能認為這樣的任務很容易,但對于機器人來說,情況往往并非如此,它們經常會學習一些人類專家看來「優柔寡斷」或「不精確」的行為。

機器人需要在桌子上滑動滑塊,然后將其精確插入固定裝置,顯式行為克隆模型表現得很猶豫

為了讓機器人更加果斷,研究人員經常利用離散化的動作空間,迫使機器人進行明確的「二選一」,而不是在選項之間搖擺不定。

比如,離散化是近年來很多游戲agent著名模型的固有特征,比如AlphaGo、AlphaStar 和 OpenAI 打Dota的AI agent。

[[440501]]

但離散化有其自身的局限性——對于在空間連續的現實世界中運行的機器人來說,離散化至少有兩個缺點:

  1. 精度有限。
  2. 因計算維度導致成本過高,許多離散化不同的維度會顯著增加內存和計算需求。在 3D 計算機視覺任務中,近期的許多重要模型都是由連續,而非離散表示來驅動的。

為了學習沒有離散化特征缺陷的決定性策略,谷歌團隊提出了一種隱式行為克隆 (Implicit BC) 的開源算法,這是一種新的、簡單的模仿學習方法,已經在 CoRL 2021 上展示。

該方法在模擬基準任務和需要精確和果斷行為的現實世界機器人任務上都取得了很好的結果。在7項測試任務中,隱式 BC 的性能在其中6項上優于此前最佳的離線強化學習方法(Conservative Q Learning)。

有趣的是,隱式 BC 在不需要任何獎勵信息的情況下實現了這些結果,即可以使用相對簡單的監督學習,而不是更復雜的強化學習。

隱式行為克隆(Implicit BC)

這種方法是一種行為克隆,可以說是機器人從演示中學習新技能的最簡單的方法。在行為克隆中,agent會學習如何通過標準監督學習模仿專家的行為。傳統的行為克隆一般是訓練一個顯式神經網絡(如下圖左所示),接受觀察并輸出專家動作。

而隱式行為克隆背后的關鍵思想是,訓練一個神經網絡來接受觀察和動作,并輸出一個數字,該數字對專家動作來說很低,對非專家動作來說很高,將行為克隆變成一個基于能量的建模問題。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

顯式(左)和隱式(右)策略之間差異的描述。在隱式策略中,「argmin」表示與特定觀察配對時最小化能量函數值的動作。

訓練后,隱式行為克隆策略會查找對給定觀察具有最低能量函數值的動作輸入,以此生成動作。

為了訓練隱式 BC 模型,研究人員使用InfoNCE損失,讓網絡為數據集中的專家動作輸出低能量,為所有其他動作輸出高能量。有趣的是,這種使用同時接受觀察和行動的模型的思想在強化學習中很常見,但在有監督的策略學習中則不然。

上圖所示為隱式模型如何適應不連續性的動畫——在這種情況下,訓練隱式模型來適應一個步長(Heaviside)函數。左:擬合黑色訓練點的2D圖,顏色代表能量值(藍色低,棕色高)。中間:訓練期間能量模型的3D圖。右圖:訓練損失曲線。

一旦經過訓練,Google AI發現隱式模型(implicit model)特別擅長精確地建模先前顯式模型(explicit model)難以解決的不連續性問題,從而產生新的策略,能夠在不同行為之間果斷切換。

為什么傳統的顯式模型(explicit model)在這個問題上表現不佳呢?

現代神經網絡幾乎總是使用連續激活函數——例如,Tensorflow、Jax和PyTorch都只提供連續激活函數。

在試圖擬合不連續數據時,用這些激活函數構建的顯式網絡無法準確表示,因此必須在數據點之間繪制連續曲線。隱式模型(implicit model)的一個關鍵優勢是,即使網絡本身僅由連續層組成,也能夠表示出尖銳的不連續性。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

與顯式模型(底部)相比,隱式模型(頂部)擬合不連續函數的示例。紅色突出顯示的插圖顯示,隱式模型表示不連續性(a)和(b),而顯式模型必須在不連續性之間畫出連續的線(c)和(d)

Google AI在這個方面建立了理論基礎,提出了一個普遍近似的概念,證明了隱式神經網絡可以表示的函數類別,這將有助于證明和指導未來的研究。

Google AI最初嘗試這種方法時面臨的一個挑戰是「高動作維度」,這意味著機器人必須決定如何同時協調多個電機。為了擴展到高作用維度,Google AI使用自回歸模型或朗之萬動力學。

全新SOTA

在實驗中,Google AI發現Implicit BC在現實世界中表現得特別好,在毫米精度的滑塊滑動及插槽任務上比基線的顯式行為克隆(explicit BC)模型好10倍。

在此任務中,隱式模型(implicit model)在將滑塊滑動到位之前會進行幾次連續的精確調整。

將滑塊精確地插入插槽的示例任務。這些是隱式策略的自主行為,僅使用圖像(來自所示的攝像機)作為輸入

這項任務有多種決定性因素:由于塊的對稱性和推動動作的任意順序,有許多不同的可能解決方案。

機器人需要決定滑塊何時已經被推動足夠遠,然后需要切換到向不同方向滑動。這一過程是不連續的,所以,連續控制型機器人在這一任務上會表現得十分優柔寡斷。

完成這項任務的不同策略。這些是來自隱式策略的自主行為,僅使用圖像作為輸入

在另一個具有挑戰性的任務中,機器人需要按顏色對滑塊進行篩選,由于挑選順序是很隨意的,這就產生了大量可能的解決方案。

頗具挑戰性的連續篩選任務中顯式BC模型的表現(4倍速度)

在這項任務中,顯式模型(explicit model)還是表現得很拿不準,而隱式模型(implicit model)表現得更好。

頗具挑戰性的連續篩選任務中隱式BC模型表現(4倍速度)

而且在Google AI的測試中,Implicit BC在面臨干擾時,盡管模型從未見過人類的手,也依然可以表現出強大的適應能力。

機器人受到干擾時,隱式BC模型的穩健行為

總的來說,Google AI發現,與跨多個不同任務領域的最先進的離線強化學習方法相比,Implicit BC策略可以獲得更好的結果。

Implicit BC可以完成很多具有挑戰性的任務,比如演示次數少(少至19次),基于圖像的觀察具有高觀察維度,還有高達30維的高動作維度,這就需要機器人充分利用自身具有的大量致動器。

橫掃6個SOTA,谷歌行為克隆算法登CoRL頂會,機器人干活10倍速

隱式策略學習結果與跨多個域的基線進行了比較

盡管Implicit BC目前還有其局限性,但使用監督學習的行為克隆仍然是機器人從人類行為例子中學習的最簡單方法之一。

該工作表明,在進行行為克隆時,用隱式策略替換顯式策略可以讓機器人克服「猶猶豫豫」,使它們能夠模仿更加復雜和精確的行為。

雖然Implicit BC取得的實驗結果來自機器人學習問題上,但是隱式函數對尖銳不連續性和多模態標簽建模的能力可能在機器學習的其他領域也有更廣泛的應用。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-12-19 14:39:29

機器人論文

2021-06-03 12:16:18

騰訊云機器人Robotics X

2020-05-20 12:44:53

編程軟件開發JavaScript

2010-02-05 10:31:46

谷歌機器人

2019-03-27 09:27:06

機器人人工智能系統

2024-07-16 13:15:23

2025-09-26 09:15:40

2025-02-21 13:00:00

2024-01-05 19:44:48

谷歌機器人憲法AI

2021-09-30 18:03:37

AI

2021-12-26 23:04:34

機器人人工智能技術

2021-04-19 20:30:06

機器人AI人工智能

2017-03-15 19:03:22

人工智能人類半機器人

2019-10-11 12:47:54

機器學習人工智能計算機

2021-04-21 13:56:32

人工智能機器學習

2024-01-05 09:16:22

谷歌機器人人工智能

2018-11-13 09:19:48

機器人人工智能系統

2021-12-13 17:53:19

谷歌Transformer技術

2021-10-27 10:41:06

機器人人工智能AI
點贊
收藏

51CTO技術棧公眾號

免费成人在线电影| 国产高清第一页| 一区二区导航| 91麻豆精品国产91久久久更新时间 | 精品亚洲一区二区三区在线观看 | 一区二区三区国产福利| 国产精品久久久久久免费| 亚洲精品综合| 日韩一区二区久久久| 欧产日产国产精品98| 精品69视频一区二区三区| 亚洲一区二区精品3399| 日日夜夜精品网站| 免费国产羞羞网站视频| 久久99国产精品久久| 91精品国产乱码久久久久久蜜臀| 亚洲熟女毛茸茸| 国产不卡av一区二区| 欧美不卡视频一区| 中日韩av在线播放| 亚洲成人激情社区| 婷婷综合另类小说色区| 可以在线看黄的网站| 国产成人天天5g影院在线观看| 高清不卡在线观看av| 成人午夜激情网| 亚洲高清视频免费观看| 99精品国产在热久久| 色综合91久久精品中文字幕 | 五月婷婷六月综合| 亚洲视频在线看| 国产成人无码一区二区在线观看| 奇米一区二区| 91精品国产综合久久久久| 成人性视频欧美一区二区三区| av不卡高清| 亚洲国产日韩一级| 一本大道东京热无码aⅴ| 永久av在线| 中文幕一区二区三区久久蜜桃| 久久久久久国产精品mv| 天堂在线资源8| 成人丝袜视频网| 国产成人精品免费视频大全最热| 国产精品自拍电影| 国产专区综合网| 国产欧美精品在线播放| 在线免费看av片| 麻豆精品蜜桃视频网站| 国产欧美 在线欧美| 中文字幕制服诱惑| 美国三级日本三级久久99| 国产精品高潮呻吟久久av无限| 日本中文字幕第一页| 麻豆成人精品| 国产aⅴ夜夜欢一区二区三区| 欧美一区二区三区网站| 日日夜夜免费精品视频| 国产精品毛片a∨一区二区三区|国| www.久久视频| 久久er99热精品一区二区| 国产欧美一区二区白浆黑人| 中文字幕日韩精品有码视频| 亚洲天堂网站在线观看视频| 日韩一级片播放| 精品欧美一区二区三区在线观看| 在线观看成人小视频| 亚洲 中文字幕 日韩 无码| 成人开心激情| 欧美日韩大陆一区二区| 天天做天天干天天操| 清纯唯美激情亚洲| 亚洲精品电影在线观看| 美女脱光内衣内裤| 日韩欧美网址| 欧美成人免费全部| 国产成人在线观看网站| 日本亚洲视频在线| 亚洲a在线播放| 人妻与黑人一区二区三区| 久久夜色精品一区| 一本色道久久综合亚洲精品婷婷| 1024在线播放| 欧美性猛交xxxx乱大交极品| 性生活免费在线观看| 999久久久久久久久6666| 精品亚洲一区二区三区| 男人的午夜天堂| 一区二区三区国产在线| 91精品美女在线| 污污网站免费在线观看| 中文字幕高清不卡| 人妻少妇精品久久| jvid一区二区三区| 亚洲白拍色综合图区| 欧美 日韩 成人| 欧美三级在线| 奇米影视亚洲狠狠色| 国产伦精品一区二区三区视频痴汉| 波多野结衣中文字幕一区| 亚洲欧洲精品在线| 超级白嫩亚洲国产第一| 欧美日韩性生活| 亚洲国产欧美一区二区丝袜黑人| 中文字幕一区二区三区四区在线视频| 国产精品白丝久久av网站| 亚洲精品在线91| 天天综合天天做| 水蜜桃久久夜色精品一区的特点 | 在线观看欧美| 亚洲片国产一区一级在线观看| 1024手机在线视频| 久久精品国产一区二区三| 久久综合中文色婷婷| 影音先锋男人资源在线| 欧美日韩一区在线| 在线 丝袜 欧美 日韩 制服| 国产一区二区三区自拍| 成人久久一区二区三区| 懂色av中文在线| 精品欧美aⅴ在线网站| 日韩精品xxx| 婷婷亚洲图片| 国产精品老牛影院在线观看| 韩国中文字幕2020精品| 欧美日韩国产页| 日本性生活一级片| 欧美视频不卡| 91久久久久久久久久久久久| 日本亚洲精品| 欧美性淫爽ww久久久久无| 91精品小视频| av成人天堂| 激情欧美一区二区三区中文字幕| 欧美三级黄网| 欧美日韩高清一区二区不卡| 丁香激情五月少妇| 久久婷婷激情| 日本一区二区三区免费观看| 麻豆成全视频免费观看在线看| 精品国产伦理网| 久久久久亚洲天堂| 成人黄色大片在线观看| av免费看网址| 欧美激情影院| 欧洲午夜精品久久久| 手机av免费在线观看| 午夜精品久久久久久久久| 天天躁日日躁狠狠躁av麻豆男男| 亚洲区一区二| 看欧美日韩国产| 欧美成人免费电影| 国产亚洲在线播放| 91精品国产乱码久久久久| 国产精品电影一区二区三区| 久久精品视频在线观看免费| 自拍视频亚洲| 国产精品区一区| 中文字幕乱码中文乱码51精品| 亚洲男人的天堂在线| 国产精品午夜一区二区| 国产精品不卡在线| 手机av在线网站| 亚洲性视频h| 另类小说综合网| 全球最大av网站久久| 色哟哟亚洲精品一区二区| 888奇米影视| 亚洲一区中文在线| 亚洲精品乱码久久久久久不卡| 久久综合亚州| 黑人巨大国产9丨视频| 国产精品宾馆| 国产成人精品视频在线观看| 91精品专区| 日韩午夜中文字幕| av大片在线免费观看| 国产精品无圣光一区二区| 欧美性猛交xx| 久久精品在线| 日韩精品一区二区三区电影| 国产欧美自拍一区| 国产精品网站视频| 免费电影网站在线视频观看福利| 亚洲欧美日韩一区在线| 国产肥老妇视频| 91久久免费观看| 五月天丁香激情| 国产午夜精品福利| 久久久久无码国产精品一区李宗瑞| 美日韩精品视频| 18视频在线观看娇喘| 杨幂一区二区三区免费看视频| 91在线观看免费观看| 国产免费不卡| 欧美黑人xxxx| 在线中文资源天堂| 日韩精品欧美激情| 国产剧情久久久| 91国在线观看| 中文在线观看免费网站| **欧美大码日韩| 精品无码国产污污污免费网站 | 欧美人与性囗牲恔配| 国产经典欧美精品| 在线免费av播放| 国产精品嫩草99av在线| 成人午夜免费剧场| 日本一区二区高清不卡| 久久99久久99精品蜜柚传媒| 国产在线视频欧美一区| 国产精品你懂得| 97成人资源| 国色天香2019中文字幕在线观看| 久久综合之合合综合久久| 亚洲欧美中文日韩在线v日本| 亚洲精品久久久久久久久久 | 人妻av一区二区三区| 免费成人美女在线观看| aaa毛片在线观看| 亚洲国产免费看| 日韩精品免费一区| 伊人久久大香线蕉综合四虎小说 | 亚洲va久久久噜噜噜| 456亚洲精品成人影院| 55夜色66夜色国产精品视频| 欧美家庭影院| 九九热精品视频在线播放| 日本免费视频在线观看| 中文字幕在线成人| 二区在线观看| 在线国产精品播放| 成人性爱视频在线观看| 亚洲色图美腿丝袜| 国产一二三在线观看| 亚洲女同性videos| 欧美日韩国产中文字幕在线| 日韩av影院在线观看| 色欲久久久天天天综合网 | 国产爆初菊在线观看免费视频网站| 精品小视频在线| 青青草免费观看免费视频在线| 亚洲精品久久久久久久久久久| 日本毛片在线观看| 精品一区二区亚洲| 秋霞av在线| 国产亚洲a∨片在线观看| 九色蝌蚪在线| 搡老女人一区二区三区视频tv| 999在线视频| 久久精品成人欧美大片古装| 成人黄视频在线观看| 欧美激情在线播放| 免费h在线看| 国产成人午夜视频网址| 福利一区和二区| 91欧美视频网站| 果冻天美麻豆一区二区国产| 久久riav| 精品精品99| 中文字幕一区二区三区四区五区人 | 亚洲激情视频一区| 日韩欧美精品中文字幕| 羞羞色院91蜜桃| 欧美一区二区二区| 少妇一级淫片免费看| 亚洲欧美在线播放| 国产一级片在线| 久久久精品国产网站| 国产精品蜜臀| 国产精品对白刺激| 国产精一区二区| 国产私拍一区| 成人免费在线播放| 黄色一级大片免费| 亚洲在线成人| 欧美在线aaa| 国产91丝袜在线播放| www.久久av| 亚洲欧美日韩在线播放| 日韩xxx高潮hd| 欧美日韩一级二级| 蜜桃视频久久一区免费观看入口| 亚洲欧美在线免费| 91麻豆一二三四在线| 奇米4444一区二区三区| 国产精品久久久久久久久久辛辛| 精品国产中文字幕| 91日韩欧美| 日韩久久一级片| 国产一区二区伦理| 一区二区黄色片| 亚洲免费看黄网站| 看黄色一级大片| 亚洲第一精品电影| 日本三级在线视频| 日韩免费观看视频| 亚洲午夜免费| 一区二区三区四区欧美| 国产日韩1区| 男男受被啪到高潮自述| 中文字幕不卡在线播放| 国偷自拍第113页| 欧美一区二区三区日韩| 阿v免费在线观看| 97视频国产在线| 涩爱av色老久久精品偷偷鲁| 日韩精品第一页| 在线亚洲激情| 91porn在线| 综合亚洲深深色噜噜狠狠网站| 91黑人精品一区二区三区| 亚洲成人动漫在线播放| 成人国产免费电影| 国产在线观看精品一区二区三区| 亚洲永久精品唐人导航网址| www插插插无码视频网站| 国产麻豆午夜三级精品| 又色又爽的视频| 日本高清不卡一区| 日韩av免费观影| 97超碰国产精品女人人人爽| 成人春色在线观看免费网站| 91精品国产吴梦梦| 国产一区二区精品久久99| 在线观看免费黄色网址| 日本黄色一区二区| 国产中文字幕在线看| 91高潮在线观看| 久久国产精品免费精品3p| 男人天堂a在线| 国产成人免费视频网站高清观看视频 | 欧美美女啪啪| av免费观看大全| 成人sese在线| 国产精品6666| 日韩av中文字幕在线免费观看| bbw在线视频| 精品国产乱码久久久久久88av| 樱桃成人精品视频在线播放| 91精品啪在线观看国产| 亚洲成av人片| 色视频在线观看福利| 国产91成人在在线播放| 窝窝社区一区二区| 国产成人久久777777| 国产女同互慰高潮91漫画| 中文字幕一区二区三区四区视频| 日日狠狠久久偷偷四色综合免费| 亚洲视频资源| 精品久久久无码人妻字幂| 粉嫩aⅴ一区二区三区四区 | h视频在线免费观看| 亚洲综合最新在线| 欧美久久视频| 国产一卡二卡三卡四卡| 欧美日韩免费一区| 国产高清一区在线观看| 国产精品视频一| 中文字幕亚洲精品乱码| 娇妻高潮浓精白浆xxⅹ| 欧美性猛交xxxx乱大交3| 992tv免费直播在线观看| 91久久精品在线| 日韩五码在线| 欧美亚洲色综久久精品国产| 在线播放欧美女士性生活| 国模私拍视频在线播放| 农村寡妇一区二区三区| 美日韩一级片在线观看| 久久久久免费看| 亚洲午夜av久久乱码| 人人精品久久| 真人抽搐一进一出视频| 久久精品亚洲国产奇米99| 国产精品国产精品国产专区| 97人人爽人人喊人人模波多| 成人激情免费视频| 日本女人性视频| 色婷婷精品大视频在线蜜桃视频| 午夜视频在线看| 狠狠色狠狠色综合人人| 美女久久久精品| 精品无码人妻一区二区三区| 国产亚洲成精品久久| 亚洲网一区二区三区| 蜜桃免费在线视频| 亚洲一卡二卡三卡四卡| 电影av一区| 国产专区一区二区| 久久成人av少妇免费| 国产日产精品一区二区三区| 久久天天躁狠狠躁夜夜躁2014| 天堂日韩电影| 国产黑丝在线视频| 在线一区二区观看| 96av在线| 亚洲激情免费视频| 国产精品每日更新| 天堂成人在线视频|