精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌大腦新研究:強化學習如何學會用聲音來觀察?

新聞 人工智能
近日,來自谷歌大腦的一篇題為 “The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning” 的論文證明了 強化學習擁有這種“感官替代”的能力。

 

人類已經證明,大腦中的神經系統擁有為不斷適應外界環境的變化而改變自身結構的能力。大腦內部的突觸、神經元之間的連接可以由于學習和經驗的影響建立新的連接。

相應的,感官替代(sensory substitution)這一天賦也存在人類技能樹之中,例如有些天生失明的人能夠通過將圖像轉換成聲音學會感知人體輪廓形狀的能力。

如果讓AI擁有這種能力,它也能像蝙蝠和海豚一樣,能夠利用其耳朵通過聲音和回聲來‘看’周圍的世界一樣。

近日,來自谷歌大腦的一篇題為 “The Sensory Neuron as a Transformer: Permutation-Invariant Neural Networks for Reinforcement Learning” 的論文證明了 強化學習擁有這種“感官替代”的能力。

論文地址:https://arxiv.org/pdf/2109.02869.pdf

具體而言, 作者在論文中設計了一系列強化學習系統,其能夠將來自環境的每種感覺輸入(sensory inputs)到不相同,卻具有一定聯系的神經網絡中,值得一提的是,這些神經網絡之間沒有固定的關系。 研究表明,這些感覺網絡可以通過訓練來整合本地收到的信息,并且通過注意機制的交流,可以集體達成一個全局一致的方案。

此外,即使在一個事件中,輸入順序被隨機地排列多次,該系統仍然可以執行其任務。

1. 證明過程

現代深度學習系統通常無法適應感覺輸入的隨機重新排序,除非對模型進行重新訓練或者用戶為模型糾正輸入的順序。然而,meta-learning這項技術,可以幫助模型適應這種變化。例如adaptive weights、Hebbian-learning和model-based等方法。

在論文中,作者研究的agents都有一個共同的特點: 在執行任務時被用來處理感覺輸入,并將輸入突然隨機重新進行排序。 受到與細胞自動機相關的自組織神經網絡的最新發展的啟發,作者在實驗中將每個感覺輸入(可以是連續控制環境中的單個狀態,或者是視覺環境中的一塊像素)輸入一個單獨的神經網絡模塊,該模塊在一段時間內只整合來自這個特定感覺輸入通道的信息。

在本地接收信息的同時,這些單獨的感覺神經網絡模塊也不斷地廣播輸出信息。參考Set Transformer架構,一個注意力機制將這些信息結合起來,形成一個全局的潛代碼(global latent code),然后將其轉換為agent的行動空間。注意力機制可以被看作是神經網絡適應性加權的一種形式,在這種情況下,允許任意數量的感覺輸入以任何隨機順序被處理。

實驗中,作者發現每個單獨的感覺神經網絡模塊,雖然只能接收到局部信息,但仍能共同產生一個全局一致的策略,而且這樣的系統可以被訓練來執行幾個流行的強化學習(RL)環境中的任務。此外,作者設計的系統能夠以任何隨機排列的順序利用不同數量的感覺輸入通道,即使在一個episode中順序再次被重新排列。

如上圖pong agent,即使在給它一個小的屏幕子集(30%),以一個重新排列的順序,也能繼續工作。

另一方面,鼓勵系統學習的置換不變的觀測空間的連貫性表示,會使 policies更加穩健,泛化性更強。研究表明,在沒有額外訓練的情況下,即使加入含有噪聲或冗余信息的其它輸入通道,系統也能繼續運作。在視覺環境中,即使只給它一小部分從屏幕上隨機選擇的區塊,而在測試時,如果給它更多的區塊,系統可以利用額外的信息來表現得更好。

作者還證明, 盡管在單一的固定背景上進行訓練,系統還是能夠推廣到具有不同背景圖像的視覺環境。 最后,為了使訓練更加實用,作者提出了一個行為克隆(behavioral cloning)方案,將用現有方法訓練的策略轉換成具有理想特性的置換不變的策略。

圖注:方法概述

上圖的AttentionNeuron 是一個獨立的層,其中每個感覺神經元只能訪問“無序觀察(unordered observations)”的一部分。結合agent的前一步動作,每個神經元使用共享函數,然后獨立生成信息。

圖注:符號列表

在上述表格中,作者還提供了我們的模型中用于不同強化學習環境的維度,以使讀者了解系統中每一部分。

圖注:CartPoleSwingUpHarder中的置換不變agent

在上述演示中,用戶可以隨時重新排列5個輸入的順序,并觀察agent如何適應輸入的新順序。

演示地址:https://attentionneuron.github.io/

圖注:車桿測試

作者報告了每個實驗的1000個測試事件的平均得分和標準偏差。agent只在有5個感覺輸入的環境中進行訓練。

圖注:置換不變的輸出

當作者按原樣輸入傳感器陣列(頂部)或隨機重新排列陣列(底部)時,Attention Neuron層的輸出(16維全局潛代碼)不會改變。黃色代表較高的數值,而藍色代表較低的數值。

圖注:處理未指定數量的額外噪聲通道

在沒有額外訓練的情況下,agent接收15個按重新排列后順序排列的輸入信號,其中10個是純高斯噪聲(σ=0.1),另外5個是來自環境的實際觀察結果。像先前的演示一樣,用戶可以對15個輸入的順序進行重新排列,并觀察agent如何適應新的輸入順序。

圖注:注意力神經元層的輸出在測試情節中的二維嵌入

作者在圖中突出了幾個有代表性的組,并展示了它們的抽樣輸入。每個組我們顯示3個相應的輸入(行),并對每個輸入進行解堆以顯示時間維度(列)。

CarRacing的基本任務(左),修改后的洗屏任務(右)。

作者的agent只在這個環境中訓練。如上圖所示,右邊的屏幕是agent觀察到的,左邊的是人類的視覺觀察到的。人類會發現用重新排列觀察的方式駕駛是非常困難的,因為人類沒有經常接觸到這樣的任務,就像前面提到的 "倒騎自行車 "的例子。

2. 討論以及未來

在這項工作中,作者研究了深度學習agents的特性,這些agents可以把它們的觀察作為一個任意排序的、可變長度的感覺輸入列表。通過獨立地處理每個輸入流,并使用注意力整合處理后的信息。即使觀測的順序在一個episode中被隨機地改變了多次,而且沒有進行訓練,agents仍然可以執行任務。我們在下表中報告了每個環境的性能對比結果。

在展開的工作中重新梳理觀測結果

在每個episode中,作者每隔t step重新打亂順序觀察。CartPole任務差異較大,因此對它測試了1000次。其他任務,報告了100次測試的平均值和標準偏差。除了Atari Pong,所有環境都有每集1000 step的硬性限制。在Atari Pong中,雖然不存在一集的最大長度,但觀察到,每個episode通常持續2500 step左右。

通過打亂agent排序,甚至是不完整的觀測信息,可以驅動它解釋每個局部感覺輸入的意義以及它們與全局的關系,這在目前的許多應用中都有實際用途。例如,當被應用于機器人時,可以避免由于交叉布線或復雜的動態輸入-輸出映射而產生的錯誤。類似于CartPole實驗的設置,加上額外的噪聲通道,可以使一個收到成千上萬的噪聲輸入通道的系統識別出具有相關信息的小的通道子集。

局限性在于, 對于視覺環境,patch size的選擇會影響性能和計算的復雜性。作者發現6x6像素的patch size在任務中很有效,4x4像素的patch size在某種程度上也可發揮效用,但單個像素的觀察卻不能發揮作用。小的patch size也會產生一個大的注意力矩陣,除非使用近似值,否則計算成本可能會過高。

另一個限制是 ,排列組合不變的特性只適用于輸入,而不適用于輸出。雖然觀測結果的排序可以以再次打亂,但行動的排序卻不能。為了使置換不變的輸出發揮作用,每個環節都需要來自環境的反饋以便學習自身和環境之間的關系,包括獎勵信息。

一個頗為有趣的未來研究 方向是使行動層也具有相同的屬性,并將每個運動神經元建模為一個使用注意力連接的模塊。有了作者的方法, 就有可能訓練一個具有任意數量的agent,或者用一個單一的被提供了一個獎勵信號作為反饋的policy控制具有不同形態的機器人 。此外 ,在這項工作中,作者設計的方法接受以前的行動作為反饋信號。然而,反饋信號并不局限于行動。作者表示,其期待看到未來的工作包括環境獎勵等信號,不僅能適應觀察到的環境變化,還能適應自身的變化,以訓練置換不變的 meta-learning agents。

責任編輯:張燕妮 來源: 人工智能學家
相關推薦

2020-01-16 15:57:36

AI 數據人工智能

2025-10-11 04:00:00

2023-09-21 10:29:01

AI模型

2021-01-11 10:23:22

谷歌神經網絡機器學習

2021-11-29 10:09:50

AI 強化學習人工智能

2021-08-18 10:20:41

人工智能強化學習技術

2021-04-29 14:53:14

谷歌強化學習開發

2018-08-29 08:13:22

Google 學習框架技術

2022-12-01 08:00:00

2020-04-15 16:44:38

谷歌強化學習算法

2017-02-20 16:35:10

人工智能算法強化學習

2025-08-01 09:05:00

2025-03-06 08:19:01

2021-07-27 15:55:01

人工智能機器學習技術

2020-08-10 06:36:21

強化學習代碼深度學習

2023-03-09 08:00:00

強化學習機器學習圍棋

2025-06-27 10:10:43

AI模型技術

2020-10-28 13:51:45

機器學習化學研發AI

2023-10-04 09:17:03

機器人AI

2025-07-01 09:05:28

點贊
收藏

51CTO技術棧公眾號

国产午夜视频在线播放| 国产xxxxxxxxx| 国产三区在线观看| 国产盗摄视频一区二区三区| 欧美激情按摩在线| 内射中出日韩无国产剧情| 桃子视频成人app| 亚洲视频香蕉人妖| 国语精品中文字幕| 伊人网视频在线| 亚洲网址在线| 中文字幕国内精品| 国产一线在线观看| 欧美日韩五码| 亚洲国产欧美日韩另类综合 | 欧美片一区二区三区| 第四色在线视频| 欧美aaaaaa| 疯狂做受xxxx欧美肥白少妇| 亚洲巨乳在线观看| 色呦呦免费观看| 精品亚洲porn| 欧美亚洲视频在线观看| av激情在线观看| 亚洲区小说区| 亚洲成人黄色网址| 日本精品一区在线| 成人视屏在线观看| 午夜视频在线观看一区| 老司机午夜网站| 成年网站在线| 97久久久精品综合88久久| 成人激情免费在线| 国产女主播喷水视频在线观看 | 国产精品视频一二三区| 国产精品免费在线播放| www.久久网| 久久xxxx精品视频| 羞羞色国产精品| a级片在线观看免费| 国产精品精品| 中文字幕日韩专区| 国产精品毛片一区二区| 欧美美女在线直播| 精品日产卡一卡二卡麻豆| 免费成人黄色大片| 亚洲男人在线| 欧美日韩的一区二区| 欧美三级午夜理伦三级| 九九色在线视频| 亚洲精品视频免费观看| 在线国产99| 麻豆电影在线播放| 国产精品久线观看视频| 一区二区三区国产福利| 97人人在线| 国产精品不卡在线| 一区二区在线观| 在线观看黄av| 中文字幕亚洲一区二区av在线| 日韩中文一区| 天天影视久久综合| 最好看的中文字幕久久| 国产精品亚洲天堂| av在线免费网站| 亚洲一区欧美一区| 黄页免费在线观看视频| 一区二区乱码| 91久久精品一区二区三| 久久精品网站视频| 激情中国色综合| 777午夜精品视频在线播放| 九九热免费在线观看| 成人免费91| 欧美成人vr18sexvr| 亚洲天堂2024| 啪啪亚洲精品| xxxxx91麻豆| 黄色片在线观看网站| 欧美日本中文| 奇米影视亚洲狠狠色| 黄色av网站免费| 久久成人免费电影| 99re在线观看| 亚洲欧美综合在线观看| 国产欧美一区二区三区沐欲| 中文字幕在线亚洲三区| 色爱综合区网| 91久久精品一区二区| 夜夜夜夜夜夜操| 综合久久成人| 亚洲欧美日韩一区二区三区在线| 国产精品综合激情| 欧美三级特黄| 国产精品91久久久| 精品人妻一区二区三区含羞草 | 久久一区二区三区四区五区 | 精品成人无码久久久久久| 日本美女视频一区二区| 91网站免费看| 欧美在线一卡| 亚洲精品成人在线| 欧美视频免费播放| 粉嫩av国产一区二区三区| 亚洲精品aⅴ中文字幕乱码| 成熟人妻av无码专区| 亚洲天堂偷拍| 国产一区视频在线播放| 色噜噜在线播放| 综合分类小说区另类春色亚洲小说欧美| www.射射射| 欧美黄页免费| 精品丝袜一区二区三区| 亚洲天堂黄色片| 视频一区二区中文字幕| 91久久极品少妇xxxxⅹ软件| 成人18在线| 日韩欧美在线视频日韩欧美在线视频 | 亚洲最大激情中文字幕| 你懂的在线看| 亚洲国产一区在线观看| 色婷婷激情视频| 欧美特黄一级大片| 88xx成人精品| 成人免费视频国产免费麻豆| 最新国产成人在线观看| 午夜欧美福利视频| 制服丝袜日韩| 性欧美xxxx| 性猛交富婆╳xxx乱大交天津| 国产精品久久久久久久久免费樱桃 | 国产欧美日韩一级| 国产精品日本一区二区 | 成人免费一区二区三区视频 | 在线看无码的免费网站| 三级在线观看视频| 精品1区2区在线观看| 黄色一级片中国| 久久丁香综合五月国产三级网站| 欧美主播一区二区三区美女 久久精品人| 国产网红在线观看| 日韩视频不卡中文| 希岛爱理中文字幕| 精品亚洲porn| 欧美h视频在线观看| 日韩av懂色| 久久精品国产一区二区电影| 亚洲系列在线观看| 国产精品毛片久久久久久| 日韩欧美在线免费观看视频| 亚洲宅男网av| 日本久久久久久久久| 欧美高清电影在线| 色国产综合视频| 中文字幕在线1| 久久人人97超碰国产公开结果| 欧美亚洲另类在线一区二区三区 | 欧美性生交大片免费| 欧美精品欧美极品欧美激情| 国产精品久久久久久久免费软件| 国产一区二区黄色| 九色porny丨国产首页在线| 日韩av在线免费观看| av网站中文字幕| 国产日韩欧美一区二区三区乱码| 波多结衣在线观看| 亚洲成人精品| 97超碰人人看人人 | 制服丝袜av在线| 欧美午夜在线| 免费日韩电影在线观看| 在线成人视屏| 久久精视频免费在线久久完整在线看| 国产精品久久久久久无人区| 一区二区三区精品| 无码一区二区精品| 日本伊人午夜精品| 男女啪啪的视频| xxxx日韩| 日韩免费精品视频| 欧美私人网站| 精品成a人在线观看| 亚洲熟妇无码乱子av电影| 国产精品丝袜91| 国产精品亚洲一区二区无码| 国产视频一区三区| 中国一区二区三区| 国产精品超碰| 国产精品久久久久国产a级| 国产在线观看av| 日韩av网站大全| 亚洲图片小说视频| 午夜在线成人av| 成年人视频软件| 成人午夜看片网址| 热久久精品免费视频| 女同性一区二区三区人了人一| 国产一级特黄a大片99| 久久精品黄色| 97超级碰碰碰| 麻豆av在线导航| 精品亚洲精品福利线在观看| 91精品国产乱码久久久| 亚洲成人免费看| 欧美日韩一区二| 91精品国产闺蜜国产在线闺蜜| 日韩国产精品大片| 免费人成自慰网站| 日韩欧美不卡| 欧美日本韩国在线| 视频一区中文字幕精品| 国产成人激情视频| 黑人精品视频| 日韩小视频网址| 国产在线91| 精品国产91亚洲一区二区三区婷婷| 少妇无套内谢久久久久| 精品久久久国产| 欧美被狂躁喷白浆精品| 欧美激情一区二区三区全黄| 国产制服丝袜在线| 国产激情偷乱视频一区二区三区 | 久久精品一区二区三| 久久久亚洲午夜电影| 香蕉视频1024| 激情丁香综合五月| 欧美日韩亚洲第一| 亚洲无线一线二线三线区别av| 亚洲国产精品日韩| 国产精品一在线观看| 精品国产一二| 国产精品久久久久av蜜臀| 亚洲jizzjizz日本少妇| 国产香蕉久久| 日韩美女免费观看| 欧美性suv| 欧美一级成年大片在线观看| 日本高清成人vr专区| 久久精品国产亚洲精品| 在线激情网站| 中文字幕在线观看亚洲| 国产精品一区在线看| 亚洲新声在线观看| 人成在线免费视频| 亚洲毛茸茸少妇高潮呻吟| 天堂av2024| 亚洲第一精品电影| 天堂中文在线资源| 日韩av在线看| 久青草国产在线| 亚洲片国产一区一级在线观看| 欧美日韩伦理片| 亚洲久久久久久久久久久| 欧洲一级在线观看| 亚洲欧美制服另类日韩| 黄色片在线免费看| 在线看日韩欧美| 91在线观看| 久久精品美女视频网站| 最新国产在线拍揄自揄视频| 欧美成人激情在线| 成人免费一区二区三区牛牛| 97香蕉久久超级碰碰高清版| 午夜影院一区| 国产精品十八以下禁看| 日韩城人网站| 成人影片在线播放| 日韩高清一级| 日韩啊v在线| 91亚洲人成网污www| 自拍偷拍一区二区三区| 激情久久久久久| 日本在线观看a| 六月丁香综合在线视频| 在线视频观看91| 国产成人免费高清| 四虎影成人精品a片| 日本一区二区在线不卡| www.av成人| 香蕉成人啪国产精品视频综合网| 亚洲国产av一区二区三区| 欧美日韩色综合| 亚洲第九十九页| 日韩黄色在线免费观看| 中文字幕在线视频区| 欧美精品一二区| av电影一区| 91免费精品视频| 欧美a级网站| 亚洲日本一区二区三区在线不卡| 影音先锋日韩精品| 欧美色图另类小说| 美国十次了思思久久精品导航| 自拍视频第一页| 久久看人人爽人人| 国产极品国产极品| 色综合久久久久网| 国产av精国产传媒| 亚洲欧美精品suv| 午夜dj在线观看高清视频完整版| 秋霞成人午夜鲁丝一区二区三区| 伊人久久综合网另类网站| 国产一区在线观| 国产精品精品| 免费裸体美女网站| 高清不卡一区二区在线| 快灬快灬一下爽蜜桃在线观看| 亚洲电影一级黄| 国产精品久久久久久69| 亚洲欧洲高清在线| 美足av综合网| 91精品视频在线看| 精品精品99| 免费无码不卡视频在线观看| 国产麻豆精品在线| 潮喷失禁大喷水aⅴ无码| 欧美日韩中国免费专区在线看| www.超碰在线.com| 中文字幕日韩专区| 成人免费短视频| 国产亚洲欧美另类一区二区三区| 98精品视频| 亚洲av永久纯肉无码精品动漫| 亚洲成av在线| 欧美精品一区二区三区很污很色的| 欧美综合视频在线| 久久亚洲精品小早川怜子66| 午夜欧美巨大性欧美巨大| 成人看片视频| 四虎成人av| 人人干人人视频| 91在线观看污| 中文字幕第28页| 欧美一二三区在线| 免费高清完整在线观看| 国产精品pans私拍| 校花撩起jk露出白色内裤国产精品 | 1024av视频| 丰满亚洲少妇av| 欧美日韩免费做爰视频| 69堂成人精品免费视频| 中文字幕日本在线| 国产精品视频在线播放| 极品美女一区二区三区| 精品无码一区二区三区在线| 成人精品视频一区二区三区尤物| 国产这里有精品| 欧美一级高清大全免费观看| xvideos国产在线视频| 成人免费激情视频| 一区二区三区在线观看免费| 中文字幕日韩久久| 亚洲日穴在线视频| 超碰在线观看av| 欧美精品福利在线| 国产亚洲成av人片在线观黄桃| 青草视频在线观看视频| 国产精品小仙女| 青娱乐av在线| 欧美精品一区二区三区蜜桃| 日本а中文在线天堂| 久久香蕉综合色| 视频在线观看91| 麻豆一区在线观看| 在线播放日韩导航| 日韩免费影院| 国产亚洲情侣一区二区无| 亚洲二区免费| 中日韩精品一区二区三区| 91久久久免费一区二区| 免费在线视频欧美| 高清视频一区| 久久精品91| 亚洲毛片亚洲毛片亚洲毛片| 538在线一区二区精品国产| 色爱综合区网| 欧美13一14另类| 秋霞国产午夜精品免费视频| 成人欧美一区二区三区黑人一| 日韩欧美一区中文| 国模私拍一区二区国模曼安| 日韩电影免费观看在| 久久99精品国产.久久久久久| 国产三级国产精品国产国在线观看| 精品久久久久久久久久久久包黑料| 国产免费拔擦拔擦8x高清在线人| 日韩不卡av| 成人中文字幕合集| 国产成人自拍偷拍| 欧美极度另类性三渗透| 免费视频国产一区| 制服下的诱惑暮生| 色94色欧美sute亚洲线路一久| 国产美女在线观看| 欧美午夜免费| 国产成人在线视频网站| 黄色一级视频免费看| 欧美日韩成人黄色| 精品免费一区二区| 催眠调教后宫乱淫校园|