精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

新聞 人工智能
李飛飛帶領三位英偉達博士發表論文,通過魯棒性策略學習,對具有大分布偏移的未見視覺環境進行零樣本泛化,提出視覺策略新模型「SECANT」,實驗結果顯示,新模型在零樣本泛化方面超過SOTA。

  [[412771]]

沒錯!又是李飛飛!

上次報道李飛飛是因為她為學界爭取到了亞馬遜谷歌云數據中心。

而這次,她和研究團隊帶著一篇論文向我們走來!

走在隊伍前面的,是來自斯坦福大學的博士,李飛飛的門生!

(不好意思最近重溫了一下08奧運開幕式……)

先來看看李飛飛團隊這次在arXiv上發表了的論文題目:

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

SECANT:用于視覺策略零樣本泛化的自專家克隆

廢話少說,給大家介紹一下這篇論文的大致內容。

論文介紹

簡要介紹

強化學習中的泛化(generalization),是指通過不斷跟環境交互,產生出一種網絡的記憶性。

這個網絡能夠根據環境中特定的信號完成相應的動作,經過訓練的agent能夠記住在什么狀態下要做什么,還能通過識別狀態的細微差別來采取不同的動作。

再通俗一點,就是在未見過的測試數據上也能夠進行預測。

因此,提升模型的泛化是機器學習領域中的一個重要研究。

特別是視覺強化學習方面,泛化很容易被高維觀察空間中,一些無關痛癢的因素分散了注意力。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

機器學習中的泛化:欠擬合、擬合、過度擬合

針對這個問題,團隊通過魯棒性策略學習,對具有大分布偏移的未見視覺環境進行零樣本泛化。

因此,團隊提出「SECANT」模型,一種可以適應新測試環境的自專家克隆方法(Self Expert Cloning for Adaptation to Novel Test-environments)。

這個方法能夠在兩個階段利用圖像增廣,分離魯棒性表征和策略優化。

首先,專家策略通過弱增廣從頭開始進行強化學習的訓練。

而學生網絡就是通過強增廣的監督學習來模仿專家策略,其表征與專家策略相比,對視覺變化更具魯棒性。

實驗表明,SECANT在DMControl(Deepmind Control)、自動駕駛、機器人操作和室內物體導航這四個具有挑戰性的領域中,在零樣本泛化方面超過了之前的SOTA模型,分別實現了26.5%、337.8%、47.7%和15.8%的提升。

主要貢獻

  • 提出了SECANT模型,可以依次解決策略學習和魯棒性表征學習問題,從而實現了對未見過的視覺環境的強大零樣本泛化性能。
  • 在自動駕駛、機器人操作和室內物體導航四個領域中,設計并制定了一套多樣化的基準測試。除了DMControl外,其它3種環境都具有代表實際應用程序的測試時視覺外觀漂移。
  • 證明了SECANT在以上4個領域中,大多數任務都能達到SOTA。

SECANT框架

SECANT的主要目標是發展自我專家克隆技術,通過這種技術可以實現零樣本生成不一樣的視覺樣本。

作者研究的SECANT訓練模型可以分解為兩步,代碼已公開。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

專家策略

第一步,作者在原始環境中通過弱增廣訓練了一套高性能的專家策略。在視覺連續控制任務中,這套策略通過前饋深度卷積網絡進行參數化,然后將觀察到的圖像轉化為d維連續動作向量。

在實際應用中,作者采用了幀疊加技術,在時間信息維度上,連接T個連續圖像進行觀測。然后通過語義保持圖像變換來生成數據擴增的算子。采用隨機裁剪圖像的方法作為默認的弱增廣方法來訓練專家策略。

這套專家策略可以通過任何標準的RL算法進行優化。作者選擇了Soft Actor-Critic (SAC),因為它在連續控制任務中被廣泛采用。然后采用梯度下降法對專家參數進行優化,使專家參數最小化。

學生策略

在第二階段,作者訓練一個學生網絡來預測專家策略采取的最優行動,在同樣的觀察的條件下,通過劇烈變化的圖像來進行測試。在這個階段不需要進一步接觸獎勵信號。

從形式上來看,學生策略也是一個深度卷積神經網絡,但與專家策略不同的是它有著不同的架構。本質上來說,學生策略是根據DAgger模仿流程,從專家策略中延伸而來的。

作者使用專家策略來收集軌跡的初始數據集D。接下來,在每一次迭代中,選擇一個強擴增算子,并將其應用于采樣的一批觀測數據。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

作者通過將原有視覺元素進行插入色塊(Cc)、隨機卷積(Cv)、補充高斯噪聲(G)以及添線性混合(M)等方式來生成不同的視覺樣本。

作者還研究了以上的組合,并試圖發現從低頻和高頻結構噪聲中的隨機抽樣產生最佳的總體結果。作者注意到,在混合中添加隨機裁剪略微有利于性能的提升,可能是因為它改善了學生策略表征的空間不變性。

實驗內容

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

四種不同場景的視覺策略泛化基準測試(從上至下):DMControl Suite、CARLA、Robosuite和iGibson

首先,作者提出了一個適用于四種不同領域的基準測試,系統地評估視覺agent的泛化能力。

在每個領域中,團隊研究了在一個環境中訓練的算法,在零樣本設置中的各種未見環境中的表現如何。此時沒有獎勵信號和額外的試驗。

在每個任務中,SECANT以之前的SOTA算法為基準:SAC、SAC+crop、DR、NetRand、SAC+IDM和PAD。

DMControl

研究團隊依照前人的設置,使用來自DMControl的8個任務進行實驗。

測量泛化能力,隨機生成背景和機器人本身的顏色,將真實的視頻作為動態背景。

除了一項任務外,SECANT在所有任務中都顯著優于先前的SOTA,通常高出88.3%。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

所有方法都經過50萬步訓練,有密集的任務特定獎勵。

Robosuite:機器人操作模擬器

Robosuite是用于機器人研究的模塊化模擬器。

作者在4個具有挑戰性的單臂和雙手操作任務上對SECANT和先前方法進行了基準測試。

使用具有操作空間控制的Franka Panda機器人模型,并使用特定于任務的密集獎勵進行訓練。

所有agent都接收一個168×168以自我為中心的RGB視圖作為輸入。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

與之前SOTA相比,SECANT有337.8%的提升

實驗表明,與之前的最佳方法相比,SECANT在簡單設置中獲得的獎勵平均增加了287.5%,在困難設置中增加了374.3%,在極端設置中增加了351.6%。

CARLA:自動駕駛模擬器

為了進一步驗證SECANT對自然變化的泛化能力,作者在CARLA模擬器中構建了一個具有視覺觀察的真實駕駛場景。

測試目標是在1000個時間步長內沿著8字形高速公路(CARLA Town 4)行駛盡可能遠,不與行人或車輛發生碰撞。

agent在「晴朗的中午」情景接受訓練,并在中午和日落時對各種動態天氣和光照條件進行評估。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA
李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

例如,潮濕天氣的特點是道路具有高反射點。經過平均每個天氣超過10集和5次訓練運行,SECANT在測試中能夠比之前的SOTA行駛的距離增加47.7%。

iGibson:室內物體導航

iGibson是一個交互式模擬器,有高度逼真的3D房間和家具。

在這個模擬器中,實驗的目標是盡可能接近一盞燈。

獎勵函數激勵agent使燈在視野中所占的像素比例最大,當這個比例在連續10個步驟中超過5%時就算成功。

李飛飛團隊提出零樣本泛化的自專家克隆技術,性能超越SOTA

在本測試中,在未見過的房間里,SECANT的成功率比之前的方法高出15.8%。

作者簡介

[[412773]]

本文一作是李飛飛門下得意弟子Linxi Fan,他畢業于上海實驗中學,本科就讀于紐約哥倫比亞大學,目前在斯坦福大學攻讀博士,主修計算機視覺、強化學習以及機器人技術。在英偉達實習期間完成了本論文。

[[412774]]

本文二作黃德安同樣師從李飛飛,本科畢業于國立臺灣大學,獲得了卡內基梅隆大學碩士學位。目前在斯坦福大學計算機科學專業攻讀博士學位,在NVIDIA做泛化學習類研究。

[[412775]]

三作禹之鼎也是來自NVIDIA的科學家,獲得華南理工大學電機工程聯合班學士學位、香港科技大學電子工程學士學位,2017年在卡內基梅隆大學獲得了ECE博士學位。

2018年加入英偉達,現在是英偉達機器學習研究組的高級研究科學家。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-06 11:25:50

2012-07-25 09:37:22

虛擬化

2025-02-06 08:45:22

2022-06-13 11:57:04

谷歌模型計算

2024-02-07 12:13:19

AI數據

2025-04-21 08:26:00

模型強化學習AI

2024-06-25 09:35:04

模型訓練

2025-02-07 10:10:05

MusicMagus擴散模型音樂編輯

2025-10-14 13:56:59

AI3D模型

2023-05-19 13:49:17

神經網絡AI

2021-09-08 17:23:33

谷歌模型開發

2024-10-14 14:30:00

2025-02-08 11:12:34

ZAPS影像模型

2024-11-20 16:51:00

目標檢測模型

2023-02-24 10:22:15

2025-05-09 07:45:23

存儲系統數據安全

2024-09-12 08:00:00

2024-09-03 14:30:00

機器人模型

2025-02-06 14:28:16

2022-10-25 13:50:40

模型參數
點贊
收藏

51CTO技術棧公眾號

91精品国产综合久久香蕉的特点| 国产69精品一区二区亚洲孕妇| 亚洲高清久久网| 国产真人做爰毛片视频直播| 五月天激情开心网| 日韩成人一区二区| 欧美成人h版在线观看| 亚洲性图第一页| 成人av三级| 中文字幕亚洲一区二区va在线| 91最新国产视频| 国产午夜视频在线播放| 国内精品视频在线观看| 欧美日本一区二区在线观看| 国产精品igao激情视频| 五月婷婷免费视频| 免费成人性网站| 国内自拍欧美激情| 久久免费手机视频| 99热这里有精品| 婷婷中文字幕综合| 在线码字幕一区| 日本高清视频免费看| 天堂va蜜桃一区二区三区 | 四虎影视精品成人| 日韩精品电影在线| 国模gogo一区二区大胆私拍 | 国产夫妻自拍一区| 岛国在线大片| 粉嫩13p一区二区三区| 国产精品扒开腿做爽爽爽的视频| 激情五月少妇a| 经典一区二区| 欧美精品一区二区久久久| www.超碰com| 国产v日韩v欧美v| 亚洲欧洲精品一区二区精品久久久| 国内精品一区二区| 国产伦理吴梦梦伦理| 亚洲免费在线| 国模叶桐国产精品一区| 成人一级黄色大片| 精品99在线| 日韩成人av在线| 亚洲精品成人无码毛片| 91国内外精品自在线播放| 亚洲精品日韩一| 亚洲欧美日韩另类精品一区二区三区| 狠狠人妻久久久久久综合麻豆| 美美哒免费高清在线观看视频一区二区| 久久久噜久噜久久综合| 国产1区2区3区4区| 亚洲成av人电影| 中文字幕久久亚洲| 久久成人激情视频| 色婷婷av一区二区三区丝袜美腿 | 天堂av2024| 国产成人亚洲精品青草天美| 欧美综合在线第二页| 豆国产97在线 | 亚洲| 牛牛国产精品| 欧美美最猛性xxxxxx| 日韩在线不卡av| 午夜影院欧美| 久久国内精品一国内精品| 亚洲一区二区三区无码久久| 精品少妇一区| 亚洲国产精品yw在线观看| 日本wwwwwww| 永久免费精品视频| 精品福利av导航| 欧美做受高潮中文字幕| 国产精伦一区二区三区| 日韩你懂的电影在线观看| 99精品999| 精品国产亚洲一区二区三区在线| 91麻豆精品国产91久久久资源速度| 日本久久久久久久久久久久| av在线不卡精品| 精品污污网站免费看| 欧美视频免费播放| 日韩一级二级| 欧美日韩国产中文| 伊人免费视频二| 九九九九九九精品任你躁 | 国产精品久久久久久久久毛片| 久久国内精品自在自线400部| 国产精品夫妻激情| 在线免费观看高清视频| 九九**精品视频免费播放| 国产精品va在线播放| 一本久道久久综合无码中文| 国模少妇一区二区三区 | 亚洲系列另类av| 视频在线观看99| 久久免费精彩视频| 亚洲欧美日本日韩| 国产精品福利小视频| 91亚洲视频在线观看| 国产精品白丝jk黑袜喷水| 国产亚洲欧美一区二区| 国产资源在线看| 亚洲日本一区二区三区| 欧美不卡在线播放| 亚洲成av在线| 精品国产一区二区三区忘忧草| 国产精品无码网站| 国产尤物久久久| 久久综合电影一区| 国产成人综合欧美精品久久| 蜜臀av亚洲一区中文字幕| 91|九色|视频| 国产福利小视频在线观看| 亚洲女爱视频在线| 黄色国产精品视频| 久久久久久亚洲精品美女| 日韩激情在线视频| 日韩在线视频网址| 亚洲免费影视| 91香蕉视频在线下载| 日本在线视频1区| 亚洲乱码国产乱码精品精98午夜 | 欧美日韩网站| 国产精品福利网| 午夜成人鲁丝片午夜精品| 中文字幕巨乱亚洲| 黄色一级视频片| 精品视频一区二区三区在线观看 | 成人免费在线视频网址| 少妇激情av一区二区| 亚洲免费观看高清完整 | 亚洲综合电影一区二区三区| 成人亚洲激情网| 免费国产在线观看| 亚洲高清视频在线| 在线免费看v片| 精品视频亚洲| 欧美亚洲一区在线| 亚洲精品国产suv一区| 国产精品久久久久一区二区三区 | 欧美日韩亚洲在线| 成人在线视频亚洲| 精品视频1区2区3区| 日本黄色网址大全| 亚洲欧洲一区二区天堂久久| 亚洲综合中文字幕68页| www 日韩| 在线观看国产一区二区| 欧美高清性xxxx| 欧美视频在线观看| 96精品久久久久中文字幕| 国产精品99999| 一本久久精品一区二区| 三叶草欧洲码在线| 精品91在线| y111111国产精品久久婷婷| v天堂福利视频在线观看| 欧美三级蜜桃2在线观看| 亚洲精品国产一区黑色丝袜| 免费欧美日韩| 欧美久久在线| 欧美片第一页| 国产亚洲精品高潮| 波多野结衣视频在线观看| 久久久亚洲精品石原莉奈| 国产偷人视频免费| 偷拍一区二区| 国产91色在线|| 风间由美一区| 欧美性高清videossexo| 一道本在线观看| 日韩极品在线观看| 在线播放 亚洲| 狂野欧美xxxx韩国少妇| 久久6免费高清热精品| 精品国产无码一区二区| 亚洲一本大道在线| 捆绑裸体绳奴bdsm亚洲| 久久欧美肥婆一二区| 欧洲精品国产| 欧美啪啪网站| 欧美极品少妇xxxxⅹ裸体艺术| 天堂v在线观看| 一本到不卡免费一区二区| 丁香花五月婷婷| 激情综合亚洲精品| www.亚洲视频.com| 伊人久久大香线蕉| 91精品国产综合久久香蕉922| 黄色在线播放网站| 欧美xxxx在线观看| 少妇太紧太爽又黄又硬又爽| 国产欧美一区二区三区鸳鸯浴 | 日韩限制级电影在线观看| 国产污视频在线看| 国产女人18水真多18精品一级做| 中文字幕精品一区二区三区在线| 国产韩日影视精品| 国产伦精品一区二区三毛| 福利影院在线看| 宅男66日本亚洲欧美视频| 乱精品一区字幕二区| 欧洲人成人精品| 久草精品视频在线观看| 国产精品久久免费看| 亚洲av无码一区二区三区网址| 国模大尺度一区二区三区| 欧美精品成人网| 亚洲国产专区校园欧美| 一区二区日本伦理| 自拍欧美一区| 国产精品久久亚洲7777| 亚洲精品一区二区在线播放∴| 欧美中文在线观看国产| 麻豆av在线播放| 久热精品在线视频| h视频在线免费| 亚洲三级 欧美三级| 亚洲精品一区二区三区新线路 | 久久五月天小说| 欧美国产一区二区在线| 国产 日韩 欧美 综合 一区| 成人自拍性视频| 精品三区视频| 国产精品av网站| 日韩深夜视频| 国外成人性视频| 免费在线观看av电影| 成人97在线观看视频| 亚乱亚乱亚洲乱妇| 亚洲香蕉成人av网站在线观看| 视频三区在线观看| 亚洲精品福利视频| 亚洲春色在线视频| 国内精品视频一区二区三区| 日韩精选在线| 国产精品一区二区av| 日本亚州欧洲精品不卡| 91在线免费观看网站| 久久精品97| 国产精品中文字幕在线观看| 欧美日韩精品免费观看视欧美高清免费大片 | 国产精品自产拍在线观看| 中文.日本.精品| 国产精品小说在线| 狠狠久久伊人中文字幕| 国产精品第3页| 成人四虎影院| 国产欧美日韩免费| 在线播放成人| 91日本在线视频| 狂野欧美xxxx韩国少妇| 99热国产免费| 国产精品超碰| 韩国成人动漫在线观看| 私拍精品福利视频在线一区| 欧美 日韩 国产在线| 国产精品免费不| 午夜精品一区二区三区在线观看| 久久裸体网站| 国产精品自拍合集| 中国女人久久久| 日本黄网站免费| 久久精品国产秦先生| 午夜福利123| 成人精品视频一区| www.久久国产| 中文字幕中文字幕一区二区| 日韩福利小视频| 午夜国产精品一区| 国产精品xxxxxx| 4438x亚洲最大成人网| 国内精品久久久久久久久久 | 草草影院在线观看| 久久综合电影一区| 天堂8中文在线最新版在线| 国产精品美女视频网站| 美女日韩一区| 久久偷窥视频| 香蕉国产精品| 久久久久久久午夜| 九色综合狠狠综合久久| 国产精品麻豆入口| 中文字幕一区日韩精品欧美| 国产亚洲精品av| 欧美在线影院一区二区| va婷婷在线免费观看| 日韩美女av在线| 成人免费在线| 国产成人高潮免费观看精品| 国产日韩在线观看视频| 欧美影视一区二区| 午夜日韩福利| 91香蕉视频导航| 福利一区二区在线观看| 欧美性受xxxx黑人| 亚洲高清中文字幕| 国产精品免费无遮挡| 亚洲精品国产综合久久| gogo在线观看| 国产精品久久久久久中文字| 国产精品tv| 熟妇熟女乱妇乱女网站| 美女爽到呻吟久久久久| 下面一进一出好爽视频| 国产欧美在线观看一区| 午夜影院在线看| 欧美绝品在线观看成人午夜影视| 天天射天天操天天干| 欧美老少配视频| 欧美成人高清视频在线观看| 久久综合狠狠综合久久综青草| 欧美成人午夜| 911福利视频| 国产精品少妇自拍| 9i看片成人免费看片| 欧美成人官网二区| 超碰个人在线| 国产在线观看一区二区三区| 最新亚洲精品| 2022亚洲天堂| av成人动漫在线观看| 男人操女人的视频网站| 欧美日韩精品二区第二页| 蜜桃视频在线免费| 欧美一区二区色| 人妖一区二区三区| 国产精品久久久久久久乖乖| 国产精品自拍一区| 亚洲天堂一级片| 欧美一区二区三区系列电影| 日韩精品毛片| 国产精品视频久久久| 欧美美女在线观看| 999精品网站| 国产亚洲欧美在线| 在线视频一区二区三区四区| 亚洲黄色在线看| a级大胆欧美人体大胆666| 99久久自偷自偷国产精品不卡| 91精品91| 美女流白浆视频| 亚洲国产一区二区三区青草影视| www.日韩在线观看| 欧美精品18videosex性欧美| 97久久综合区小说区图片区| 黄色激情在线视频| 99在线热播精品免费| 日韩黄色a级片| 日韩精品在线私人| 色婷婷综合久久久中字幕精品久久| 欧美日韩无遮挡| 麻豆成人久久精品二区三区小说| 后入内射无码人妻一区| 91精品麻豆日日躁夜夜躁| 伊人手机在线| 国产综合第一页| 免费视频一区| 国产主播av在线| 欧美一级一区二区| 2020国产在线| 四虎一区二区| 国产剧情一区在线| 日韩三级一区二区三区| 亚洲男人天堂2023| 日本一区二区中文字幕| 大地资源网在线观看免费官网| 成人激情免费网站| 国产性生活视频| 久久亚洲精品一区二区| 国产厕拍一区| 日本美女高潮视频| 亚洲女与黑人做爰| 色视频精品视频在线观看| 国产精品男人的天堂| 很黄很黄激情成人| 国产sm调教视频| 日韩欧美色综合网站| 丝袜老师在线| 男女爱爱视频网站| av欧美精品.com| 在线免费观看一级片| 久久久免费观看视频| 欧美亚洲国产激情| 精品国产aⅴ一区二区三区东京热| 高潮白浆女日韩av免费看| 亚洲天天影视| 精品一区久久| 极品美女销魂一区二区三区免费| 日本亚洲欧美在线| 久久精品成人欧美大片古装| 美女视频免费精品| 国产一级爱c视频| k8久久久一区二区三区| 中文字幕一区二区三区四区视频| 裸体女人亚洲精品一区| 国产99亚洲| 色婷婷狠狠18禁久久| 欧美天堂一区二区三区| 97蜜桃久久|