精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

率先解決多類數據同時受損,中科大MIRA團隊TRACER入選NeurIPS 2024:強魯棒性的離線變分貝葉斯強化學習

人工智能 新聞
近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據集存在多類數據損壞這一復雜的實際問題,提出了一種魯棒的變分貝葉斯推斷方法,有效地提升了智能決策模型的魯棒性,為機器人控制、自動駕駛等領域的魯棒學習奠定了重要基礎。

本論文作者楊睿是中國科學技術大學 2019 級碩博連讀生,師從王杰教授、李斌教授,主要研究方向為強化學習、自動駕駛等。他曾以第一作者在 NeurIPS、KDD 等頂級期刊與會議上發表論文兩篇,曾獲滴滴精英實習生(16/1000+)。

近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據集存在多類數據損壞這一復雜的實際問題,提出了一種魯棒的變分貝葉斯推斷方法,有效地提升了智能決策模型的魯棒性,為機器人控制、自動駕駛等領域的魯棒學習奠定了重要基礎。論文發表在 CCF-A 類人工智能頂級會議 Neural Information Processing Systems(NeurIPS 2024)。

圖片

  • 論文地址:https://arxiv.org/abs/2411.00465
  • 代碼地址:https://github.com/MIRALab-USTC/RL-TRACER

引言

在機器人控制領域,離線強化學習正逐漸成為提升智能體決策和控制能力的關鍵技術。然而,在實際應用中,離線數據集常常由于傳感器故障、惡意攻擊等原因而遭受不同程度的損壞。這些損壞可能表現為隨機噪聲、對抗攻擊或其他形式的數據擾動,影響數據集中的狀態、動作、獎勵和轉移動態等關鍵元素。經典離線強化學習算法往往假設數據集是干凈、完好無損的,因此在面對數據損壞時,機器學習到的策略通常趨向于損壞數據中的策略,進而導致機器在干凈環境下的部署時性能顯著下降。

盡管研究者在魯棒離線強化學習領域已經取得了一些進展,如一些方法嘗試通過增強測試期間的魯棒性來緩解噪聲或對抗攻擊的影響,但它們大多在干凈數據集上訓練智能體模型,以防御測試環境中可能出現的噪聲和攻擊,缺乏對訓練用離線數據集存在損壞的應對方案。而針對離線數據損壞的魯棒強化學習方法則只關注某一特定類別的數據存在損壞,如狀態數據、或轉移動態數據存在部分損壞,他們無法有效應對數據集中多個元素同時受損的復雜情況。

為了針對性地解決這些現有算法的局限性,我們提出了一種魯棒的變分貝葉斯推斷方法(TRACER),有效地增強了離線強化學習算法在面臨各類數據損壞時的魯棒性。TRACER 的優勢如下所示:

1. 據我們所知,TRACER 首次將貝葉斯推斷引入到抗損壞的離線強化學習中。通過將所有離線數據作為觀測值,TRACER 捕捉了由各類損壞數據所導致的動作價值函數中的不確定性。

2. 通過引入基于熵的不確定性度量,TRACER 能夠區分損壞數據和干凈數據,從而調控并減弱損壞數據對智能體模型訓練的影響,以增強魯棒性。

3. 我們在機器人控制(MuJoCo)和自動駕駛(CARLA)仿真環境中進行了系統性地測試,驗證了 TRACER 在各類離線數據損壞、單類離線數據損壞的場景中均顯著提升了智能體的魯棒性,超出了多個現有的 SOTA 方法。

1. 方法介紹

1.1 動機

考慮到(1)多種類型的損毀會向數據集的所有元素引入較高的不確定性,(2)每個元素與累積獎勵(即動作值、Q 值)之間存在明確的相關性關系(見圖 1 中的虛線),因此使用多種受損數據估計累積獎勵函數(即動作值函數)會引入很高的不確定性。

圖片

圖 1. 決策過程的概率圖模型。實線連接的節點表示數據集中的數據,而虛線連接的 Q 值(即動作值、累積回報)不屬于數據集。

為了處理這類由多種數據損毀(即狀態、動作、獎勵、狀態轉移數據受損)導致的高不確定性問題,基于圖 2 所示的概率圖模型,我們提出利用數據集中的所有元素作為觀測數據。我們旨在利用這些觀測數據與累積獎勵之間的高度相關性,來準確地識別動作值函數的不確定性。

1.2 基于受損數據的貝葉斯推斷

我們提出使用離線數據集的所有元素作為觀測值,利用數據之間的相關性同時解決不確定性問題。具體地,基于離線數據集中動作價值與四個元素(即狀態、動作、獎勵、下一狀態)之間的關系,我們分別使用各個元素作為觀測數據,通過引入變分貝葉斯推理框架,我們最大化動作值函數的后驗分布,從而推導出各個元素對應的基于最大化證據下界 (ELBO) 的損失函數。基于對動作價值函數的后驗分布的擬合,我們能有效地將數據損壞建模為動作值函數中的不確定性。

1.3 基于熵的不確定性度量

為了進一步應對各類數據損壞帶來的挑戰,我們思考如何利用不確定性進一步增強魯棒性。鑒于我們的目標是提高在干凈環境中的智能體性能,我們提出減少損壞數據的影響,重點是使用干凈數據來訓練智能體。因此,我們提供了一個兩步計劃:(1)區分損壞數據和干凈數據;(2)調控與損壞數據相關的損失,減少其影響,從而提升在干凈環境中的表現。

對于(1),由于損壞數據通常會造成比干凈數據更高的不確定性和動作價值分布熵,因此我們提出通過估計動作值分布的熵,來量化損壞數據和干凈數據引入的不確定性。

對于 (2),我們使用分布熵指數的倒數來加權我們提出的 ELBO 損失函數。因此,在學習過程中,TRACER 能夠通過調控與損壞數據相關的損失來減弱其影響,并同時專注于最小化與干凈數據相關的損失,以增強在干凈環境中的魯棒性和性能。

1.4 算法架構

圖片

圖 2. TRACER 算法框架圖。

2. 實驗介紹

為了模擬數據受損的情形,我們對數據集的部分數據加入隨機噪聲或對抗攻擊來構建損壞數據。在我們的實驗中,我們對 30% 的單類數據進行損壞。因此,在所有類型的數據都有損壞時,整個離線數據集中,損壞數據占約圖片的規模。

各類數據均受損

所有類型數據元素均存在損壞的部分實驗結果見表 1,TRACER 在所有控制環境中均獲得了較為明顯的性能提升,提升幅度達 + 21.1%,這一結果展現了 TRACER 對大規模、各類數據損壞的強魯棒性。

圖片

表 1. 離線數據集的所有類型元素均存在隨機損壞(random)或對抗損壞(advers)時,我們的方法 TRACER 在所有環境中都獲得了最高的平均得分。

單類數據受損

單種類型數據元素存在損壞的部分實驗結果見表 2 和表 3。在單類數據損壞中,TRACER 于 24 個實驗設置里實現 16 組最優性能,可見 TRACER 面向小規模、單類數據損壞的問題也能有效地增強魯棒性。

圖片

表 2. 單類元素存在隨機損壞時,我們的方法 TRACER 在 8 個實驗設置中獲得了最高的平均得分。

圖片

表 3. 單類元素存在對抗損壞時,我們的方法 TRACER 在 8 個實驗設置中獲得了最高的平均得分。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-21 10:35:00

2025-04-01 09:32:00

模型訓練AI

2025-03-14 10:22:03

2021-05-07 09:34:20

量子芯片計算機

2025-10-27 09:15:00

2023-12-18 15:16:47

數據模型

2020-04-15 16:44:38

谷歌強化學習算法

2024-12-09 10:15:00

AI技術

2022-10-31 14:06:32

量子研究

2022-02-25 23:49:31

量子研究

2022-02-23 09:27:37

神經網絡人工智能模型

2024-11-11 17:27:26

2012-04-18 10:40:33

超級計算機大學生超算大賽

2013-06-19 11:32:32

計算性能ISCHPC

2024-06-17 07:10:00

2023-12-04 13:23:00

數據訓練

2024-11-04 13:30:00

模型AI

2024-04-07 09:00:00

數據模型

2020-05-06 16:07:05

百度飛槳
點贊
收藏

51CTO技術棧公眾號

国产视频在线播放| 国产精品51麻豆cm传媒| 日韩动漫一区| 日本久久精品电影| 天堂av免费看| 亚洲av激情无码专区在线播放| 老牛嫩草一区二区三区日本| 日韩亚洲第一页| aaa黄色大片| 国产综合av| 亚洲一区二区三区四区不卡| 日韩欧美一区二区三区四区五区 | 黄色亚洲免费| 国产一区二区三区直播精品电影| 亚洲第一区第二区第三区| 超碰资源在线| 亚洲欧洲日韩一区二区三区| 精品欧美一区二区久久久伦| 91麻豆视频在线观看| 亚洲经典自拍| 久久精品视频播放| 制服 丝袜 综合 日韩 欧美| 色播一区二区| 欧美三级日韩三级国产三级| 无码人妻精品一区二区三区在线| 91麻豆免费在线视频| 国产欧美精品日韩区二区麻豆天美| 97超级碰碰| 91亚洲精品国偷拍自产在线观看 | jvid福利在线一区二区| 欧美精品一区二区蜜臀亚洲| 狠狠干狠狠操视频| 全球最大av网站久久| 五月天亚洲精品| 免费看日b视频| 日本美女在线中文版| 久久天堂av综合合色蜜桃网| 国产一区二区免费在线观看| 精品人妻无码一区二区色欲产成人 | 久久99国产精品久久久久久久久| 亚洲欧美日韩第一页| 一本色道久久综合亚洲精品酒店| 精品国产区一区| 欧美性猛交乱大交| 亚洲一区二区三区久久久| 在线视频一区二区免费| 91免费视频网站在线观看| 超级碰碰不卡在线视频| 亚洲综合视频在线观看| 国产又粗又长又爽视频| 超碰在线caoporen| 亚洲免费伊人电影| 成人污网站在线观看| 激情视频在线观看| 亚洲三级免费电影| 免费观看黄色大片| 国产三区在线观看| 亚洲欧美另类图片小说| 中文字幕精品在线播放| 91国内在线| 亚洲国产日日夜夜| 六月婷婷在线视频| 色多多在线观看| 色婷婷综合在线| 国产成人av影视| 成人网ww555视频免费看| 91国偷自产一区二区开放时间| 老头吃奶性行交视频| 色香欲www7777综合网| 91高清视频在线| 国产91色在线观看| 高清精品久久| 精品欧美久久久| 亚洲精品乱码久久| 欧美久久综合网| 色阁综合伊人av| 日韩三级在线观看视频| 欧美特黄一区| 18性欧美xxxⅹ性满足| 亚洲色成人www永久网站| 蜜芽一区二区三区| 亚洲va国产va天堂va久久| 懂色av一区二区三区四区| 91丝袜美腿高跟国产极品老师| 欧美激情专区| 老司机福利在线视频| 一区二区三区免费看视频| 乱人伦xxxx国语对白| 亚洲成人不卡| 日韩一区二区免费电影| 中文字幕一区二区三区人妻| 日韩大片在线播放| 欧美激情18p| 最近免费中文字幕大全免费版视频| 美腿丝袜一区二区三区| 国产高清不卡av| 九色视频成人自拍| 中文字幕中文乱码欧美一区二区| 亚洲国产精品无码观看久久| 91精品韩国| 欧美成人精品二区三区99精品| 熟妇高潮精品一区二区三区| 99热在线成人| 26uuu另类亚洲欧美日本一| 亚洲图片在线播放| 国产伦理精品不卡| 青青草久久网络| 亚洲淫性视频| 精品污污网站免费看| 男人的天堂影院| 我不卡伦不卡影院| 国产精品av网站| 成人免费公开视频| 亚洲天堂成人在线观看| 国产第一页视频| 福利片在线一区二区| 色悠悠久久久久| www五月天com| 99精品久久只有精品| 国风产精品一区二区| 高潮毛片又色又爽免费| 欧美自拍第一页| 国产视频一区二区在线观看| 国产精品一线二线三线| 国产高清视频一区二区| 亚洲视频免费一区| 久久露脸国语精品国产91| 国产一区美女在线| 亚洲激情啪啪| 二吊插入一穴一区二区| 亚洲精品久久久久久久久久久久| 国产盗摄一区二区三区在线| 美女精品一区二区| 日韩av电影在线观看| 中文字幕在线看片| 亚洲护士老师的毛茸茸最新章节| 三级影片在线看| av一区二区高清| 国产91在线高潮白浆在线观看 | 国产综合久久久久影院| 午夜午夜精品一区二区三区文| 超碰一区二区| 亚洲精品色婷婷福利天堂| 日韩美女视频网站| 成人av午夜电影| 成人在线播放网址| 成人搞黄视频| 久久久免费在线观看| 亚洲精品国产精品国| 亚洲乱码中文字幕| 国产成人精品综合久久久久99| 国产精品99久久精品| 国产日韩欧美影视| 精品美女在线观看视频在线观看| 欧美久久久久久久久久| 麻豆一区在线观看| 国产综合一区二区| 一道本在线观看视频| 九九99久久精品在免费线bt| 久久视频中文字幕| av免费观看网址| 亚洲综合男人的天堂| 可以看的av网址| 国产在线欧美| 国产伦精品一区二区三区照片| av成人 com a| 日韩精品中文字幕久久臀| 69视频免费在线观看| 国产欧美精品在线观看| 成人综合久久网| 国产精品videossex久久发布| 国产精品麻豆免费版| 午夜影院在线播放| 亚洲图片欧美日产| 国产尤物在线观看| 亚洲一区二区三区四区五区中文 | 国产精品美女久久久久久2018| 中文字幕国内自拍| 亚洲午夜精品一区 二区 三区| 高清不卡一区二区三区| 性感女国产在线| 中文字幕在线看视频国产欧美在线看完整| 92久久精品一区二区| 亚洲国产一区二区在线播放| 国产熟妇搡bbbb搡bbbb| 精品亚洲成a人在线观看| 污污污污污污www网站免费| 亚洲97av| 91在线高清视频| 日韩伦理在线一区| 日韩中文在线中文网在线观看| 亚洲成人一级片| 一本色道久久综合亚洲91| 来吧亚洲综合网| 99久久久久久99| 9l视频白拍9色9l视频| 伊人精品在线| 亚洲国产精品一区在线观看不卡| 亚洲成人偷拍| 国产精品久久久久久久久男| xxxx视频在线| 综合136福利视频在线| 亚洲卡一卡二卡三| 精品视频一区三区九区| 国产一级在线播放| 在线观看免费高清视频| 91在线观看视频| 亚洲色图欧美自拍| 天堂影院一区二区| 东北少妇不带套对白| 日韩aaaa| 裸体丰满少妇做受久久99精品| 精品视频91| 国产精品久久av| 麻豆mv在线观看| 久久综合伊人77777尤物| 韩国中文字幕2020精品| 精品国产一区二区三区不卡| 一区二区三区亚洲视频| 色综合天天性综合| 日本中文字幕网| 亚洲欧美国产毛片在线| 国产一二三四视频| 91视频一区二区三区| 欧美激情一区二区三区p站| 久久国产综合精品| 福利在线一区二区三区| 免费亚洲网站| 男女激情无遮挡| 欧美黄色一区二区| 欧美三级午夜理伦三级老人| 欧洲杯什么时候开赛| 久久国产精品99久久久久久丝袜| 天堂精品在线视频| 91日本在线观看| 亚洲黑人在线| 成人激情视频网| 国产成人免费| 国产精品美女久久| 欧美一级二级视频| 国产精品扒开腿做| 成人va天堂| 国产福利精品视频| 偷拍中文亚洲欧美动漫| 日本久久中文字幕| 国产日韩另类视频一区| 大奶在线精品| 国产成人一区二| 日本综合字幕| 国产精品高潮呻吟视频| 欧洲av一区二区| 国产精品欧美日韩一区二区| 99久久婷婷国产综合精品首页| 日产日韩在线亚洲欧美| 精品免费av一区二区三区| 国产精品美女在线观看| 成人免费视频观看| 国产日韩欧美日韩大片| 国产一精品一av一免费爽爽| 亚洲va欧美va国产综合久久| 久久一级大片| 国产伦精品一区二区三区免费视频 | 欧美一级淫片aaaaaaa视频| av免费网站在线观看| 欧美另类xxx| 国产桃色电影在线播放| 91av免费观看91av精品在线| 免费亚洲电影| 国产精品亚洲欧美导航| 免费看日产一区二区三区| 国产精品亚洲综合| 综合综合综合综合综合网| 婷婷四月色综合| 中文精品电影| 日本一道本久久| 日产国产欧美视频一区精品| 天天久久综合网| 成人av免费网站| 亚洲精品国产精品国自产网站| 国产精品电影一区二区三区| 劲爆欧美第一页| 欧美视频二区36p| 亚洲最大成人av| 精品区一区二区| 粉嫩av在线播放| 欧美日韩第一视频| 日韩欧美另类一区二区| 成人在线视频网站| 青青操综合网| 中文字幕中文字幕在线中一区高清 | 青青草成人av| 欧美精品一卡二卡| 天天干天天干天天干| 色黄久久久久久| 看黄在线观看| 亚洲va久久久噜噜噜久久天堂| 亚洲免费成人av在线| 裸体裸乳免费看| 老牛国产精品一区的观看方式| 亚洲欧洲国产视频| 国产午夜精品久久久久久免费视 | 欧美1区视频| 国模无码视频一区二区三区| 精品中文字幕一区二区| 欧美色图亚洲激情| 一区二区三区小说| 又污又黄的网站| 亚洲精品影视在线观看| 2024短剧网剧在线观看| 国产精品久久久久久久app| 粉嫩的18在线观看极品精品| 中文字幕综合在线观看| 日韩精品亚洲专区| 极品白嫩丰满美女无套| 一区二区三区在线观看国产| 中文区中文字幕免费看| 亚洲精品成人久久| 日韩另类在线| 国产欧美日韩91| 欧洲福利电影| 成人av一级片| 不卡的电视剧免费网站有什么| 永久免费看片直接| 欧美亚洲综合久久| 欧美美女色图| 91爱视频在线| 国产精品成人自拍| 日本免费a视频| 国产精品一区二区久激情瑜伽| 貂蝉被到爽流白浆在线观看| 一本大道久久a久久综合婷婷| 日本免费不卡视频| 精品自拍视频在线观看| 国模大尺度视频一区二区| 亚洲二区三区四区| 日韩av二区在线播放| jizz中文字幕| 在线观看亚洲成人| 加勒比一区二区三区在线| 91av网站在线播放| 私拍精品福利视频在线一区| www.国产在线播放| www.亚洲免费av| 久久久精品免费看| 亚洲男人天堂九九视频| 成人免费网站视频| 日本在线视频一区| 日韩在线观看一区二区| 卡一卡二卡三在线观看| 欧美视频在线播放| 麻豆视频在线| 亚洲一区二区三区在线视频 | 男人操女人免费软件| 91视频www| 不卡av电影在线| 97视频一区| 中文字幕中文字幕99| 精品一区二区三区在线播放| 黑鬼狂亚洲人videos| 日韩一区二区三区三四区视频在线观看 | 在线观看视频中文字幕| 中文字幕在线观看亚洲| 精品一区二区三区四区五区| 日韩在线视频在线| 成人激情小说乱人伦| 国产视频91在线| 亚洲视频电影图片偷拍一区| 精品176极品一区| 小泽玛利亚av在线| 99re热这里只有精品免费视频| 三级网站在线播放| 久久久精品免费| 加勒比视频一区| 免费在线观看污污视频| 国产激情一区二区三区四区| 精品亚洲永久免费| 亚洲人a成www在线影院| 日韩城人网站| 成年人网站国产| 国产目拍亚洲精品99久久精品| 国产精品久久久久久久久毛片 | 亚洲视频在线观看网站| 欧美视频在线视频精品| 成人在线国产视频| 国产欧美日韩卡一| www.五月天激情| 日韩av免费在线观看| 亚洲国产精品久久久天堂| 日本黄色免费观看| 欧美性猛交一区二区三区精品| 亚洲小说区图片| 欧美激情国产日韩| 国产成人在线视频免费播放| 秋霞av一区二区三区| 久久高清视频免费| 亚洲欧美日本伦理| 2018国产精品| 欧美性猛交xxxxxxxx| 9999精品成人免费毛片在线看| 亚洲五月六月|