精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

讓大模型自主探索開放世界,北大&智源提出訓練框架LLaMA-Rider

人工智能 新聞
北京大學和北京智源人工智能研究院的團隊針對這個問題提出了 LLaMA-Rider,該方法賦予了大模型在開放世界中探索任務、收集數據、學習策略的能力,助力智能體在《我的世界》(Minecraft)中自主探索獲取知識并學習解決各種任務,提升智能體自主能力和通用性。

大語言模型因其強大而通用的語言生成、理解能力,展現出了成為通用智能體的潛力。與此同時,在開放式的環境中探索、學習則是通用智能體的重要能力之一。因此,大語言模型如何適配開放世界是一個重要的研究問題。

北京大學和北京智源人工智能研究院的團隊針對這個問題提出了 LLaMA-Rider,該方法賦予了大模型在開放世界中探索任務、收集數據、學習策略的能力,助力智能體在《我的世界》(Minecraft)中自主探索獲取知識并學習解決各種任務,提升智能體自主能力和通用性。

圖片

自主探索開放世界

圖片

  • 論文鏈接:https://arxiv.org/abs/2310.08922
  • 代碼鏈接:https://github.com/PKU-RL/LLaMA-Rider

1、環境反饋驅動的探索與學習

LLaMA-Rider 著眼于讓大語言模型 (LLM) 適應環境從而提高在環境中解決多任務的能力。LLM 在預訓練階段獲得的知識與實際環境很可能存在不一致,這常常導致決策錯誤。為了解決這個問題,現有的方法有些利用提示工程,通過和 LLM 頻繁交互讓其獲取環境信息,不過并不更新 LLM;有些使用強化學習在線微調 LLM,不過其計算代價高且難以擴展到多任務和復雜任務。

LLaMA-Rider 對此提出了新的思路。它首先利用環境的反饋信息,靠 LLM 自身的能力在環境中探索,收集成功經驗。之后,LLaMA-Rider 將經驗整合成監督數據集進行學習,更新自身的知識。這樣一個兩階段的訓練框架讓 LLaMA-Rider 能夠在 Minecraft 環境中的 30 個任務上取得超過 ChatGPT 任務規劃器的平均表現,并展現出對新任務的泛化能力。

圖片

在探索階段,LLaMA-Rider 利用反饋 - 修改機制來進行主動探索。在每個時間步上,LLaMA-Rider 接收文本化的環境信息和任務信息,并給出下一步的決策。由于與環境的知識差距,該決策可能無法在環境中執行并觸發環境的反饋信息,而該反饋信息會再次輸入給 LLaMA-Rider,引導其修改決策。憑借 LLM 自身的上下文理解能力和環境反饋信息,LLaMA-Rider 可高效探索開放世界。

為了將 LLM 的文本輸出匹配到環境的動作空間,LLaMA-Rider 使用了一組預訓練的技能作為技能庫,并使用技能檢索模塊將 LLM 的輸出文本和技能庫中的技能描述進行匹配,檢索最接近的技能。由于技能描述和環境中的動作相比具有更多的語義,這種方式可以更大程度利用 LLM 的能力。

此外,LLaMA-Rider 使用了子任務重標記的方法,在探索過程中用當前正在完成的子任務信息替換輸入中的原始任務信息,讓 LLM 在探索過程中能關注當下的子目標,提高任務成功率。

圖片

在學習階段,探索時收集到的經驗將會整合成監督數據集,用以對 LLM 進行監督微調 (SFT)。數據集中同樣采用子任務重標記的方法讓 LLaMA-Rider 學習到任務之間的子任務組合性,提高策略的泛化能力。

2、實驗效果

LLaMA-Rider 使用的大語言模型為近期推出的 LLaMA-2-70B-chat。在 Minecraft 的三類共 30 個任務中,LLaMA-Rider 的表現超過了基于 ChatGPT 的任務規劃器,并且經過學習后的 LLaMA-Rider 所能完成的任務數量也超過了它在探索階段能成功的數量,展現出 LLaMA-Rider 對于開放世界中持續學習和多任務解決的能力。

與強化學習 (RL) 方法相比,LLaMA-Rider 則展現出了高采樣效率和低訓練代價的優勢。即使在難度較簡單、完成步數較短的木材相關任務上,RL 方法也難以取得訓練成效,表明強化學習的訓練方法難以擴展到大動作空間以及復雜的場景中。而 LLaMA-Rider 在探索階段只采用了 5-10 次的任務探索便完成數據收集,在學習階段也只在包含 1.3k 樣本量的數據集上進行訓練就取得了效果提升。

圖片

作者進而發現,在對上述的 30 個任務進行探索學習后,LLaMA-Rider 在測試時對于學習過程中未探索過的更困難的鐵礦相關任務,也能取得效果的提升。這進一步體現了 LLaMA-Rider 學習到的決策能力的泛化性。

圖片

在消融實驗中,作者利用包含更多子任務的石頭相關任務,驗證了子任務重標記的方法對于任務成功率和任務泛化能力的關鍵作用。

圖片

除此之外,盡管 LLaMA-Rider 只學習了任務決策相關的數據,當作者使用任務相關的問題進行提問時,LLaMA-Rider 也給出了更準確的回答,表明它在訓練過程中同樣學習到了環境知識,證明 LLaMA-Rider 起到了與環境知識對齊的作用。

圖片

3、總結

作者提出了 LLaMA-Rider 的大語言模型訓練框架,讓大語言模型根據環境反饋結合自身能力自主探索開放世界,并根據收集到的經驗完成高效學習,在 Minecraft 環境中取得了比包括 ChatGPT 任務規劃器在內的其他方法更好的解決多任務的能力,讓大語言模型獲得了對開放世界的適應性。此外,LLaMA-Rider 能利用過去任務的經驗解決新任務的泛化能力表明了該方法應用于大模型終身探索學習的前景。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-08-07 13:00:00

2023-09-12 13:43:00

智能技術

2023-09-15 13:08:56

AI訓練

2025-10-22 08:52:23

2025-06-06 14:30:52

2024-07-19 12:48:29

2025-05-19 14:57:44

架構模型AI

2024-09-12 12:46:36

2025-01-20 07:58:51

2025-01-24 08:53:46

2023-11-29 14:00:00

AI數據

2025-10-16 08:56:00

模型AI技術

2023-05-12 17:31:43

模型AI

2023-10-27 07:46:28

2023-09-05 10:21:03

人工智能

2025-09-23 12:48:36

AGI模型框架

2025-10-10 07:48:12

大模型預訓練初始化

2024-06-19 11:45:34

2025-02-12 13:34:40

點贊
收藏

51CTO技術棧公眾號

色欧美片视频在线观看在线视频| 国产综合久久久久久鬼色 | 久久精品高清| 日韩精品中文字幕在线不卡尤物 | 人人狠狠综合久久亚洲| 久久九九精品99国产精品| 五月天丁香社区| 巨胸喷奶水www久久久免费动漫| 亚洲欧洲另类国产综合| 蜜桃视频在线观看91| 91成人国产综合久久精品| 一本一本久久| 久久天天躁夜夜躁狠狠躁2022| 屁屁影院国产第一页| 亚洲欧洲日韩精品在线| 精品女同一区二区三区在线播放| 一区二区三区一级片| 猫咪在线永久网站| 国产成人福利片| 成人免费福利在线| 免费的毛片视频| 国产专区一区| 久久影院免费观看| 国产精品久久免费观看| 国产成人高清精品免费5388| 欧美精品日韩一区| av无码精品一区二区三区| freexxx性亚洲精品| 亚洲猫色日本管| 免费日韩av电影| 色婷婷av一区二区三| 国产精品77777| 91色中文字幕| 曰批又黄又爽免费视频| 日韩精品亚洲一区| 日本成熟性欧美| 国产午夜免费福利| 亚洲国产一区二区三区高清| 欧美精品激情在线| 一区二区视频免费看| 国产精品成久久久久| 在线观看国产精品91| 精品无码国产污污污免费网站| 久久午夜影院| 亚洲高清在线观看| 在线免费看黄色片| 精品亚洲免a| 亚洲精品久久久久久久久久久久久| 一区二区在线免费观看视频| 免费观看亚洲视频大全| 欧美一区二区啪啪| 丰满人妻一区二区三区53视频| 青青久久精品| 91精品国产麻豆国产自产在线| 五月婷婷之婷婷| 欧美成a人片免费观看久久五月天| 欧美私人免费视频| 午夜剧场高清版免费观看| 免费一区二区三区四区| 欧美裸体一区二区三区| 亚洲精品mv在线观看| www.成人| 精品久久久久久久久久久久久久久久久| 韩国三级在线播放| 精品女人视频| 亚洲精品自拍第一页| 大又大又粗又硬又爽少妇毛片| av伊人久久| 精品国内亚洲在观看18黄| 男人的天堂久久久| 国自产拍偷拍福利精品免费一| 91精品国产777在线观看| 国产伦精品一区二区三区视频网站| 久久综合影音| 91久久国产精品91久久性色| 好吊视频一二三区| 26uuu亚洲综合色欧美| 日韩成人av网站| 美女写真理伦片在线看| 亚洲一卡二卡三卡四卡无卡久久| 久色视频在线播放| 亚洲mmav| 欧美成人猛片aaaaaaa| 日本japanese极品少妇| 成人一区不卡| 色综合久久88色综合天天看泰| 日本中文字幕在线免费观看| 日本欧美一区二区| 97久久精品午夜一区二区| 五月激情丁香婷婷| 国产精品午夜免费| 国产女主播自拍| 欧美一区 二区 三区| 91精品在线麻豆| 香港三日本8a三级少妇三级99| 精品国产一区探花在线观看 | 久草视频手机在线| 亚洲人妖在线| 91精品久久久久久久久久久久久久| 亚洲精品久久久久久久久久| 国产午夜精品一区二区三区嫩草| 欧美黄色免费网址| 欧美与亚洲与日本直播| 日韩精品一区二区在线观看| 国产一二三四区在线| 国产精品s色| 国产欧美日韩高清| 天堂中文在线资| 亚洲人123区| 国产精品乱码久久久久| 国产成人一二| 欧美成人在线免费| 特级西西444www大胆免费看| av资源网一区| 成年人视频网站免费| 色999久久久精品人人澡69| 亚洲欧美另类国产| 久久亚洲成人av| 激情综合网天天干| 日韩免费三级| 超级碰碰久久| 亚洲激情久久久| 久久久综合久久久| 国产乱一区二区| 日本免费在线视频观看| 成人免费av电影| 亚洲美女在线看| 国产成人啪精品午夜在线观看| 韩国欧美国产1区| 自拍偷拍亚洲色图欧美| 成人黄色毛片| 欲色天天网综合久久| 少妇高潮av久久久久久| 91麻豆123| 777777av| 日韩高清在线免费观看| 国模精品视频一区二区三区| 性网爆门事件集合av| 综合久久久久久| 污污视频在线免费| 牛夜精品久久久久久久99黑人| 91在线免费网站| 黄色精品在线观看| 3d成人动漫网站| 欧美大片xxxx| 国产老肥熟一区二区三区| 日本精品免费视频| 国产一区二区三区精品在线观看 | 色欲人妻综合网| 国产原创一区二区| 国产制服91一区二区三区制服| 精品视频一二| 色综合久久88| 四虎在线视频| 91国偷自产一区二区三区观看 | 久久婷婷中文字幕| 亚洲成人精选| 国产二区不卡| 日本不良网站在线观看| 亚洲视频在线视频| 国产亚洲久一区二区| 中文字幕电影一区| 欧美日韩精品区别| 欧美福利影院| 久久er99热精品一区二区三区| 亚洲天堂av影院| 国产亚洲精品综合一区91| 91精东传媒理伦片在线观看| 亚洲乱码精品一二三四区日韩在线| 亚洲国产日韩在线一区| 亚洲日韩成人| 日韩欧美手机在线| 国产一区二区三区免费在线 | 久久免费精品| 97人人做人人爱| 国产高清视频免费最新在线| 欧美电影一区二区| 国产又色又爽又黄的| 国产精品天天看| 日批视频免费看| 久久久久国产精品午夜一区| 制服诱惑一区| 欧美成人午夜77777| 国产精品视频99| 婷婷av在线| 亚洲视频axxx| 精品国产乱码一区二区三 | 欧美裸体xxxx极品少妇| 欧洲天堂在线观看| 欧美日韩国产不卡| 日韩在线视频免费播放| 中文字幕日韩精品一区| 800av在线播放| 麻豆精品在线播放| 免费观看国产精品视频| 日韩免费一区| 国内成+人亚洲| 亚洲欧洲日韩精品在线| 欧美一区二粉嫩精品国产一线天| 九义人在线观看完整免费版电视剧| 亚洲第一精品福利| 在线免费一级片| 欧美日韩一区免费| 日韩女优一区二区| 久久久久久免费| 亚洲欧美日韩偷拍| 国产另类ts人妖一区二区| 国产v亚洲v天堂无码久久久| 亚洲精品看片| 性生活免费观看视频| 成人影院在线| 日韩福利视频| 图片婷婷一区| 国产欧美日韩视频一区二区三区| 高清一区二区三区av| 国产精品扒开腿做爽爽爽视频| 2021天堂中文幕一二区在线观| 久热在线中文字幕色999舞| 成人欧美亚洲| 国产一区二区三区在线看| 午夜激情小视频| 精品播放一区二区| 亚洲狼人综合网| 欧美一区二区三区婷婷月色| 亚洲特级黄色片| 欧美性受极品xxxx喷水| 久久人妻免费视频| 天天色综合成人网| 日本熟女一区二区| 亚洲国产综合色| 久草成人在线视频| 亚洲女人****多毛耸耸8| 91大神福利视频| 国产精品视频第一区| 91l九色lporny| 久久久蜜桃精品| 四虎永久免费影院| 99久久er热在这里只有精品66| 麻豆精品国产传媒av| 成人va在线观看| 性色av蜜臀av浪潮av老女人| 成人精品亚洲人成在线| 亚洲图片欧美另类| 不卡的av电影在线观看| 一起草在线视频| 久久一区二区三区四区| 久久精品国产亚洲av麻豆| 久久先锋资源网| 毛片aaaaaa| 国产精品久久久久久久久免费桃花| www中文在线| 亚洲免费三区一区二区| 久草资源在线视频| 精品久久久久久国产| 9i精品福利一区二区三区| 91国偷自产一区二区开放时间| 伊人网综合在线| 91精品中文字幕一区二区三区| 亚洲第一色视频| 亚洲精品乱码久久久久久按摩观| 三区在线视频| 色av吧综合网| 性欧美videoshd高清| 97在线观看免费高清| 精品无人乱码一区二区三区 | 欧美成人精品欧美一级乱| 久久久久国产精品午夜一区| 欧美男女交配视频| 国产二区国产一区在线观看| 亚洲激情 欧美| 国产欧美视频一区二区三区| 免费高清在线观看电视| 一区二区三区精品| 国产精品21p| 欧美精选午夜久久久乱码6080| 亚洲精品无遮挡| 亚洲欧美三级伦理| 久久综合之合合综合久久| 久久久久久美女| 成人开心激情| 99中文视频在线| 国产中文字幕一区二区三区| 看全色黄大色大片| 免费看的黄色欧美网站| 国产免费中文字幕| 99久久777色| 欧美另类videoxo高潮| 亚洲成av人片在线观看| 在线免费观看日韩视频| 亚洲国产精久久久久久| 在线观看av的网站| 久久免费视频这里只有精品| 97精品国产综合久久久动漫日韩| 国产高清不卡av| 日韩成人精品一区二区| 久久久久久久久久网| 久草热8精品视频在线观看| 中文字幕免费在线播放| 亚洲视频综合在线| av毛片在线免费观看| 欧美r级在线观看| 婷婷在线视频| 日本免费在线精品| 8848成人影院| 中文字幕黄色大片| 米奇777在线欧美播放| 催眠调教后宫乱淫校园| 亚洲欧洲韩国日本视频| 无码一区二区三区| 日韩精品免费视频| 欧美wwww| 7777精品久久久大香线蕉小说| 北条麻妃国产九九九精品小说 | 久草福利资源在线观看| 欧美男人的天堂一二区| 国产永久免费高清在线观看视频| 97涩涩爰在线观看亚洲| 日韩不卡在线视频| 日本黄色a视频| 久久精品国产免费| 精品无人区无码乱码毛片国产| 婷婷综合久久一区二区三区| 亚洲国产精彩视频| 欧美成人精品激情在线观看| 日韩av懂色| 亚洲成人18| 日韩电影在线免费看| 精品无人区无码乱码毛片国产| 欧美日韩中文字幕| 日韩在线观看视频一区| 午夜精品福利电影| 中文字幕一区二区三区四区久久| 性生活免费观看视频| 国产一区二区不卡老阿姨| 神马久久精品综合| 91精品欧美久久久久久动漫| 成人高清免费在线| 91久久精品国产| 亚洲欧美综合国产精品一区| 三级性生活视频| 国产精品久久久久永久免费观看 | 国产精品xx| 精品高清视频| 亚洲一区二区网站| 精品人妻互换一区二区三区| 色婷婷精品久久二区二区蜜臀av | 亚洲欧美日韩久久| 国产美女www爽爽爽| 色偷偷噜噜噜亚洲男人| 老司机精品视频网| 日本黄xxxxxxxxx100| 国产成人亚洲综合a∨婷婷 | 国产在线观看a视频| 91亚洲精品丁香在线观看| 欧美激情精品久久久六区热门| 国产乱淫av麻豆国产免费| 午夜电影网亚洲视频| 欧美3p视频在线观看| 国产精品视频一区二区三区四| 三区四区不卡| 亚洲性图第一页| 欧美午夜激情视频| av电影在线观看| 147欧美人体大胆444| 亚洲精品孕妇| 一区二区伦理片| 7777精品伊人久久久大香线蕉超级流畅| av免费在线观| 欧美精品七区| 老司机午夜精品| 一区二区三区免费高清视频| 日韩美女av在线| 亚洲tv在线| 水蜜桃色314在线观看| 久久久精品免费网站| 国产精品久久久久久久久久久久久久久久 | 亚洲在线观看视频| 99国产精品视频免费观看一公开| 一级黄色性视频| 日韩欧美电影一区| 台湾佬中文娱乐久久久| 中文字幕中文字幕在线中一区高清 | 亚洲高清影视| 国产高清自拍视频| 欧美猛男男办公室激情| 美女高潮在线观看| 成人在线观看www| 国产婷婷色一区二区三区在线| 国产精品久久777777换脸| 欧美一区亚洲一区| 91成人观看| 免费福利视频网站| 精品国产乱子伦一区| 日韩福利在线观看| 国产精品97在线| 一区二区三区在线视频免费 | 国内免费精品永久在线视频| 日韩电影免费网址| 污污内射在线观看一区二区少妇| 欧美精品99久久久**|