精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用語言建模世界:UC伯克利多模態世界模型利用語言預測未來

人工智能 新聞
人工智能長期以來的目標是開發能夠在物理世界中與人類自然交互的智能體。當前的具身智能體可以遵循簡單的低層指令,比如「拿一塊藍色的積木」或者「經過電梯,然后向右轉」。

當前,人與智能體(比如機器人)的交互是非常直接的,你告訴它「拿一塊藍色的積木」,它就會幫你拿過來。但現實世界的很多信息并非那么直接,比如「扳手可以用來擰緊螺母」、「我們的牛奶喝完了」。這些信息不能直接拿來當成指令,但卻蘊含著豐富的世界信息。智能體很難了解這些語言在世界上的含義。

圖片

圖源:谷歌機器人團隊論文「Interactive Language: Talking to Robots in Real Time」。

UC 伯克利 Dynalang 研究的關鍵思想是,我們可以將語言看作是幫助我們更好地對世界進行預測的工具,比如「我們的牛奶喝完了」→打開冰箱時沒有牛奶;「扳手可以用來擰緊螺母」→使用工具時螺母會旋轉。Dynalang 在一個模型中結合了語言模型(LM)和世界模型(WM),使得這種范式變成多模態。研究者認為,將語言生成和行動統一在一個智能體架構中是未來研究的一個令人興奮的方向。

論文概覽

人工智能長期以來的目標是開發能夠在物理世界中與人類自然交互的智能體。當前的具身智能體可以遵循簡單的低層指令,比如「拿一塊藍色的積木」或者「經過電梯,然后向右轉」。

然而,要實現自由交流的互動智能體,就需要理解人們在「此時此地」之外使用語言的完整方式,包括:傳遞知識,比如「左上角的按鈕是關掉電視的」;提供情境信息,如「我們的牛奶喝完了」;以及協同,比如跟別人說「我已經吸過客廳了」。我們在文本中閱讀的很多內容或者從他人口中聽到的信息都在傳遞有關世界的知識,無論是關于世界如何運行還是關于當前世界狀態的知識。

我們如何使智能體能夠使用多樣化的語言呢?一種訓練基于語言的智能體解決任務的方法是強化學習(RL)。然而,目前的基于語言的 RL 方法主要是學習從特定任務指令生成行動,例如將目標描述「拿起藍色的積木」作為輸入,輸出一系列運動控制。

然而,當考慮到自然語言在現實世界中所服務的多樣功能時,直接將語言映射到最優行動是一個具有挑戰性的學習問題。以「我把碗放好了」為例:如果任務是清洗,智能體應該繼續進行下一個清洗步驟;而如果是晚餐服務,智能體應該去取碗。當語言不涉及任務時,它只與智能體應該采取的最優行動弱相關。將語言映射到行動,尤其是僅使用任務獎勵,對于學會使用多樣化語言輸入完成任務來說是一個弱學習信號。

不同的是,UC 伯克利的研究者提出,智能體使用語言的一種統一方法是幫助它們預測未來。前面提到的語句「我把碗放好了」有助于智能體更好地預測未來的觀察結果(即,如果它采取行動打開櫥柜,它將在那里看到碗)。

我們遇到的很多語言可以通過這種方式與視覺體驗聯系起來。先前的知識,比如「扳手可以用來擰緊螺母」,幫助智能體預測環境變化。諸如「包裹在外面」的陳述有助于智能體預測未來的觀察結果。這個框架還將標準指令遵循歸入預測范疇:指令幫助智能體預測自己將如何受到獎勵。類似于下一個 token 預測允許語言模型形成關于世界知識的內部表示,研究者假設預測未來的表示為智能體理解語言以及它與世界的關系提供了豐富的學習信號。

基于此,他們提出了 Dynalang,一種從在線經驗中學習語言和圖像世界模型,并利用該模型學習如何行動的智能體。

Dynalang 將學習用語言對世界建模(帶有預測目標的監督學習)與學習根據該模型采取行動(帶有任務獎勵的強化學習)分離開來。該世界模型接收視覺和文本輸入作為觀察模態,并將它們壓縮到潛在空間。研究者通過在線收集的經驗訓練世界模型,使其能夠預測未來的潛在表示,同時智能體在環境中執行任務。他們通過將世界模型的潛在表示作為輸入,訓練策略來采取最大化任務獎勵的行動。由于世界建模與行動分離,Dynalang 可以在沒有行動或任務獎勵的單模態數據(僅文本或僅視頻數據)上進行預訓練。

此外,他們的框架還可以統一語言生成:智能體的感知可以影響智能體的語言模型(即其對未來 token 的預測),使其能夠通過在動作空間輸出語言來描述環境。

論文鏈接:https://arxiv.org/pdf/2308.01399.pdf

項目主頁:https://dynalang.github.io/

代碼鏈接:https://github.com/jlin816/dynalang

研究者在具有不同類型語言上下文的多樣化環境中對 Dynalang 進行了評估。在一個多任務家庭清潔環境中,Dynalang 學會利用關于未來觀察、環境動態和修正的語言提示,更高效地完成任務。在 Messenger 基準測試中,Dynalang 可以閱讀游戲手冊來應對最具挑戰性的游戲階段,優于特定任務的架構。在視覺 - 語言導航中,研究者證明 Dynalang 可以學會在視覺和語言復雜的環境中遵循指令。

圖片

Dynalang 學會使用語言來預測未來的(文本 + 圖像)觀察結果和獎勵,從而幫助解決任務。在這里,研究者展示了在 HomeGrid 環境中真實的模型預測結果。智能體在接收環境中的視頻和語言觀察的同時,探索了各種房間。根據過去的文本「瓶子在客廳」,在時間步 61-65,智能體預測將在客廳的最后一個角落看到瓶子。根據描述任務的文本「拿起瓶子」,智能體預測將因為拿起瓶子而獲得獎勵。智能體還可以預測未來的文本觀察:在時間步 30,給定前半句「盤子在」,并觀察到櫥柜上的盤子,模型預測下一個最可能的 token 是「廚房」。

圖片

研究者考慮了一系列具有視覺輸入和多樣化語言的環境。HomeGrid 是一個具有指令和多樣化提示的具有挑戰性的視覺網格世界。Messenger 是一個具有符號輸入的基準測試,包含數百個人工編寫的游戲手冊,需要進行多次推理。Habitat 是一個模擬逼真的 3D 家居環境,用于視覺 - 語言導航,在其中智能體必須在數百個場景中定位物體。LangRoom 是一個簡單的視覺網格世界,具有部分可觀察性,智能體需要同時生成動作和語言。

詳解 Dynalang 工作原理

使用語言來理解世界很自然地符合世界建模范式。這項工作構建在 DreamerV3 的基礎之上,DreamerV3 是一種基于模型的強化學習智能體。Dynalang 不斷地從經驗數據中學習,這些數據是智能體在環境中執行任務時收集到的。

如下圖(左)所示,在每個時間步,世界模型將文本和圖像壓縮成潛在表示。通過這個表示,模型被訓練用于重建原始觀察結果、預測獎勵,并預測下一個時間步的表示。直觀地說,世界模型根據它在文本中讀到的內容,學習它應該期望在世界中看到什么。

如下圖(右)所示,Dynalang 通過在壓縮的世界模型表示之上訓練策略網絡來選擇行動。它通過來自世界模型的想象的模擬結果進行訓練,并學會采取能夠最大化預測獎勵的行動。

與之前逐句或逐段消耗文本的多模態模型不同,研究者設計的 Dynalang 將視頻和文本作為一個統一的序列來建模,一次處理一幀圖像和一個文本 token。直觀來說,這類似于人類在現實世界中接收輸入的方式 —— 作為一個單一的多模態流,人需要時間來聆聽語言。將所有內容建模為一個序列使得模型可以像語言模型一樣在文本數據上進行預訓練,并提高強化學習的性能。

HomeGrid 中的語言提示

研究者引入了 HomeGrid 來評估一個環境中的智能體。在這個環境中,智能體除了任務指令外還會收到語言提示。

HomeGrid 是一個具有指令和多樣化提示的具有挑戰性的視覺網格世界。HomeGrid 中的提示模擬了智能體可能從人類那里學到或從文本中獲取的知識,提供了對解決任務有幫助但不是必需的信息:

未來觀察:描述了智能體未來可能觀察到的情況,比如「盤子在廚房里」。

圖片

Correction:提供了基于智能體當前行為的交互式反饋,比如「轉身」。

Dynamics:描述了環境的動態變化,比如「踩踏板打開垃圾桶」。

圖片

HomeGrid 環境將與代碼一起發布,以鼓勵大家進一步在這個方向上進行研究。

盡管智能體沒有明確地接受有關文本對應于什么觀察結果的明確監督,但 Dynalang 通過未來預測目標學會了將各種類型的語言與環境相聯系。Dynalang 的性能優于基于語言的 IMPALA 和 R2D2,這兩種方法在使用不同類型的語言上遇到困難,通常在超出指令范圍的語言任務上表現更差。

Messenger 中的游戲手冊

研究者在 Messenger 游戲環境中進行評估,以測試智能體如何從更長、更復雜的文本中學習,這需要對文本和視覺觀察進行多次推理。智能體必須對描述每個任務動態的文本手冊進行推理,并將其與環境中實體的觀察結果結合起來,以確定哪些實體應該接收消息,哪些應該避免。Dynalang 的表現優于 IMPALA、R2D2 以及使用專門架構對文本和觀察進行推理的任務特定 EMMA 基線,特別是在最困難的第三階段。

圖片

圖片

圖片

Habitat 中的指令遵循

研究者還展示了 Dynalang 能夠處理逼真的視覺觀察,并在 Habitat 中執行指令跟隨。智能體必須遵循自然語言指令,在家庭逼真掃描中導航到目標位置。在 Dynalang 中,指令遵循可以統一在相同的預測框架中,將其視為未來獎勵預測。

圖片

圖片

圖片

圖片

基于 LangRoom 的語言生成

就像語言可以影響智能體對將要看到的事物的預測一樣,智能體觀察到的內容也會影響它對將要聽到的語言的期望(例如,關于它所看到的內容的真實陳述)。通過在 LangRoom 中將語言輸出到動作空間,研究者展示了 Dynalang 可以生成與環境相關聯的語言,從而進行具身問答。LangRoom 是一個簡單的視覺網格世界,具有部分可觀察性,智能體需要在其中產生運動動作和語言。

圖片


圖片

文本預訓練

由于使用語言進行世界建模與基于世界模型的行動學習解耦,Dynalang 可以使用離線數據進行預訓練,而無需行動或獎勵標簽。這種能力使得 Dynalang 能夠從大規模的離線數據集中受益,全部都在單一的模型架構內實現。研究者使用僅包含文本數據的數據對 Dynalang 進行預訓練,從零開始學習 token 嵌入。在通用文本數據(TinyStories,2M 個短故事)上預訓練模型,提高了模型在 Messenger 上的下游強化學習任務表現,超過了使用預訓練的 T5 嵌入的結果。

圖片

研究者表示,盡管他們的工作專注于用于在世界中行動的語言理解,但它也可以像一個僅文本語言模型一樣從世界模型中生成文本。研究者在潛在空間中對預訓練的 TinyStories 模型進行模擬的抽樣,然后在每個時間步驟從表示中解碼 token 觀察。盡管生成的文本質量仍然低于當前語言模型的水平,但模型生成的文本令人驚訝地連貫。他們認為將語言生成和行動統一在一個智能體架構中是未來研究的一個令人興奮的方向。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-08-15 14:18:19

智能研究

2024-03-04 08:15:00

2024-12-02 08:20:00

2023-05-04 14:55:02

模型AI

2023-12-16 09:49:18

2025-07-02 08:40:00

智能體AI模型

2024-04-07 00:45:00

開源模型

2023-09-25 12:42:00

AI數據

2023-04-07 09:28:31

模型訓練

2023-08-21 08:00:00

人工智能大型語言模型

2025-04-18 08:42:52

模型推理AI

2025-01-22 15:21:00

2023-10-12 16:37:36

模型學習

2024-07-31 15:38:00

2025-04-30 09:09:00

2024-11-26 13:40:00

2022-12-23 10:15:44

模型AI

2023-11-14 07:47:42

IGN擴散模型

2023-04-04 13:17:00

GPUCMU開源

2025-05-06 15:31:55

智能模型AI
點贊
收藏

51CTO技術棧公眾號

亚洲a成v人在线观看| 6080日韩午夜伦伦午夜伦| 精品视频一区二区三区四区| 国产精品久久久久久久久久久久久久久久久 | 91aaa精品| 超级白嫩亚洲国产第一| 国产欧美久久久精品影院| 91老司机在线| 日本特级黄色片| 欧美激情在线| 这里只有精品视频在线| 亚洲啪av永久无码精品放毛片 | 欧美视频专区一二在线观看| 欧美日韩一区在线观看视频| 国产免费久久久| 亚洲综合国产| 欧美成人合集magnet| 亚洲综合网在线观看| 日韩高清在线观看一区二区| 欧美性xxxx极品hd满灌| 日韩不卡视频一区二区| 国产理论电影在线观看| 成人午夜免费电影| 国产精品美女久久| 日本少妇性生活| 亚洲经典一区| 一区二区三区精品99久久 | 一道本一区二区三区| 91精品国产乱码| 中文字幕永久视频| 日韩大片免费观看| 亚洲国产日韩a在线播放性色| 亚洲欧洲一二三| 国产中文字幕在线视频| 成人国产一区二区三区精品| 成人精品福利视频| 国产精品尤物视频| 麻豆成人精品| 欧美精品性视频| www.超碰在线观看| 99久久精品费精品国产风间由美| 国产一区二区三区免费视频| 黄色正能量网站| 久久a级毛片毛片免费观看| 日韩精品一区二区在线观看| 伊人国产精品视频| 精品一区二区三区视频在线播放| 欧美日韩国产成人在线91| 亚洲人成无码www久久久| 青春草在线视频| 亚洲午夜久久久| 成人免费观看在线| av在线播放资源| 偷偷要91色婷婷| 97在线免费公开视频| 在线天堂资源www在线污| 精品国产乱码久久久久久婷婷| 成人性生活视频免费看| av日韩中文| 日韩欧美在线视频日韩欧美在线视频 | 欧美日韩日本视频| 国产九九热视频| 欧美一区在线观看视频| 欧美变态凌虐bdsm| 怡红院一区二区| 亚洲va久久| 在线观看欧美成人| 免费三级在线观看| 狠狠综合久久av一区二区老牛| 欧美黑人巨大精品一区二区| 久久精品性爱视频| 国产日韩免费| 国产成人精品一区二区| 中文字幕人妻色偷偷久久| 蜜臀av一区二区| 亚洲一区二区三区视频播放| www国产在线| 久久综合狠狠综合久久综合88| 日本成人黄色| av在线免费网站| 亚洲va欧美va人人爽| 97xxxxx| 国产亚洲亚洲国产一二区| 日韩女优视频免费观看| 久久国产精品无码一级毛片| 国模吧精品视频| 欧美大成色www永久网站婷| 好吊操这里只有精品| 青青草97国产精品免费观看 | 国产三级视频在线播放| 99精品在线免费| 四虎永久国产精品| 国产蜜臀一区二区打屁股调教| 欧美午夜激情在线| 一区二区三区四区毛片| 欧美日韩一区二区三区不卡视频| 伊人久久五月天| 日本a在线观看| 蜜桃精品视频在线观看| 国产精品一区二| 2021av在线| 精品动漫一区二区三区| 日本人69视频| 色婷婷狠狠五月综合天色拍 | 日本在线视频免费观看| 日本伊人色综合网| 国产在线精品一区二区中文| 天天在线视频色| 欧美日韩国产在线看| 亚洲免费成人在线视频| 久久av超碰| 高清欧美性猛交xxxx| 91麻豆成人精品国产| 久久综合色鬼综合色| 毛片在线视频观看| 日本电影久久久| 亚洲欧美另类国产| 国产午夜福利精品| 国产精品综合在线视频| 亚洲乱码一区二区三区| 最新欧美色图| 亚洲国产欧美一区| 久久久99精品| 美女视频黄久久| 蜜桃久久精品乱码一区二区| 深夜国产在线播放| 7777精品伊人久久久大香线蕉的 | jizz亚洲| 欧亚洲嫩模精品一区三区| 欧美夫妇交换xxx| 欧美日韩中文| 亚洲自拍偷拍一区| av网站免费在线观看| 欧美日韩精品免费| 国产性猛交xx乱| 首页亚洲欧美制服丝腿| 久久久亚洲综合网站| 草草视频在线观看| 亚洲精品国产综合久久| www..com国产| 97久久久精品综合88久久| 日韩av在线播放不卡| 粉嫩一区二区三区四区公司1| 久久99精品国产99久久6尤物 | 国产精品中文字幕日韩精品| 26uuu成人| 动漫一区二区三区| 欧美日韩国产成人| 国产成人三级在线播放| 依依成人综合视频| 久久久久国产免费| 一区在线视频观看| 久久国产精品亚洲va麻豆| 九色porny丨入口在线| 国产丝袜一区二区三区| 黄色片视频免费| 国产网红主播福利一区二区| 免费黄色一级网站| 99久久婷婷国产综合精品电影√| 国产在线播放不卡| 羞羞电影在线观看www| 欧美成人精精品一区二区频| 久久久久亚洲AV| 久久免费电影网| www午夜视频| 欧美日韩国产精品一区二区亚洲| 岛国视频一区免费观看| 偷拍自拍在线看| 色yeye香蕉凹凸一区二区av| 国产又黄又大又爽| 亚洲国产精品自拍| 成人免费网站黄| 精品一区二区在线免费观看| 久操手机在线视频| 国产一区二区三区四区五区传媒 | 精品毛片在线观看| 黑人巨大精品欧美一区免费视频 | 直接在线观看的三级网址| 亚洲精品在线观看网站| 69亚洲精品久久久蜜桃小说| 国产精品久久久久久妇女6080 | 精品中文字幕av| 欧美成人精品一区二区三区在线看| 国产日韩欧美在线| 538在线视频| 日韩中文第一页| 免费看日韩av| 欧美日韩情趣电影| 日本少妇做爰全过程毛片| 中文字幕第一区二区| 91成人在线观看喷潮蘑菇| 丝袜亚洲另类欧美| 成人免费a级片| 大胆日韩av| 国产欧美日韩伦理| 久久女人天堂| 欧美性在线视频| av毛片在线看| 国产亚洲欧美日韩精品| 丰满少妇一级片| 欧美精品久久一区| 香蕉影院在线观看| 亚洲一区在线观看网站| 无码人中文字幕| 92国产精品观看| 在线观看免费看片| 日韩av中文字幕一区二区三区| www.日本在线视频| 天天综合亚洲| 亚洲精品视频一区二区三区| 欧美电影在线观看完整版| 国产精品黄页免费高清在线观看| 国产午夜性春猛交ⅹxxx| 国产精品免费视频一区| 亚洲一区二区三区综合| 久久av中文字幕片| 国产乱子伦农村叉叉叉| 欧美a级在线| 亚洲一卡二卡三卡| 精品国产一区二区三区久久久蜜臀 | 久久精品久久综合| 国产欧美综合一区| 成人影院在线| 欧美成人免费在线| 久本草在线中文字幕亚洲| 91久久精品视频| 成人h在线观看| 国产91九色视频| 在线手机中文字幕| 欧美亚洲另类在线| 91福利在线免费| 午夜精品久久久久久久男人的天堂| 成人在线视频亚洲| 精品国产一区二区三区久久久| 国产视频在线看| 亚洲区中文字幕| 久久经典视频| 一本久久综合亚洲鲁鲁| 成人欧美亚洲| 在线视频欧美性高潮| 黑人与亚洲人色ⅹvideos| 国产视频久久网| 日本中文字幕电影在线观看| 日韩成人在线免费观看| 国产精品国产高清国产| 日韩av网址在线| 欧美成人免费| 国产午夜精品全部视频在线播放| 精品视频一二区| 中文字幕亚洲欧美| 免费黄色在线看| 欧美www在线| 黑人玩欧美人三根一起进| 国内精品视频在线| 中文字幕 在线观看| 国产精品99免视看9| 日本美女久久| 亚洲专区中文字幕| 一区二区三区亚洲变态调教大结局| www久久99| 日韩激情啪啪| 天堂va久久久噜噜噜久久va| 欧美电影一二区| 六月婷婷激情综合| 国产精品人人爽人人做我的可爱| 国产极品美女高潮无套久久久| 香蕉精品999视频一区二区| 成年人在线观看视频免费| 久久精品国产成人一区二区三区| 国产黄色一区二区三区 | 五十路六十路七十路熟婆| www久久精品| 999福利视频| 亚洲国产日韩精品| 午夜久久久久久久久久影院| 欧美日韩国产不卡| 少妇一级淫片免费看| 国产亚洲精品久久久久久777| 免费av毛片在线看| 午夜精品福利视频| 97人人做人人爽香蕉精品| 亚洲一区国产精品| 亚洲三级精品| 天天综合五月天| 欧美在线综合| 一级黄色片在线免费观看| 99国产欧美久久久精品| 极品尤物一区二区| 亚洲第一主播视频| 中文字幕在线观看视频一区| 精品国产乱码久久久久久牛牛| 国产日韩精品在线看| 欧美巨猛xxxx猛交黑人97人| 亚洲精品中文字幕| 99热99热| 色777狠狠狠综合伊人| 国产中文字幕二区| 韩国v欧美v日本v亚洲v| 3d动漫精品啪啪一区二区下载| 国产精品传媒视频| 中文字幕日韩免费| 精品国产成人在线影院 | 亚洲人辣妹窥探嘘嘘| 成人污污视频在线观看| 国精产品一区一区| 欧美性黄网官网| 丰满少妇在线观看bd| 日韩一区av在线| 国产精品迅雷| 国产综合 伊人色| 欧美日韩视频一区二区三区| 九色porny91| 99re视频这里只有精品| 免费又黄又爽又色的视频| 欧美日韩在线三级| 户外极限露出调教在线视频| 97人洗澡人人免费公开视频碰碰碰| 免费视频成人| 日韩欧美亚洲区| 美女精品一区| 好吊日免费视频| 亚洲成人资源在线| 亚洲AV无码精品色毛片浪潮| 久久精品国产免费观看| 精品久久久网| 日韩一本精品| 久久中文欧美| 精品人妻无码一区二区三区换脸| 性感美女久久精品| 欧美 日韩 国产 成人 在线| 久久伊人精品一区二区三区| 午夜不卡一区| 亚洲一二三区精品| 六月丁香综合在线视频| 免费看黄色三级| 91成人在线精品| 国产午夜视频在线观看| 国产精品 欧美在线| 免费成人结看片| 激情五月开心婷婷| 国产欧美一区二区精品婷婷| 色一情一乱一伦| 一个色综合导航| 精品美女一区| av电影一区二区三区| 国产精品自在欧美一区| 欧美人妻精品一区二区三区 | 欧美特黄级在线| 日本国产在线| 国产成人精品久久二区二区| 国产精品探花在线观看| 国产精品拍拍拍| 亚洲欧洲成人精品av97| 国产精品国产三级国产普通话对白| 久久精品视频在线观看| 人人九九精品视频| 欧美午夜性视频| 91视频你懂的| 综合久久中文字幕| 久久视频在线视频| 97久久亚洲| 黑森林福利视频导航| 亚洲国产精华液网站w | 韩国欧美国产1区| 免费毛片在线播放免费| 亚洲国产精品大全| 亚洲高清黄色| 永久免费在线看片视频| 成年人国产精品| 波多野结衣一本一道| 精品国内自产拍在线观看| 国内精品麻豆美女在线播放视频| 九色在线视频观看| 中文字幕欧美一| 人人妻人人澡人人爽人人欧美一区| 日韩av不卡电影| 91高清一区| 色噜噜在线观看| 欧美日韩成人在线一区| 后进极品白嫩翘臀在线播放| 欧美极品视频一区二区三区| 久久99国产精品免费| 国产网友自拍视频| 亚洲一级黄色av| 亚洲综合影院| 免费看污黄网站| 亚洲电影在线播放| 欧美极品另类| 久久久久久久久久码影片| 黄一区二区三区| 中文字幕黄色片| 欧美韩国理论所午夜片917电影| 色棕色天天综合网| 在线观看免费看片| 欧美综合天天夜夜久久| 97蜜桃久久| 99亚洲国产精品| 国产欧美一区二区在线观看| 蜜臀久久久久久999| 成人a免费视频|