精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用多模態(tài)世界模型預(yù)測(cè)未來!UC伯克利全新AI智能體,精確理解人類語(yǔ)言,刷新SOTA

人工智能 新聞
智能體如何從不同的語(yǔ)言中理解世界?近日,來自UC伯克利的研究人員提出了一種全新的AI智能體,可以通過對(duì)未來進(jìn)行多模態(tài)世界建模來學(xué)習(xí)理解語(yǔ)言。

現(xiàn)在,基于強(qiáng)化學(xué)習(xí)的智能體已經(jīng)可以輕松地執(zhí)行諸如「撿起藍(lán)色積木」這類的指令。

但人類大部分時(shí)間的語(yǔ)言表達(dá),卻遠(yuǎn)遠(yuǎn)超出了指令的范圍。比如:「我們好像沒有牛奶了」......

而智能體想要學(xué)習(xí)這類語(yǔ)言在世界中的含義,是非常困難的。

對(duì)此,來自UC伯克利的研究團(tuán)隊(duì)認(rèn)為,我們實(shí)際上可以利用這些語(yǔ)言,來幫助智能體更好地對(duì)未來進(jìn)行預(yù)測(cè)。

論文地址:https://arxiv.org/pdf/2308.01399.pdf

具體來說,研究人員提出了一種全新的智能體——Dynalang。

與僅用語(yǔ)言預(yù)測(cè)動(dòng)作的傳統(tǒng)智能體不同,Dynalang通過使用過去的語(yǔ)言來預(yù)測(cè)未來的語(yǔ)言、視頻和獎(jiǎng)勵(lì),從而獲得豐富的語(yǔ)言理解。

除了在環(huán)境中的在線交互中學(xué)習(xí)外,Dynalang還可以在沒有動(dòng)作或獎(jiǎng)勵(lì)的情況下在文本、視頻或兩者的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。

也就是說,新的智能體這時(shí)再聽到「我們沒有牛奶了」,就能get到這句話意思是「冰箱里的牛奶喝完了」。

工作原理

使用語(yǔ)言來理解世界自然而然地適合于世界建模范式。

Dynalang以基于模型的RL智能體DreamerV3為基礎(chǔ),并可利用其在環(huán)境中動(dòng)作時(shí)所收集到的經(jīng)驗(yàn)數(shù)據(jù),不斷地進(jìn)行學(xué)習(xí)。

左:世界模型在每個(gè)時(shí)間步將文本和圖像壓縮為潛在表征。在這個(gè)表征中,模型被訓(xùn)練以重構(gòu)原始觀察結(jié)果,預(yù)測(cè)獎(jiǎng)勵(lì),并預(yù)測(cè)下一個(gè)時(shí)間步的表征。直觀地說,世界模型學(xué)會(huì)了在給定文本中所讀內(nèi)容的情況下,應(yīng)該期望在世界中看到什么。

右:Dynalang通過在壓縮的世界模型表征基礎(chǔ)上訓(xùn)練策略網(wǎng)絡(luò)來選擇動(dòng)作。它在世界模型的想象中反復(fù)進(jìn)行訓(xùn)練,從而學(xué)會(huì)采取最大化預(yù)測(cè)獎(jiǎng)勵(lì)的動(dòng)作。

與之前一次處理一個(gè)句子或段落的多模態(tài)模型不同,Dynalang將視頻和文本作為一個(gè)統(tǒng)一的序列進(jìn)行建模,一次處理一個(gè)圖像幀和一個(gè)文本token。

直觀地說,這更像是人類在現(xiàn)實(shí)世界中接收輸入的方式。

將所有內(nèi)容都建模為一個(gè)序列,就可以像語(yǔ)言模型一樣在文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,從而提高強(qiáng)化學(xué)習(xí)的性能。

語(yǔ)言提示

為了評(píng)估智能體在環(huán)境中的表現(xiàn),研究人員引入了HomeGrid。其中,智能體除了任務(wù)指令外,還會(huì)收到語(yǔ)言提示。

HomeGrid中的提示,不僅模擬了智能體可能從人類那里學(xué)到的知識(shí)或從文本中讀到的信息,而且還提供了有用但不是解決任務(wù)所必需的信息:

- 「未來觀察」:描述智能體在未來可能觀察到的情況,例如「盤子在廚房里」。

- 「糾正」:根據(jù)智能體正在執(zhí)行的任務(wù)的提供交互式反饋,例如「轉(zhuǎn)過身去」。

- 「動(dòng)態(tài)」:描述環(huán)境的動(dòng)態(tài),例如「踩踏板打開堆肥箱」。

雖然智能體并未接受過明確的指導(dǎo)來分辨觀察結(jié)果和文本的對(duì)應(yīng)關(guān)系。但Dynalang仍能通過未來的預(yù)測(cè)目標(biāo),學(xué)會(huì)將各種類型的語(yǔ)言與環(huán)境聯(lián)系起來。

結(jié)果顯示,Dynalang要明顯優(yōu)于以語(yǔ)言為條件的IMPALA和R2D2。

后者不僅在使用不同類型的語(yǔ)言時(shí)非常吃力,而且在使用指令以外的語(yǔ)言時(shí)表現(xiàn)得更差。

游戲評(píng)估

在Messenger游戲環(huán)境中,研究人員測(cè)試了智能體是如何從較長(zhǎng)且更復(fù)雜的文本中學(xué)習(xí)的,這需要在文本和視覺觀察之間進(jìn)行多跳推理。

智能體必須對(duì)描述每個(gè)情節(jié)動(dòng)態(tài)的文本說明進(jìn)行推理,并將其與環(huán)境中的實(shí)體觀察結(jié)合起來,以確定從哪些實(shí)體獲取消息和避開哪些實(shí)體。

結(jié)果顯示,Dynalang的表現(xiàn)要明顯優(yōu)于IMPALA和R2D2,以及使用專門架構(gòu)對(duì)文本和觀察結(jié)果進(jìn)行推理任務(wù)優(yōu)化的EMMA基準(zhǔn),尤其是在最困難的第3階段。

指令跟隨

Habitat的測(cè)試結(jié)果表明,Dynalang能夠處理逼真的視覺觀察并執(zhí)行指令。

也就是,智能體需要按照自然語(yǔ)言的指令,導(dǎo)航到家中的目標(biāo)位置。

在Dynalang中,指令跟隨可以通過將其視為未來獎(jiǎng)勵(lì)預(yù)測(cè),來在相同的預(yù)測(cè)框架中統(tǒng)一處理。

圖片

語(yǔ)言生成

就像語(yǔ)言會(huì)影響智能體對(duì)所見事物的預(yù)測(cè)一樣,智能體觀察到的事物也會(huì)影響它期望聽到的語(yǔ)言(例如,關(guān)于所見事物的真實(shí)陳述)。

通過在LangRoom中將語(yǔ)言輸出到動(dòng)作空間中,Dynalang可以生成與環(huán)境相關(guān)聯(lián)的語(yǔ)言,從而執(zhí)行具體的問題回答。

圖片

文本預(yù)訓(xùn)練

由于使用語(yǔ)言建立世界模型與使用世界模型學(xué)習(xí)動(dòng)作是分開的,因此Dynalang可以在沒有動(dòng)作或獎(jiǎng)勵(lì)標(biāo)簽的情況下使用離線數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。

這種能力使Dynalang能夠從大規(guī)模的離線數(shù)據(jù)集中受益,所有這些數(shù)據(jù)集都在單一模型架構(gòu)內(nèi)。

研究人員使用純文本數(shù)據(jù)對(duì)Dynalang進(jìn)行預(yù)訓(xùn)練,并從頭開始學(xué)習(xí)token嵌入。

模型在通用文本數(shù)據(jù)(TinyStories,200萬個(gè)短故事)上進(jìn)行預(yù)訓(xùn)練之后,可以提高M(jìn)essenger下游RL任務(wù)的表現(xiàn),甚至超過了使用預(yù)訓(xùn)練的T5嵌入。

盡管這項(xiàng)工作的重點(diǎn)是讓智能體能夠理解語(yǔ)言并采取行動(dòng),但其實(shí)也可以像純文本語(yǔ)言模型一樣生成文本。

研究人員在潛空間中對(duì)預(yù)訓(xùn)練的TinyStories模型進(jìn)行了抽樣推演,并在每個(gè)時(shí)間步驟從表征中解碼出token觀察。

結(jié)果顯示,模型生成的結(jié)果具有令人驚訝的一致性,不過在質(zhì)量上仍然低于SOTA的語(yǔ)言模型。

不過由此也可以看出,將語(yǔ)言生成和行動(dòng)統(tǒng)一到單一的智能體架構(gòu)中,是一個(gè)很有趣的研究方向。

作者介紹

Jessy Lin

圖片

論文一作Jessy Lin,是加州大學(xué)伯克利分校人工智能研究院(Berkeley AI Research)的三年級(jí)博士生,由Anca Dragan和Dan Klein指導(dǎo)。

她的研究方向是構(gòu)建能與人類合作和互動(dòng)并以語(yǔ)言為媒介的智能體。此外,她還對(duì)對(duì)話以及語(yǔ)言+強(qiáng)化學(xué)習(xí)非常感興趣。目前,她的研究得到了蘋果人工智能獎(jiǎng)學(xué)金的支持。

她在麻省理工學(xué)院獲得了計(jì)算機(jī)科學(xué)和哲學(xué)雙學(xué)位。在那里,她與計(jì)算認(rèn)知科學(xué)小組合作,在Kelsey Allen和Josh Tenenbaum的指導(dǎo)下進(jìn)行人類啟發(fā)式人工智能研究,同時(shí)作為labsix的創(chuàng)始成員從事機(jī)器學(xué)習(xí)安全研究。

此外,她還曾在Lilt從事人機(jī)協(xié)作機(jī)器翻譯/專家翻譯的Copilot研究和產(chǎn)品開發(fā)。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2023-08-05 13:45:46

模型AI

2025-07-02 08:40:00

智能體AI模型

2024-12-02 08:20:00

2024-03-04 08:15:00

2023-05-04 14:55:02

模型AI

2021-03-05 15:03:36

算法強(qiáng)化學(xué)習(xí)技術(shù)

2025-02-14 09:20:00

模型數(shù)據(jù)訓(xùn)練

2025-01-22 15:21:00

2025-10-11 15:55:08

AI模型數(shù)據(jù)

2024-04-07 00:45:00

開源模型

2023-12-16 09:49:18

2023-04-07 09:28:31

模型訓(xùn)練

2025-05-15 09:10:00

2025-04-18 08:42:52

模型推理AI

2025-07-14 13:47:29

2024-09-11 13:04:53

2025-05-06 15:31:55

智能模型AI

2024-07-31 15:38:00

2024-09-23 14:46:27

2025-10-13 09:03:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产视频中文字幕在线观看| 国产精品午夜一区二区| 美女视频免费精品| 色综合夜色一区| 亚洲国产日韩欧美| 国产综合视频在线| 丝袜a∨在线一区二区三区不卡| 中文字幕日韩欧美| 日本一级大毛片a一| 国产精品av一区二区三区| 国产精品久久久久四虎| 国产一区不卡在线观看| 亚洲中文无码av在线| 韩国av一区| 国产午夜一区二区| 在线播放av网址| 欧美日韩女优| 亚洲福利视频导航| 爱爱爱视频网站| 三级在线播放| 成人丝袜视频网| 国产欧美一区二区三区视频| 国产成人一区二区三区影院在线| 国产高清一区| 国产亚洲精品成人av久久ww| 国产二级一片内射视频播放 | 国产精品午夜一区二区三区| 日韩一区二区在线看| 欧美性猛交久久久乱大交小说| 免费在线观看av电影| 国产精品精品国产色婷婷| 蜜桃av噜噜一区二区三区| 亚洲国产精品久久久久久久| 激情亚洲综合在线| 国产福利精品在线| 国产午夜免费福利| 一区二区黄色| 97久久国产精品| 久久黄色小视频| 亚洲精品国产成人影院| 色婷婷av一区二区三区久久| 性猛交ⅹxxx富婆video| 免费看日本一区二区| 亚洲韩国青草视频| 一边摸一边做爽的视频17国产 | 亚洲丁香久久久| 青娱乐精品在线| 日韩毛片免费视频一级特黄| 欧美日韩三级一区二区| 丰满少妇在线观看| 日韩网站中文字幕| 在线一区二区三区做爰视频网站| 国产精品视频一区二区三区四区五区 | 97久久超碰精品国产| 国产成人精品日本亚洲11| a天堂在线观看视频| 国产乱子伦一区二区三区国色天香| 国产精品美女久久久久av超清| 樱花视频在线免费观看| 肉色丝袜一区二区| 国产精品狠色婷| 中文字幕日韩经典| 久久99精品久久只有精品| 成人激情视频网| 国产福利资源在线| 成人一级片在线观看| 国产精品三区在线| 可以在线观看的av| 国产精品免费看片| 青青草视频在线视频| 99色在线观看| 一本到高清视频免费精品| www.日本xxxx| 97久久中文字幕| 日韩一区二区精品葵司在线| 国产成人av无码精品| 国产91一区| 视频在线一区二区| 久草免费在线观看视频| 中文亚洲欧美| 国产精品xxx视频| 国产精品亚洲lv粉色| 国产99久久久国产精品潘金网站| 久久av一区二区| av在线收看| 一区二区三区在线观看网站| 日韩精品xxxx| 99只有精品| 精品成人私密视频| 亚洲毛片亚洲毛片亚洲毛片| 欧美日韩精品免费观看视频完整| 7777kkkk成人观看| 亚洲一区二区色| 波多野结衣91| 亚洲视频小说| 国产传媒在线| 91 com成人网| www.色天使| 欧美成人高清| 国产精品精品久久久| 成人黄色免费视频| 中文字幕第一区第二区| 日韩亚洲欧美视频| 亚洲福利影视| 亚洲欧美综合图区| 久久9999久久免费精品国产| 麻豆久久久久久久| 国语精品免费视频| 超碰电影在线播放| 欧美性受xxxx| www.免费av| 欧美.www| 成人免费观看a| 国产毛片av在线| 亚洲不卡在线观看| 亚洲一区二区偷拍| 成人羞羞网站入口免费| 国产91精品视频在线观看| 99久久免费国产精精品| 欧美激情综合五月色丁香小说| 久久99久久久久久| 国产视频一区二区在线播放| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 亚洲精品一区国产精品| 深夜福利视频一区二区| 欧美不卡一区二区三区| 亚洲欧美卡通动漫| 人人爽香蕉精品| 久久久精品国产一区二区三区| 伊人影院在线视频| 欧美电影一区二区| 国产又粗又长又硬| 日本免费新一区视频| 欧美在线一二三区| 久久毛片亚洲| 亚洲视屏在线播放| 波多野结衣绝顶大高潮| 91一区一区三区| 丁香花在线影院观看在线播放| 日韩精品一区国产| 美女性感视频久久久| aaa国产视频| 亚洲色图欧美偷拍| 午夜不卡福利视频| 亚洲女同中文字幕| 999视频在线观看| 中中文字幕av在线| 日韩三级中文字幕| 久久在线视频精品| 成人黄色a**站在线观看| 日韩一区二区高清视频| 成人av综合网| 91精品成人久久| 人人妻人人澡人人爽人人欧美一区| 亚洲一区二区三区四区的| 免费啪视频在线观看| 99精品99| 欧美裸体网站| 国外成人福利视频| 久久亚洲私人国产精品va| 国产麻豆免费观看| 亚洲综合精品自拍| 先锋资源av在线| 性感少妇一区| 日韩欧美亚洲精品| 主播大秀视频在线观看一区二区| 精品国产视频在线 | 精品无码久久久久久国产| 亚洲AV无码成人精品区东京热| 久久精品无码一区二区三区| 一级黄色香蕉视频| 天天影视欧美综合在线观看| 成人免费观看网站| 亚洲精品日产| 中文字幕不卡在线视频极品| 精品人妻一区二区三区蜜桃| 图片区小说区区亚洲影院| 好吊视频在线观看| 国内精品第一页| 男女私大尺度视频| 成人精品视频| 国产传媒一区二区| 亚洲www啪成人一区二区| 欧美成人精品不卡视频在线观看| 天堂成人在线观看| 欧美日韩国产综合一区二区三区 | 精品91久久久久| 欧美午夜欧美| 久久的色偷偷| 日本精品久久久| 最新日本在线观看| 亚洲久久久久久久久久| 97人人爽人人爽人人爽| 天天综合日日夜夜精品| 林心如三级全黄裸体| 成人国产精品免费观看动漫| www欧美激情| 136国产福利精品导航网址| 色综合久久88色综合天天提莫| 精品中文字幕一区二区三区| 国产成人一区二区三区小说| 久久不射影院| 日韩在线观看免费网站| 色wwwwww| 日韩一区二区高清| 在线观看视频二区| 精品福利在线视频| 草视频在线观看| 欧美韩国一区二区| 国产精品无码一区二区三| 韩国一区二区在线观看| 国产亚洲天堂网| 极品av少妇一区二区| 最新视频 - x88av| 欧美精品一区二区久久| 精品产品国产在线不卡| 精品视频一二| 国产日韩一区在线| 肉色欧美久久久久久久免费看| 久久免费视频在线观看| 黄色免费网站在线观看| 中文字幕精品www乱入免费视频| 特级丰满少妇一级aaaa爱毛片| 91精品免费在线| 在线观看不卡的av| 色婷婷av一区二区三区软件| 日本熟女一区二区| 亚洲综合一区在线| 日本天堂中文字幕| 久久精品在线免费观看| 国产精品1000部啪视频| 成人成人成人在线视频| 国产在线久久久| 亚洲一区二区三区四区五区| 欧洲三级视频| 国产精品成人一区二区三区| 五月亚洲婷婷| 91入口在线观看| 免费欧美网站| 亚洲综合日韩在线| 欧美大片91| 91九色蝌蚪成人| 亚洲高清999| 99porn视频在线| 国产福利资源一区| 国产原创精品| 天堂网av成人| 欧美一区二区三区成人久久片 | 精品无码黑人又粗又大又长| 亚洲乱码日产精品bd| 一区二区在线观看免费视频| 亚洲美女淫视频| 久久免费小视频| 午夜国产不卡在线观看视频| 好吊操这里只有精品| 婷婷开心激情综合| 波多野结衣国产| 日韩欧美综合在线视频| 免费黄色片视频| 欧美怡红院视频| 国产探花精品一区二区| 日韩亚洲欧美一区| 色欲久久久天天天综合网| 日韩av在线播放资源| 酒色婷婷桃色成人免费av网| 国产亚洲日本欧美韩国| 久操视频在线免费播放| 欧美日韩不卡合集视频| 黄色在线免费观看网站| 国产激情综合五月久久| 欧美天堂在线| 成人黄色片视频网站| 亚洲大片精品免费| 亚洲欧美成人一区| 欧美伊人久久| 超碰97人人射妻| 久久国产成人午夜av影院| 真实乱偷全部视频| 久久综合久久99| 日韩精品123区| 亚洲成年人影院| 成年人晚上看的视频| 91精品国产美女浴室洗澡无遮挡| 内射无码专区久久亚洲| 在线视频精品一| 18+激情视频在线| 国产精品999999| 日韩精品成人| 欧美最大成人综合网| 91精品综合| 丰满少妇被猛烈进入高清播放| 裸体一区二区三区| 中文字幕 日本| 亚洲色图都市小说| 欧美黄色一级大片| 日韩女优电影在线观看| 国产一级在线观看| 久久久久久久一| 国产麻豆一区| 久久99精品国产一区二区三区| 国产精品久久久久久久久久10秀| 人妻少妇精品久久| 国产一区二区视频在线播放| 久久无码人妻精品一区二区三区| 亚洲人亚洲人成电影网站色| 欧美啪啪小视频| 精品久久国产字幕高潮| 日本视频在线观看| 茄子视频成人在线| 永久免费精品视频| 制服丝袜综合日韩欧美| 鲁大师成人一区二区三区| 69xxx免费视频| 亚洲女爱视频在线| 亚洲天堂五月天| 日韩激情av在线播放| 伊人在我在线看导航| 国产欧美一区二区| av中文字幕一区二区| 久久综合色视频| 成人免费毛片嘿嘿连载视频| 欧美一区免费观看| 欧美三级日韩在线| 久久米奇亚洲| 2020欧美日韩在线视频| 国产精品极品| 狠狠精品干练久久久无码中文字幕| 美国毛片一区二区| 日本爱爱爱视频| 一本大道综合伊人精品热热| 日韩一区二区三区不卡| 欧美激情综合色| 日韩综合一区二区三区| 爱爱爱视频网站| 国产一区二区三区观看| 欧美h片在线观看| 欧美精品久久久久久久久老牛影院 | 国产精品2020| 亚洲成人激情在线观看| 51av在线| 精品视频在线观看| 99国产精品99久久久久久粉嫩| 中文文字幕文字幕高清| 午夜精品视频在线观看| 天天躁日日躁狠狠躁喷水| 韩剧1988在线观看免费完整版| 精品福利一区| www.浪潮av.com| 久久毛片高清国产| 欧美一区二区三区网站| 一区二区欧美久久| 久久夜夜久久| 日本丰满少妇黄大片在线观看| 国产一区二区91| 青青草成人免费| 亚洲国产另类久久精品| 成人爽a毛片免费啪啪| 欧美亚洲国产免费| 蜜桃久久久久久久| 91麻豆免费视频网站| 日韩精品中文字幕在线不卡尤物| 欧美人动性xxxxz0oz| 国产伦精品一区二区三区视频孕妇| 亚洲国产日本| 亚洲永久精品ww.7491进入| 在线视频中文字幕一区二区| 在线观看免费版| 成人91免费视频| 99精品热视频只有精品10| 午夜时刻免费入口| 欧美精品粉嫩高潮一区二区| 黄色大片在线| 日本欧美精品久久久| 卡一卡二国产精品| 久久丫精品久久丫| 亚洲欧洲一区二区三区久久| 日韩国产一二三区| 久久男人资源站| 久久久不卡网国产精品二区| 91精品国自产| 97超碰蝌蚪网人人做人人爽| 日本一区二区高清不卡| 特黄特色免费视频| 日韩欧美中文字幕在线观看 | 中文字幕日韩欧美一区二区三区| 国产成人av免费看| 欧洲永久精品大片ww免费漫画| 四季av一区二区三区免费观看| 岛国av免费观看| 精品视频1区2区3区| 男男gaygays亚洲| 日韩精品久久一区二区三区| 粉嫩蜜臀av国产精品网站| 免费av中文字幕| 欧美精品18videos性欧美| 国产亚洲一区| 亚洲一区二区三区黄色| 欧美日韩国产三级| 性欧美又大又长又硬| 7777在线视频|