精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI鍵盤俠來了:DeepMind開始訓練智能體像人一樣「玩」電腦

人工智能 新聞
人類每天使用數字設備的時間長達數十億小時。如果我們能夠開發出協助完成一部分這些任務的智能體,就有可能進入智能體輔助的良性循環,然后根據人類對故障的反饋,改進智能體并使其獲得新的能力。DeepMind 在這一領域有了新的研究成果。

如果機器可以像人類一樣使用計算機,則可以幫助我們完成日常任務。在這種情況下,我們也有可能利用大規模專家演示和人類對交互行為的判斷,它們是推動人工智能最近取得成功的兩個因素。

最近關于 3D 模仿世界中自然語言、代碼生成和多模態交互行為的工作(2021 年 DeepMind 交互智能體團隊)已經產生了具備卓越表達能力、上下文感知和豐富常識的模型。這項研究有力地證明了以下兩種組件的力量:機器與人類之間一致的豐富、組合輸出空間;為機器行為提供信息的大量人類數據和判斷。

具備這兩種組件但受到較少關注的一個領域是數字設備控制(digital device control),它包括使用數字設備來完成大量有用任務。由于幾乎完全使用數字信息,該領域在數據采集和控制并行化方面具有很好的擴展性(與機器人或聚變反應堆相比)。該領域還將多樣化、多模態輸入與富有表達能力、可組合且兼容人類的可供性相結合。

近日,在 DeepMind 的新論文《A Data-driven Approach for Learning to Control Computers》,研究者重點探究了訓練智能體像人一樣進行鍵盤和鼠標的基本計算機控制。


論文地址:https://arxiv.org/pdf/2202.08137.pdf

DeepMind 對計算機控制進行初步調查采用的基準是 MiniWob++ 任務套件(一組具有挑戰性的計算機控制問題),它包含一組執行點擊、打字、填寫表格和其他此類基本計算機交互任務的指令(下圖 1 b)。MiniWob++ 進一步提供了以編程方式定義的獎勵。這些任務是邁向更開放人機交互的第一步,其中人類使用自然語言指定任務并提供有關性能的后續判斷。

研究者重點訓練智能體來解決這些任務,使用的方法在原則上適用于任何在數字設備上執行的任務,并且具備符合預期的數據和計算擴展特性。因此,他們直接結合強化學習(RL)和行為克隆(BC)兩種技術,其中行為克隆通過人類與智能體行動空間之間的對齊來輔助完成(也就是鍵盤和鼠標)。

具體地,研究者探究使用鍵盤和鼠標進行計算機控制,并通過自然語言指定對象。并且,他們沒有專注于手工設計的課程和專門的行動空間,而是開發了一種基于強化學習的可擴展方法,并結合利用實際人機交互提供的行為先驗。

這是 MiniWob(2016 年由 OpenAI 提出的一種與網站交互的強化學習智能體的基準,MiniWob++ 是它的擴展版本)構想中提出的一種組合,但當時并未發現可以生成高性能智能體。因此,之后的工作試圖通過讓智能體訪問特定 DOM 的操作來提升性能,并通過受限的探索技術使用精心策劃的指導來減少每個步驟中可用的行動數量。通過重新審視模仿與強化學習的簡單可擴展組合,研究者發現實現高性能主要的缺失因素僅是用于行為克隆的人類軌跡數據集的大小。隨著人類數據的增加,性能會可靠地提升,使用的數據集大小是以往研究中的 400 倍。

研究者在 MiniWob++ 基準測試中的所有任務上都實現了 SOTA 和人類平均水平,并找到了跨任務遷移的強有力證據。這些結果證明了訓練機器使用計算機過程中統一的人機界面非常有用。總之,研究者結果展示了一種超越 MiniWob++ 基準測試能力以及像人類一樣控制計算機的方案。

對于 DeepMind 的這一研究,網友大都驚呼「不可思議」。


方法

MiniWob++

MiniWob++ 是 Liu 等人在 2018 年提出的基于 web 瀏覽器的套件,是早期 MiniWob(Mini World of Bits)任務套件的擴展,而 MiniWoB 是一個用于與網站交互的強化學習基準,其可以感知小網頁(210x160 像素)的原始像素和產生鍵盤和鼠標動作。MiniWob++ 任務范圍從簡單的按鈕點擊到復雜的表單填寫,例如,在給出特定指令時預訂航班(圖 1a)。

之前關于 MiniWob++ 的研究已經考慮了能夠訪問 DOM 特定動作的架構,從而允許智能體直接與 DOM 元素交互而無需鼠標或鍵盤導航到它。DeepMind 的研究者選擇僅使用基于鼠標和鍵盤的操作,并進一步假設該接口將更好地遷移到計算機控制任務,而無需與緊湊的 DOM 進行交互。最后,MiniWob++ 任務需要單擊或拖動操作,而這些操作無法通過基于 DOM 元素的操作來實現(參見圖 1b 中的示例)。

與之前的 MiniWob++ 研究一樣,DeepMind 的智能體可以訪問由環境提供的文本字符串字典,該字典被輸入到給定任務的輸入字段中(參見附錄圖 9 示例)。 

下圖為運行 MiniWob++ 的計算機控制環境。人類和智能體都使用鍵盤和鼠標控制計算機,人類提供用于行為克隆的示范行為,智能體受過訓練以模仿這種行為或表現出追求獎勵的行為。人類和智能體嘗試解決 MiniWob++ 任務套件,其中包括需要單擊、鍵入、拖動、填寫表格等。


環境接口

如果想要智能體像人類一樣使用計算機,它們需要接口來傳輸和接收觀察結果和動作。最初的 MiniWob++ 任務套件提供了一個基于 Selenium 的接口。DeepMind 決定實現一個可替代環境堆棧,旨在支持智能體可以在 web 瀏覽器中實現各種任務。該接口從安全性、特性和性能方面進行了優化 (圖 1a)。

原來的 MiniWob++ 環境實現通過 Selenium 訪問內部瀏覽器狀態并發出控制命令。相反,DeepMind 的智能體直接與 Chrome DevTools 協議 (CDP) 交互,以檢索瀏覽器內部信息。

智能體架構

DeepMind 發現沒有必要基于專門的 DOM 處理架構,相反,受最近關于多模態架構的影響,DeepMind 應用了最小模態特定處理,其主要依靠多模態 transformer 來靈活處理相關信息,如圖 2 所述。

感知。智能體接收視覺輸入(165x220 RGB 像素)和語言輸入(示例輸入顯示在附錄圖 9 中)。像素輸入通過一系列四個 ResNet 塊,具有 3×3 內核,strides 為 2、2、2、2,以及輸出通道(32、128、256、512)。這產生了 14×11 的特征向量,DeepMind 將其展平為 154 個 token 列表。

三種類型的語言輸入任務指令、DOM 和任務字段使用同一個模塊處理:每個文本字符串被分成 token,每個 token 映射被到大小為 64 的嵌入。

策略:智能體策略由 4 個輸出組成:動作類型、光標坐標、鍵盤鍵索引和任務字段索引。每個輸出都由單個離散概率分布建模,除光標坐標外,光標坐標由兩個離散分布建模。

動作類型是從一組 10 種可能的動作中選擇的,其中包括一個無操作(表示無動作)、7 個鼠標動作(移動、單擊、雙擊、按下、釋放、上滾輪、下滾輪)和兩個鍵盤動作(按鍵、發出文本)。

DeepMind 從 77 名人類參與者那里收集了超過 240 萬個 104 MiniWob++ 任務演示,總計大約 6300 小時,并使用模仿學習和強化學習 (RL) 的簡單混合來訓練智能體。

實驗結果

MiniWob++ 上的人類水平性能

由于大部分研究通常只解決了 MiniWob++ 任務的一個子集,因此該研究在每個單獨的任務上采用已公開的最佳性能,然后將這些子任務的聚合性能與該研究提出的智能體進行比較。如下圖 3 所示,該智能體大大超過了 SOTA 基準性能。

此外, 該智能體在 MiniWob++ 任務組件中實現了人類水平的平均性能。這種性能是通過結合 BC 和 RL 聯合訓練來實現的。

研究者發現,雖然該智能體的平均性能與人類相當,但有些任務人類的表現明顯優于該智能體,如下圖 4 所示。 

任務遷移

研究者發現,與在每個任務上單獨訓練的智能體相比,在 MiniWob++ 的全部 104 個任務上訓練一個智能體可以顯著提升性能,如下圖 5 所示。

擴展

如下圖 7 所示,人類軌跡數據集(human trajectory dataset)的大小是影響智能體性能的關鍵因素。使用 1/1000 的數據集,大約相當于 6 小時的數據,會導致快速過擬合,并且與僅使用 RL 的性能相比沒有顯著提升。隨著該研究將此基線的數據量增加到三個數量級直至完整數據集大小,智能體的性能得到了持續的提升。

此外,研究者還注意到,隨著算法或架構的變化,在數據集大小上的性能可能會更高。

消融實驗

該智能體使用像素和 DOM 信息,并且可以配置為支持一系列不同的操作。該研究進行了消融實驗以了解各種架構選擇的重要性。

該研究首先消融不同的智能體輸入(圖 8a)。當前的智能體配置強烈依賴 DOM 信息,如果刪除此輸入,性能會下降 75%。相反,視覺信息的輸入對該智能體的影響不太顯著。

如圖 8b 所示,該研究移除了智能體使用環境給定的文本輸入選項(任務字段)的能力。有趣的是,移除之后的智能體仍然能夠解決涉及表單填寫的任務,但它是通過 highlight 文本,并將其拖動到相關的文本框,以從人類軌跡中學會完成這個任務。值得注意的是,在原始 Selenium 版本的環境中智能體實現這種拖動操作并不簡單。

圖 8b 還展示了一個消融實驗結果,其中智能體使用與特定 DOM 元素交互的替代動作。這意味著智能體無法解決涉及單擊畫布內特定位置、拖動或 highlight 文本的任務。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-07-12 14:56:30

AI模型研究

2020-10-28 10:05:00

AI 數據人工智能

2024-10-28 10:30:00

AI開源模型

2025-06-03 14:16:40

編程AI生成

2024-04-07 00:20:00

智能體技術

2020-10-11 21:39:35

計算機互聯網 技術

2022-12-02 15:25:03

2020-01-09 17:03:29

人工智能技術算法

2020-09-30 17:12:09

人工智能技術數據

2023-02-23 15:35:14

人工智能ChatGPT聊天機器人

2022-07-28 14:46:01

人工智能機器人計算機科學

2017-04-05 12:16:21

2023-04-05 14:19:07

FlinkRedisNoSQL

2017-03-16 09:26:27

谷歌神經網絡智能化

2024-03-14 11:55:21

2021-12-20 16:23:40

AI 數據人工智能

2022-07-12 16:46:45

DeepMindAIAlphaFold?

2015-07-02 14:55:39

款穿戴設備規則Fitbit

2020-05-08 15:48:33

手機PCAndroid
點贊
收藏

51CTO技術棧公眾號

日韩精品欧美成人高清一区二区| **日韩最新| 久久综合999| 国产精品一区=区| 欧美xxxx黑人xyx性爽| 91国内精品白嫩初高生| 色菇凉天天综合网| 国产一区二区三区播放| 五月婷在线视频| 久久99国产精品久久99果冻传媒| 欧美激情亚洲视频| 五月婷婷欧美激情| 国产伦理久久久久久妇女| 在线观看91视频| 一本色道久久88亚洲精品综合| 亚洲色欧美另类| 精东粉嫩av免费一区二区三区| 久久久久久久网站| 黄色激情小视频| 台湾佬综合网| 欧美va亚洲va在线观看蝴蝶网| 免费看黄色一级大片| 国产区美女在线| 国产精品精品国产色婷婷| 精品不卡在线| www.色日本| 久久精品国产网站| 国产91网红主播在线观看| 久久综合亚洲色hezyo国产| 日韩欧美高清| 亚洲人成电影网| 性农村xxxxx小树林| 四虎地址8848精品| 欧美在线999| 日韩视频在线免费看| 日本在线观看高清完整版| 中文字幕一区av| 日本精品一区二区| 日本不卡视频一区二区| 成人免费视频视频| av蓝导航精品导航| 国产视频在线观看视频| 麻豆国产欧美一区二区三区| 国产高清在线不卡| 日韩一区二区视频在线| 亚洲高清网站| 97高清免费视频| 国产一级在线观看视频| 欧美 日韩 国产 一区| 久久久极品av| 国产黄色小视频网站| 久久伦理在线| 日韩亚洲综合在线| 国产精品视频看看| 色综合狠狠操| 最近中文字幕日韩精品| 在线观看日本黄色| 久久高清免费| 久久精品视频在线观看| 日日碰狠狠添天天爽| 欧美国产一级| 不卡毛片在线看| 国产日韩欧美在线观看视频| 欧美成人国产| 高清欧美性猛交| 日本一二三区不卡| 亚洲一区二区伦理| 国产精品爱久久久久久久| 黄色网址中文字幕| 精品一区二区综合| 电影午夜精品一区二区三区| 色呦呦视频在线| 91香蕉视频黄| 亚洲高清在线观看一区| 男人在线资源站| 亚洲乱码中文字幕综合| 日韩精品在线中文字幕| 中文字幕 在线观看| 欧美性xxxxxxxx| 亚洲热在线视频| 国产精品极品| 亚洲性猛交xxxxwww| 殴美一级黄色片| 欧美精品一卡| 日韩av电影在线网| 国产乱人乱偷精品视频| 国产宾馆实践打屁股91| 久久国产精品久久| av在线免费观看网站| 亚洲精品菠萝久久久久久久| 野外做受又硬又粗又大视频√| 涩涩在线视频| 欧美日韩第一区日日骚| 涩视频在线观看| 精品一级毛片| 欧美精品18videos性欧美| 一区二区三区福利视频| 黄色资源网久久资源365| 国产精品一区二区免费看| 男女网站在线观看| 亚洲欧美乱综合| 欧美 日韩 国产一区| 91丨精品丨国产| 日韩精品在线观看视频| www.xxxx日本| 老鸭窝91久久精品色噜噜导演| 92国产精品视频| 蜜桃视频在线免费| 一区二区三区欧美亚洲| 簧片在线免费看| 欧美黄色影院| 久久久精品在线观看| 精品国产xxx| 成人一区在线看| 一区二区三区四区久久| 新片速递亚洲合集欧美合集| 亚洲成人黄色网| 九九精品视频免费| 青青草国产成人99久久| 久久精品美女| 好看的中文字幕在线播放| 欧美另类久久久品| 黑人巨大精品欧美| 亚洲一级二级| 97视频热人人精品| 男人在线资源站| 欧美在线free| 国产jk精品白丝av在线观看 | 日韩av电影免费在线观看| 中文在线免费| 欧美精品vⅰdeose4hd| xxxxx在线观看| 影音先锋久久| 国产高清精品一区| 亚洲奶水xxxx哺乳期| 欧美亚男人的天堂| 中文字幕第20页| 母乳一区在线观看| 久久久精品国产一区二区三区| 青草视频在线免费直播 | 一区二区免费在线观看视频| 男同在线观看| 香蕉乱码成人久久天堂爱免费| www.污污视频| 久久精品播放| 国产精品网站入口| melody高清在线观看| 欧美综合一区二区三区| 91精品国产综合久久婷婷香蕉| 真实乱视频国产免费观看| 日韩午夜在线电影| 国产视色精品亚洲一区二区| 国产三线在线| 亚洲精品一区二区三区精华液 | 日本在线播放一区二区三区| 欧美成人dvd在线视频| 日韩av一卡| 亚洲人成网站999久久久综合| 69视频免费在线观看| 337p粉嫩大胆色噜噜噜噜亚洲| www国产黄色| 国产一区毛片| 91精品久久久久久久久久久久久| 麻豆视频在线观看免费| 91精品国产91久久综合桃花| 顶臀精品视频www| 国产精品系列在线观看| 日本手机在线视频| 亚洲免费成人av在线| 国产精品99久久久久久白浆小说| 国产三级在线| 欧美美女网站色| 黄色在线观看免费| 91污在线观看| 尤物国产在线观看| 欧美理论在线| 久久久com| 久久爱.com| 欧美大尺度激情区在线播放| 三级网站免费观看| 欧美三级一区二区| 欧美黄色免费观看| 国产欧美日韩综合| 一级黄色大片免费看| 国产精品毛片在线看| 视频一区二区综合| 91亚洲无吗| 亚州国产精品久久久| 97超碰国产一区二区三区| 日韩一二三四区| aaaaaa毛片| 亚洲欧美另类小说| 国产精品成人一区二区三区电影毛片 | 色婷婷av一区二区三区久久| 国内精品久久久久久久久久久| 岛国av一区二区三区| 蜜臀av午夜精品久久| 91在线看国产| 色偷偷中文字幕| 六月丁香综合| 欧美极品少妇无套实战| 欧美一区二区三| 国产女人水真多18毛片18精品| 成人免费视频观看| 97视频在线播放| dy888亚洲精品一区二区三区| 亚洲精品天天看| 亚洲成人一二三区| 欧美日韩国产另类一区| av资源免费观看| 一区二区三区高清| 中文字幕第二区| 久久午夜羞羞影院免费观看| 精品久久久久久无码人妻| 麻豆精品精品国产自在97香蕉 | 国产在线不卡视频| 91av俱乐部| 国产精品日韩| a级免费在线观看| 久久精品亚洲欧美日韩精品中文字幕| 欧美在线视频二区| 婷婷成人在线| 国产日韩精品一区观看| 久久久久九九精品影院| 国产精品一区=区| 成人不卡视频| 国产精品91免费在线| 最近高清中文在线字幕在线观看1| 欧美肥老妇视频| 二区三区在线观看| 色偷偷88888欧美精品久久久| 好男人免费精品视频| 亚洲精品国产精品国自产观看浪潮| 亚洲国产视频一区二区三区| 91麻豆精品国产91久久久久 | 日韩影院在线| 91wwwcom在线观看| 第一福利在线视频| 国内精品久久影院| 毛片大全在线观看| 国产69精品久久久久9| 女同视频在线观看| 久久久久国产视频| 成人免费网站观看| 青青草原一区二区| 日韩电影网站| 国产精品高潮呻吟久久av无限 | 国产3级在线观看| 国产精品免费人成网站| 国产在线免费av| 自拍偷拍国产亚洲| 日本妇女毛茸茸| 亚洲午夜久久久久| 日韩免费不卡视频| 狠狠综合久久av一区二区小说 | av女在线播放| 欧洲永久精品大片ww免费漫画| 超碰一区二区| 国产精品久久久久久久久久久久| 国产成+人+综合+亚洲欧美| 国产精品亚洲精品| 综合欧美精品| 国产伦精品一区二区三区四区视频 | 日韩精品资源二区在线| 高h放荡受浪受bl| 日韩精品在线电影| gogogo高清在线观看免费完整版| 日韩中文字幕免费视频| 在线观看午夜av| 国内精品久久久久久影视8| 高清成人在线| 91精品视频免费看| 精品欠久久久中文字幕加勒比| 欧美日韩无遮挡| 亚洲色图网站| 国产视频一视频二| 免费成人av在线播放| 色哟哟免费视频| 91丝袜美腿高跟国产极品老师| 人妻精品久久久久中文| 亚洲欧美一区二区三区久本道91| 国产性猛交普通话对白| 色成年激情久久综合| 91在线公开视频| 日韩成人在线播放| 香蕉视频免费在线播放| 久久久亚洲影院| 69堂精品视频在线播放| 97神马电影| 日韩精品午夜| 精品无码国模私拍视频| 日本麻豆一区二区三区视频| 日本天堂在线播放| 国产精品色一区二区三区| 国产 日韩 欧美 成人| 欧美三级三级三级| 天堂在线视频观看| 日韩在线播放视频| 欧美7777| 国产在线播放一区二区| 图片区亚洲欧美小说区| 2022亚洲天堂| 国产成人精品1024| 日韩av片在线免费观看| 福利一区福利二区微拍刺激| 夜夜躁很很躁日日躁麻豆| 亚洲国产精品999| 国产二区三区在线| 国产成人综合亚洲| 卡通动漫精品一区二区三区| 精品一区二区成人免费视频| 亚洲永久在线| 激情av中文字幕| 亚洲欧美激情小说另类| 久久久999久久久| 精品网站999www| a级片免费在线观看| 亚洲影院色在线观看免费| 青青一区二区三区| 日韩精品一区二区三区不卡 | 欧美一区在线视频| h网站视频在线观看| 热久久免费视频精品| 国产欧美自拍一区| 国产一区二区四区| 国产高清久久久| 五月综合色婷婷| 欧美日韩第一区日日骚| 91美女视频在线| 国产精品日韩久久久久| av中字幕久久| 亚洲国产精品yw在线观看| 日韩 欧美 综合| 欧美精品一区视频| 国内在线视频| 国产精品乱码一区二区三区| 欧美激情一级片一区二区| 亚洲高清视频免费| 亚洲情趣在线观看| 精品国产av鲁一鲁一区| 粗暴蹂躏中文一区二区三区| 综合久草视频| 免费看黄色a级片| 国产99精品国产| 久久久久久久久久一区二区三区| 欧美一区二区三区免费在线看| 二区三区在线观看| 99www免费人成精品| 黄色成人在线网址| 国模私拍在线观看| 精品福利在线观看| 每日更新av在线播放| 国产成人精品免费视频| 欧洲美女日日| 加勒比av中文字幕| 亚洲精品综合在线| 欧美一区二区三区激情| 91国偷自产一区二区三区的观看方式 | 欧美性猛片aaaaaaa做受| 成人在线高清视频| 成人激情av在线| 伊人狠狠色j香婷婷综合| 无码人妻精品一区二区三| 精品magnet| av大全在线免费看| 亚洲在线观看视频| 黄色日韩在线| 丰满少妇在线观看资源站| 在线免费观看不卡av| 在线播放日本| 成人自拍网站| 久久中文欧美| 日韩在线观看免| 欧美精品一区二区三区四区| 国产欧美一区二区三区精品酒店| 亚洲高清视频在线观看| 国产iv一区二区三区| 成人免费a视频| 色婷婷综合久久久久| 麻豆一区二区麻豆免费观看| 丰满少妇在线观看| 一级特黄大欧美久久久| 色视频在线看| 亚洲精品欧美日韩专区| 国产精品嫩草99av在线| 日本不卡一区视频| 亚洲国产又黄又爽女人高潮的| 怡红院成人在线| 青青草原网站在线观看| 久久天堂av综合合色蜜桃网| 国产露脸91国语对白| 欧美亚洲激情视频| 综合国产在线| 免费在线观看a视频| 精品久久久久久无| 亚州精品国产| 欧美日韩第二页| 亚洲制服丝袜在线| 日本免费在线观看| 欧美日韩在线精品|