精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

強化學習AI能帶你1打5嗎?MIT新研究:AI并不是人類的最佳隊友

新聞 深度學習
MIT最近研究表明,AI和人類玩家之間的配合可以說是沒有配合了,根本看不懂隊友給的各種暗示信息!

[[433351]]

 強化學習的AI在圍棋、星際爭霸、王者榮耀等游戲以絕對的優勢碾壓了人類玩家,也證明了思維能力可以通過模擬來得到。

但如果這么強的AI成為了你的隊友,能被帶飛嗎?

MIT林肯實驗室的研究人員最近的在紙牌游戲Hanabi(花火)中人類和AI agenet之間的合作研究結果表明,盡管RL agent的個人表現能力十分出色,但當跟人類玩家一起匹配的時候,卻只會讓人直呼太坑。

強化學習AI能帶你1打5嗎?MIT新研究:AI并不是人類的<span><span><span><i style=最佳隊友">

https://arxiv.org/pdf/2107.07630.pdf

Hanabi是一個需要玩家之間互相溝通合作取勝的游戲,在這個游戲中,人類玩家更喜歡可預測的基于規則的AI系統,而非黑盒的神經網絡模型。

強化學習AI能帶你1打5嗎?MIT新研究:AI并不是人類的<span><span><span><i style=最佳隊友">

一般來說,最先進的游戲機器人使用的算法都是深度強化學習(deep reinforcement learning)。首先通過在游戲中提供一個agent和一組可能的候選action集合,通過來自環境的反饋機制來進行學習。在訓練過程中,還會采用隨機的探索action來最大化目標,從而獲得最優的action序列。

深增強學習的早期研究依靠人類玩家提供的游戲數據進行學習。最近研究人員已經能夠在沒有人類數據的情況下,純粹依靠自我博弈來開發RL agent。

MIT 林肯實驗室的研究人員更關注讓如此強大的AI 如何成為隊友,這項工作也能讓我們進一步了解是什么阻礙了強化學習的應用只能局限于電子游戲,而無法擴大到現實應用中。

強化學習AI能帶你1打5嗎?MIT新研究:AI并不是人類的<span><span><span><i style=最佳隊友">

最近的強化學習研究大多應用于單人游戲(Atari Breakout 打磚塊)或者對抗性游戲(星際爭霸,圍棋),其中AI 主要的對手是人類玩家或者是其他的AI 機器人。

在這些對抗中,強化學習取得了空前的成功,因為機器人對這些游戲并沒有一些先入為主的偏見和假設,而是從零開始學習打游戲,并以最好的玩家數據進行訓練。

事實上,AI學會打游戲以后,甚至還會自己創造一些技巧。一個有名的例子是DeepMind的alphago在它的比賽中下了一步棋,但分析師當時認為這一步棋是一個錯誤,因為它違背了人類專家的直覺。

但同樣的舉動卻帶來了不一樣的結果,AI最后憑借這手成功擊敗了人類。所以當RL agent與人類合作時,研究人員認為同樣的聰明才智也可以發揮作用。

[[433353]]最佳隊友">

在MIT研究人員的實驗中選擇了紙牌游戲Hanabi,其中包括兩到五名玩家,他們必須合作以特定的順序出牌。Hanabi 很簡單,但它也是一個需要合作和有限的信息的游戲。

Hanabi游戲發明于2010年,由二到五個玩家參與,玩家需以正確的順序一起打出五種不同顏色的牌。游戲特點:所有玩家都可以看到對方的牌,但卻看不到自己的牌。

根據游戲規則,玩家可以互相提示自己手里的牌(但僅限于牌的顏色或數字),讓其他玩家可以推斷他們應該出什么牌,但提示的次數是有限制的。

正是這種高效溝通的行為使Hanabi具備了一種科學魅力。例如,人類可以很自然地理解其他玩家的提示,哪張卡片是可出的,但是機器本質上無法理解這些提示。

到目前為止人工智能程序已經可以在玩Hanabi花火游戲時贏得很高分數,但只限于與其他類似的智能機器人一起玩。在不熟悉其他玩家的游戲風格或者有「臨時」(從未一起玩過的)玩家的情況下,對程序的挑戰最大,也更接近真實情況。

近年來,幾個研究團隊探討了可以玩Hanabi的AI機器人的發展,其中一些強化學習agent使用符號AI。

AI的評估主要采用他們的性能,包括self-play(和自己玩),cross-play(和其他類型的agent一起玩),Human-play(和人類合作)。

強化學習AI能帶你1打5嗎?MIT新研究:AI并不是人類的<span><span><span><i style=最佳隊友">

和人類玩家之間的cross-play,對于衡量人與機器之間的合作尤為重要,也是論文實驗的基礎。

為了檢驗人工智能協作的有效性,研究人員使用了SmartBot,這是一種基于規則的self-play人工智能系統,還有一種在跨游戲和RL算法中排名最高的模型Hanabi機器人Other-Play。

在實驗中,人類參與者與AI agent一起玩了幾次Hanabi游戲,每次隊友的AI都不相同,實驗人員并不知道在和哪個模型一起玩。

研究人員根據客觀和主觀指標評估了人類AI合作的水平。客觀指標包括分數、錯誤率等。主觀指標包括人類玩家的經驗,包括他們對AI團隊成員的信任和舒適程度,以及他們理解AI動機和預測其行為的能力。

兩種人工智能模型的客觀表現無顯著差異。但研究人員預計,人類玩家對Other-Play有更積極的主觀體驗,因為他們接受過與其他玩家合作的訓練。

根據對參與者的調查,與基于規則的SmartBot Agent相比,經驗豐富的Hanabi玩家在其他游戲RL算法方面的經驗較少,成功的一個關鍵點是為其他玩家提供偽裝線索的技能。

例如,說「一個方塊」卡放在桌子上,你的隊友手里拿著兩個方塊。當你指著卡片說「這是兩張」或「這是一個正方形」時,你暗地里告訴你的隊友玩這張卡片,而不告訴他關于卡片的全部信息。一個經驗豐富的玩家會立刻就能夠領會這個提示。但向AI 隊友提供相同類型的信息證明要困難得多。

一個參與者表示,我已經給了隊友很明顯的提示了,但他根本就沒用,我不知道為什么。

一個有趣的現實是,Other-play一直在避免創建「秘密」的約定,他們只是在執行self-play時開發的這些預定規則。這使得Other-play成為其他AI算法的最佳隊友,盡管AI算法并不是其訓練計劃的一部分。但研究人員認為,這是他在訓練過程中已經假設了會遇到哪些類型的隊友。

值得注意的是,Other-play假設隊友也針對zero-shot 協調進行了優化。相比之下,人類Hanabi玩家通常不會使用這種假設進行學習。

游戲前常規設置和游戲后復盤是人類Hanabi玩家的常見做法,使人類學習更容易獲得few-shot協調的能力。

研究人員表示,目前的研究結果表明,人工智能的客觀任務表現(self-play和cross-play)在與其他AI模型合作時,可能與人類的信任和偏好無關。

這就產生了一個問題:哪些客觀指標與主觀的人類偏好相關?

[[433354]]最佳隊友">

鑒于訓練基于RL的agent所需的數據量巨大,訓練環中的人是不可行的。因此,如果我們想訓練被人類合作者接受和評估的AI agent,我們需要找到可訓練的,可以替代或與人類偏好密切相關的目標函數。

同時,研究人員也說明,不要將Hanabi實驗的結果外推到他們無法測試的其他環境、游戲或領域。

論文還承認了實驗中的一些局限性,研究人員正在努力解決這些局限性。例如,受試者群體很小(只有29名參與者),并且偏向于精通Hanabi的人,這意味著他們已經預先定義了AI團隊成員的行為期望,并且更有可能對RL agent有負面體驗。

然而,研究結果對未來加強學習研究具有重要意義。

如果最先進的RL agent甚至不能在一個限制性和窄范圍的游戲中成為一個可以接受的合作者,那么我們真的應該期待同樣的RL技術在應用于更復雜、更微妙、更具后果性的游戲和現實世界的情況時只是可以用。

在技術和學術領域,關于強化學習的爭論很多,而且確實如此,研究結果也表明不應將RL系統的顯著性能視為在所有可能的應用中都能獲得相同的高性能。

在學習型智能體在復雜的人類機器人交互等情況下成為有效的合作者之前,需要更多的理論和應用工作。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-10-18 22:18:09

2024-09-23 15:04:16

2025-03-03 09:12:00

2024-09-03 13:30:00

2019-01-31 10:42:04

框架AI開發

2018-02-25 19:20:13

軟件定義SD-WAN廣域網

2025-10-10 08:41:13

AI AgentAI代理

2022-05-09 11:23:43

人工智能機器學習推理

2022-03-13 23:19:04

元宇宙區塊鏈數字貨幣

2022-11-27 12:50:01

AI算法MIT

2023-06-01 17:26:25

人工智能

2025-10-11 04:00:00

2011-07-26 13:47:06

AndroidLinux

2015-12-17 11:04:00

云開支云計算

2015-05-08 07:29:42

OpenStack云方案云服務成本

2021-07-15 06:43:12

SQLSelect命令

2024-08-09 12:46:04

2011-08-31 15:52:26

微軟

2011-07-28 09:45:59

云計算

2024-10-23 09:00:00

點贊
收藏

51CTO技術棧公眾號

免费福利视频一区二区三区| 香蕉视频911| 先锋资源久久| 亚洲成人教育av| 蜜臀av午夜一区二区三区| 国产精品麻豆一区二区三区 | 狠狠躁狠狠躁视频专区| 黄网址在线观看| 99精品热视频| 91中文字幕在线观看| 圆产精品久久久久久久久久久| 久久综合欧美| 精品久久人人做人人爱| 色综合一个色综合亚洲| 亚洲九九在线| 欧美日韩一区二区在线观看视频| 特色特色大片在线| 欧美一区二区三区少妇| 国产精品影音先锋| 国产精品对白刺激| 国产午夜精品无码一区二区| 日韩一区三区| 日韩精品在线观看一区二区| 亚洲成人手机在线观看| 激情aⅴ欧美一区二区欲海潮| 国产精品高潮久久久久无| 精品欧美日韩| 性一交一乱一乱一视频| 麻豆传媒一区二区三区| 日本成人黄色片| 日本一级片免费看| 欧美日韩国产免费观看| xxxxxxxxx欧美| 无码国产69精品久久久久同性| 操欧美女人视频| 91精品国产91久久综合桃花| 69久久久久久| 偷拍视频一区二区三区| 欧美日韩国产综合新一区| 成人短视频在线观看免费| 日韩美女网站| 国产精品视频在线看| 欧美极品色图| 日韩av免费观影| av电影在线观看完整版一区二区| www 成人av com| 国产欧美日韩综合精品一区二区三区| 日韩不卡一区二区| 国产精品久久久亚洲| 一区二区三区美女视频| 国产又粗又长又爽视频| a毛片在线看免费观看| 国产精品国产三级国产aⅴ入口| 污视频在线免费观看一区二区三区 | 色综合激情五月| 久久国产亚洲精品无码| 黄视频网站在线观看| 精品国产91久久久久久| 日韩av黄色网址| 婷婷六月国产精品久久不卡| 色狠狠av一区二区三区| 欧美 激情 在线| 欧美男女交配| 欧美日韩在线播放三区四区| 日本特黄a级片| 婷婷成人av| 欧美videos大乳护士334| 18禁一区二区三区| 激情亚洲另类图片区小说区| 亚洲精品xxx| av网站免费在线播放| 国产精品一区二区99| 伊人伊成久久人综合网小说| 天天操夜夜操av| 欧美激情综合| 欧美亚洲一级片| 中国黄色一级视频| 国产精品亚洲成人| 国产一区二区三区色淫影院| 欧美精品少妇| 国产精品毛片高清在线完整版 | 国产美女福利在线| 一二三区精品视频| 日韩av三级在线| 四虎4545www精品视频| 欧美日韩国产系列| 日本天堂在线播放| 女人丝袜激情亚洲| 久久九九有精品国产23| 自拍偷拍欧美亚洲| 蜜臀av性久久久久蜜臀av麻豆| 亚洲专区中文字幕| 日本中文字幕电影在线观看| 国产精品高潮久久久久无| 欧美一级欧美一级| 2019年精品视频自拍| 欧美成人三级在线| 精品无码国产污污污免费网站| 99久久综合| 欧美一区二粉嫩精品国产一线天| 一级片在线免费观看视频| 成人午夜大片免费观看| 日韩视频在线观看国产| 在线中文字幕-区二区三区四区| 高跟丝袜欧美一区| 国产高清av片| 美女精品一区最新中文字幕一区二区三区| 最好看的2019的中文字幕视频| 久久久久黄色片| 男女性色大片免费观看一区二区| 国外成人在线视频网站| 在线看av的网址| 亚洲一区二区三区四区五区中文| 国产一二三四在线视频| 国内露脸中年夫妇交换精品| 日韩中文字幕欧美| 亚洲永久精品在线观看| 国产成人综合网站| 色播五月综合| 综合另类专区| 亚洲国产天堂久久综合网| 亚洲精品国产精品国自| 国产日韩综合| 99影视tv| 欧美人xxx| 色噜噜狠狠一区二区三区果冻| 国产chinesehd精品露脸| 日韩欧美午夜| 国产精品久久在线观看| 视频国产在线观看| 亚洲成人自拍网| 日本少妇一区二区三区| 日韩中文首页| 国产欧美日韩综合精品| 黄色小视频在线免费观看| 亚洲国产综合色| 2018国产精品| 欧美国产激情| 成人性生交xxxxx网站| 成人免费在线电影| 日韩欧美在线第一页| 欧美大喷水吹潮合集在线观看| 欧美1区视频| 成人激情av| 超碰在线免费播放| 欧美一级xxx| 欧美日韩免费一区二区| 国产不卡高清在线观看视频| 欧美日韩中文字幕在线播放| 久久伦理中文字幕| 欧美精品做受xxx性少妇| 国产日韩一级片| 亚洲卡通欧美制服中文| 99九九精品视频| 欧美777四色影| 999久久久| 男女免费观看在线爽爽爽视频| 日韩精品一区二区三区视频在线观看| 欧美极品aaaaabbbbb| 国产91精品一区二区麻豆亚洲| 国产成人免费高清视频| 99久久香蕉| 欧美黑人国产人伦爽爽爽| 黑人精品一区二区三区| 精品久久久久久久久国产字幕| 青青草视频成人| 免费欧美日韩国产三级电影| 一区二区三区av| 欧美久久一区二区三区| 91精品国产精品| 国产福利免费在线观看| 在线不卡欧美精品一区二区三区| 黄色一级片中国| 99视频有精品| 亚洲污视频在线观看| 欧美在线亚洲| 欧美成人免费在线| 国精品产品一区| 久久91亚洲精品中文字幕奶水| 天天干天天做天天操| 在线免费观看日本欧美| 小泽玛利亚一区| www.视频一区| 亚洲精品性视频| 亚洲国产日韩欧美一区二区三区| 欧美在线播放一区| 99精品国产九九国产精品| 久久久久国色av免费观看性色| 全色精品综合影院| 欧美精品日韩一区| 精品成人免费视频| 国产精品国产三级国产普通话蜜臀| 两女双腿交缠激烈磨豆腐| 国产亚洲午夜| 老司机午夜网站| 亚洲三级网址| 春色成人在线视频| 91福利精品在线观看| 久久久久国产精品一区| 日韩美女网站| 日韩av在线资源| 99久久婷婷国产一区二区三区| 精品国产999| 曰本女人与公拘交酡| 国产无人区一区二区三区| 亚洲精品一区二区18漫画| 日韩av中文字幕一区二区三区| www婷婷av久久久影片| 精品日韩免费| 精品无人乱码一区二区三区的优势| 全球最大av网站久久| 91成人在线视频| 日皮视频在线观看| 综合136福利视频在线| 男男激情在线| 亚洲精品电影在线观看| jizz中国少妇| 欧美美女一区二区| 久久精品五月天| 精品久久久免费| 青娱乐在线视频免费观看| 综合色天天鬼久久鬼色| xxxxx99| 国产三级一区二区| 黄色污在线观看| 成人手机电影网| 国产精品熟女一区二区不卡| 看片网站欧美日韩| 一区二区成人网| 久久人人97超碰国产公开结果| 自拍日韩亚洲一区在线| 国产一区美女| 中文字幕日本欧美| 天堂中文在线观看视频| 欧美大胆人体bbbb| 国产手机av在线| 91精品久久久久久久久99蜜臂| 中文字幕精品一区二| 欧洲一区在线电影| 无码人妻丰满熟妇区bbbbxxxx| 欧美日韩激情视频8区| 国产午夜精品无码| 五月婷婷色综合| 国产精品视频123| 黑人精品xxx一区一二区| 久久国产黄色片| 色综合久久综合网97色综合 | 国产日韩欧美亚洲一区| 影音先锋欧美激情| 国产精品欧美久久| 国产91精品入| 精品一卡二卡三卡四卡日本乱码| 国产女人18毛片水真多18精品| 国产精品国色综合久久| 精品一区二区男人吃奶| 韩国成人动漫在线观看| 亚洲伊人春色| 色一情一区二区三区四区| 日韩精品一区二区久久| 中文字幕欧美日韩一区二区| 亚洲在线久久| www.avtt| 久久国产精品毛片| 免费一级特黄录像| 国内精品伊人久久久久av一坑| 性色av浪潮av| 99精品黄色片免费大全| 国产亚洲精品熟女国产成人| 国产精品麻豆欧美日韩ww| 国语对白在线播放| 香蕉影视欧美成人| 中文字幕精品无| 欧美一区欧美二区| 人妻91麻豆一区二区三区| 国产视频在线一区二区| yourporn在线观看中文站| 日韩中文字幕第一页| 欧美精品videossex少妇| 91精品国产免费久久久久久| 99只有精品| av色综合网| 精品产国自在拍| 玖玖精品在线视频| 香蕉精品999视频一区二区| 国产精品嫩草影院8vv8| 成人午夜激情在线| 人人妻人人澡人人爽| 一区二区三区波多野结衣在线观看| 成人免费区一区二区三区| 欧美日韩免费高清一区色橹橹| 丰满人妻一区二区三区免费视频| 国产视频精品免费播放| 激情视频在线观看| 日产精品久久久一区二区福利| 精品视频在线播放一区二区三区| 精品福利影视| 亚洲精品888| 不卡影院一区二区| 国产成人h网站| а天堂中文在线资源| 婷婷成人综合网| 精品毛片在线观看| 中文字幕日韩av| 亚洲十八**毛片| av在线不卡一区| 97在线精品| 国产97色在线 | 日韩| 国产成人综合亚洲网站| 欧美性猛交xxxx乱大交少妇| 欧美日韩一区二区精品| www.蜜桃av.com| 日韩中文字幕在线看| 电影一区二区三| 国产伦精品一区二区三区视频孕妇| 91亚洲国产| 欧美日韩在线免费播放| 99九九99九九九视频精品| 波多野结衣爱爱视频| 欧美日韩高清一区二区不卡| 国产毛片在线| 国产suv精品一区二区三区88区| 福利欧美精品在线| 91精品国产吴梦梦| 美女视频一区在线观看| 亚洲区自拍偷拍| 欧美性猛交xxxx乱大交蜜桃| 欧美一级淫片免费视频魅影视频| 久热精品视频在线观看| 九九热这里有精品| 图片区小说区区亚洲五月| 视频在线在亚洲| 国产男男chinese网站| 激情亚洲一区二区三区四区| 黄色a在线观看| 久久久久久国产精品三级玉女聊斋 | 亚洲黄色成人| 激情av中文字幕| 亚洲一区二区三区在线播放| a天堂在线视频| 欧美日韩成人网| 澳门久久精品| xxxx18hd亚洲hd捆绑| 不卡高清视频专区| xxxxxx国产| 日韩精品999| 97成人资源| 色就是色欧美| 久久er精品视频| 黄色一级片中国| 精品国产伦理网| 自拍视频在线看| 日韩av不卡播放| 美腿丝袜亚洲一区| 国产精品丝袜一区二区| 欧美电影精品一区二区| 51精品在线| 欧美午夜精品久久久久久蜜| 丝袜诱惑亚洲看片| 国产又黄又粗又猛又爽的| 91精品一区二区三区在线观看| av网站网址在线观看| 国产三级精品在线不卡| 亚洲欧美大片| 国产主播av在线| 日韩欧美亚洲一区二区| 免费高潮视频95在线观看网站| 欧美日韩免费高清| 美女尤物国产一区| 青青操视频在线播放| 亚洲精品乱码久久久久久金桔影视 | 日本成人黄色片| 欧美肥老太太性生活| 国产精品19p| 色综合久久六月婷婷中文字幕| 超碰免费97在线观看| 99国产超薄肉色丝袜交足的后果| 亚洲免费大片| 亚洲av毛片基地| 日韩精品一区二区三区老鸭窝| 日韩欧美精品一区二区三区| 香蕉久久免费影视| 国产成人自拍高清视频在线免费播放| 国产精品99无码一区二区| 亚洲欧美国产一本综合首页| 日本亚洲欧洲无免费码在线| 福利视频免费在线观看| 欧美国产一区视频在线观看| 亚洲精品国产精| 国产精品va在线播放| 欧美精品二区| 中文字幕免费视频| 日韩精品中文字幕在线一区| 婷婷激情一区| 国产精品一线二线三线| 亚洲国产精品激情在线观看| 国 产 黄 色 大 片| 国产中文日韩欧美| 国产精品视区| 久久国产露脸精品国产| 最近中文字幕日韩精品 |