精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用魔法打敗魔法!一個叫板頂級人類棋手的圍棋AI輸給了它的同類

人工智能 新聞
AI:「我能戰(zhàn)勝頂級人類玩家。」另一個 AI:「我玩不過人類,但我能戰(zhàn)勝你。」

近幾年,自我博弈中的強(qiáng)化學(xué)習(xí)已經(jīng)在圍棋、國際象棋等一系列游戲中取得了超人的表現(xiàn)。此外,自我博弈的理想化版本還收斂于納什均衡。納什均衡在博弈論中非常著名,該理論是由博弈論創(chuàng)始人,諾貝爾獎獲得者約翰 · 納什提出,即在一個博弈過程中,無論對方的策略選擇如何,當(dāng)事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果任意一位參與者在其他所有參與者的策略確定的情況下,其選擇的策略是最優(yōu)的,那么這個組合就被定義為納什均衡。

之前就有研究表明,自我博弈中看似有效的連續(xù)控制策略也可以被對抗策略利用,這表明自我博弈可能并不像之前認(rèn)為的那樣強(qiáng)大。這就引出一個問題:對抗策略是攻克自我博弈的方法,還是自我博弈策略本身就能力不足?

為了回答這個問題,來自 MIT、 UC 伯克利等機(jī)構(gòu)的研究者進(jìn)行了一番研究,他們選擇自我博弈比較擅長的領(lǐng)域進(jìn)行,即圍棋(Go)。具體而言,他們對公開可用的最強(qiáng)圍棋 AI 系統(tǒng) KataGo 進(jìn)行攻擊。針對一個固定的網(wǎng)絡(luò)(凍結(jié) KataGo),他們訓(xùn)練了一個端到端的對抗策略,僅用了訓(xùn)練 KataGo 時 0.3% 的計算,他們就獲得了一個對抗性策略,并用該策略攻擊 KataGo,在沒有搜索的情況下,他們的策略對 KataGo 的攻擊達(dá)到了 99% 的勝率,這與歐洲前 100 名圍棋選手實力相當(dāng)。而當(dāng) KataGo 使用足夠的搜索接近超人的水平時,他們的勝率達(dá)到了 50%。至關(guān)重要的是,攻擊者(本文指該研究學(xué)到的策略)并不能通過學(xué)習(xí)通用的圍棋策略來取勝。

這里我們有必要說一下 KataGo,正如本文所說的,他們在撰寫本文時,KataGo 還是最強(qiáng)大的公開圍棋 AI 系統(tǒng)。在搜索的加持下,可以說 KataGo 非常強(qiáng)大,戰(zhàn)勝了本身就是超人類的 ELF OpenGo 和 Leela Zero。現(xiàn)在該研究的攻擊者戰(zhàn)勝 KataGo,可以說是非常厲害了。

圖片

圖 1:對抗策略打敗了 KataGo 受害者。

圖片

  • 論文地址:https://arxiv.org/pdf/2211.00241.pdf
  • 研究主頁:https://goattack.alignmentfund.org/adversarial-policy-katago?row=0#no_search-board

有趣的是,該研究提出的對抗策略無法戰(zhàn)勝人類玩家,即使是業(yè)余選手也能大幅勝過所提模型。

攻擊方法

KataGo、AlphaZero 等之前的方法通常是訓(xùn)練智能體自己玩游戲,游戲?qū)κ质侵悄荏w自己。而在 MIT、UC 伯克利等機(jī)構(gòu)的這項研究中,攻擊者(adversary)和固定受害者(victim)智能體之間進(jìn)行博弈,利用這種方式訓(xùn)練攻擊者。該研究希望訓(xùn)練攻擊者利用與受害者智能體的博弈交互,而不只是模仿博弈對手。這個過程被稱為「victim-play」。

圖片

在常規(guī)的自我博弈中,智能體通過從自己的策略網(wǎng)絡(luò)中采樣來建模對手的動作,這種方法的確適用于自我博弈。但在 victim-play 中,從攻擊者的策略網(wǎng)絡(luò)中建模受害者的方法就是錯誤的。為了解決這個問題,該研究提出了兩類對抗型 MCTS(A-MCTS),包括:

  • A-MCTS-S:在 A-MCTS-S 中,研究者將攻擊者的搜索過程設(shè)置如下:當(dāng)受害者移動棋子時,從受害者策略網(wǎng)絡(luò)中采樣;當(dāng)輪到攻擊者移動棋子時,從攻擊者策略網(wǎng)絡(luò)中采樣。
  • A-MCTS-R:由于 A-MCTS-S 低估了受害者的能力,該研究又提出了 A-MCTS-R,在 A-MCTS-R 樹中的每個受害者節(jié)點上為受害者運行 MCTS。然而,這種變化增加了攻擊者訓(xùn)練和推理的計算復(fù)雜性。

在訓(xùn)練過程中,該研究針對與 frozen KataGo 受害者的博弈來訓(xùn)練對抗策略。在沒有搜索的情況下,攻擊者與 KataGo 受害者的博弈可以實現(xiàn) >99% 的勝率,這與歐洲前 100 名圍棋選手的實力相當(dāng)。此外,經(jīng)過訓(xùn)練的攻擊者在與受害者智能體博弈的 64 個回合中實現(xiàn)了超過 80% 的勝率,研究者估計其實力與最優(yōu)秀的人類圍棋棋手相當(dāng)。

值得注意的是,這些游戲表明,該研究提出的對抗策略并不是完全在做博弈,而是通過欺騙 KataGo 在對攻擊者有利的位置落子,以過早地結(jié)束游戲。事實上,盡管攻擊者能夠利用與最佳人類圍棋選手相當(dāng)?shù)牟┺牟呗裕鼌s很容易被人類業(yè)余愛好者擊敗。

為了測試攻擊者與人類對弈的水平,該研究讓論文一作 Tony Tong Wang 與攻擊者模型實際對弈了一番。Wang 在該研究項目之前從未學(xué)習(xí)過圍棋,但他還是以巨大的優(yōu)勢贏了攻擊者模型。這表明該研究提出的對抗性策略雖然可以擊敗能戰(zhàn)勝人類頂級玩家的 AI 模型,但它卻無法擊敗人類玩家。這或許可以說明一些 AI 圍棋模型是存在 bug 的。

評估結(jié)果

攻擊受害者策略網(wǎng)絡(luò)?

首先,研究者對自身攻擊方法對 KataGo (Wu, 2019) 的表現(xiàn)進(jìn)行了評估,結(jié)果發(fā)現(xiàn) A-MCTS-S 算法針對無搜索的 Latest(KataGo 的最新網(wǎng)絡(luò))實現(xiàn)了 99% 以上的勝率。

如下圖 3 所示,研究者評估了自身對抗策略對 Initial 和 Latest 策略網(wǎng)絡(luò)的表現(xiàn)。他們發(fā)現(xiàn)在大部分訓(xùn)練過程中,自身攻擊者對兩個受害者均取得很高的勝率(高于 90%)。但是隨著時間推移,攻擊者對 Latest 過擬合,對 Initial 的勝率也下降到 20% 左右。

研究者還評估了對 Latest 的最佳對抗策略檢查點,取得了超過 99% 的勝率。并且,如此高的勝率是在對抗策略僅訓(xùn)練 3.4 × 10^7 個時間步長的情況下實現(xiàn)的,這一數(shù)據(jù)是受害者時間步長的 0.3%。

圖片

遷移到有搜索的受害者?

研究者將對抗策略成功地遷移到了低搜索機(jī)制上,并評估了上一節(jié)訓(xùn)練的對抗策略對有搜索 Latest 的能力。如下圖 4a 所示,他們發(fā)現(xiàn)在 32 個受害者回合時,A-MCTS-S 對受害者的勝率下降到了 80%。但這里,受害者在訓(xùn)練與推理時都沒有搜索。

圖片

此外,研究者還測試了 A-MCTS-R,并發(fā)現(xiàn)它的表現(xiàn)更好,在 32 個受害者回合時對 Latest 取得了超過 99% 的勝率,但在 128 個回合時勝率下降到 10% 以下。

在圖 4b 中,研究者展示了當(dāng)攻擊者來到 4096 個回合時,A-MCTS-S 對 Latest 最高取得了 54% 的勝率。這與 A-MCTS-R 在 200 個回合時的表現(xiàn)非常相似,后者取得了 49% 的勝率。

其他評估

如下圖 9 所示,研究者發(fā)現(xiàn),盡管 Latest 是一個更強(qiáng)大的智能體,但針對 Latest 訓(xùn)練的攻擊者在對抗 Latest 時要比 Initial 表現(xiàn)更好。

圖片?

最后,研究者探討了攻擊原理,包括受害者的 value 預(yù)測和硬編碼防御評估。如下圖 5 所示,所有的基線攻擊都要比他們訓(xùn)練的對抗策略表現(xiàn)差得多。

圖片

更多技術(shù)細(xì)節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2022-11-10 13:57:48

2023-09-14 10:07:38

人工智能數(shù)據(jù)管理

2025-11-06 10:00:00

2021-03-04 07:24:32

開發(fā)者搜索編程

2023-02-20 09:39:32

2019-11-29 08:00:36

AI 數(shù)據(jù)人工智能

2020-12-02 10:13:03

AI 數(shù)據(jù)人工智能

2025-07-10 00:16:00

2023-12-29 14:17:16

2023-11-07 06:56:00

模型微軟

2023-02-03 11:34:18

ChatGPT人工智能

2021-09-01 00:02:42

人工智能機(jī)器學(xué)習(xí)技術(shù)

2025-01-14 14:54:57

2022-08-08 08:39:45

艾米麗·瓊斯游戲賽車人工智能

2020-07-13 11:20:23

Python魔法命令代碼

2018-06-14 09:52:03

2018-03-02 10:58:17

人工智能AI律師

2024-11-13 10:26:25

2025-05-21 08:23:52

IO開發(fā)Java

2025-08-20 07:12:43

點贊
收藏

51CTO技術(shù)棧公眾號

福利一区在线| 免费在线国产| 亚洲黄网站黄| 亚洲精品狠狠操| 999精品网站| 免费av在线播放| 国产成人精品亚洲午夜麻豆| 91精品国产乱码久久久久久蜜臀| 日本一区二区三区网站| 99只有精品| 亚洲国产综合在线| 欧美色欧美亚洲另类七区| 中文字字幕在线中文乱码| 一区二区中文| 亚洲片在线资源| 6080国产精品| 欧洲一级精品| 亚洲午夜视频在线观看| 神马影院我不卡| 97人妻精品一区二区三区视频| 最新亚洲视频| 爱福利视频一区| 手机在线看片日韩| 爱情电影网av一区二区| 日韩欧美成人精品| 亚洲精品乱码久久久久久蜜桃91| 成人午夜免费福利| 久久国产福利国产秒拍| 欧美亚洲一区在线| 欧美成人精品激情在线视频| 欧美军人男男激情gay| 日韩精品一区二区三区在线| 天天影视综合色| 国产精品一区二区日韩| 亚洲日本一区二区| 色一情一乱一伦一区二区三欧美| 囯产精品久久久久久| 久久国产日韩欧美精品| 欧亚精品中文字幕| 国产精品theporn动漫| 亚洲精品极品少妇16p| 夜夜躁日日躁狠狠久久88av| japanese在线观看| 欧美日本三级| 777奇米四色成人影色区| 黄色片视频在线播放| 国产理论电影在线| 一区二区三区高清| 三上悠亚免费在线观看| 亚洲成人三级| 国产精品久久久久三级| 欧美日韩在线观看一区二区三区| 亚洲av成人精品毛片| 大桥未久av一区二区三区中文| 91精品国产综合久久香蕉| 无码人妻一区二区三区免费| 国产精品久久久久久久久久妞妞| 欧美国产日韩视频| 九九热这里有精品视频| 亚洲乱码免费伦视频| www.欧美三级电影.com| 日本免费网站视频| 日本不卡二三区| 正在播放国产一区| 精品熟妇无码av免费久久| 欧美理论电影大全| www.精品av.com| 污软件在线观看| 最新国产精品| 欧美激情视频一区二区| 久久老司机精品视频| 国内精品久久久久国产盗摄免费观看完整版 | 亚洲一区二区三区精品视频| 成人在线观看免费| 国产精品乱码一区二三区小蝌蚪| 亚洲欧美99| 蜜芽在线免费观看| 一区二区三区蜜桃| av高清在线免费观看| 制服丝袜专区在线| 欧洲精品在线观看| 日韩av一卡二卡三卡| www 久久久| 亚洲福利在线播放| aa片在线观看视频在线播放| 九九视频精品全部免费播放| 尤物九九久久国产精品的特点 | 亚洲激情图片一区| 日韩视频在线视频| 精品三区视频| 日韩视频在线永久播放| av网页在线观看| 精品日韩在线| 欧美日韩成人免费| 国产精品777777| 久久精品国产亚洲高清剧情介绍| 91日韩久久| 日本黄在线观看| 国产精品麻豆视频| 日韩亚洲欧美视频| 久久亚洲人体| 337p日本欧洲亚洲大胆色噜噜| 亚洲国产无码精品| 999成人网| 97在线免费观看视频| 中文字幕日产av| 东方欧美亚洲色图在线| 欧美日韩亚洲综合一区二区三区激情在线 | 日韩精品日韩在线观看| 日本伦理一区二区三区| 一区在线视频| 成人a级免费视频| 天天综合网天天综合| 国产精品大尺度| 精品视频免费在线播放| 一级欧美视频| 国产亚洲欧美日韩精品| 免费在线看黄网址| 日韩二区在线观看| 国产一区在线免费观看| 欧美黄色激情| 色中色一区二区| 蜜臀视频在线观看| 久久中文字幕av| 777午夜精品福利在线观看| 国产精品一区二区三区在线免费观看| 91麻豆精品一区二区三区| 青青草免费在线视频观看| 在线国产成人影院| 亚洲韩国日本中文字幕| 手机在线免费看片| 免费观看一级特黄欧美大片| 久久久久久久久一区二区| 四虎影院观看视频在线观看| 欧美三级日韩在线| 新91视频在线观看| 宅男噜噜噜66国产日韩在线观看| 91青草视频久久| 777电影在线观看| 色哟哟在线观看一区二区三区| 香蕉视频污视频| 欧美精品三级| 亚洲www永久成人夜色| 在线观看av黄网站永久| 一本色道a无线码一区v| 国产精品无码一区二区三区| 亚洲美女毛片| 国产综合色一区二区三区| 欧美理论电影| 欧美不卡一区二区三区四区| www青青草原| 国产乱码精品一区二区三| 一本色道久久99精品综合| 台湾成人免费视频| 亚洲三级 欧美三级| 亚洲图片在线视频| 久久综合国产精品| 欧美女人性生活视频| 天海翼精品一区二区三区| 性色av一区二区三区免费| 免费国产黄色片| 香蕉乱码成人久久天堂爱免费| 影音先锋资源av| 亚洲欧洲另类| 欧美视频1区| av在线一区不卡| 日韩在线一区二区三区免费视频| 最近中文字幕免费观看| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 一级黄色电影片| 在线电影一区| 久久综合一区二区三区| 日韩免费va| 日韩在线免费视频| 国产裸体永久免费无遮挡| 亚洲精品一卡二卡| 麻豆网站免费观看| 亚洲乱码久久| 欧美在线视频二区| 欧美天堂在线| 欧美国产第二页| 亚洲日本国产精品| 欧美日精品一区视频| 成年人午夜剧场| 99亚偷拍自图区亚洲| 黄色高清无遮挡| 日韩专区精品| 国产欧美日韩一区| 天天免费亚洲黑人免费| 日韩一区二区久久久| 亚洲国产精品久久人人爱潘金莲| 精品欧美一区二区三区| www..com.cn蕾丝视频在线观看免费版| 麻豆精品一区二区三区| 999一区二区三区| 在线视频亚洲专区| 91亚洲永久免费精品| 九色porny视频在线观看| 中文字幕亚洲欧美日韩高清| 亚洲国产精品二区| 欧美无砖专区一中文字| 国产在线拍揄自揄拍| 久久久久国色av免费看影院| 中文字幕一二三区| 美女黄网久久| 免费看日b视频| av在线不卡顿| 国产精品日韩高清| 福利一区和二区| 91精品国产精品| av免费在线免费| 国产亚洲精品va在线观看| 国内精品久久久久久久久久 | 成人综合视频在线| 综合久久一区| 日韩视频专区| 久久大胆人体视频| 91日本在线观看| 不卡福利视频| 久久久久久久久久久免费 | 日本一区二区三区dvd视频在线| 能看毛片的网站| 美女一区二区三区在线观看| 亚洲美免无码中文字幕在线| 中文字幕一区二区三区乱码图片| 热re99久久精品国99热蜜月| 国产精品调教视频| 亚洲一区免费网站| 国产人妖一区| 国产成人久久久| 蜜桃视频在线观看播放| 欧美激情图片区| 超碰在线caoporn| 色香阁99久久精品久久久| 理论视频在线| 国产视频一区在线| 亚洲人妻一区二区| 亚洲第一中文字幕在线观看| 国产麻豆91视频| 91精品婷婷国产综合久久竹菊| 中文字幕黄色av| 欧美日韩午夜影院| 久久久久久av无码免费看大片| 色伊人久久综合中文字幕| 99热国产在线观看| 亚洲第一成年网| 日本亚洲色大成网站www久久| 亚洲精品美腿丝袜| 男人操女人的视频网站| 日韩久久一区二区| 激情高潮到大叫狂喷水| 国产精品久线在线观看| 91禁男男在线观看| 国产精品欧美久久久久一区二区| 韩国女同性做爰三级| 久久久欧美精品sm网站| 亚洲午夜久久久久久久国产| 国产亚洲一区二区在线观看| 亚洲成人黄色av| 日本一区二区视频在线观看| 毛片久久久久久| 中文字幕在线不卡一区二区三区| 日本理论中文字幕| 国产精品三级在线观看| 影音先锋男人资源在线观看| 中文字幕日韩一区| 国产a免费视频| 亚洲第一精品在线| 日本中文字幕久久| 欧美色视频在线| 国产精品午夜福利| 精品久久久久久最新网址| 天天摸天天干天天操| 亚洲男人天堂视频| 亚洲免费观看在线| 国产成人啪午夜精品网站男同| 国产艳妇疯狂做爰视频| 91亚洲精品乱码久久久久久蜜桃 | 女人扒开屁股爽桶30分钟| 久久久久91| 在线不卡一区二区三区| 国产精品一区二区无线| www.com日本| 久久精品免视看| 美女的奶胸大爽爽大片| 午夜精品aaa| 亚洲 小说区 图片区| 日韩视频一区二区三区 | 国产亚洲精品美女| 巨大荫蒂视频欧美大片| 另类少妇人与禽zozz0性伦| 色噜噜在线播放| 亚洲欧美一区二区三区四区| 免费观看在线午夜影视| 久久久久免费精品国产| 电影亚洲精品噜噜在线观看| 91在线观看免费| 免费视频一区三区| 青青草原网站在线观看| 亚洲影院免费| 日韩精品国产一区| 欧美国产一区二区| 久久久久久久久久久久久久久久久| 色综合天天综合网国产成人综合天 | 成人午夜免费影院| 午夜精品久久久久久不卡8050| 一级淫片免费看| 亚洲免费视频观看| 在线中文字幕第一页| 国产精品视频1区| 黄色成人美女网站| 久久国产精品免费观看| 人人精品人人爱| 成人影视免费观看| 一区二区三区波多野结衣在线观看| 波多野结衣高清视频| 亚洲黄页视频免费观看| 在线黄色网页| 国产精品专区一| 国产欧美日韩免费观看| 99视频在线免费播放| 国产精品一区二区免费不卡| 99国产精品免费| 欧美自拍偷拍一区| 香蕉视频黄色片| 欧美精品精品精品精品免费| 在线免费成人| 亚洲二区自拍| 久久一区中文字幕| 亚洲国产欧洲综合997久久 | 成人免费视频网站| 日韩高清欧美| 丝袜老师办公室里做好紧好爽| 成人性色生活片免费看爆迷你毛片| 少妇视频在线播放| 日韩欧美在线免费观看| 手机在线不卡av| 欧美日本亚洲视频| 国产精品亚洲一区二区在线观看| 欧美亚洲丝袜| 韩日在线一区| 丰满少妇xbxb毛片日本| **欧美大码日韩| 亚洲网站在线免费观看| 亚洲精品一区在线观看香蕉| 免费观看久久久久| 91精品啪在线观看麻豆免费| 精品日韩毛片| 男操女免费网站| 久久久另类综合| xxxx.国产| 日韩av综合中文字幕| 黄色小说在线播放| 国产厕所精品在线观看| 欧美黄色一区| 黑人玩弄人妻一区二区三区| 亚洲精品国久久99热| 亚洲永久精品视频| 久久天天躁狠狠躁夜夜躁| 国产69精品久久久久按摩| 一区视频二区视频| 久久精品二区亚洲w码| 成人免费视频网站入口::| 欧美精品粉嫩高潮一区二区| 香蕉视频国产在线观看| 91精品视频免费| 一区二区三区在线电影| av不卡中文字幕| 婷婷夜色潮精品综合在线| 91精品国产色综合久久不8| 久久艹在线视频| 99国产精品久久一区二区三区| 免费av手机在线观看| 99re8在线精品视频免费播放| 国模私拍一区二区| 色琪琪综合男人的天堂aⅴ视频| 中文字幕不卡三区视频| 亚洲国产精品一区在线观看不卡| 久久99精品国产.久久久久久| 青青草手机在线视频| 欧美精品一区在线观看| 亚洲一区二区三区四区| 日韩一区不卡| 黄一区二区三区| 懂色av.com| 亚洲天堂av网| 日韩精品成人| 霍思燕三级露全乳照| 国产女主播视频一区二区| 中文字幕制服诱惑| 91国产美女视频| 国产一区二区亚洲| 午夜免费看毛片| 五月激情丁香一区二区三区| 九九热视频在线观看| 亚洲影院高清在线| 国产精品婷婷| 草视频在线观看| 精品亚洲一区二区三区在线播放| 欧美91在线|欧美|