精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

這場比賽,讓上百個AI智能體「卷起來了」

人工智能 新聞
不遠的將來,智能決策技術將成為數字化轉型的加速器,推進能源、物流、工業等產業領域的研究落地和成果轉化。

過去數年,隨著神經網絡、基于強化學習的自我博弈、多智能體學習和模仿學習等通用機器學習理論的突破,AI 智能體的決策能力實現了飛躍式發展。

可以看到,不管是谷歌、微軟、IBM 等全球科技巨頭,還是國內一眾 AI 龍頭企業,在學術研究和產業落地上,它們的關注焦點都在從智能感知向智能決策過渡?!笡Q策 AI」成了領域內的必爭之地。

今年 5 月,谷歌旗下的機構 DeepMind 發布 Gato,這款全新的 AI 智能體能夠在「廣泛的環境中」完成 604 項不同的任務。Gato 的誕生,再次刷新了單智能體的能力上限。當然,關于 AI 決策能力的探索不會僅限于此,如果讓海量智能體在一個接近真實世界的開放決策環境中「狹路相逢」,它們會做出何種判斷和選擇,又會怎樣分工合作、競爭呢? 近日,由超參數科技發起,麻省理工學院、清華大學深圳國際研究生院,以及知名數據科學挑戰平臺 AIcrowd 聯合主辦的「IJCAI 2022-Neural MMO 海量 AI 團隊生存挑戰賽」落幕。在這場比賽中,我們發現了一些進行新探索的可能性。

圖片


復雜環境中的多智能體博弈

近年來,多智能體環境已經成為深度強化學習的一個有效研究平臺。目前,強化學習環境要么足夠復雜,但限制條件太多,普適性不強;要么限制條件很少,但過于簡單。這些問題限制了更高復雜度任務的創建,也很難激發出多智能體更高階的決策能力。

2019 年,MIT 博士生 Joseph Suarez 在 OpenAI 實習期間開發了 Neural MMO,他借鑒大型多人在線游戲(MMO),模擬出一個龐大的生態系統,系統中包含數量不等的智能體,并讓它們在持久、廣闊的環境中競爭。行業人士普遍認為,「這個模擬相當有趣」。與過往著眼于技術水準的 AI 游戲對戰環境不同,Neural MMO 涉及到了 AI 的長期判斷和選擇,更考驗智能體的決策能力。 「IJCAI 2022-Neural MMO 海量 AI 團隊生存挑戰賽」使用的正是上述環境。主辦方表示,選擇 Neural MMO 主要基于兩點:一是 Neural MMO 類似于開放世界生存游戲,本身有一個自運轉系統,并且定義了采集、攻擊、生存等基本機制,二是它支持海量 AI 共存、交互,并涌現策略。無論在學術界還是工業界,這種環境都不多見。

圖片

Neural MMO環境在這場比賽中,每局對戰都包含 16 支隊伍,每支隊伍包含 8 個智能體,這些智能體小分隊要在 128x128 的地圖上進行自由對抗。根據主辦方的設計,每個智能體小分隊要達成覓食、探索、競爭、打怪四項成就。這意味著每個環境里有 128 個智能體同時決策,每支隊伍里的 8 個智能體要為了不同的目標進行有效的合作分工。

圖片


在這種情況下,每個智能體都要發揮自己的強項,必要時,為了團隊能夠獲得「最后的勝利」,一部分智能體還要學會「主動送人頭」。鑒于環境里有多個智能體在同時學習,智能體們不僅需要考慮自己期望得到何種獎勵,還要考慮對手可能會采取什么策略。再加上每一局對戰都要完成四項任務,層層設置之下,每個智能體面臨的「抉擇」都有更高的決策復雜度。

讓海量智能體「卷」起來

對一場學術性質的比賽來說,除了找到好問題,還要有足夠多的好選手。為此,主辦方從賽事規則、工具、賽事支持等方面對 Neural MMO 挑戰賽進行了全面優化。 在工具層面,「IJCAI 2022-Neural MMO 海量 AI 團隊生存挑戰賽」升級了提交系統,讓第一次成功提交到返回結果的時間從原來的兩個多小時減少到十分鐘;此外,挑戰賽還提供了全新的 StarterKit 和 Baseline 。在 StarterKit 中,參賽者只需要跑一遍代碼,就可以完成第一個提交;在 Baseline 中,用戶只需要訓練兩天,就可以完成 Stage 1 0.5 的勝率,運行訓練四天,就可以獲得 Stage 1 0.8 的勝率。

這些設計幫助參賽者在初始階段迅速地熟悉規則,并以此節省大量時間。利用省下來的時間,參賽者們可以將思考重點放在定義智能體在 Neural MMO 環境中的決策方式上,比如進行獎勵信號的設計等。

在賽制上,這場 Neural MMO 挑戰賽采取了 PvE 與 PvP 結合的方式。在 PvE 階段,每個 Stage 的內置 AI 難度會逐漸增加,參賽者由此感受到「梯度」。Stage 1 的難度是最低的,包含了一些基于簡單規則編寫的開源腳本。之后,Stage 2 的難度會變得更高,主辦方基于經典的 PPO 算法對內置 AI 進行訓練,并加入自我博弈(Self-Play)的訓練機制。到了 Stage 3,智能體的綜合能力進一步升級,選手們面對的已經是高度團結的競爭對手隊伍。

在 PvE 階段獲,成就分達到 25 的隊伍即可晉級;但在 PvP 階段,難度上升,對戰對象從內置 AI 變為其它參賽選手隊伍。

讓 8 個智能體組團完成任務,是合作博弈中的一個經典問題。如果說在 PvE 階段的前兩個 Stage,依靠單打獨斗還能取得一些成績,那么隨著環境內置 AI 不斷變強,再到對手從環境內置 AI 變為真實世界中的參賽團隊,出戰的智能體小分隊也需要隨之完成脫胎換骨般的進化,以此去理解怎樣達成「團隊最優決策」。

基于上述改進,不同水平的參賽者都能在這場賽事中找到適合自己的參賽目標。但同時,要想獲得頂尖名次,智能體的綜合決策能力要能經受住考驗,這就要求選手在智能體的算法設計上具備更深刻的思考。

RL 算法選手,后來者居上

經過三個月的激烈角逐,兩支來自業界的隊伍脫穎而出,斬獲了本屆挑戰賽的冠亞軍。有趣的是,這兩支隊伍均采用強化學習算法,且都是在最后一個月才參賽。

冠軍團隊 LastOrder 提到,相較現有的其他多智能體環境,MMO 有更豐富的內容,例如生存、戰斗、升級、團隊 PK、隨機地圖等。與其他同類比賽不同的是,Neural MMO 挑戰賽給參賽者的規則限制很少,這也為強化學習算法的應用提供了廣闊的發揮空間。

NeuralNoob 是亞軍獲得者,他認為 Neural MMO 最明顯的特點在于支持的海量智能體,本場比賽的設置為 128 個,但實際上可以增加到上千或者更多?!杆且粋€多任務的環境,每個智能體需要在必要的時候改變策略各司其職,具有更大的研究價值?!?/span>

在比賽過程中,LastOrder 設計了分布式強化學習訓練框架 Newton,該框架具備高度靈活性及可擴展性。

圖片


他們采用獎勵設計等方法間接鼓勵智能體做出合理的行為。在設計合理的獎勵、神經網絡結構等之后,他們觀察到,深度強化學習訓練后的智能體自行涌現了相互配合的行為。

「啟發式算法的優點是思路更加簡明,反饋更加直接。相比之下,強化學習需要更長的訓練時間,以進行網絡結構和參數的調整。」LastOrder 表示,「但強化學習算法所能達到的能力上限更高,更具探索的價值?!?/span>

NeuralNoob 同樣采用強化學習算法,整體方案是 ppo 算法加自我博弈 ( self-play) 訓練機制,所有智能體的訓練都將 8 個智能體作為一個團隊來訓練,value 部分則會用到整個團隊的共享表征,并按照 CTDE 的方式訓練。

在 LastOrder 看來,MMO 這個平臺還存在更多想象空間:例如它可以引入更多游戲要素,甚至可以變成一個開放的線上游戲,促進 Human in the loop 等領域的相關研究。對此,NeuralNoob 持相似看法,他認為可以有更多樣的裝備供智能體選擇,并設置一個安全區,智能體到達安全區后不能發動攻擊,同時可以和敵方智能體進行裝備交易。

在 NeuralNoob 的設想里,甚至可以讓智能體臨時和敵方智能體進行合作,聯手擊殺一些強大的內置 AI,而同敵方智能體的合作將會讓 MMO 更符合真實世界中合作與競爭共存的關系。

NeuralNoob 認為,這些是強化學習目前比較難勝任的地方,強大如 openai five,也是通過手寫規則來實現出裝路線,因為設計到裝備選擇的訓練樣本占比勢必會很小,但依賴鏈卻很長。

智能決策的「今天」和「未來」

更長遠地看,Neural MMO 環境提供了一個廣闊、高自由度的學術框架,可以推動一些種群層面的行為研究,比如如何高效組隊,它甚至能衍生出社會學、經濟學方面的概念研究,這些都是現階段相關領域內瓶頸仍存的研究方向。正因此,「IJCAI 2022-Neural MMO 海量 AI 團隊生存挑戰賽」 在學術研究層面的意義也更加凸顯。

任何關于決策智能的學術研究,人們都希望它能在真實的產業場景中發揮價值,包括但不限于商業游戲、量化交易。在現實生活中,決策的代價可能會非常大,這是因為,一方面,決策會直接導致結果,所以決策水平的質量高低,跟結果帶來的收益直接相關;另一方面,決策所設定的環境相當復雜,而想要在真實世界中做預演,成本也會非常高。

在學界、業界對智能決策的探索過程中,Neural MMO 無疑有希望成為一個很好的試驗載體。但現實中的智能決策往往更加復雜,有著更長的決策鏈條。如何進一步仿真模擬,讓 Neural MMO 更大程度上地接近現實決策環境,這需要整個行業進行長期探索。

據了解,超參數科技將依托 2022 NeurlPS 會議舉辦新一輪 NMMO 挑戰賽。相較于「IJCAI 2022-Neural MMO 海量 AI 團隊生存挑戰賽」,新賽事增加了交易系統,豐富了裝備品類、多職業分工以及毒圈機制,這使得它本就開放的環境變得更加貼合現實決策環境。同時,持續豐富的智能體之間合作及競爭的交互方式也大大增加了決策多樣性、策略深度以及合作競爭的可能性。

在Neural NMMO系列挑戰賽中,智能體與環境中的內置AI、敵方智能體,以及隊友之間產生了大量交互,形成實時反饋,在動態的決策環境中達成最優決策,研究結果推動智能決策技術的發展。不遠的將來,智能決策技術將成為數字化轉型的加速器,推進能源、物流、工業等產業領域的研究落地和成果轉化,為更多「不確定」的真實決策場景提供相對「確定」的答案。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-18 15:20:00

2021-12-16 09:52:18

云計算行業科技

2013-07-23 16:43:28

Android開源項目

2022-04-18 16:25:17

辦公軟件釘釘飛書

2025-03-24 08:43:00

GrokAI模型

2019-05-22 13:51:04

騰訊AI互聯網

2020-12-07 10:21:39

漏洞Google Play攻擊

2025-04-02 09:21:00

DeepSeekAI開源

2024-07-19 12:45:23

2020-06-23 14:33:52

惡意軟件谷歌監控活動

2024-01-12 10:09:12

谷歌云計算

2024-03-27 18:14:32

2014-02-19 10:52:43

ETL項目SSIS框架

2024-04-30 15:06:03

智能體模型工具

2022-02-28 09:50:27

AI數字化開發

2025-09-03 14:05:11

瀏覽器智能體AI

2023-08-25 13:27:00

模型開源
點贊
收藏

51CTO技術棧公眾號

aaa一区二区三区| 亚洲视频重口味| 日韩影片中文字幕| 中文在线一区二区| 91精品久久久久| 国产精品白丝喷水在线观看| 日本精品视频| 婷婷丁香激情综合| 日韩福利视频| 国产精品嫩草影院桃色| 激情欧美一区| 亚洲欧美中文字幕在线一区| 日本888xxxx| 18网站在线观看| 不卡一区二区三区四区| 337p亚洲精品色噜噜噜| 自拍另类欧美| 欧洲av在线播放| 日精品一区二区| www.欧美免费| 男女一区二区三区| 青青国产精品| 亚洲一区二区综合| 欧美福利精品| av小说天堂网| 男女精品网站| 久久99热这里只有精品国产 | 最近中文字幕免费mv2018在线| 国产乱码精品一区二区三区五月婷| 欧美激情18p| 精品亚洲aⅴ无码一区二区三区| 久久天堂久久| 日本国产一区二区| 国产成人艳妇aa视频在线 | 日韩国产激情| 一区二区三区精品视频在线| 日本一区视频在线播放| 国内毛片毛片毛片毛片| 狂野欧美一区| 欧美激情视频播放| 亚洲一二三四五六区| 全球av集中精品导航福利| 91精品国产aⅴ一区二区| 黄色片一级视频| 日本片在线观看| 成人免费在线观看入口| 欧美在线视频二区| 国产综合视频在线| 国产综合色精品一区二区三区| 97超碰国产精品女人人人爽 | 一区二区三区在线免费| 五月天婷亚洲天综合网鲁鲁鲁| 日本xxxxwww| 国产一区二区免费看| 国产精品1234| 精品国产一区二区三区四| 欧美日韩一区二区国产| 久久五月天综合| 久久久久久久久福利| 日韩美脚连裤袜丝袜在线| 精品免费一区二区三区| 天天综合成人网| yw.尤物在线精品视频| 欧美日韩激情视频8区| 97碰在线视频| 美女网站视频在线| 亚洲午夜成aⅴ人片| 免费看日本黄色| 国内精品久久久久久野外| 久久精品视频在线免费观看| 久久久久久久久一区二区| 丰满岳乱妇国产精品一区| 国产成人精品一区二| 91老司机在线| www男人的天堂| 国产精品一区在线观看你懂的| 91精品中文在线| 91丨九色丨丰满| 久久99精品久久久久婷婷| 国产精品亚洲美女av网站| 国产美女www爽爽爽| 青青草视频一区| 国产欧美日韩精品在线观看| 夜夜狠狠擅视频| 久久99热这里只有精品| 亚洲a级在线观看| 国产人妻精品一区二区三| 国产在线视频一区二区三区| 97久久精品午夜一区二区| 亚洲美女综合网| 2023国产一二三区日本精品2022| 精品一区久久久久久| 免费在线视频一级不卡| 国产欧美精品日韩区二区麻豆天美| 日韩欧美精品一区二区| av在线1区2区| 亚洲乱码国产乱码精品精可以看| 国产精品日韩三级| 91桃色在线| 欧美特级www| 激情五月俺来也| 成人在线日韩| 日韩精品免费视频| 污污视频网站在线免费观看| 欧美1区2区| 欧美亚洲激情在线| 91久久久久久久久久久久| 成人丝袜高跟foot| 久久综合九色综合久99| 天天影视久久综合| 午夜在线成人av| 九九视频精品在线观看| 日韩中文字幕| 国产亚洲精品一区二555| 91麻豆精品成人一区二区| 亚洲黄色影院| 国产精品丝袜一区二区三区| 亚洲精品一区二区三区四区| 91蜜桃网址入口| 一区二区av| 成入视频在线观看| 欧美日韩视频在线第一区 | 久久久久无码精品国产| 另类天堂av| 91在线观看网站| 国产片在线观看| 亚洲一区二区视频在线观看| 一区二区xxx| 久久人人爽人人爽人人片av不| 在线亚洲欧美视频| 日韩成人在线免费视频| 麻豆成人综合网| 精品久久久久亚洲| 国产在线观看av| 欧美一a一片一级一片| 香蕉在线观看视频| 久久一区二区三区喷水| 18一19gay欧美视频网站| 国产精品欧美激情在线| 国产人妖乱国产精品人妖| 人妻久久久一区二区三区| 成人动漫视频在线观看| 亚洲一级一级97网| 亚洲高清毛片一区二区| 不卡的av在线播放| 亚洲人一区二区| 成人美女黄网站| 精品国产乱码久久久久久夜甘婷婷| 波多野结衣欲乱| 天堂蜜桃91精品| 久久久影院一区二区三区| 日本片在线观看| 日韩一区二区三区四区| 国精产品视频一二二区| 日韩成人精品在线观看| 美女亚洲精品| 国产在线观看www| 精品少妇一区二区三区在线播放| 林心如三级全黄裸体| 日本伊人午夜精品| 激情欧美一区二区三区中文字幕| 污污的视频在线观看| 欧美亚洲免费在线一区| 粉嫩av懂色av蜜臀av分享| 亚洲经典视频在线观看| 粉嫩av免费一区二区三区| av一本在线| 欧美日韩国产不卡| 日本美女黄色一级片| 美女尤物国产一区| 亚洲综合第一| 成人在线免费av| 在线观看日韩www视频免费| 精人妻无码一区二区三区| 久久久久久电影| 国产一区二区视频免费在线观看| 欧美日日夜夜| 日本电影亚洲天堂| 欧美zozo| 欧美日韩国产首页| 女同久久另类69精品国产| 国产在线精品免费av| 无颜之月在线看| 国产精品对白久久久久粗| 性色av一区二区三区| 天堂在线中文字幕| 色欧美乱欧美15图片| 伊人影院综合网| 精品一区二区三区在线播放视频| 久久久久亚洲av无码专区喷水| 天堂精品在线视频| 97色在线视频| 精品一二三区视频| 欧美日韩美女一区二区| 国产女人18水真多毛片18精品| 国产成人精品影院| 免费在线观看日韩视频| 久久人人88| 国产成人精品日本亚洲11| 精品捆绑调教一区二区三区| 亚洲无av在线中文字幕| 国产精品主播一区二区| 亚洲午夜精品在线| 高清国产在线观看| 成人黄色一级视频| 亚洲36d大奶网| 欧美亚韩一区| 欧洲亚洲一区| 日本伊人久久| 国产成人精品av| 人交獸av完整版在线观看| 日韩精品在线私人| 亚洲一级av毛片| 午夜av一区二区| 极品色av影院| 久久夜色精品国产噜噜av| 少妇性l交大片| 91精品国产乱码久久久久久| 国产伦精品一区二区三区在线| 超碰国产一区| 久久影院免费观看| 你懂的视频在线播放| 欧美一区三区二区| 亚洲va在线观看| 亚洲一区二区三区四区中文字幕 | 久久综合国产精品| 日韩成人av免费| 日日夜夜精品视频免费| www.国产在线播放| 欧美独立站高清久久| 精品无码久久久久国产| 美女日韩一区| 国产精品午夜一区二区欲梦| 一个人www视频在线免费观看| 草民午夜欧美限制a级福利片| 亚洲欧美日韩成人在线| 日韩视频一区二区三区在线播放| 天堂网一区二区| 精品福利樱桃av导航| 久久黄色免费视频| 亚洲欧洲日韩一区二区三区| 国产av自拍一区| www.成人在线| 黄色激情在线观看| 国产精品888| 亚洲欧美日韩一二三区| 男人操女人的视频在线观看欧美 | 天美传媒免费在线观看| wwww国产精品欧美| 无码任你躁久久久久久老妇| 国产精品18久久久| 亚洲第一天堂久久| 奇米影视一区二区三区| 欧美激情国产精品日韩| 宅男噜噜噜66国产日韩在线观看| 少妇大叫太大太粗太爽了a片小说| 欧美oldwomenvideos| 午夜精品亚洲一区二区三区嫩草| 私拍精品福利视频在线一区| 99re在线| 成人av资源网址| 97久久夜色精品国产九色| 国产一区二区三区亚洲综合| 91精品久久久久久久久久入口| 秋霞国产精品| 国产精品夫妻激情| 91久久久久久白丝白浆欲热蜜臀| 国产成人精品免费视频| 亚洲精品国产嫩草在线观看| 国产精品日韩在线一区| 电影在线观看一区二区| 国产精品爽爽爽| 欧美成人aaa| 91久久精品美女| 日韩精品一区二区三区免费视频| 99在线视频首页| 超碰精品在线| 久久综合九色综合久99| 欧美**vk| 亚洲一二三区在线| 国产精品成久久久久| 强开小嫩苞一区二区三区网站| 欧美一级本道电影免费专区| 欧美性色黄大片人与善| 成人激情开心网| 色阁综合av| 91综合网人人| 18视频在线观看娇喘| 亚洲永久字幕| 久久人人爽av| 成人免费毛片嘿嘿连载视频| 三级黄色片网站| 欧美韩日一区二区三区| 破处女黄色一级片| 午夜视黄欧洲亚洲| 亚洲精品国产欧美在线观看| 欧美日韩视频一区二区| 亚洲第一大网站| 精品亚洲国产成av人片传媒| av一本在线| 久久久久久亚洲精品中文字幕| 亚洲欧美韩国| 91在线色戒在线| 羞羞答答一区二区| 亚洲午夜在线观看| 亚洲精选一区| 久久精品免费网站| 国产成人一区在线| 中文字幕在线1| 亚洲欧美日韩国产另类专区| 日韩av在线播| 欧美另类久久久品| 天堂视频中文在线| 久久视频精品在线| 中老年在线免费视频| 成人精品久久久| 啪啪激情综合网| 亚洲综合欧美日韩| 国产日韩欧美一区在线| 中文字幕久久久久久久| eeuss国产一区二区三区| 国产精品高清无码在线观看| 亚洲伦在线观看| 中文字幕+乱码+中文| 亚洲第一中文字幕在线观看| 幼a在线观看| 欧美性受xxxx黑人猛交| 欧美日韩黄色| 伊人狠狠色丁香综合尤物| 亚洲视频播放| 欧美日韩一区二区区| 国产精品美女久久久久久久久 | 成人性视频欧美一区二区三区| 国产经典欧美精品| 五月天免费网站| 色综合久久久久综合体桃花网| 亚洲第一天堂影院| 久久精视频免费在线久久完整在线看| 亚洲精华液一区二区三区| 国产高清在线一区| 91精品亚洲| 男人添女人下面免费视频| 久久久精品欧美丰满| 欧美三级午夜理伦| 亚洲国产中文字幕久久网| 国产福利视频在线观看| 国产欧美日韩免费看aⅴ视频| 欧美极品中文字幕| 欧美视频在线播放一区| 风间由美性色一区二区三区| 日韩女优一区二区| 91精品黄色片免费大全| 日本在线观看www| 国产精品嫩草影院一区二区| 亚洲区小说区图片区qvod按摩 | 日精品一区二区| 亚洲午夜久久久久久久久红桃| 亚洲成av人片观看| 老牛影视av牛牛影视av| 欧美国产日韩免费| 老司机亚洲精品一区二区| 久久精品在线免费视频| 国产精品一区二区你懂的| 永久久久久久久| 日韩欧美国产1| 毛片在线播放a| 国产日韩精品视频| 四季av一区二区三区免费观看 | 在线毛片网站| 国产日韩精品在线播放| 天天综合一区| 久久精品一二三四| 亚洲最新在线观看| 黄色一级a毛片| 欧美与黑人午夜性猛交久久久| 偷拍一区二区| 国产成人手机视频| 日韩一区在线播放| 国内精品久久久久久久久久久| 欧美激情国产日韩精品一区18| 日韩最新av| 欧美日韩黄色一级片| 2021国产精品久久精品| 亚洲黄色免费观看| 国产一区二区三区在线视频 | 免费看欧美黑人毛片| 暴力调教一区二区三区| 日韩精品一区二区亚洲av| 伊人久久久久久久久久久| 婷婷丁香久久| 男人的天堂狠狠干| 久久久国产综合精品女国产盗摄| 中文字幕人妻一区二区在线视频| 久久精品国产清自在天天线| 日本一区精品视频| 国产日产欧美视频| 国产精品不卡在线| 成人精品在线播放| 国产成人一区二| 888久久久|