精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4肆虐「誰是臥底」桌游!交談逼真,類人屬性仍有發展空間

人工智能 新聞
最近,韓國一團隊為了測試GPT-3.5和GPT-4的類人屬性,竟然讓它們玩兒這款游戲!

生成式AI研究再整新活!

韓國團隊嘗試讓GPT玩兒游戲,還是個黑幫題材的游戲——「Spyfall」。

不熟悉這個游戲的朋友先來了解一下,下圖就是「Spyfall」的畫風。

實際上這是個桌游,屬于老少咸宜,很適合朋友聚會的那種熱場游戲。

游戲的主要進行方式就是「說話」。

玩家中會有一位扮演「間諜」,所有玩家抽取一張牌,其中有一張間諜牌,剩余玩家抽到的都是相同的地點牌。

間諜的目標,就是通過交談找出剩下玩家所在的地點,而其余玩家就是要判斷誰是間諜。

游戲總共進行8分鐘,玩家之間可以相互提問。8分鐘一到,所有玩家要一同投票。

是不是很像平時我們聚會玩兒的誰是臥底?唯一不同在于,誰是臥底的詞匯可能來自各個領域,而這款游戲只有地點類名詞,比如球場、劇院、教室等等。

好了,游戲規則搞明白,下一步就是要讓GPT來玩玩看了。

研究結果

研究團隊表示, 在實驗過程中,將會特別關注GPT在角色扮演中的表現,本研究旨在展示GPT在具體游戲場景中的理解、決策和互動的能力以及潛力。

從結果粗看,GPT-4與GPT-3.5-turbo的對比分析表明,GPT-4增強了對游戲環境的適應性,在提出相關問題和形成類似人類的反應方面有顯著改進。

然而,也并非全是優點。比如說,GPT-4在虛張聲勢(Bluff)和預測對手行動方面存在一定的局限性,尤其是沒扮演間諜的時候。

研究結果表明,雖然GPT-4與之前的版本相比取得了不錯的進步,但還是有進一步發展的潛力,特別是在向AI灌輸更多「類人」屬性的方面。

不過,實驗還是成功表明,生成式AI在模擬類人互動方面大有可為。從GPT-2到GPT-4,模型的決策能力、可解釋性和解決問題的能力都有了長足的進步。

未來的努力方向,就是上面提到的「類人」屬性,使GPT更具通用性和廣泛性。

研究方法

首先,我們知道,GPT模型最大的優勢就在于,用戶可以通過自然語言和其進行直觀的交互,無論用戶本人是否對技術的內核熟悉。

當然,幾乎所有的模型交互都是通過自然語言進行的,用戶可以用自己最熟悉的方式表達自己的想法和意圖,并得到模型的回應。

此外,LLM擁有廣闊的知識譜系,GPT-4的數據庫也能使模型提供關于眾多主題的深入的知識。

同時,GPT和其它LLM所不同之處在于其可擴展性非常強,用戶可以在很多領域應用GPT,就比如說今天介紹的實驗。

在這次實驗中,研究人員一共安排了5名玩家,包括GPT。

研究人員總共進行了2項實驗。

實驗一:

測試GPT-4和GPT-3.5-turbo的性能差異。

實驗二:

僅使用GPT-4進行游戲。研究人員一共進行了8局游戲,記錄了每場游戲的日志,并對結果進行了討論。

當然,對于給出生成式AI的潛力一個確切的結論來說,實驗次數并不足夠。但是按照這個思路進行更多組重復實驗以及更加廣泛的測試,就可以提供更多實質性的證據。

我們先來看實驗一。

為了評估GPT-4與GPT-3.5-turbo相比的差異,尤其是在格式方面出現錯誤的機率、對游戲規則和進程等游戲背景相關內容的理解,以及類人反應方面的不同。

研究人員從第一輪交談的第一個問題開始進行實驗。

有了這一最清晰、變數最小的游戲部分,他們就可以精確地分析每個模型的能力,最大限度地減少外部因素的影響。

首先,研究人員比較了GPT-3.5-turbo和GPT-4對規則腳本中,所描述的30個地點中每個地點的30個首輪問題的回答。

向兩種模型提問的行動請求腳本是相同的,只是更改了地點的關鍵字而已。

規則與基本策略都和上述腳本相同,如下圖所示,實驗人員通過將三個腳本合并為一個請求,來獲得模型的響應。

為了進行更準確的比較,所有請求都固定為玩家 1,并假定玩家 1 不是間諜。

提交給每個模型的腳本如下:

你是玩家1,你不是間諜。本輪的地點是______。

現在輪到你來向其他玩家提問。從玩家1到5中(不可以選擇自己)選擇一位玩家,并寫下你的問題。并按以下格式進行提交:n(玩家序號)_player,問題內容

對于游戲本身來說,一個高質量的提問應該包括以下幾個部分:表明身份,即自己不是間諜。表明自己知道地點是什么,以此來證明自己不是間諜。最后保證間諜不會知道地點究竟在哪里。

同時,模型的輸出結果必須符合上述腳本中的格式。研究人員表示,如果模型不遵守格式,那就要花費大量精力來進行糾正。

我們來看如下輸出:

最上面就是一個不錯的問題:你去這個地方需要買票嗎?

下面的例子則是一些不太相關的問題,但是符合格式。

比如:問題中直接提到地點(就好像玩兒誰是臥底的時候直接把底牌交了)。

再比如:和上述游戲計劃無關的問題。

(例:正確地點是劇院,GPT問其他玩家最喜歡的戰爭片是什么。)

當然,還有完全失敗的情況:

比如經典話術:作為一個AI語言模型,我不能....

甚至還有從單純重復問題的情況出現。

根據上述結果(完整結果見論文),研究人員得出結論,和GPT-3.5-turbo相比,GPT-4更適合下一步的實驗。

檢查數據時研究人員發現,GPT-3.5-turbo經常會生成一些脫離游戲背景的問題。比如上面提到的直接交出地點,使間諜能立即確定位置,對非間諜不利。

還有上面說的詢問玩家的個人喜好,而非與游戲相關的話題,擾亂了游戲流程。這都是GPT-3.5干的。

此外,不按要求的格式回答,妨礙游戲進行,也是GPT-3.5的拿手好戲。

上表即為GPT-3.5不合要求的所有情況統計。有意思的是,總共68個回答,出錯68次,沒一個完美的輸出。

GPT-3.5 pass,我們接下來再來看GPT-4進行下一個實驗。

研究人員按照概述的規則進行了8次游戲,并用GPT-4采集了每次游戲的日志。

游戲中的所有反應都是由GPT-4生成的,而游戲的自動化代碼則是由Python編寫的。

根據本文中的規則和腳本,感興趣的朋友們可以輕松重現該實驗。

研究人員從地點列表中的A開始依次選擇地點,總共進行了8場游戲。每局游戲都從玩家1開始,GPT-4會獨立響應每個請求,不會從一局游戲保留到下一局游戲。

GPT-4僅根據提供的腳本來做出決定,這意味著開始玩家的身份不會影響游戲結果。

經過8輪游戲,研究人員得出的結論是,GPT-4在每個游戲和回合中的對話都是流暢和有機的,一連串的問答讓人感覺真實可信、像人一樣。

同時,在分析所提出的問題及其答案時,團隊發現了一個明顯的觀察結果。

那就是,在沒有經過任何專門訓練或微調的情況下,GPT-4模型就能根據游戲流程,熟練地提出各種相關問題。

為了證明GPT-4在游戲中提出的問題和答案的多樣性,研究人員將問題和相應的答案分成了幾組

不過,雖說這些問題和答案沒有經過預先訓練,但每個回答都有自己的對象和獨特的細微差別。

盡管沒有經過任何特定的訓練,GPT-4還是能根據游戲的流程巧妙地提出相關問題,似乎能分辨出哪些問題適合游戲環境,哪些問題可能不合適或多余。

比如下面這個例子:

問:我們在這里能吃到什么樣的點心?

答:小點心和飲料,包括軟飲料和酒精飲料,通常是小份供應。

問:這里通常提供什么類型的食品和點心?

答:在這個地點,您可以找到各種食品,如漢堡、熱狗、棉花糖、爆米花、和冰激凌,以及蘇打水和水等飲料,讓每個人都能精神飽滿。

問:我們可以在這里找到哪些食物?

答:這里有各種食品可供選擇,包括油炸食品、棉花糖和爆米花。

問:您通常在這里吃什么類型的食物?

答:根據情況,我們主要吃腌制食品和不易腐壞的食品。

在論文的結尾,研究人員表示,盡管存在某些局限性,但這些模型不斷增長的潛力還是很有希望促進創新、激發實際應用的。

GPT系列模型的進步非常迅速,尤其是在決策、可解釋性和解決問題的能力方面。

最初,GPT-2的目標僅僅是處理基礎層面的自然語言。后來,該模型發展成為具有多種任務的交互模型。

而現在,GPT-4在某些領域展示出了超越人類表現的邏輯推理能力。接下來,研究人員就可以深入到一個新的融合領域了。

GPT出色的自然語言處理能力可極大地幫助用戶理解模型如何運行并解釋其結果。

這種可訪問性擴大了潛在用戶群,向來自不同背景的用戶張開了懷抱,增強了模型在不同領域的創造性,以及可擴展性。

最后,GPT-4的類人特質與其他模型相比,在模仿類人反應的能力方面毫無疑問更勝一籌。

對于某些任務或活動(比如說教育、體育、音樂和藝術等娛樂領域)來說,人性化地完成任務可能比返回最佳結果更重要。

責任編輯:張燕妮 來源: 新智元
相關推薦

2011-02-22 16:51:49

2011-03-04 15:26:30

2019-08-05 10:32:58

病毒MyDoom

2023-07-06 14:26:43

2022-02-09 11:51:42

卡巴斯基Roaming Ma觀察

2012-08-17 17:18:24

數據中心萬國數據

2009-10-12 13:12:16

木馬病毒QVOD防范

2010-09-25 15:50:24

2012-02-08 10:32:26

ARM服務器ARM芯片

2017-05-26 16:01:38

2014-08-27 18:00:18

2022-08-17 10:36:32

Emotet惡意軟件

2009-08-27 09:59:17

2013-03-19 14:25:36

2019-02-19 14:31:37

2020-02-04 19:26:08

人工智能AI新型冠狀病毒

2013-06-06 15:13:22

2017-11-15 13:08:38

2009-02-17 09:58:00

2017-05-14 23:47:36

點贊
收藏

51CTO技術棧公眾號

成人妇女免费播放久久久| 国产网站欧美日韩免费精品在线观看| 只有这里有精品| 国产精品久久久久久久久毛片 | 国产成人三级在线观看| 性欧美亚洲xxxx乳在线观看| 亚洲无人区码一码二码三码的含义| 成人视屏在线观看| 一区二区三区在线不卡| 免费不卡亚洲欧美| 国产情侣在线播放| 天使萌一区二区三区免费观看| 日韩中文字幕精品| 99精品一区二区三区无码吞精| 亚洲视频在线观看免费视频| 五月婷婷在线观看视频| 欧美日韩伊人| 在线日韩av观看| 逼特逼视频在线观看| 99久久综合国产精品二区| 精品中文在线| 亚洲人成亚洲人成在线观看图片| 国产伦精品一区二区三区照片91| 波多野结衣午夜| 欧美日韩三级| 日韩在线不卡视频| 人妻在线日韩免费视频| 国产精品欧美一区二区三区不卡 | 91国产丝袜播放在线| 久久一区二区三区喷水| 日韩激情av在线播放| 天天摸天天舔天天操| 日韩伦理在线一区| 亚洲综合在线视频| 中文字幕一区二区三区四区五区六区| 头脑特工队2在线播放| 久久精品国产77777蜜臀| 青青在线视频一区二区三区| 中文字幕第28页| 99热在线成人| 最新日韩在线| 欧美日韩免费视频| 国产精品人人妻人人爽人人牛| 成人福利影视| 亚洲二区在线视频| 91黄色在线看| 青草在线视频| 一区二区三区视频在线观看| 男人j进女人j| 成人免费看片| 中文字幕佐山爱一区二区免费| 日本一区免费观看| 久草福利在线| 久久久久久麻豆| 欧美精品亚洲精品| 免费在线毛片| 国产婷婷色一区二区三区| 乱一区二区三区在线播放| 午夜国产在线视频| 久久亚洲欧美国产精品乐播| 美女主播视频一区| 黄色软件在线| 欧美国产一区在线| 一区二区日本伦理| 日韩理伦片在线| 亚洲女性喷水在线观看一区| 四虎精品欧美一区二区免费| 性欧美video高清bbw| 亚洲综合色丁香婷婷六月图片| 亚洲国产精品成人天堂| 中文一区一区三区高中清不卡免费 | 欧美日韩国产高清一区二区| 色婷婷成人在线| 91精品福利观看| 日韩精品一区二区三区老鸭窝| 性生活在线视频| 一区二区精彩视频| 日韩理论片久久| 永久免费成人代码| 久久精品青草| 久久久久久国产三级电影| 波多野结衣国产| 日韩精品三区四区| 成人欧美一区二区三区黑人| wwwav网站| 2024国产精品| 日韩一本精品| 在线三级中文| 黑人巨大精品欧美一区免费视频 | 秋霞国产精品| 欧美日本国产一区| 中文字幕在线观看视频www| 久久大胆人体视频| 中文字幕一区二区三区电影| 玖玖爱免费视频| 国产精品一二| 91美女片黄在线观| 亚洲欧美日韩精品永久在线| 六月丁香久久丫| 亚洲欧美日韩成人高清在线一区| 无码人妻少妇伦在线电影| 华人av在线| 欧美精品xxxxbbbb| 亚洲第一黄色网址| 亚洲欧美综合久久久| 欧美亚洲国产视频| 国产女同91疯狂高潮互磨| 91免费国产在线观看| 91九色国产ts另类人妖| 第84页国产精品| 欧美日韩情趣电影| 极品人妻一区二区三区| 亚洲一区二区三区无吗| 国产精品www网站| 狠狠人妻久久久久久综合麻豆| 中文一区二区完整视频在线观看| www.亚洲成人网| 亚洲精品成人一区| 国产亚洲精品va在线观看| 日韩激情一区二区三区| 国产一区二区精品久久91| 欧洲精品亚洲精品| 91九色美女在线视频| 91精品国产综合久久蜜臀| 在线观看国产精品一区| 日韩午夜免费| 国产精品yjizz| 老司机免费在线视频| 在线免费观看一区| 日本少妇色视频| 亚洲成色精品| 国产福利不卡| 污片视频在线免费观看| 欧美日韩国产中文| 99精品全国免费观看| 性色一区二区| 久久资源亚洲| 国产伦子伦对白在线播放观看| 日韩美女一区二区三区| 91在线精品播放| 黄色一级视频免费观看| 久久国产精品露脸对白| 亚洲区一区二区三区| 欧美日韩成人影院| 亚洲一区二区国产| 国产精品免费无遮挡无码永久视频| 99久久亚洲一区二区三区青草| 国产爆乳无码一区二区麻豆| 一区二区视频| 久久久久久久国产精品| 内射后入在线观看一区| 亚洲国产精品自拍| 影音先锋资源av| 国产视频一区欧美| 美女精品国产| 99久久亚洲国产日韩美女| 在线观看欧美视频| 一区二区视频网站| 中文字幕在线观看一区| 亚洲男人天堂2021| 欧美 日韩 国产一区二区在线视频| 成人亚洲欧美一区二区三区| 成人毛片av在线| 欧美精品一区二区三区在线 | 欧美一级二级三级蜜桃| 国产探花视频在线| 久久综合综合久久综合| dy888午夜| www.久久东京| 2023亚洲男人天堂| 东热在线免费视频| 欧美福利一区二区| 免费一级黄色大片| 26uuu精品一区二区在线观看| 国产1区2区在线| 日韩免费视频| 91观看网站| 高潮在线视频| 中文字幕亚洲欧美| 午夜精品久久久久久久第一页按摩| 一区二区欧美在线观看| 中国av免费看| 久久精品国产亚洲aⅴ| 亚洲精品天堂成人片av在线播放| 加勒比久久高清| 国产成人欧美在线观看| 91亚洲天堂| 亚洲欧美日韩久久久久久| 一级黄色片在线观看| 亚洲综合免费观看高清完整版| 91精彩刺激对白露脸偷拍| 久久国产欧美日韩精品| 男人添女荫道口图片| 成人免费看片39| 国产日本一区二区三区| 欧美午夜三级| 97久久伊人激情网| 很黄的网站在线观看| 亚洲免费福利视频| 国产福利第一视频| 欧美视频精品在线观看| 精品视频一区二区在线观看| 国产精品国产三级国产aⅴ无密码| av免费观看不卡| 捆绑调教一区二区三区| 99精品人妻少妇一区二区| 99国产**精品****| 欧美日韩综合网| 超碰精品在线| 成人国产精品久久久久久亚洲| www.精品| 国内精品久久久久久| 国产一二三区在线观看| 国产一区二区黄| 亚洲av成人无码网天堂| 日韩一区二区在线看片| 中文字幕乱码一区二区| 欧美色视频日本版| 好吊操这里只有精品| 亚洲日本护士毛茸茸| 成人免费视频入口| 国产欧美日韩综合| 日本黄色特级片| jlzzjlzz国产精品久久| 91丨porny丨九色| 国内外成人在线| 欧美特黄aaa| 蜜臀av性久久久久蜜臀aⅴ| 日韩免费毛片视频| 妖精视频成人观看www| 国产96在线 | 亚洲| 欧美日韩亚洲国产精品| 三级在线免费观看| 91精品秘密在线观看| 在线综合视频网站| 欧美3p视频| 亚洲制服欧美久久| 欧美gayvideo| 一区二区精品免费视频| 久久久久久久99| 99re热这里只有精品免费视频| 午夜影院福利社| 国产91综合一区在线观看| 日日夜夜精品视频免费观看| 国产一区91精品张津瑜| 国产性生活一级片| 国产美女一区二区三区| 午夜诱惑痒痒网| 国产精品一二三四五| 久久久久无码国产精品一区李宗瑞 | 污污视频网站在线| 国产乱码精品一区二区三区五月婷| 天堂在线一区二区三区| 国产乱妇无码大片在线观看| aaaaaaaa毛片| 成人免费视频网站在线观看| 亚洲av人人澡人人爽人人夜夜| 99re视频精品| 91麻豆制片厂| 亚洲天堂av一区| 久久久久无码国产精品| 亚洲va欧美va人人爽午夜| 在线观看中文字幕视频| 91久久线看在观草草青青| 一级一级黄色片| 欧美一卡2卡三卡4卡5免费| 性欧美8khd高清极品| 亚洲国产精品99| 国产女主播在线直播| 久久精品男人天堂| 538在线观看| 国产精品看片资源| 精品精品视频| 久久久久久久久久久久久久一区 | 亚洲熟妇av乱码在线观看| 欧美剧在线免费观看网站| 亚洲国产www| 国产视频久久网| 久草免费在线观看| 午夜精品理论片| av成人在线观看| 俄罗斯精品一区二区三区| 视频小说一区二区| 国产福利片一区二区| 亚洲黄色高清| 手机视频在线观看| www.亚洲国产| 毛片久久久久久| 亚洲成av人片在www色猫咪| www.日韩一区| 欧美mv和日韩mv的网站| 国产区视频在线| 国模极品一区二区三区| av成人在线观看| 久久涩涩网站| 欧美一区二区三区免费看| 久热免费在线观看| 国产v综合v亚洲欧| 91精品久久久久久久久久久久| 一区二区三区免费观看| 超碰在线97观看| 日韩的一区二区| caoporn97在线视频| 国产精品第3页| 精品一区二区男人吃奶| 欧美aaa在线观看| 石原莉奈在线亚洲三区| www.男人天堂| 亚洲欧美色图小说| 又骚又黄的视频| 亚洲无亚洲人成网站77777| 波多野在线观看| 91色在线视频| 久久五月天小说| 丁香婷婷激情网| 97久久人人超碰| 久久精品美女视频| 日韩小视频在线观看专区| 337p日本欧洲亚洲大胆鲁鲁| 4p变态网欧美系列| 爱高潮www亚洲精品| 国产对白在线播放| 久久97超碰色| 久久久久麻豆v国产| 欧美视频中文字幕| 九色在线视频| 日韩av电影在线网| 亚洲警察之高压线| 免费成人在线视频网站| 成人av午夜电影| 国产第100页| 精品粉嫩超白一线天av| 国语对白在线刺激| 亚洲最大福利网| 韩国av一区| 亚洲欧美综合视频| 一区二区高清在线| 亚洲欧美激情国产综合久久久| 久热精品视频在线免费观看| 亚洲久草在线| av磁力番号网| 国产毛片精品国产一区二区三区| 麻豆精品国产免费| 正在播放亚洲一区| av在线影院| 91久久久久久久| 欧美精品国产一区| wwwww在线观看| 亚洲va欧美va人人爽午夜| 污视频软件在线观看| 性欧美在线看片a免费观看| 欧美日韩精品一区二区三区在线观看| 精品少妇在线视频| 久久先锋资源网| 国产一区免费看| 日韩在线视频中文字幕| 综合久久av| 日韩精品手机在线观看| 成人高清伦理免费影院在线观看| 日韩免费不卡视频| 亚洲人成电影网站| 欧美91在线|欧美| 天天在线免费视频| 成人免费av资源| 日韩人妻精品中文字幕| 日韩亚洲精品视频| 亚洲午夜免费| av天堂永久资源网| 国产精品素人一区二区| 国产成人久久精品77777综合 | 久久久久无码国产精品不卡| 亚洲精品白浆高清久久久久久| 影视一区二区三区| 免费观看中文字幕| 99精品1区2区| 亚洲一区二区人妻| 欧美极品在线播放| 国产一区二区三区四区五区 | 国产一区一区| 国产精品无码人妻一区二区在线| 久久久久久久av麻豆果冻| 国产精品视频第一页| 国模吧一区二区| 日韩精品久久| 88av在线播放| 欧美三级电影网站| 大香伊人久久| 亚洲在线视频一区二区| jizz一区二区| 国产精品乱码一区二区| 538国产精品视频一区二区| 日韩一区三区| 中文字幕丰满孑伦无码专区| 欧美狂野另类xxxxoooo| 手机av在线| 蜜臀av.com| 欧美激情一区二区三区蜜桃视频 | 夜夜添无码一区二区三区| 国产精品色哟哟网站| 日本波多野结衣在线|