精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

吳恩達力贊!哈佛、MIT學者用下棋證明:大型語言模型確實「理解」了世界

人工智能 新聞
大型語言模型理解世界了嗎?那要看你怎么理解「理解世界」。

2021年,華盛頓大學語言學家Emily M. Bender發表了一篇論文,認為大型語言模型不過是「隨機鸚鵡」(stochastic parrots)而已,它們并不理解真實世界,只是統計某個詞語出現的概率,然后像鸚鵡一樣隨機產生看起來合理的字句。

由于神經網絡的不可解釋性,學術界也弄不清楚語言模型到底是不是隨機鸚鵡,各方觀點差異分歧極大。

由于缺乏廣泛認可的測試,模型是否能「理解世界」也成為了哲學問題而非科學問題。

最近,來自哈佛大學、麻省理工學院的研究人員共同發表了一項新研究Othello-GPT,在簡單的棋盤游戲中驗證了內部表征的有效性,他們認為語言模型的內部確實建立了一個世界模型,而不只是單純的記憶或是統計,不過其能力來源還不清楚。

論文鏈接:https://arxiv.org/pdf/2210.13382.pdf

實驗過程非常簡單,在沒有任何奧賽羅規則先驗知識的情況下,研究人員發現模型能夠以非常高的準確率預測出合法的移動操作,捕捉棋盤的狀態。

吳恩達在「來信」欄目中對該研究表示高度認可,他認為基于該研究,有理由相信大型語言模型構建出了足夠復雜的世界模型,在某種程度上來說,確實理解了世界。

博客鏈接:https://www.deeplearning.ai/the-batch/does-ai-understand-the-world/

不過吳恩達也表示,雖然哲學很重要,但這樣的爭論可能會無休無止,所以不如編程去吧!

棋盤世界模型

如果把棋盤想象成一個簡單的「世界」,并要求模型在對局中不斷決策,就可以初步測試出序列模型是否能夠學習到世界表征。

圖片

研究人員選擇一個簡單的黑白棋游戲奧賽羅(Othllo)作為實驗平臺,其規則是在8*8棋盤的中心位置,先放入四個棋子,黑白各兩個;然后雙方輪流下子,在直線或斜線方向,己方兩子之間的所有敵子(不能包含空格)全部變為己子(稱為吃子),每次落子必須有吃子;最后棋盤全部占滿,子多者為勝。

相比國際象棋來說,奧賽羅的規則簡單得多;同時棋類游戲的搜索空間足夠大,模型無法通過記憶完成序列生成,所以很適合測試模型的世界表征學習能力。

Othello語言模型

研究人員首先訓練了一個GPT變體版語言模型(Othello-GPT),將游戲腳本(玩家做出的一系列棋子移動操作)輸入到模型中,但模型沒有關于游戲及相關規則的先驗知識。

模型也沒有被明確訓練以追求策略提升、贏得對局等,只是在生成合法奧賽羅移動操作時準確率比較高。

數據集

研究人員使用了兩組訓練數據:

錦標賽(Championship)更關注數據質量,主要是從兩個奧賽羅錦標賽中專業的人類玩家采用的、更具戰略思考的移動步驟,但分別只收集到7605個和132921個游戲樣本,兩個數據集合并后以8:2的比例隨機分成訓練集(2000萬個樣本)和驗證集(379.6萬個)。

合成(Synthetic)更關注數據的規模,由隨機的、合法的移動操作組成,數據分布不同于錦標賽數據集,而是均勻地從奧賽羅游戲樹上采樣獲得,其中2000萬個樣本用于訓練,379.6萬個樣本用于驗證。

每場游戲的描述由一串token組成,詞表大小為60(8*8-4)

模型和訓練

模型的架構為8層GPT模型,具有8個頭,隱藏維度為512

模型的權重完全隨機初始化,包括word embedding層,雖然表示棋盤位置的詞表內存在幾何關系(如C4低于B4),但這種歸納偏置并沒有明確表示出來,而是留給模型學習。

預測合法移動

模型的主要評估指標就是模型預測的移動操作是否符合奧賽羅的規則。

在合成數據集上訓練的Othello-GPT錯誤率為0.01%,在錦標賽數據集上的錯誤率為5.17%,相比之下,未經訓練的Othello-GPT的錯誤率為93.29%,也就是說這兩個數據集都一定程度上讓模型學會了游戲規則。

一個可能的解釋是,模型記住了奧賽羅游戲的所有移動操作。

為了驗證這個猜想,研究人員合成了一個新的數據集:在每場比賽開始時,奧賽羅有四種可能的開局棋位置(C5、D6、E3和F4),將所有C5開局的走法移除后作為訓練集,再將C5開局的數據作為測試,也就是移除了近1/4的博弈樹,結果發現模型錯誤率仍然只有0.02%

所以Othello-GPT的高性能并不是因為記憶,因為測試數據是訓練過程中完全沒見過的,那到底是什么讓模型成功預測?

探索內部表征

一個常用的神經網絡內部表征探測工具就是探針(probe),每個探針是一個分類器或回歸器,其輸入由網絡的內部激活組成,并經過訓練以預測感興趣的特征。

在這個任務中,為了檢測Othello-GPT的內部激活是否包含當前棋盤狀態的表征,輸入移動序列后,用內部激活向量對下一個移動步驟進行預測。

當使用線性探針時,訓練后的Othello-GPT內部表征只比隨機猜測的準確率高了一點點。

當使用非線性探針(兩層MLP)時,錯誤率大幅下降,證明了棋盤狀態并不是以一種簡單的方式存儲在網絡激活中。

干預實驗

為了確定模型預測和涌現世界表征之間的因果關系,即棋盤狀態是否確實影響了網絡的預測結果,研究人員進行了一組干預(intervention)試驗,并測量由此產生的影響程度。

給定來自Othello-GPT的一組激活,用探針預測棋盤狀態,記錄相關聯的移動預測,然后修改激活,讓探針預測更新的棋盤狀態。

干預操作包括將某個位置的棋子從白色變成黑色等,一個小的修改就會導致模型結果發現內部表征能夠可靠地完成預測,即內部表征與模型預測之間存在因果影響。

可視化

除了干預實驗驗證內部表征的有效性外,研究人員還將預測結果可視化,比如說對于棋盤上的每個棋子,可以詢問模型如果用干預技術將該棋子改變,模型的預測結果將如何變化,對應預測結果的顯著性。

然后根據當前棋盤狀態的top1預測的顯著性對牌進行著色可視化,因為繪制出來的圖是基于網絡的潛空間而輸入,所以也可以叫做潛在顯著性圖(latent saliency map)。

可以看到,在合成和錦標賽數據集上訓練的Othello-GPTs的top1預測的潛顯著性圖中都展現出了清晰的模式。

合成版Othello-GPT在合法操作位置中顯示出了更高的顯著性值,非法操作的顯著性值明顯更低,稍微有點經驗的棋手都能看出模型的意圖;

錦標賽版的顯著圖更復雜,雖然合法操作位置的顯著性值比較高,但其他位置也顯示出較高的顯著性,可能是因為奧賽羅高手考慮更多的是全局特征。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-10-05 13:33:53

AI訓練

2023-05-22 15:46:56

模型訓練

2023-06-03 13:28:35

ChatGPTAItoken

2021-03-24 15:10:11

算法科學技術

2022-02-13 17:27:59

吳恩達AI小數據

2020-03-13 09:30:39

區塊鏈安全應用程序

2023-08-05 12:50:18

AI技術

2025-03-13 12:09:27

2025-10-20 17:06:19

AI智能體開源

2025-10-30 16:10:20

吳恩達AI應用

2023-07-10 16:01:56

2024-06-13 09:05:36

2021-04-23 10:55:52

人工智能深度學習

2017-12-15 12:44:02

2021-03-29 15:07:19

AI 數據人工智能

2021-04-13 09:25:21

機器學習人工智能計算機

2023-06-01 16:42:41

AI課程

2024-04-16 16:14:01

人工智能LLMRAG

2022-12-29 13:32:05

AI發展

2020-11-09 08:55:10

Python 開發AI
點贊
收藏

51CTO技術棧公眾號

97久久视频| 黄色污网站在线观看| 韩国精品免费视频| 久久久女人电视剧免费播放下载| 短视频在线观看| 中韩乱幕日产无线码一区| 亚洲视频一区在线观看| 国产私拍一区| 懂色av蜜臀av粉嫩av喷吹| 最新国产精品| 亚洲欧美另类人妖| 在线观看网站黄| 日韩成人动漫| 亚洲国产一区二区三区青草影视| 日本10禁啪啪无遮挡免费一区二区| 97人妻人人澡人人爽人人精品 | 国产一级视频在线| 国产一区二区三区天码| 精品奇米国产一区二区三区| 国产成人精品视频ⅴa片软件竹菊| 国语精品中文字幕| 国产jk精品白丝av在线观看| 日韩在线观看中文字幕| 欧美视频三区在线播放| 五月丁香综合缴情六月小说| 日本高清视频在线播放| 2欧美一区二区三区在线观看视频| 亚洲一区二区三区乱码aⅴ| 日日骚av一区二区| 一本色道久久综合亚洲精品高清| 久久久精品在线| 一级片久久久久| 一区二区美女| 日韩成人在线网站| 国产chinese中国hdxxxx| 国产精品2区| 欧美日韩国产另类不卡| caoporn超碰97| 免费福利视频一区二区三区| 亚洲成人激情av| 久久在线中文字幕| 精精国产xxxx视频在线中文版| 中文字幕永久在线不卡| 欧美色偷偷大香| 国产成人亚洲综合青青| 国产区在线观看视频| 欧美日韩一卡| 欧美肥婆姓交大片| 国产少妇在线观看| 亚洲色图88| 久久久国产视频91| 成人免费精品动漫网站| 久久精品青草| 精品国内亚洲在观看18黄| 久久视频一区二区三区| 日韩激情在线| 久久视频在线直播| 懂色av懂色av粉嫩av| 综合一区二区三区| 欧美丰满片xxx777| www.99re7.com| 亚洲国产日本| 欧美在线视频在线播放完整版免费观看 | 中文字幕在线观看视频免费| 久久婷婷一区| 国产精品美女久久久久久免费| 日本一区二区三区免费观看| 国产黄色网址在线观看| 欧美人体视频| 亚洲片av在线| 免费看黄色三级| 天天影视天天精品| 欧美日本高清一区| 日韩欧美a级片| 久久激情婷婷| 成人午夜在线视频一区| 亚洲成人中文字幕在线| 成人动漫中文字幕| 欧美高清视频一区| √新版天堂资源在线资源| 成人免费一区二区三区视频| 国产在线xxxx| free欧美| 欧美一区二区在线免费观看| 麻豆免费在线观看视频| 亚洲精品亚洲人成在线| 色综久久综合桃花网| 欧美成人片在线观看| 国产欧美一区二区三区国产幕精品| 欧美亚洲另类视频| 在线观看国产成人| 中文字幕这里只有精品| 亚洲欧美视频| 国产日韩欧美在线看| 亚洲av无码一区二区乱子伦| 99精品欧美一区二区三区综合在线| 日韩激情视频| 欧美6一10sex性hd| 在线观看视频一区二区欧美日韩| 91av免费观看| 一区三区在线欧| 欧美精品在线看| 天天操夜夜操视频| 国产综合色在线视频区| 久久久久se| 超碰在线观看免费版| 欧美午夜性色大片在线观看| 日本网站在线看| 欧美精品色图| 97人人爽人人喊人人模波多| 国产有码在线观看| 久久免费看少妇高潮| 99re6这里有精品热视频| 国产不卡网站| 亚洲福利视频免费观看| 69夜色精品国产69乱| 噜噜噜91成人网| 91精品在线观看入口| 91在线免费看片| 国产尤物视频在线| 亚洲成国产人片在线观看| 91丨九色丨蝌蚪| 欧美精选一区二区三区| 97视频com| 亚洲第一第二区| 一区在线播放视频| 亚洲欧美国产中文| 深爱激情久久| 人人爽久久涩噜噜噜网站| 亚洲国产999| 亚洲精品高清在线| 天天干天天玩天天操| 精品成人影院| 热久久美女精品天天吊色| 性xxxxbbbb| 亚洲国产精品尤物yw在线观看| 99精品视频国产| 婷婷综合伊人| 成人免费淫片aa视频免费| 国产在线视频福利| 色8久久精品久久久久久蜜| 亚洲成人av免费在线观看| 国语自产精品视频在线看8查询8| 成人性教育视频在线观看| 久久久久久久久久久久国产精品| 成人免费在线电影| 欧美性黄网官网| 中文字幕国产综合| 亚洲欧美大片| 日韩三级电影免费观看| 先锋欧美三级| 日韩专区中文字幕| 国产精品久久久久久久久毛片 | 精品一区二区三区av| 天堂va久久久噜噜噜久久va| yw.尤物在线精品视频| 国产午夜精品一区二区三区 | 久久99久久99| 99亚洲精品视频| 视频国产精品| 91国产在线精品| 青青草视频免费在线观看| 色哦色哦哦色天天综合| 日韩精品在线一区| 国产尤物在线播放| 国产乱人伦偷精品视频免下载| 成人免费看片视频在线观看| 亚洲精品a区| 欧美一级淫片丝袜脚交| 国产区av在线| 欧美老年两性高潮| 久久亚洲成人av| 久久久午夜精品| 一区二区三区网址| 欧美一区精品| 精品伦精品一区二区三区视频| 成人免费看黄| 精品国产一区二区三区久久| www.av在线.com| 欧美日韩美女在线观看| 老头老太做爰xxx视频| 国产一区三区三区| 欧美成人高潮一二区在线看| 精品国产精品| 91视频99| 日韩制服诱惑| 欧美精品videofree1080p| 国产小视频福利在线| 91精品麻豆日日躁夜夜躁| 日本熟妇色xxxxx日本免费看| 久久久久国产精品人| 亚洲高清av一区二区三区| 国产欧美69| 亚洲天堂av免费在线观看| 久久久久97| 国产精品人成电影在线观看| 97人人爽人人澡人人精品| 亚洲最新av网址| 欧美 日韩 国产 成人 在线 91| 精品自拍视频| 亚洲国产日韩一区| 在线观看国产小视频| 五月综合激情日本mⅴ| 中文字幕91视频| 99麻豆久久久国产精品免费优播| 三上悠亚av一区二区三区| 亚洲黄色成人| 国产一级黄色录像片| 欧美综合另类| 国产综合第一页| 精品国模一区二区三区欧美| 国产成人精品午夜| 678在线观看视频| 大量国产精品视频| av网在线观看| 亚洲欧美日韩图片| 你懂的网站在线| 日韩一区二区免费在线观看| 中文字字幕在线观看| 欧美丝袜一区二区| 国产无套粉嫩白浆内谢| 亚洲同性同志一二三专区| 第一次破处视频| 2023国产一二三区日本精品2022| 性高潮久久久久久| 国产在线一区观看| 中文字幕永久视频| 久久一区二区三区超碰国产精品| 99热久久这里只有精品| 欧美二区不卡| 国产精品无码乱伦| 久久要要av| 一级二级三级欧美| 欧美精品尤物在线观看| 日本成人黄色免费看| 香蕉视频一区| 欧美精品一区在线| 婷婷五月色综合香五月| 国产偷久久久精品专区| 成人资源在线播放| 国产富婆一区二区三区| 视频精品一区二区三区| 亚洲自拍在线观看| 一区二区三区在线资源| 91久久精品国产91久久性色tv | 欧美性色黄大片| 国产熟妇一区二区三区四区| 欧美日韩一区二区精品| 国产精品乱子伦| 激情成人在线视频| 国产乡下妇女做爰毛片| 午夜在线电影亚洲一区| 日本污视频在线观看| 亚洲高清视频在线| 国产真实的和子乱拍在线观看| 一区二区三区四区国产精品| 免费网站观看www在线观| 亚洲一二三四区不卡| 日本一级淫片免费放| 欧美日韩激情视频8区| 五月天激情四射| 欧美视频在线不卡| 国产精品毛片一区二区在线看舒淇| 欧美日韩电影在线| 精品区在线观看| 精品国产一区二区三区四区四| 欧美特黄一级视频| 亚洲裸体xxxx| 91成人高清| 久久九九有精品国产23| 国精一区二区三区| 97免费中文视频在线观看| 最新中文字幕在线播放| 国产精品嫩草影院一区二区| 免费一区二区三区在线视频| 好看的日韩精品视频在线| 国产一区99| 超碰在线免费观看97| 99国产精品视频免费观看一公开| 日韩亚洲在线视频| 国产麻豆精品95视频| 精品人妻一区二区三区日产乱码卜| 久久久久久久久岛国免费| 国产无遮挡在线观看| 亚洲精品第1页| 亚洲s码欧洲m码国产av| 91精品国模一区二区三区| 欧美亚一区二区三区| 国产精品国产亚洲精品| 国产免费一区视频观看免费| 成人福利一区| 午夜精品一区二区三区四区| 欧美日韩亚洲三区| 天堂中文视频在线| 国v精品久久久网| 一级肉体全黄裸片| 亚洲一区二区三区国产| 怡红院成永久免费人全部视频| 欧美成人性战久久| 午夜在线播放| 68精品国产免费久久久久久婷婷| 成人黄色91| 欧美另类一区| 亚洲大片在线| 天天操精品视频| 国产视频亚洲色图| 国产精品美女毛片真酒店| 欧美丰满一区二区免费视频| 午夜影院免费体验区| 欧美福利视频网站| 欧美日韩国产网站| 久久一区二区精品| 国语自产精品视频在线看8查询8| 在线观看国产一级片| 国产午夜亚洲精品不卡| 精品久久免费视频| 日韩欧美自拍偷拍| 精品孕妇一区二区三区| 国产不卡av在线| 西瓜成人精品人成网站| 九色自拍视频在线观看| 国产精品资源网| 国产精品视频看看| 日本韩国精品在线| 国产一级黄色录像| 91精品秘密在线观看| 99视频精品免费| www日韩大片| 在线观看日韩中文字幕| 亚洲成人中文字幕| 污片在线免费观看| 91在线看www| 自拍偷拍欧美专区| 黄色a级三级三级三级| 一色屋精品亚洲香蕉网站| 在线免费观看一级片| 中文字幕日韩免费视频| 99热播精品免费| 日韩在线国产| 青青草成人在线观看| 永久免费毛片在线观看| 欧美亚洲日本国产| 在线播放日本| 91精品久久久久久久久久久久久久| 成人免费看片39| 日本xxxx黄色| 亚洲人一二三区| 精品人妻无码一区二区 | 男男gaygays亚洲| 国产精品一级久久久| 亚洲理论在线| 好吊日免费视频| 91成人在线免费观看| av中文天堂在线| 国产狼人综合免费视频| 99久久婷婷| 日韩精品国产一区| 精品国产精品自拍| 精品美女视频在线观看免费软件 | 国产又粗又黄又爽| 色妞色视频一区二区三区四区| 欧美成人高清视频在线观看| 在线视频不卡国产| 国产风韵犹存在线视精品| 日韩成人高清视频| 亚洲欧洲午夜一线一品| 成人在线免费| 中国女人做爰视频| av不卡在线观看| 波多野结衣毛片| 久久精品视频va| 久草精品视频| 亚洲成人av免费看| 一区二区三区欧美视频| 婷婷丁香一区二区三区| 国产成人精品网站| 欧美a级在线| 国产精品1000部啪视频| 欧美日韩在线一区二区| 牛牛在线精品视频| 欧美日韩在线高清| 国产中文字幕精品| 国产精品乱子伦| 美女少妇精品视频| 日本亚洲不卡| 免费av不卡在线| 精品国产乱码久久久久久虫虫漫画| a天堂中文在线| 懂色av一区二区三区在线播放| 国产精品久久久久久久免费软件| 黄色裸体一级片| 亚洲精品国产综合久久| 欧美美女福利视频| 欧美三级在线观看视频| 国产精品久久久久9999吃药| 免费国产精品视频| 国产精品免费在线免费| 99视频在线精品国自产拍免费观看| 国产探花视频在线| 久久国产精品72免费观看|