精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

考那么多試,拿那么高分,大模型們真的懂語言了嗎?

開發 開發工具 機器學習
GPT-3 這樣在大量網絡文本上訓練的模型真的超越了 Watson 嗎?它真的理解它生成的語言和推理嗎?這是 AI 研究界存在明顯分歧的話題。

十年前,IBM 的 Watson 獲得了答題節目《Jeopardy!》的冠軍,當時 IBM 宣稱:「Watson 能夠理解自然語言的所有歧義和復雜性。」然而,正如我們所看到的,Watson 隨后在試圖「用人工智能徹底改變醫學」的過程中失敗了,智能體所具備的語言能力與實際理解人類語言并不能完全劃等號。

[[441624]]

自然語言理解一直是人工智能研究的主要目標之一。起初,研究人員試圖手動編程,讓機器理解新聞故事、小說或人類可能創作的任何其他內容。結果就像 Watson 一樣,這種方法是徒勞的,人們不可能歸納出理解文本所需的所有事實、規則和假設。

近年來一種 AI 領域建立起一種新的范式:我們不建立顯性知識,而是讓機器學習自己理解語言——攝取大量書面文本并學習預測單詞。這種新范式現在被稱作語言模型,GPT-3 等基于大型神經網絡的模型可以生成令人難以置信的人類散文和詩歌,并且能夠執行復雜的語言推理。

但是 GPT-3 這樣在大量網絡文本上訓練的模型真的超越了 Watson 嗎?它真的理解它生成的語言和推理嗎?這是 AI 研究界存在明顯分歧的話題。

此類討論曾經是哲學的范疇,但在過去十年中,人工智能已經從學術泡沫中迸發出來,進入了現實世界,它們對現實世界缺乏了解可能會產生非常嚴重的后果。一項研究發現 IBM 的 Watson 曾提出了「不安全和不正確的治療建議」。另一項研究表明:谷歌的機器翻譯系統在為非英語患者翻譯醫療說明時出現了重大錯誤。

那么我們如何確定機器是否可以理解現實?1950 年,計算機科學先驅艾倫 · 圖靈試圖用「圖靈測試」來回答這個問題。然而,圖靈低估了人類被機器愚弄的可能。早在上世紀 60 年代,Joseph Weizenbaum 就構建了一個簡單的聊天機器人 Eliza,試圖通過解釋句子讓 Eliza 模仿心理治療師講話。結果發現 Eliza 會讓人們相信他們正在與理解自己的人交談,即使他們知道和自己對話的是一臺機器。

在 2012 年的一篇論文中,計算機科學家 Hector Levesque、Ernest Davis 和 Leora Morgenstern 提出了一個更客觀的測試——Winograd 模式挑戰。這種測試方法已被 AI 語言社區采用,是當前評估機器理解的最佳方式之一。

Winograd 模式挑戰中包含一對句子,兩個句子僅相差一個詞,每個句子后面跟一個問題,例如:

Sentence 1: I poured water from the bottle into the cup until it was full.

Question: What was full, the bottle or the cup?

Sentence 2: I poured water from the bottle into the cup until it was empty.

Question: What was empty, the bottle or the cup?

 

Sentence 1: Joe’s uncle can still beat him at tennis, even though he is 30 years older.

Question: Who is older, Joe or Joe’s uncle?

Sentence 2: Joe’s uncle can still beat him at tennis, even though he is 30 years younger.

Question: Who is younger, Joe or Joe’s uncle?

Winograd 模式在 2016 年被用作一場比賽的主題,其中獲勝程序僅在 58% 的句子上給出了正確答案,這幾乎和簡單猜測的準確率差不多。句子中一個詞的差異可以改變代詞所指的人或事,正確回答這些問題需要常識性的理解。Winograd 模式正是為了測試這種理解而設計的,減輕了圖靈測試對人類判斷和聊天機器人技巧的不可靠性。特別是,Winograd 的作者設計了數百個被稱為「Google-proof」的模式:機器不應該使用谷歌搜索(或類似搜索)來正確回答問題。

然而,大型神經網絡語言模型的出現讓人工智能程序解決 Winograd 模式的能力迅速提高。OpenAI 2020 年的一篇論文稱 GPT-3 在 Winograd 模式基準集中近 90% 的句子上都是正確的。在專門針對這些任務進行訓練后,語言模型的表現甚至會更好。一些神經網絡在特定任務上甚至能達到 97% 的準確率,這種準確性和人類的表現已經大致相當。這是否意味著神經網絡語言模型已經達到了人類的理解水平?

并非如此。盡管創作者盡了最大努力,但 Winograd 模式實際上并沒有完全經過「Google-proof」。Winograd 模式中的挑戰就和許多其他 AI 語言理解測試一樣,有時允許使用快捷方式 ,讓神經網絡在不理解的情況下也能表現良好。例如:

  • 跑車超過了郵車因為它開得更快。
  • 跑車超過了郵車因為它開得更慢。

在龐大的語料庫上訓練的語言模型將吸收「跑車」和「快」之間以及「郵車」和「慢」之間的相關性,因此語言模型可以僅根據這些相關性來正確回答這些問題,而不存在真正的理解。事實證明,SuperGLUE 比賽中的許多 Winograd 模式都可以使用這類統計相關性。

艾倫人工智能研究所的一組研究人員嘗試解決 Winograd 模式的一些問題。2019 年,他們創建了一個更龐大的 Winograd 模式——WinoGrande。

WinoGrande 包含多達 44000 個句子,而不是數百個示例。這些句子是借助 Amazon Mechanical Turk 平臺獲得的,由真人編寫——每人被要求寫幾個句子對,這些句子包含多個主題,但每對句子可能相差不止一個單詞。

然后,研究人員通過用相對簡單的 AI 方法測試每個句子,將太容易解決的句子丟棄,以消除可能允許統計相關性捷徑的句子。與研究人員預期的一樣,與原始的 Winograd 模式相比,剩余的句子對機器提出了更困難的挑戰,在 Winograd 模式上與人類表現相當的神經網絡語言模型在 WinoGrande 集合上得分要低得多。

然而,另一個驚喜很快接踵而至。在 WinoGrande 集合問世之后的兩年里,神經網絡語言模型變得越來越大。而且,模型越大,它們在這項新挑戰上的得分似乎就越高。在本文撰寫之時,當前最好的模型(在幾 TB 的數據和數千個 WinoGrande 實例上訓練)已經達到了接近 90% 的準確率(人類是 94%)。這種性能的增益幾乎全部來自于神經網絡語言模型規模的增大和訓練數據體量的增加。

這些大模型真的獲得了像人類一樣的常識理解能力嗎?看起來并沒有。WinoGrande 反映出的結果有幾點需要注意。例如,由于那些句子依賴于 Amazon Mechanical Turk 平臺上的兼職人員,句子的質量和流暢度是非常不均衡的。同時,用來剔除「non-Google-proof」句子的 AI 方法可能過于簡單,無法發現一個龐大的神經網絡可能使用的所有統計捷徑。而且,該方法只適用于單個的句子,很多句子最后都會失去自己的「雙胞胎」兄弟姐妹。一項后續研究表明,神經網絡語言模型只在兩個「雙胞」句子上進行測試,而且兩個測試都要正確,它們比人類的準確率要低得多,這表明早前 90% 的結果沒那么重要。

那么,從 Winograd 的失敗中我們能得出什么教訓呢?那就是:我們通常很難根據 AI 系統在某項特定挑戰中的表現來判斷它們是否真的理解了自己所處理的語言。我們知道,神經網絡經常會使用統計方面的捷徑來獲取高分,而不是真正像人類一樣去理解。

在我看來,問題的關鍵在于,理解語言就需要理解世界,而只接觸語言的機器就無法獲取這種理解能力。舉個例子,「跑車超過了郵車,因為它開得慢一些」,理解這句話需要什么前提?首先,你要知道跑車和郵車分別是什么、車是可以互相「超過」的,甚至你還要知道更基本的常識:交通工具是存在于這個世界并與之交互的對象,由人類根據自己的行程驅動。

以上這些都是我們人類認為理所當然的知識,但這些知識并沒有內嵌在機器中,也不可能被明確地寫在任何語言模型的訓練文本中。一些認知科學家認為,在學習和理解語言方面,人類依賴于先天的、前語言的關于時空以及世界上其他基本屬性的核心知識。如果我們想讓機器像人類一樣掌握語言,我們首先需要賦予它們人類與生俱來的原始原則(primordial principle)。要評估機器的理解能力,我們應該首先評估它們對上述原則的掌握程度,有人將其稱為「嬰兒形而上學(infant metaphysics)」。

與 GPT-3 等成就輝煌的 AI 系統相比,訓練并評估一個嬰兒水平的機器看起來似乎倒退了一大步。但如果目標是真實可信的理解,那這可能是唯一一條讓機器理解「它」是什么以及獲取理解「它」所需要的一切的途徑。

原文鏈接:https://www.quantamagazine.org/what-does-it-mean-for-ai-to-understand-20211216/

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】  

戳這里,看該作者更多好文 

 

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2020-03-31 10:58:38

2010-01-26 09:24:53

C++語言

2019-12-18 15:11:42

數組集合數據

2010-01-15 16:45:35

C++語言

2015-09-29 10:12:10

2013-06-17 10:45:34

2017-09-07 16:32:05

華為

2017-01-21 14:57:43

Linuxsystemd

2020-07-13 08:40:21

BAT模具設計

2018-03-27 08:46:01

數據庫NoSQLredis

2023-01-24 16:13:22

編程語言JavaIT

2020-08-26 17:03:52

同型號顯卡產品

2010-02-07 13:45:12

Android操作系統

2010-03-02 10:26:32

Android系統平臺

2020-04-24 08:15:51

代碼 if else數組

2019-10-08 14:40:53

Java線程

2024-03-18 10:24:12

優化模型

2019-12-02 14:22:01

浪費云計算支出

2021-02-21 08:48:19

技術升職程序員

2011-12-31 14:47:10

Web App
點贊
收藏

51CTO技術棧公眾號

午夜免费久久看| 丁香婷婷综合色啪| 久久精品色欧美aⅴ一区二区| 日韩精品aaa| av在线视屏| 国产精品三级视频| 国产免费一区| 中文字幕在线2018| 亚洲午夜久久久久久尤物| 亚洲欧美在线播放| 欧美色图校园春色| 高清av不卡| 一区二区三区中文字幕| 日韩精品不卡| 亚洲欧美激情另类| 免费高清在线一区| 5278欧美一区二区三区| 国产67194| av在线不卡顿| 亚洲精品久久久久久下一站| 国产成人美女视频| free欧美| 午夜精品久久久久久久久| 国产奶头好大揉着好爽视频| 久久精品a一级国产免视看成人 | 91高清国产视频| 日韩伦理福利| 亚洲在线成人精品| 日韩国产精品毛片| 午夜看片在线免费| 国产视频在线观看一区二区三区| 国产成人看片| 精品毛片一区二区三区| 久久成人18免费观看| 国产国产精品人在线视| 亚洲伊人成人网| 激情五月***国产精品| 欧美乱大交做爰xxxⅹ性3| 成人一级片免费看| 欧美美女视频| 亚洲人a成www在线影院| a视频免费观看| 噜噜噜狠狠夜夜躁精品仙踪林| 欧美一区二区视频免费观看| 91视频这里只有精品| 精品女同一区二区三区在线观看| 色综合激情久久| 免费观看精品视频| 91久久国产综合久久91猫猫| 午夜精品久久久久影视| 国产亚洲综合视频| 日韩av影片| 欧美性猛交xxxx久久久| 国产xxxxx在线观看| 2020国产在线| 欧美视频在线免费| 日韩免费毛片视频| 五月激情久久| 欧美日韩国产在线播放网站| 日本高清久久久| 宅男噜噜噜66国产精品免费| 在线播放欧美女士性生活| aaa一级黄色片| 日韩在线观看一区二区三区| 精品国产伦一区二区三区观看方式 | 国产女人18水真多毛片18精品| 亚洲精品久久久| 欧美高清第一页| 天天做天天爱夜夜爽| 国产精品毛片| 国产精品免费在线免费| 在线观看不卡的av| 国产一区 二区 三区一级| 999精品视频一区二区三区| 高h调教冰块play男男双性文| 99视频超级精品| 日韩福利视频| 看女生喷水的网站在线观看| 亚洲一区自拍偷拍| 免费观看日韩毛片| 久久电影天堂| 日韩欧美一级精品久久| 国产三级国产精品| 天堂网在线观看国产精品| 欧美黑人巨大精品一区二区| 青青青国产在线| 精品一区二区国语对白| 精品一区二区不卡| 色网站在线看| 精品久久久免费| 浓精h攵女乱爱av| 中文字幕日韩在线| 国产亚洲欧洲黄色| 国产亚洲精品av| 日韩专区欧美专区| 99porn视频在线| 黄色av网址在线免费观看| 亚洲欧美日韩小说| 任你操这里只有精品| 日韩激情综合| 亚洲色图在线观看| 久久久久久国产精品视频| 久久先锋资源| 成人一区二区三区四区| 成人不用播放器| 亚洲国产精品久久一线不卡| 自拍偷拍一区二区三区四区| 成人看片爽爽爽| 日韩视频亚洲视频| 久久久久女人精品毛片九一| 国产一区二三区好的| 麻豆久久久9性大片| 在线观看免费视频你懂的| 欧美影院一区二区三区| 性色av蜜臀av色欲av| 亚洲国产精品久久久天堂| 国产精品99久久久久久久久久久久| 亚洲精品久久久久久无码色欲四季| 中文字幕成人在线观看| 久久综合色视频| 成人av动漫| 免费成人高清视频| 中文字幕一区二区三区免费看 | 欧美成人免费在线| 欧美性爽视频| 91精品婷婷国产综合久久竹菊| 美女脱光内衣内裤| 亚洲综合99| 国产一区免费| 色操视频在线| 日韩三级视频中文字幕| 亚洲不卡在线播放| 九九**精品视频免费播放| 婷婷亚洲婷婷综合色香五月| 毛片无码国产| 国产丝袜一区视频在线观看| 日韩成人免费在线观看| 国产v日产∨综合v精品视频| 国产91porn| 日韩在线视频一区二区三区| 麻豆乱码国产一区二区三区| 在线观看黄色网| 国产精品毛片久久久久久久| 一区二区三区 日韩| 欧美日韩久久精品| 国产精品免费一区二区三区都可以| 春暖花开成人亚洲区| 欧美性大战久久| 91麻豆精品国产91久久综合| 日韩国产欧美视频| 亚洲春色在线视频| 国产资源一区| 久久久极品av| 亚洲av永久纯肉无码精品动漫| 亚洲码国产岛国毛片在线| 日日夜夜精品视频免费观看| 综合天天久久| 国产精品一区二区免费| 欧美男男激情videos| 亚洲美女性生活视频| 国产精品欧美综合| 中文字幕一区二区三区不卡在线| 国产性生活一级片| 欧美日韩亚洲一区二区三区在线| 国产精品jizz视频| 超碰国产一区| 最新国产精品拍自在线播放 | 国产精品2024| 欧美爱爱视频免费看| 一本久久青青| 成人字幕网zmw| 黑人玩欧美人三根一起进| 亚洲精品久久久久久久久久久久 | 77thz桃花论族在线观看| 精品视频久久久| 中文在线字幕免费观| 亚洲欧美福利一区二区| 国产二级一片内射视频播放| 视频在线在亚洲| 97超碰免费观看| 日韩福利视频一区| 成人a免费视频| 9999热视频在线观看| 国产午夜精品免费一区二区三区 | 亚洲国产综合久久| 国产三级精品三级| 日本泡妞xxxx免费视频软件| 亚洲欧美视频| 国产欧美自拍视频| 三级小说欧洲区亚洲区| 成人激情视频在线观看| 欲香欲色天天天综合和网| 色婷婷成人综合| 欧美熟女一区二区| 欧美日韩第一区日日骚| 日韩女同强女同hd| 亚洲三级理论片| 永久免费看mv网站入口78| 国产精品一区二区三区四区| av片中文字幕| 欧美涩涩网站| 视频一区二区三| 久久悠悠精品综合网| 91精品久久久久久综合乱菊| av免费在线视| 久久久精品久久久久| 青青草视频免费在线观看| 日韩一区二区在线观看视频| 一级久久久久久| 精品久久久久久国产| 亚洲综合网在线| 国产精品丝袜在线| 久久丫精品国产亚洲av不卡| 国产精品一区二区黑丝| 美女少妇一区二区| 午夜一级久久| 成人免费观看cn| 欧美三级午夜理伦三级中文幕| 亚洲一二三区精品| 国产精品美女久久久久久不卡| 国产伦精品一区二区三区四区视频| 四虎国产精品永久在线国在线| 国产福利视频一区二区| 日本三级一区| 久久全球大尺度高清视频| a在线免费观看| 日韩中文字幕在线| a黄色在线观看| 国产亚洲激情在线| 免费在线稳定资源站| 亚洲精品美女在线| 神宫寺奈绪一区二区三区| 日韩一级二级三级精品视频| 国产精品国产一区二区三区四区 | 99sesese| 免费在线观看不卡| 天天操天天摸天天爽| 日韩国产精品久久久| 欧美激情国产精品日韩| 久久久久国产精品一区二区| 日本免费一级视频| 日韩精品一级中文字幕精品视频免费观看| 日韩av综合在线观看| 国产日韩精品视频一区二区三区 | 国产很黄免费观看久久| 亚洲天堂一区二区在线观看| 黑人巨大精品欧美黑白配亚洲| 国模私拍视频在线观看| 精品在线观看视频| 亚洲五月激情网| 国产激情视频一区二区三区欧美 | 亚洲18在线看污www麻豆 | 91黄视频在线观看| 成人一二三四区| 在线观看一区不卡| 在线免费观看日韩视频| 91精品国产入口| 亚洲精品一级片| 亚洲美女在线看| www.av在线播放| 久久艳片www.17c.com| 日韩精品亚洲人成在线观看| 欧美夫妻性视频| 中国色在线日|韩| 国产精品第1页| 国产精品一区二区三区av| 成人av蜜桃| 亚洲免费专区| 中文字幕免费在线不卡| 亚洲午夜精品久久久久久app| 国产精品50p| 免费观看一级特黄欧美大片| 日韩av影视大全| 99精品黄色片免费大全| 人妻熟人中文字幕一区二区| 亚洲精品一二三四区| 国产又大又黑又粗免费视频| 在线精品视频免费观看| 99热这里只有精品9| 日韩精品www| 色网站在线看| 国产91ⅴ在线精品免费观看| 久久久久久久性潮| 国产女主播一区二区三区| 清纯唯美日韩| 国产 日韩 亚洲 欧美| 日本人妖一区二区| 国产精品日日摸夜夜爽| 欧美国产1区2区| 五月天综合在线| 欧美午夜在线一二页| 成人午夜视频一区二区播放| 在线电影欧美日韩一区二区私密| av免费在线观| 国产精品久久久久av免费| 亚洲视频国产精品| 神马影院我不卡午夜| 亚洲高清激情| 九九九久久久久久久| 日本一二三不卡| 中文字幕一区二区三区精品| 制服.丝袜.亚洲.另类.中文| 人成在线免费视频| 欧美激情影音先锋| 少妇高潮一区二区三区99| 欧美不卡三区| 亚洲国产裸拍裸体视频在线观看乱了中文| 欧美伦理片在线观看| 9i在线看片成人免费| 中文字幕在线2021| 欧美日韩国产首页| 欧美美女搞黄| 91av视频导航| 成人av婷婷| 少妇久久久久久被弄到高潮| 麻豆国产一区二区| 久久婷婷五月综合| 欧美日韩中文字幕在线| 国产成人手机在线| 欧美日韩成人网| 成人豆花视频| 夜夜爽99久久国产综合精品女不卡 | 久久a级毛片毛片免费观看| 国产手机视频在线观看| 麻豆国产欧美一区二区三区| 久操视频免费看| 欧美日韩国产一区二区三区| 蜜桃在线一区二区| 欧美激情综合色| 日韩在线精品强乱中文字幕| 吴梦梦av在线| 激情图片小说一区| 免费成人美女女在线观看| 欧美天堂一区二区三区| 高清毛片在线看| 国产精品福利网| 精品精品久久| 国产一区二区在线免费播放| 中文字幕精品一区二区精品绿巨人 | 午夜欧美激情| 狼狼综合久久久久综合网| 中文精品视频| 超碰97在线资源站| 欧美特级www| 九九在线视频| 国产精品久久久久久久久久| 欧美亚洲国产激情| 日本特黄a级片| 亚洲同性同志一二三专区| 国产老妇伦国产熟女老妇视频| 久久成人人人人精品欧| 亚洲精品一区国产| 97视频久久久| 91免费看片在线观看| 久久久久亚洲av成人毛片韩| 亚洲人成人99网站| a∨色狠狠一区二区三区| 亚洲制服欧美久久| 国产精品主播直播| 国产大片中文字幕在线观看| 亚洲精品电影网在线观看| 亚洲私拍视频| 亚洲欧美99| 国产电影一区在线| 激情五月色婷婷| 夜夜嗨av一区二区三区免费区| 九九热这里有精品| 激情六月天婷婷| 91一区二区三区在线播放| 五月婷婷丁香在线| 欧美成人精品xxx| 欧洲亚洲视频| 中文字幕国内自拍| 夜色激情一区二区| 免费动漫网站在线观看| 成人观看高清在线观看免费| 亚洲欧洲午夜| 久久免费手机视频| 精品美女在线播放| 成人日韩精品| av一区二区三区免费观看| 久久婷婷成人综合色| 国产女人18毛片18精品| 98精品在线视频| 久久麻豆精品| 亚洲调教欧美在线| 91麻豆精品国产91久久久久| 蜜桃av在线播放| 三级网在线观看| 久久久99精品免费观看| 精品人妻无码一区二区色欲产成人 | 欧美日韩免费一区二区| 亚洲欧美日韩在线高清直播| 精品国产三区在线| 亚洲乱码国产一区三区| 亚洲综合一二区| 免费在线观看av网站| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 久久久999精品免费| 亚洲素人在线|