精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI能理解自己生成的東西嗎? 在GPT-4、Midjourney上實驗后,有人破案了

人工智能 新聞
近日,華盛頓大學與艾倫人工智能研究院(Allen Institute for AI)聯合發布論文,對這一悖論進行研究。

從 ChatGPT 到 GPT4,從 DALL?E 2/3 到 Midjourney,生成式 AI 引發了前所未有的全球關注。強大的潛力讓人們對 AI 產生了許多期待,但是強大的智能也會引發人們的恐懼和擔憂。近期大牛們針對該問題還上演了一場激烈的論戰。先是圖靈得獎主們「混戰」,后有吳恩達下場加入。

在語言和視覺領域,目前的生成模型只需要幾秒鐘就可輸出,甚至能夠挑戰具有多年技能和知識的專家。這似乎為模型已經超越人類智能的說法提供了令人信服的動機。但是,同樣需要注意到的是,模型輸出中常有理解性的基本錯誤。

這樣看來,似乎出現了一個悖論:我們要如何協調這些模型看似超人的能力與持續存在的大多數人類都能糾正的基本錯誤?

近日,華盛頓大學與艾倫人工智能研究院(Allen Institute for AI)聯合發布論文,對這一悖論進行研究。

圖片

論文地址:https://arxiv.org/abs/2311.00059

本文認為,之所以會出現這樣的現象,是因為當今生成模型中的能力配置與人類的智能配置相背離。本文提出并測試了生成式 AI 悖論假設:生成模型通過訓練,直接輸出媲美專家的結果,該過程直接跳過了理解生成該質量輸出的能力。然而,對于人類來說,這截然不同,基本的理解往往是專家級輸出能力的先決條件。

在本文中,研究者通過對照實驗來檢驗這一假設,分析生成模型對文本和視覺的生成、理解能力。本文首先通過兩個角度講生成模型的「理解」概念化:

  • 1)給定一個生成任務,模型在多大程度上能在同一任務的判別版本中選擇正確的回復;
  • 2)給定一個正確的生成回復,模型在多大程度上能回答有關該回復的內容和問題。這就產生了兩種實驗設置,分別是選擇性實驗和詢問性實驗。

研究者發現,在選擇性評估中,模型在生成任務設置中的表現往往與人類相當甚至優于人類,但在判別(理解)設置中,模型的表現卻不及人類。進一步的分析表明,與 GPT-4 相比,人類的判別能力與生成能力聯系更為緊密,而且人類的判別能力對對抗性輸入也更為魯棒,模型與人類的判別能力差距隨著任務難度的增加而增大。

同樣,在詢問性評估中,雖然模型可以在不同任務中產生高質量的輸出,但研究者觀察到模型在回答有關這些輸出的問題時經常出現錯誤,模型的理解能力再次低于人類的理解能力。本文討論了生成模型與人類在能力配置上出現分歧的一系列潛在原因,包括模型訓練目標、輸入的大小和性質。

這項研究的意義在于,首先,這意味著從人類經驗中得出的現有智能概念可能無法推廣到 AI,即使 AI 的能力在很多方面似乎模仿或超越了人類智能,但其能力可能與人類的預期模式存在根本性差異。另一方面,本文研究結果也建議,在研究生成模型以深入了解人類智能和認知時要謹慎,因為看似專家級的類人輸出可能掩蓋了非人類的機制。 

總之,生成式 AI 悖論鼓勵人們把模型作為一個人類智能的有趣對立面來研究,而不是作為一個平行的對立面來研究。

「生成式 AI 悖論強調了一個有趣的概念,即 AI 模型可以創造出它們自己可能無法完全理解的內容。這就提出了人工智能存在理解的局限性及其強大的生成能力背后所面臨的潛在問題。」網友表示。

圖片

何謂生成式 AI 悖論 

我們首先了解一下生成式 AI 悖論以及測試它的實驗設計。

圖片

圖 1:語言和視覺中的生成式 AI 可以產生高質量的結果。然而,矛盾的是,模型在展示對這些模式的選擇性(A,C)或詢問性(B,D)理解方面有困難。

生成模型獲得生成能力似乎比獲得理解能力更有效,這與人類的智能形成鮮明對比,后者通常是獲得生成能力更難。

要驗證這一假設,需要對悖論的各個方面進行操作性定義。首先,對于給定的模型和任務 t,以人類智能為基線,生成能力比理解能力「更有效」意味著什么。將 g 和 u 作為生成和理解的一些性能指標,研究者將生成式人工智能悖論假設正式表述為:

圖片

簡單地說,對于一項任務 t,如果人類的生成性能 g 與模型相同,那么人類的理解性能 u 就會明顯高于模型(在合理的大 ? 條件下 > ?)。換一種說法,模型在理解方面的表現比研究者對具有類似強大生成能力的人類的預期要差。

生成的操作性定義很簡單:給定一個任務輸入(問題 / 提示),生成就是生成可觀察到的內容以滿足該輸入。因此,可以自動或由人類對性能 g 進行評估(如風格、正確性、偏好)。雖然理解能力不是由一些可觀察到的輸出來定義的,但可以通過明確定義其效果來進行測試:

  1. 選擇性評價。對于一個可以生成應答的給定任務,模型在多大程度上還能在同一任務的判別版本中從提供的候選集中選擇出準確的答案?一個常見的例子是多選題回答,這是檢驗語言模型中人類理解和自然語言理解的最常見方法之一。(圖 1,A、C 欄)
  2. 提問式評價。對于給定生成的模型輸出,模型能在多大程度上準確回答有關該輸出的內容和適當性的問題?這類似于教育中的口試。(圖 1,B、D 欄 )。

這些關于理解的定義提供了一個評估「生成式 AI 悖論」的藍圖,讓研究者能夠檢驗假設 1 是否在不同模式、任務和模型中都成立。

當模型可以生成時,它們能否判別?

首先,研究者在選擇性評估中對生成性任務和判別性任務的變體進行了并列性能分析,以評估模型在語言和視覺模式下的生成和理解能力。他們將這種生成和判別性能與人類進行比較。

下圖 2 比較了 GPT-3.5、GPT-4 和人類的生成和判別性能。可以看到,在 13 個數據集中的 10 個數據集中,至少有一個模型支持子假設 1,模型的生成能力優于人類,但判別能力低于人類。在 13 個數據集中,有 7 個數據集的兩個模型都支持子假設 1。

圖片

要求人類像視覺模型那樣生成詳細圖像是不現實的,普通人無法達到 Midjourney 等模型的風格質量,因此假設人類的生成性能較低。這里只將模型的生成和判別準確性與人類的判別準確性進行比較。與語言領域類似,圖 3 展示了 CLIP 和 OpenCLIP 在判別性能方面也不及人類的準確性。假設人類的生成能力較差,這與子假設 1 一致:視覺 AI 在生成方面超過人類平均水平,但在理解方面落后于人類

圖片

圖 4(左)展示了 GPT-4 與人類的對比。通過觀察,可以發現,當回答冗長且具有挑戰性時,例如總結冗長的文檔,模型往往會在判別任務中犯最多的錯誤。相比之下,人類則能在不同難度的任務中始終保持較高的準確率。

圖 4(右)展示了 OpenCLIP 與人類在不同難度下的判別性能對比。總之,這些結果突出表明,即使面對具有挑戰性或對抗性的樣本,人類也有能力判別出正確答案,但這種能力在語言模型中并不那么強大。這種差異引發了人們對這些模型真正理解程度的疑問。

圖片

圖 5 展示了一個值得注意的趨勢:與人類生成的回復相比,評估員往往更青睞 GPT-4 的回復。

圖片

模型能理解自己生成的結果嗎?

上一節展示了模型通常擅長生成準確的答案,而在判別任務中卻落后于人類。現在,在提問式評估中,研究者通過直接向模型提出有關生成內容的問題,以研究模型能在多大程度上展示出對生成內容有意義的理解 —— 而這正是人類的強項。

圖片

圖 6(左)展示了語言模態的結果。雖然模型在生成方面表現出色,但在回答有關其生成的問題時卻經常出錯,這表明模型在理解方面存在失誤。假設人類無法以同樣的速度或規模生成這樣的文本,盡管問題是關于模型自身的輸出,但與模型相比,人類在質量保證方面的準確率一直較高。正如子假設 2 中所述,研究者預計人類對自己生成的文本會取得更高的準確率。同時可以注意到,本研究中的人類并不是專家,制作與模型輸出一樣復雜的文本可能是一個巨大的挑戰。

因此研究者預計,如果將模型與人類專家進行比較,在理解自己生成內容方面的性能差距會進一步拉大,因為人類專家很可能以接近完美的準確度回答此類問題。

圖 6(右)展示的是視覺模式下的提問結果。可以看到,圖像理解模型在回答有關生成圖像中元素的簡單問題時,其準確性仍然無法與人類相比。同時,圖像生成 SOTA 模型在生成圖像的質量和速度上都超過了大多數普通人(預計普通人很難生成類似的逼真圖像),這表明視覺 AI 在生成(較強)和理解(較弱)方面與人類存在相對差距。令人驚訝的是,與先進的多模態 LLM(即 Bard 和 BingChat)相比,簡單模型與人類之間的性能差距較小,后者具有一些引人入勝的視覺理解能力,但仍難以回答有關生成圖像的簡單問題。

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-06 16:09:46

程序員AI

2023-03-16 19:17:57

2023-08-15 15:03:00

AI工具

2023-06-19 08:19:50

2023-11-02 12:10:00

AI訓練

2025-04-16 09:35:03

2023-03-30 11:08:49

AI模型訓練

2023-05-31 14:23:44

人工智能

2023-05-29 09:29:52

GPT-4語言模型

2023-04-04 08:01:35

2024-05-13 07:14:03

GPT-4生成式AIAI模型

2025-05-30 07:40:56

2023-04-13 15:10:58

AI模型

2023-03-28 13:01:20

GPT-4開發OpenAI

2023-05-03 20:53:48

2023-03-15 07:49:57

GPT-4ChatGPT

2023-11-27 13:06:41

2023-12-15 12:52:17

AI模型

2024-03-22 13:33:00

AI模型

2023-08-02 10:45:43

點贊
收藏

51CTO技術棧公眾號

欧美精品一区二区视频 | 9久久婷婷国产综合精品性色| 深夜福利在线看| 久久精品导航| 日韩在线视频网站| av中文字幕网址| а√在线中文在线新版| 欧美激情一区不卡| 丁香五月网久久综合| 国产美女激情视频| 91成人观看| 亚洲精选在线观看| 激情在线观看视频| 超碰一区二区| 尤物在线观看一区| 日韩欧美国产二区| 成人av无码一区二区三区| 久久在线精品| 欧美激情第99页| 妺妺窝人体色WWW精品| 日韩亚洲精品在线观看| 欧美在线观看禁18| 久久久99精品视频| freemovies性欧美| 久久综合色之久久综合| 99国产盗摄| 在线免费观看视频网站| 在线视频日韩| 欧美激情在线观看视频| 韩国一级黄色录像| 国产免费播放一区二区| 精品免费国产一区二区三区四区| 男女无套免费视频网站动漫| 国产污视频在线播放| 亚洲精品亚洲人成人网| 蜜桃麻豆91| 老牛影视av牛牛影视av| 国产乱一区二区| 国产精品中文字幕在线| 看片网址国产福利av中文字幕| 欧美不卡视频| 精品激情国产视频| 黑人と日本人の交わりビデオ| 亚洲国产合集| 日韩精品亚洲元码| 欧美在线一级片| 久久av国产紧身裤| 精品av久久707| 在线免费观看av网| 国产成人免费av一区二区午夜 | 女性隐私黄www网站视频| www.九色在线| 午夜精品久久久久久久蜜桃app| 男女啪啪免费观看| 深夜国产在线播放| 亚洲综合久久av| 野外做受又硬又粗又大视频√| 99在线视频观看| 亚洲激情男女视频| 精品国偷自产一区二区三区| 日本大片在线播放| 亚洲在线视频一区| 国产人妻777人伦精品hd| 国产一二三在线| 欧美日韩国产中文精品字幕自在自线 | 午夜视频在线网站| 国产精品美女久久久久| 欧美一区二区三区电影| 色婷婷狠狠18禁久久| 成人看片爽爽爽| 亚洲国内精品在线| 免费污网站在线观看| 欧洲专线二区三区| 日韩中文字幕免费看| h色网站在线观看| 欧美久色视频| 欧美影院在线播放| 日韩乱码一区二区三区| 激情综合色播激情啊| av资源一区二区| 亚洲 欧美 激情 小说 另类| 国产亚洲精久久久久久| 亚洲午夜在线观看| 日本三级在线观看网站| 欧美视频国产精品| 激情 小说 亚洲 图片: 伦| 国产不卡精品在线| 精品中文字幕久久久久久| 色婷婷国产精品免| 欧美日韩国产一区精品一区| 96精品视频在线| 伊人网站在线观看| 粉嫩在线一区二区三区视频| 麻豆亚洲一区| 欧美jizz18hd性欧美| 亚洲国产婷婷综合在线精品| 久久精品视频91| 国产麻豆一区二区三区| 亚洲女人天堂av| 国产三级国产精品国产国在线观看| 欧美日韩一区自拍| 国产精品久久婷婷六月丁香| 精品国产av 无码一区二区三区 | 超碰97免费在线| 欧美色手机在线观看| xxxwww国产| 国产精品久久久久蜜臀| 97香蕉久久超级碰碰高清版| 伊人免费在线观看高清版| 波多野洁衣一区| 亚洲一区影院| 漫画在线观看av| 91精品国产综合久久久久| 国产成人av一区二区三区不卡| 午夜精品视频一区二区三区在线看| 欧美夜福利tv在线| 精品国产伦一区二区三| 国产精品无码永久免费888| xxxx18hd亚洲hd捆绑| 日韩一级特黄| 国产一区二区动漫| 99久久精品国产亚洲| 国产精品一级在线| 无遮挡亚洲一区| 在线天堂资源| 亚洲精品mp4| 激情五月婷婷在线| 韩国av一区二区三区四区| 日本一区不卡| 亚洲欧美小说色综合小说一区| 精品蜜桃在线看| 黄色一级片中国| 久久激情五月激情| 视频一区视频二区视频| 美女日韩欧美| 日韩精品中文字幕在线| 日韩黄色三级视频| 国产91精品在线观看| 国产免费xxx| 亚瑟国产精品| 神马久久久久久| 色婷婷久久综合中文久久蜜桃av| 久久综合九色欧美综合狠狠| www.99热这里只有精品| 成人三级av在线| 98视频在线噜噜噜国产| 亚洲精品国产精品国| 一区二区视频在线| 亚洲av毛片在线观看| 午夜激情久久| 91中文在线视频| av在线导航| 日韩欧美一二三四区| 国产免费无码一区二区视频 | 无码国产69精品久久久久网站| 综合av在线| 91精品国产一区二区三区动漫 | 91精品精品| 91深夜福利视频| 中文字幕伦理免费在线视频| 日韩一级片在线观看| 青娱乐av在线| 成人h动漫精品一区二| 久久久亚洲精品无码| 婷婷综合福利| 国产精品成久久久久三级| 97超碰国产一区二区三区| 欧美日韩成人综合天天影院| 中文字幕求饶的少妇| 国产精品自拍av| 日韩欧美不卡在线| 久久99国产精品视频| 国产精品视频免费在线| h视频在线免费观看| 亚洲精品一区二区三区影院| 国产情侣在线视频| 国产欧美一区二区三区沐欲| 国产一级做a爰片久久| 在线观看国产精品入口| 国产在线一区二| 日韩色淫视频| 欧美黑人xxxx| 大地资源中文在线观看免费版| 这里只有精品电影| 欧美不卡视频在线观看| 国产日韩欧美综合一区| 一级黄色高清视频| 国产欧美一区二区色老头| 亚洲黄色成人久久久| 亚洲专区**| 国产精品久久久久久久久久尿| 成人在线播放免费观看| 亚洲精品久久久久久久久久久| 中文字幕人成人乱码亚洲电影| 亚洲精品免费电影| 亚洲日本精品视频| 国产精品一区二区在线看| 777久久久精品一区二区三区 | 国产freexxxx性播放麻豆| 久久av网址| 成人动漫在线视频| 色综合一本到久久亚洲91| 欧美福利视频网站| 最新97超碰在线| 亚洲精品国产成人| 国产亲伦免费视频播放| 色综合天天综合| 久久国产在线视频| 国产精品毛片久久久久久 | 日本一区二区三区免费乱视频 | 无码国模国产在线观看| 国产成人精品视频| 91九色在线看| 美日韩丰满少妇在线观看| av资源在线观看免费高清| 精品国产乱码久久久久久浪潮| 中文字幕在线观看欧美| 欧美性猛交xxxx| 久久婷婷国产麻豆91| 成人免费一区二区三区在线观看| 国产aⅴ激情无码久久久无码| 成人在线一区二区三区| 五月天开心婷婷| 日本色综合中文字幕| 国产精品沙发午睡系列| 韩国久久久久| 亚洲国产精品女人| 久久一区91| 亚洲国产精品综合| 色棕色天天综合网| 免费观看成人在线| 欧美电影免费网站| 国产一区二区黄色| 综合久久成人| 不卡一区二区三区视频| 激情五月综合婷婷| 成人黄色网免费| 日日夜夜亚洲| 成人国产精品久久久| 日日夜夜综合| 91精品久久久久久| 成人福利片在线| 国产精品视频99| 国产精品蜜月aⅴ在线| 国产精品劲爆视频| 岛国精品在线| 成人福利在线观看| 精品一区二区三区免费看| 91网在线免费观看| 日韩精品视频在线看| 91黄色精品| 97久久综合区小说区图片区| 国产精品一区二区三区免费观看| 91精品国产自产在线丝袜啪 | 亚洲一区日韩精品| 蜜桃视频一区二区三区在线观看| 最近中文字幕一区二区| 蜜桃精品视频在线观看| 亚洲一二三av| 国产精品小仙女| v天堂中文在线| 久久综合色天天久久综合图片| 亚欧洲乱码视频| 中文字幕国产一区二区| 日本黄色免费片| 一区二区三区四区在线| www.av麻豆| 欧亚洲嫩模精品一区三区| 国产又粗又猛又爽又黄的| 欧美v日韩v国产v| 午夜视频在线免费播放| 亚洲人成网站999久久久综合| 国产精品一区在线看| 日韩亚洲精品电影| 成年人视频免费在线播放| 日韩免费在线视频| 电影中文字幕一区二区| 国产免费一区二区| 成人三级视频| 国产专区在线视频| 久久国产99| 手机av在线网站| 99久久国产综合色|国产精品| 人妻aⅴ无码一区二区三区 | 1级黄色大片儿| 在线观看一区二区精品视频| 国产精品国产三级国产aⅴ| 精品久久一区二区三区| 搞黄视频免费在线观看| 超碰91人人草人人干| 亚洲色图官网| 91免费版网站入口| 亚洲精品无吗| 在线观看av的网址| 奇米亚洲午夜久久精品| 国产精品一级无码| 国产欧美日产一区| 国产一级二级三级| 欧美日韩午夜在线| 天天干在线观看| 久久久国产精品视频| 成人免费影院| 成人一区二区三区四区| 不卡在线一区二区| 国产精品333| 国产精品综合二区| 91麻豆制片厂| 欧美午夜久久久| 黄色一级大片在线免费看国产一 | 日本成人免费在线观看 | h视频久久久| 日本午夜精品一区二区| 亚洲日本成人| 香蕉视频xxxx| 国产精品国产精品国产专区不蜜| 九九热精品视频在线| 日韩欧美一区二区视频| 国产高清视频在线| 77777少妇光屁股久久一区| 久久久国产精品入口麻豆| 涩涩涩999| 久久亚洲二区| 亚洲第九十七页| 亚洲成人综合网站| 国产成人三级一区二区在线观看一 | 亚洲国产精品无码久久久久高潮 | 97久久人人超碰| 麻豆疯狂做受xxxx高潮视频| 在线成人av影院| 在线激情网站| 国产精品黄色av| av中文字幕一区二区| 国产精品少妇在线视频| 91小视频在线| 日本一本高清视频| 337p日本欧洲亚洲大胆精品| 伊人福利在线| 亚洲在线一区二区| 亚洲最新色图| 香蕉视频xxxx| 亚洲精品中文字幕在线观看| ,一级淫片a看免费| 日韩中文第一页| 国产一区影院| 色中文字幕在线观看| 激情另类小说区图片区视频区| 国产亚洲精品精品精品| 欧美三级日韩三级| 天堂资源在线中文| 成人网址在线观看| 91精品精品| 美女又黄又免费的视频| 亚洲一区日韩精品中文字幕| 高h放荡受浪受bl| 国自在线精品视频| 亚洲另类av| 91最新在线观看| 亚洲欧洲日韩综合一区二区| 国产乱色精品成人免费视频| 久久成人人人人精品欧| 最新精品在线| 无罩大乳的熟妇正在播放| 久久综合九色综合欧美98| 美女黄页在线观看| 久久躁狠狠躁夜夜爽| 亚洲日本va中文字幕| 免费看国产曰批40分钟| 久久精品夜色噜噜亚洲a∨| 一区二区视频免费| 欧美老女人在线视频| 欧美韩一区二区| 国产一级特黄a大片免费| 亚洲欧美另类在线| 日本成人动漫在线观看| 国产精品18久久久久久首页狼| 久久人体视频| 亚洲欧洲国产视频| 色婷婷国产精品| 精品欧美色视频网站在线观看| 国产高清精品一区二区| 首页国产欧美日韩丝袜| 午夜国产福利一区二区| 亚洲福利视频久久| 国产综合av| 欧美狂野激情性xxxx在线观| 26uuu国产日韩综合| 国产露脸91国语对白| 韩国一区二区电影| 日韩欧美中字| 国产激情视频网站| 欧美裸体bbwbbwbbw| 高端美女服务在线视频播放| 亚洲v日韩v欧美v综合| 国产91精品一区二区麻豆网站| 国产一卡二卡三卡| 欧美激情一区二区三区成人 | 男人添女荫道口女人有什么感觉| 久久只精品国产| 亚洲av无码专区在线| 国产精品久久久久久久久久久久 |