精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理

發(fā)布于 2024-11-25 16:24
瀏覽
0收藏

有關(guān)類似GPT-4這樣的大型語言模型(LLM)是否真正模擬人類邏輯和推理的辯論正在進(jìn)行中。一些研究人員認(rèn)為,隨著規(guī)模的擴(kuò)大,LLM可能會發(fā)展出對抽象推理、模式識別和類比制作的新能力。

另一方面,一些人認(rèn)為促使這些能力的內(nèi)部機(jī)制尚未被解釋清楚。一些實(shí)驗(yàn)證明,這些模型在其訓(xùn)練數(shù)據(jù)范圍之外難以推廣。

"在創(chuàng)建和推理抽象表示方面的能力對于強(qiáng)大的泛化至關(guān)重要,因此有必要了解LLM在這方面已經(jīng)取得了多大的能力," 圣塔菲研究所的科學(xué)家在最近的一篇論文中寫道。

在他們的研究中,研究人員深入探討了抽象推理的含義,并提供了在LLM中評估其能力的框架。研究結(jié)果表明,盡管GPT-4及其多模態(tài)版本GPT-4V非常復(fù)雜,但它們都未達(dá)到人類水平的抽象推理能力。

什么是抽象推理

抽象推理是從有限數(shù)據(jù)中識別規(guī)律或模式,并將其推廣到新場景的能力。這種特質(zhì)是人類智能的基石,兒童展示了從最少的例子中學(xué)習(xí)抽象規(guī)則的熟練技能。

評估抽象推理能力是一項(xiàng)困難的任務(wù)。弗朗索瓦·紹萊(Francois Chollet)提出的抽象與推理語料庫(ARC)是一個(gè)公正的衡量工具。ARC是一個(gè)評估人類和人工智能抽象推理能力的框架。該測試包含1,000個(gè)手工制作的類比謎題,每個(gè)謎題呈現(xiàn)一些網(wǎng)格轉(zhuǎn)換的例子和一個(gè)最終不完整的網(wǎng)格,解題者必須正確填充。這些謎題旨在消除任何不公平的優(yōu)勢,如與訓(xùn)練數(shù)據(jù)的相似性或?qū)ν獠恐R的依賴。

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

為了解決這些謎題,必須從少數(shù)示例中推斷出總體的抽象規(guī)律,并將其應(yīng)用于測試網(wǎng)格。解決ARC謎題所需的基礎(chǔ)知識被認(rèn)為是人類天生具備的,包括物體識別、數(shù)量評估以及幾何和拓?fù)涞幕驹淼雀拍睢?/p>

研究人員在他們的論文中寫道:“[ARC] 的目標(biāo)是捕捉抽象推理的核心:從少量示例中歸納出一般規(guī)則或模式,并靈活地應(yīng)用于新的、以前未見過的情境。”

人類在ARC上的表現(xiàn)大約在84%左右。相比之下,利用當(dāng)前人工智能系統(tǒng)嘗試解決ARC的努力表現(xiàn)不佳。在一場著名的Kaggle競賽中,使用了程序合成技術(shù)的頂級參賽作品僅成功解決了這些謎題的21%,而且無法超越其狹窄的范圍進(jìn)行泛化。作為通用問題解決者的LLM表現(xiàn)甚至更差,在最近的實(shí)驗(yàn)中只解決了10-12%的ARC挑戰(zhàn)。

對GPT-4進(jìn)行推理任務(wù)的測試

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

圣塔菲研究所的科學(xué)家們進(jìn)行了一系列新的實(shí)驗(yàn),使用了ConceptARC,這是ARC的一種變體,旨在更易于人類參與,并促進(jìn)對特定概念理解的評估。為了適應(yīng)基于文本的GPT-4,視覺謎題被轉(zhuǎn)化為字符序列。模型接收到一個(gè)包含說明、一個(gè)已解決的例子和一個(gè)新問題的提示。GPT-4的任務(wù)是生成表示解決方案的字符序列,允許最多三次嘗試。

先前的測試顯示,GPT-4在不同溫度下在ConceptARC上的得分分別為19%和25%。但通過新的更全面的提示技術(shù),結(jié)果有所改善。在進(jìn)行了480個(gè)ConceptARC任務(wù)的全面測試中,將模型的溫度設(shè)置調(diào)整為0和0.5時(shí),GPT-4的平均表現(xiàn)約為33%。

盡管取得了一些進(jìn)展,但GPT-4的能力明顯落后于人類表現(xiàn),人類在ConceptARC上的表現(xiàn)令人印象深刻,達(dá)到了91%。圣塔菲科學(xué)家指出:“盡管有更詳細(xì)的提示,GPT-4的表現(xiàn)仍然遠(yuǎn)遠(yuǎn)低于人類的高水平,這支持了一個(gè)結(jié)論,即即使有更多的信息提示,該系統(tǒng)仍然缺乏由這個(gè)語料庫測試的基本抽象推理能力。”

GPT-4和GPT-4V能否像人類一樣進(jìn)行抽象推理-AI.x社區(qū)

多模態(tài)是否可以提高GPT-4的性能

研究人員還在GPT-4V上測試了ConceptARC,這是GPT-4的多模態(tài)版本,除了文本外還能處理圖像。普遍的假設(shè)是,由于其增強(qiáng)的能力,GPT-4V將超越其僅文本的對應(yīng)版本。然而,由于全面測試的高昂成本,研究人員將對GPT-4V的評估限制在ConceptARC謎題的一個(gè)被稱為“注意力檢查”的特定組別上,人類通常在這里達(dá)到95%的成功率。

有趣的是,當(dāng)這些注意力檢查被轉(zhuǎn)換為GPT-4的純文本格式時(shí),該模型獲得了65-69%的分?jǐn)?shù),表明這些任務(wù)比完整集合的任務(wù)更容易。然而,GPT-4V在這些任務(wù)上的表現(xiàn)平均為23-25%,不及僅文本版本的成績。

論文對GPT-4V的回應(yīng)進(jìn)行了有趣的觀察:“GPT-4V經(jīng)常在其解決方案中包含對抽象變換規(guī)則的描述...在某些情況下,盡管識別了錯誤的抽象規(guī)則,該模型準(zhǔn)確地描述了輸出網(wǎng)格,我們將其歸類為成功。另一方面,我們將模型正確識別了抽象規(guī)則但未能準(zhǔn)確描述輸出網(wǎng)格的情況歸類為失敗。”

這個(gè)對LLM申請意味著什么

GPT-4V在完整的ConceptARC語料庫上的表現(xiàn)可能會比注意力檢查子集更差。這個(gè)結(jié)果表明,多模態(tài)能力并不一定會為LLM提供卓越的抽象推理能力。

圣塔菲研究所的研究結(jié)果強(qiáng)調(diào)了人類與當(dāng)前最先進(jìn)的人工智能系統(tǒng)之間在抽象推理方面存在的顯著差異。

研究人員寫道:“我們的結(jié)果支持這樣的假設(shè),即GPT-4,也許是目前最具“通用”性的LLM,仍然無法穩(wěn)健地形成抽象概念并推理有關(guān)其訓(xùn)練數(shù)據(jù)中先前未見過的基本核心概念。其他提示或任務(wù)表示的方法可能會提高GPT-4和GPT-4V的性能;這是未來研究的一個(gè)課題。”

因此,在將這些模型整合到需要精確邏輯的決策過程中時(shí),最好保持謹(jǐn)慎。在人工智能應(yīng)用中,尤其是在敏感領(lǐng)域,人類監(jiān)督仍然至關(guān)重要。

本文轉(zhuǎn)載自 ??MoPaaS魔泊云??,作者: Ben Dickson

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
鲁大师影院一区二区三区| 亚洲一区二区三区在线免费| 国产精品妹子av| 51蜜桃传媒精品一区二区| 国产成人无码一区二区三区在线| 蜜桃精品噜噜噜成人av| 欧美在线色视频| 亚洲爆乳无码精品aaa片蜜桃| 欧美日韩国产综合视频| 国产原创一区二区三区| 欧美在线免费视频| 麻豆明星ai换脸视频| 神马香蕉久久| 欧美一区二区福利在线| 国产精品亚洲二区在线观看| 国产精品剧情| 国产午夜精品福利| 成人三级在线| 中文字幕在线2018| 国产视频久久| 欧美激情中文字幕乱码免费| 大吊一区二区三区| 亚洲成a人片77777在线播放 | 国产午夜精品视频一区二区三区| 丝袜视频国产在线播放| 国产九色精品成人porny| 国产精品久久久久久久久久久久久| 久久久久免费看| 色婷婷亚洲mv天堂mv在影片| 亚洲精品网站在线播放gif| 久久精品一卡二卡| 激情亚洲小说| 在线精品视频一区二区| 日韩精品视频一区二区在线观看| 自拍亚洲图区| 亚洲美女淫视频| 在线精品日韩| av一区在线观看| 国产三级欧美三级日产三级99| 激情五月综合色婷婷一区二区 | 亚洲不卡系列| 色婷婷国产精品综合在线观看| 成 年 人 黄 色 大 片大 全| 色呦呦网站在线观看| 亚洲视频免费在线观看| 一级日韩一区在线观看| 在线免费观看的av网站| 国产欧美日韩在线观看| 久久综合一区| 日本韩国精品一区二区| 99re这里只有精品视频首页| 国产精品一区二区不卡视频| 亚洲国产999| 国产v日产∨综合v精品视频| 99精品在线直播| 国产成人精品毛片| 国产在线观看免费一区| 亚洲在线视频观看| 国产丰满果冻videossex| 国产精品一区免费视频| 不卡视频一区二区| 日日夜夜精品免费| a在线欧美一区| 久久精品五月婷婷| 国产小视频在线播放| 国产色一区二区| 亚洲欧美99| 91精选在线| 香蕉成人伊视频在线观看| 国产免费黄色av| 久久99久久99精品免观看软件| 欧美性猛交一区二区三区精品| 久久撸在线视频| 精品国产一区二区三区性色av| 日韩欧美123| 特大黑人巨人吊xxxx| 久久爱www成人| 日韩网站在线观看| 久久久久成人精品无码| 国产欧美精品久久| 国产精品视频一区国模私拍| 国产情侣一区二区| 成人一区二区三区在线观看| 久久精品日产第一区二区三区| 番号在线播放| 亚洲精品日韩一| 久久综合九色综合88i| 成人国产一区二区三区精品麻豆| 91精品国产麻豆国产自产在线| 日韩少妇一区二区| 欧美日韩在线二区| 欧美激情女人20p| 销魂美女一区二区| 国产福利91精品| 秋霞在线观看一区二区三区| 日本在线视频www鲁啊鲁| 色综合欧美在线视频区| 黑人性生活视频| 视频精品在线观看| 欧美极品美女视频网站在线观看免费| 偷偷操不一样的久久| 国产在线观看免费一区| 欧洲视频一区二区三区| 欧美aaa免费| 欧美性猛片xxxx免费看久爱| 又黄又爽的网站| 91综合网人人| 日韩免费观看av| 成 人 免费 黄 色| 中文字幕巨乱亚洲| 无码播放一区二区三区| 国产精品视频一区二区三区综合 | 欧美高清www午色夜在线视频| 青青草视频网站| 欧美va天堂| 国产精品一区二区久久| 日本一区视频| 亚洲va欧美va人人爽| 图片区乱熟图片区亚洲| 你懂的视频欧美| 午夜精品99久久免费| 精品人妻一区二区三区四区不卡 | 伊人久久大香线蕉精品| 手机在线理论片| 日韩精品一区二区三区视频播放| 蜜桃视频最新网址| 三级不卡在线观看| 久久久久欧美| 成人ssswww在线播放| 日韩精品在线一区二区| 中文字幕人妻一区二| 美女一区二区视频| 欧美亚洲免费高清在线观看| 成av人片在线观看www| 亚洲国产成人精品一区二区 | 自拍视频在线| 日本韩国精品一区二区在线观看| 国产熟女高潮一区二区三区 | 999在线免费视频| 国产精品日韩精品中文字幕| 77777亚洲午夜久久多人| 少妇一区二区三区四区| 亚洲综合丁香婷婷六月香| 亚洲精品无码久久久久久久| 一个色综合网| 91gao视频| 在线中文字幕视频观看| 日韩亚洲欧美一区二区三区| 破处女黄色一级片| 国产精品中文有码| 久久观看最新视频| 欧美欧美在线| 久久久久久久999| 男人天堂一区二区| 无码av免费一区二区三区试看| 污污污www精品国产网站| 日韩图片一区| 日韩色妇久久av| 深夜日韩欧美| 欧美精品亚州精品| 亚洲精品成av人片天堂无码| 午夜视频在线观看一区二区三区| 国产chinese中国hdxxxx| 国产亚洲福利| 亚洲精品国产精品国自产观看| 日本黄色成人| 欧美日韩xxxxx| 日产精品久久久久久久性色| 欧美性猛交一区二区三区精品| 黄色录像一级片| 国产sm精品调教视频网站| 奇米影视亚洲色图| 免费黄色成人| 国产啪精品视频| 国模雨婷捆绑高清在线| 国产视频综合在线| 国产精品欧美亚洲| 亚洲小说欧美激情另类| 中文字幕人妻一区二区| 久久精品av麻豆的观看方式| 高清无码一区二区在线观看吞精| 色爱av综合网| 国产欧美精品xxxx另类| 久久亚洲导航| 国产一区av在线| 亚洲a视频在线| 色女孩综合影院| 国产三级国产精品国产国在线观看| 成人看片黄a免费看在线| jizz欧美激情18| 中文在线日韩| 日本一区二区三区精品视频| 日韩区一区二| 国产精品免费在线免费| 欧美日韩经典丝袜| 中文字幕一精品亚洲无线一区| 亚洲精品一区二区三区四区| 在线观看国产91| 久久久久99精品| 国产精品入口麻豆九色| 免费看毛片的网站| 韩国一区二区在线观看| 国产午夜福利视频在线观看| 欧美福利专区| 亚洲视频电影| 亚洲成a人片77777在线播放| 91嫩草免费看| 99热播精品免费| 欧洲美女免费图片一区| 免费电影视频在线看 | 菠萝菠萝蜜在线观看| 日韩精品在线视频| 亚洲精品911| 91麻豆精品国产91| 中文字幕日韩经典| 色综合天天综合在线视频| 国产亚洲精品成人| 亚洲日本在线看| 婷婷综合在线视频| 国产午夜亚洲精品理论片色戒| 国产污在线观看| 国产成人综合在线| 善良的小姨在线| 黄页视频在线91| 亚洲欧美日韩综合网| 爽好久久久欧美精品| 草草久久久无码国产专区| 激情欧美日韩| 久久人人爽人人爽人人av| 欧美1区2区3区| 男人的天堂成人| 欧美高清在线| 伊人婷婷久久| 婷婷综合五月| 男人j进女人j| 午夜精品亚洲| 国产一二三四区在线观看| 久久久久美女| 潘金莲一级淫片aaaaa免费看| 久久久国产精品| 视频一区二区视频| 91精品国产福利在线观看麻豆| 老司机av福利| 亚洲第一天堂| 久久男人资源站| 在线日韩电影| 精品视频在线观看一区| 国产亚洲精品bv在线观看| 欧美一区二区三区爽大粗免费| 亚洲免费播放| 成人一级片网站| 首页综合国产亚洲丝袜| 亚洲福利精品视频| 久久成人久久鬼色| 色男人天堂av| 成人h动漫精品一区二区| 久久人妻少妇嫩草av无码专区| 91天堂素人约啪| 高潮毛片无遮挡| 欧美国产禁国产网站cc| 欧美三级黄色大片| 亚洲一区成人在线| 五月婷婷开心网| 在线观看视频一区二区| 一级aaaa毛片| 日韩精品一区二区在线| 日韩一级片免费看| 亚洲人成网站免费播放| 青青影院在线观看| 欧美黄色小视频| 国产伦精品一区二区三区视频金莲| 国产精品99久久久久久久久久久久 | 你懂的在线看| 日韩在线观看免费全集电视剧网站| 国内精品久久久久久野外| 久久久久成人网| 天天免费亚洲黑人免费| 成人写真视频福利网| 国产精伦一区二区三区| 视频一区不卡| 黑人一区二区三区四区五区| 黑人糟蹋人妻hd中文字幕 | www.四虎在线| 久久久电影一区二区三区| 蜜臀av午夜精品久久| 午夜成人免费视频| 亚洲天堂网视频| 亚洲黄色在线看| 97电影在线观看| 午夜精品久久久久久久白皮肤| 日日av拍夜夜添久久免费| 91免费在线观看网站| 国产真实有声精品录音| 成人手机在线播放| 久久久国产亚洲精品| japan高清日本乱xxxxx| 国产日韩综合av| 18精品爽视频在线观看| 欧美日韩久久久| 亚洲欧美日韩免费| 久久伊人免费视频| 91精品xxx在线观看| 国产伦精品一区二区三区视频免费 | 中国日韩欧美久久久久久久久| 日本aa在线| 国产色综合天天综合网| 红杏aⅴ成人免费视频| 在线视频不卡国产| 久久精品女人天堂| 中文字幕天堂网| 亚洲精品日日夜夜| 中文字幕男人天堂| 日韩激情av在线播放| 日本在线观看大片免费视频| 国产专区欧美专区| av伊人久久| 欧美精品成人网| 91在线观看下载| 国产精品第56页| 精品捆绑美女sm三区| 4438x成人网全国最大| 91精品国产自产在线| av亚洲免费| 玩弄japan白嫩少妇hd| 337p粉嫩大胆噜噜噜噜噜91av| 国产在线观看免费av| 日韩天堂在线观看| 黄色一级大片在线免费看产| 国产精品免费久久久久久| 精品九九在线| 日韩av一二三四| 久久精品亚洲一区二区三区浴池| 日本道在线观看| 日韩毛片在线观看| 在线免费日韩片| 精品一区久久久| 午夜在线视频观看日韩17c| 荫蒂被男人添免费视频| 午夜欧美大尺度福利影院在线看| 亚洲精品无遮挡| 久久久久久噜噜噜久久久精品| 欧美日韩中出| 台湾无码一区二区| 成人动漫视频在线| 国产无遮挡又黄又爽又色| 精品福利一二区| av电影免费在线看| 久久综合给合久久狠狠色| 免费在线成人| www色com| 欧美日韩国产美女| 蜜桃av在线免费观看| 96精品久久久久中文字幕| 亚洲一区在线| 美女久久久久久久久| 香港成人在线视频| 精品一二三区视频| 国产精品偷伦一区二区 | 亚洲国产精品成人久久综合一区 | 亚洲白拍色综合图区| 草草在线观看| 欧美一区三区二区在线观看| 日韩主播视频在线| 91麻豆免费视频网站| 精品日韩成人av| 另类激情视频| 亚洲亚洲精品三区日韩精品在线视频 | 亚洲日本丝袜连裤袜办公室| av网站在线观看免费| 欧美精品电影免费在线观看| 亚洲免费专区| 国产精品久久久久久久av福利| 一区二区高清在线| 欧美视频综合| 91免费看片在线| 亚洲九九精品| 黑人と日本人の交わりビデオ| 91精品国产麻豆国产自产在线| 国产99在线观看| 一区二区高清视频| 高清国产一区二区三区| 精品人妻无码一区二区性色 | freexxx性亚洲精品| 秋霞毛片久久久久久久久| 国产精品一区三区| 中文字幕亚洲乱码熟女1区2区| 久久亚洲国产成人| 香蕉久久精品| 日本精品一区在线| 日韩欧美999| 久草免费在线色站| 日韩国产精品一区二区三区| 国产99精品在线观看| 成年人视频免费| 久久久亚洲成人| 日韩三级在线| aaaaa级少妇高潮大片免费看| 7777精品伊人久久久大香线蕉超级流畅| 蜜桃视频在线观看播放| 国产精品夜夜夜爽张柏芝|