精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

慢思考準(zhǔn)確率反降30%!普林斯頓揭示思維鏈某些任務(wù)上失效的秘密

人工智能
換言之,CoT到底好不好用,還得具體情況具體分析。這項(xiàng)研究更大的意義在于,將認(rèn)知心理學(xué)與大模型之間建立了聯(lián)系。

OpenAI o1徹底帶火慢思考和思維鏈(CoT)方法,但CoT在某些任務(wù)上反而會(huì)降低模型表現(xiàn)。

比如給生造的詞分類(lèi)任務(wù),GPT-4在zero-shot提示下的準(zhǔn)確率高達(dá)94%,換成CoT的準(zhǔn)確率卻斷崖式下跌到64.4%。

內(nèi)置CoT的o1-preview準(zhǔn)確率更是只有57.7%。

圖片圖片

CoT究竟會(huì)“搞砸”哪些任務(wù),在學(xué)術(shù)界仍是一個(gè)懸而未決的問(wèn)題。

現(xiàn)在,普林斯頓計(jì)算機(jī)系與心理系合作,確定了其中一些任務(wù)的特征:人類(lèi)深思熟慮或被要求解釋自己的思路時(shí),也會(huì)降低在這些任務(wù)上的表現(xiàn)。

新論文“一步一步想,但小心腳下”已上傳到arXiv。

圖片圖片

心理學(xué)探索思維鏈掉鏈子原因

為了縮小要探索的范圍,團(tuán)隊(duì)在CoT提示和人類(lèi)進(jìn)行語(yǔ)言思考之間進(jìn)行了類(lèi)比。

大模型和人類(lèi)具能力有著根本不同,因此影響表現(xiàn)的約束因素也不同。如大模型的上下文長(zhǎng)度很長(zhǎng),遠(yuǎn)遠(yuǎn)超出了人類(lèi)的記憶限制。

因此,團(tuán)隊(duì)預(yù)計(jì)CoT將在以下情況下?lián)p害模型性能:

(i) 深思熟慮會(huì)損害人類(lèi)的表現(xiàn)
(ii) 影響人類(lèi)在任務(wù)上表現(xiàn)的約束條件,可以普遍性地推廣到大模型。

在實(shí)驗(yàn)中,選擇了心理學(xué)文獻(xiàn)中的6項(xiàng)任務(wù),其中隱式統(tǒng)計(jì)學(xué)習(xí)、面部識(shí)別、包含異常的數(shù)據(jù)分類(lèi)符合假設(shè)條件。

隱式統(tǒng)計(jì)學(xué)習(xí)(Implicit Statistical Learning)

心理學(xué)研究發(fā)現(xiàn),當(dāng)包含統(tǒng)計(jì)模式的數(shù)據(jù)不用語(yǔ)言來(lái)描述時(shí),人類(lèi)可以更好地概括這些數(shù)據(jù)。

使用有限狀態(tài)語(yǔ)法構(gòu)建“人造單詞”,參與者的任務(wù)是識(shí)別哪些單詞屬于同一類(lèi)別。

人類(lèi)參與者可以識(shí)別格式不正確的序列,但無(wú)法用語(yǔ)言表達(dá)他們判斷的基礎(chǔ)。

圖片圖片

在幾個(gè)開(kāi)源和閉源模型上評(píng)估這項(xiàng)任務(wù),發(fā)現(xiàn)與zero-shot提示相比,使用CoT提示時(shí)性能大幅降低。

圖片圖片

面部識(shí)別(Facial Recognition)

另一類(lèi)任務(wù)中語(yǔ)言思考會(huì)干擾視覺(jué)感知,稱(chēng)為語(yǔ)言遮蔽(verbal overshadowing)。

在實(shí)驗(yàn)中選用了經(jīng)典的人臉識(shí)別任務(wù),首先展示一個(gè)人臉照片,要求參與者從候選列表中找出同一個(gè)人。

圖片圖片

人類(lèi)參與者不說(shuō)話(huà)直接選準(zhǔn)確率更高,先描述看到的人臉再選的話(huà)面部識(shí)別能力反而受損。

多模態(tài)大模型的表現(xiàn)相似,當(dāng)使用CoT提示時(shí),所有模型性能都下降。其中較弱的模型傾向于回答“所有圖像都是同一個(gè)人的”。

圖片圖片

包含異常的數(shù)據(jù)分類(lèi)(Classifying Data With Patterns That Contain Exceptions)

第三類(lèi)任務(wù)設(shè)置比較復(fù)雜,其中包含一個(gè)陷阱。

有10輛不同的車(chē)需要分為A類(lèi)和B類(lèi),每輛車(chē)有5個(gè)特征:

  • 1個(gè)獨(dú)特特征(車(chē)牌號(hào),每輛車(chē)不同)
  • 1個(gè)看起來(lái)有規(guī)律的特征,如顏色,但有20%的例外。
  • 3個(gè)與分類(lèi)無(wú)關(guān)的特征,如變速箱類(lèi)型、座椅材質(zhì)、車(chē)門(mén)數(shù)量

實(shí)際上只有車(chē)牌號(hào)才是最可靠的分類(lèi)依據(jù)。

如果10輛車(chē)沒(méi)有全部猜對(duì),就會(huì)重新打亂順序再來(lái)一輪,最多可以嘗試15輪。

圖片圖片

不用CoT提示時(shí),模型很快就能記住每輛車(chē)的正確分類(lèi)。使用CoT時(shí),模型會(huì)陷入試圖總結(jié)規(guī)律的思維定式,需要嘗試的輪數(shù)增加。

和人類(lèi)在被要求解釋分類(lèi)依據(jù)時(shí)的表現(xiàn)很像。

圖片圖片

大模型和人類(lèi)約束條件不同

同時(shí),研究團(tuán)隊(duì)也找出三種,滿(mǎn)足思考降低人類(lèi)表現(xiàn),但大模型使用CoT提示能提升性能的任務(wù)。

  • 自然語(yǔ)言推理
  • 空間直覺(jué)(涉及模型缺乏相關(guān)先驗(yàn)知識(shí))
  • 涉及工作記憶限制的任務(wù)

圖片圖片

團(tuán)隊(duì)分析原因認(rèn)為,模型和人類(lèi)具有根本不同的能力,存在不同的約束條件影響其性能,

這是因?yàn)榇竽P蛽碛羞h(yuǎn)超人類(lèi)的工作記憶(上下文長(zhǎng)度)和某些特定的邏輯推理能力。

換言之,CoT到底好不好用,還得具體情況具體分析。

這項(xiàng)研究更大的意義在于,將認(rèn)知心理學(xué)與大模型之間建立了聯(lián)系。

論文的討論部分提出,心理學(xué)界幾十年來(lái)積累的豐富文獻(xiàn)中,或許還能找出更多推進(jìn)大模型領(lǐng)域的見(jiàn)解。

論文地址:https://arxiv.org/abs/2410.21333

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2024-09-25 14:41:15

2012-08-02 16:18:10

普林斯頓結(jié)構(gòu)哈佛結(jié)構(gòu)架構(gòu)

2025-10-23 12:46:39

2021-11-09 09:52:57

神經(jīng)網(wǎng)絡(luò)AI算法

2011-04-22 10:14:34

無(wú)線網(wǎng)絡(luò)DHCPAndroid

2022-07-26 09:56:48

模型AI

2023-05-22 15:17:02

谷歌AI

2024-12-12 17:30:00

模型測(cè)評(píng)AI

2025-03-24 13:45:56

2024-08-02 13:33:04

2020-12-02 10:05:26

AI 數(shù)據(jù)人工智能

2018-06-13 11:00:17

人工智能員工保留率

2025-10-09 09:15:11

2025-06-09 15:26:53

ChatGPTGPT-4o4o-mini

2024-01-16 14:00:00

2025-07-01 08:53:26

2025-04-18 08:42:52

模型推理AI

2023-06-19 09:36:16

AI矩陣

2025-07-18 07:07:00

人工智能AIAI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本亚洲欧美在线| 狠狠爱免费视频| 亚洲精品一区二区三区区别| 亚洲三级影院| 亚洲一区av在线播放| 亚洲一二三av| 在线手机中文字幕| 中文字幕在线播放不卡一区| 3d精品h动漫啪啪一区二区| 黄色小说在线观看视频| 精品一区二区三| 精品国产伦理网| 手机在线免费观看毛片| 人交獸av完整版在线观看| 99国产精品久| 91久久国产综合久久91精品网站| 日韩三级小视频| 999久久久国产精品| 亚洲国产精品小视频| 日本黄色福利视频| 亚洲午夜天堂| 一区二区三区不卡视频在线观看| 欧美人与物videos另类| aaa一区二区三区| 日韩av不卡一区二区| 色综合久久中文字幕综合网小说| 非洲一级黄色片| 红杏视频成人| 3d动漫精品啪啪1区2区免费| 日本wwww视频| 97蜜桃久久| 一区二区三区四区蜜桃| 一区二区欧美日韩| 酒色婷婷桃色成人免费av网| 国产91高潮流白浆在线麻豆| 成人精品aaaa网站| 伊人久久亚洲综合| 三级亚洲高清视频| 欧美综合国产精品久久丁香| 国产香蕉在线视频| 欧美三级乱码| 欧美成人在线免费视频| 国产无遮挡在线观看| 啪啪亚洲精品| 亚洲精选在线观看| 亚洲欧美日本一区| 欧美变态挠脚心| 亚洲国产精品小视频| 国产精品一区二区无码对白| 国产麻豆一区二区三区| 91精品久久久久久久91蜜桃 | 在线观看视频日韩| 久久国产精品久久久| 日韩亚洲欧美中文字幕| 久久在线免费| 久久天天躁狠狠躁夜夜爽蜜月| 你懂得视频在线观看| 首页国产精品| 久热爱精品视频线路一| 三上悠亚作品在线观看| 久久久久久久久国产一区| 精品国产一区二区三区久久| 国产免费嫩草影院| 亚洲九九视频| 久久久久久久久久久av| 国产奶水涨喷在线播放| 国产精品毛片| 国产精品av免费在线观看| 亚洲综合成人av| 久久精品国产99| 91网站在线免费观看| 午夜精品久久久久久久96蜜桃| 床上的激情91.| 久久精品国产第一区二区三区最新章节 | 91精品久久| 午夜久久久影院| 欧美精品一区免费| 欧美va视频| 日韩一区二区在线观看视频| 美国黄色一级视频| 久久综合色占| 另类图片亚洲另类| 一区二区三区视频免费看| 久热精品在线| 亚洲淫片在线视频| 涩涩视频在线观看免费| 国产欧美日韩综合精品一区二区 | 亚洲永久无码7777kkk| 精品国产a一区二区三区v免费| 亚洲欧美中文在线视频| 国产高清视频免费在线观看| 亚洲国产三级| 国产精品丝袜一区二区三区| 亚洲av无码一区二区乱子伦| 久久久天堂av| 亚洲国产一二三精品无码| 蜜桃视频m3u8在线观看| 欧美日韩亚洲国产综合| 久久久久久久久久影视| 欧美天天综合| 久久久久久亚洲精品| 中文字幕日本视频| 成人av网站在线观看免费| 亚洲国产精品综合| 97人澡人人添人人爽欧美| 欧美精品一二三四| 国产精品无码午夜福利| 仙踪林久久久久久久999| 777精品视频| 国产999久久久| 国产欧美视频一区二区三区| 丰满少妇久久久| 国产精品一区二区三区av| 亚洲欧美精品在线| 久久免费播放视频| 黑人巨大精品欧美一区| 欧美一区二区三区在线播放 | 日本aaa在线观看| 亚洲激情在线激情| 天天干天天爽天天射| 亚洲永久精品唐人导航网址| 欧美激情影音先锋| 99久久精品无免国产免费| 国产日韩av一区| 18禁免费无码无遮挡不卡网站| 精品99re| 日韩在线视频二区| 中文精品久久久久人妻不卡| 99久久精品国产麻豆演员表| youjizz.com在线观看| 日韩毛片网站| 国产伦精品一区二区三区在线播放 | 日韩美女毛片| 久久久免费精品视频| 国产免费黄色片| 国产精品毛片久久久久久| 成人免费无码av| 伊人春色精品| 日本高清不卡在线| 日韩专区一区二区| 福利视频导航一区| 91精品人妻一区二区| 一本久道久久综合狠狠爱| 国产视频不卡| 国产福利片在线观看| 亚洲国内精品在线| 91九色丨porny丨肉丝| 9人人澡人人爽人人精品| 免费无码毛片一区二三区| 国产三级精品三级在线观看国产| 欧美疯狂做受xxxx高潮| 性网爆门事件集合av| 亚洲一区二区视频在线观看| www男人天堂| 妖精视频成人观看www| 久久久一本精品99久久精品| 在线免费看h| 国产亚洲一级高清| 中文字幕永久免费视频| 日韩一区欧美小说| 国产精品熟女一区二区不卡| 国产综合色产| 久久99精品久久久久久三级 | 少妇真人直播免费视频| 肉色丝袜一区二区| 色综合久久久888| 欧美深深色噜噜狠狠yyy| 538在线精品| 亚洲欧美日韩天堂| 亚洲中文字幕一区二区| 亚洲色图一区二区三区| 亚洲午夜久久久久久久久| 国产精品亚洲综合色区韩国| 欧美亚洲精品日韩| 成人日韩视频| 亚州国产精品久久久| 欧美巨乳在线| 3d动漫精品啪啪一区二区竹菊| 毛片a片免费观看| 久久久三级国产网站| 中文字幕线观看| 一区二区国产在线观看| 水蜜桃亚洲精品| 深夜福利一区| 国产成人激情视频| 曰本三级在线| 亚洲欧美中文字幕在线一区| 国产免费av观看| 欧美日韩国产一区二区| 国产精品精品软件男同| 9人人澡人人爽人人精品| www欧美激情| 黄色av日韩| 亚洲欧洲免费无码| 久久久精品国产**网站| 国产欧美精品va在线观看| 免费男女羞羞的视频网站在线观看| 亚洲精品一二区| 精品国产av一区二区三区| 色婷婷综合久久久中文一区二区 | 一本大道久久a久久精品综合| 国产精品69久久久久孕妇欧美| 国产99久久久精品| 久久久精品麻豆| 制服诱惑一区二区| 99re8这里只有精品| 国产精品亚洲二区| 国产精品久久7| 少妇高潮一区二区三区99| 51午夜精品视频| 香蕉久久aⅴ一区二区三区| 国产一区二区美女视频| 欧美一区二区三区激情| 欧美精品三级在线观看| 久久久成人免费视频| 亚洲午夜一区二区三区| 在线观看天堂av| 久久久久国产精品免费免费搜索| 韩国黄色一级片| 韩国v欧美v日本v亚洲v| 国产视频一区二区三区在线播放 | 欧美日韩激情在线一区二区三区| 国产99午夜精品一区二区三区| 欧洲亚洲精品久久久久| 日韩男女性生活视频| 国产直播在线| 欧美极品在线播放| av片在线观看免费| www.美女亚洲精品| 91在线看片| 一区三区二区视频| 国产在线观看黄| 亚洲精品自在久久| 男同在线观看| 日韩精品在线第一页| 蜜桃91麻豆精品一二三区| 欧美一级黄色片| 国产xxxx在线观看| 91精品中文字幕一区二区三区| 亚洲综合精品国产一区二区三区 | 日韩欧美电影| 色女人综合av| 日韩精品dvd| 亚洲一区二区三区精品在线观看| 成人3d动漫在线观看| 日韩精彩视频| 超碰成人久久| 免费成人深夜夜行网站视频| 99久久99久久精品国产片果冰| 亚洲视频在线观看日本a| 欧美偷拍综合| 免费观看中文字幕| 欧美日韩福利| 蜜臀av无码一区二区三区| 亚洲毛片在线| 妺妺窝人体色www在线小说| 午夜影院日韩| 手机在线看福利| 久久99久久99| 性高潮久久久久久| 成人性生交大合| 国产熟妇搡bbbb搡bbbb| 国产午夜精品久久久久久久 | 色婷婷亚洲一区二区三区| 亚洲欧美偷拍视频| 欧美日韩国产高清一区二区| 国产欧美久久久| 亚洲成人精品久久久| 青青国产在线| 色黄久久久久久| 色老头在线观看| 欧美一区二粉嫩精品国产一线天| 另类中文字幕国产精品| 亚洲精品欧美日韩专区| 荡女精品导航| 色之综合天天综合色天天棕色| 亚洲v在线看| 国产一区二区视频播放| 日本sm残虐另类| 超碰人人cao| 久久夜色精品国产欧美乱极品| 2019男人天堂| 一区二区三区高清在线| 成人公开免费视频| 91精品综合久久久久久| 青青草在线播放| 久久久国产精品x99av| 高端美女服务在线视频播放| 国产精品久久久久高潮| 9国产精品午夜| 日韩高清在线播放| 激情久久中文字幕| 免费看黄色一级大片| 成人午夜免费电影| 俄罗斯毛片基地| 精品成人av一区| 国产又黄又粗又猛又爽| 日韩毛片在线看| 成人看av片| 国产精品91免费在线| 在线精品国产亚洲| 亚洲啪啪av| 亚洲欧美日本视频在线观看| 中文字幕一二三| 欧美极品美女视频| yjizz国产| 欧美成人性战久久| 久操免费在线| 国产精品高潮呻吟视频| 全国精品免费看| 免费的av在线| 极品少妇xxxx偷拍精品少妇| 成人午夜剧场视频网站| 亚洲不卡在线观看| 国产成人精品一区二三区四区五区 | 美女免费久久| 国产成人极品视频| 欧美大胆a级| 和岳每晚弄的高潮嗷嗷叫视频| 精品一区二区免费| 日韩福利在线视频| 色综合激情久久| 手机看片一区二区三区| 欧美高清在线视频观看不卡| 婷婷久久免费视频| 午夜久久资源| 日韩成人精品在线观看| 精品夜夜澡人妻无码av| 五月婷婷综合网| 日日躁夜夜躁白天躁晚上躁91| 美女黄色丝袜一区| 伊人久久大香| 中文字幕黄色大片| 免费看欧美女人艹b| 日本成人午夜影院| 色先锋久久av资源部| 欧美伦理影视网| 欧洲日韩成人av| 亚洲人成精品久久久| 久久9精品区-无套内射无码| 99精品一区二区| 日本三级小视频| 精品视频久久久| 伊人久久综合一区二区| 欧美亚洲另类在线一区二区三区| 免费在线观看成人av| 一二三不卡视频| 色综合色狠狠天天综合色| 六十路在线观看| 国产精品视频一区二区三区四| 成人网18免费网站| 色婷婷成人在线| 日韩理论片中文av| 精品久久人妻av中文字幕| 欧美精品情趣视频| 超碰一区二区三区| 国产91在线视频观看| 久久精品视频一区二区| 欧美日韩 一区二区三区| 中文字幕无线精品亚洲乱码一区 | 成人信息集中地| 欧美一区二区三区视频在线| 在线看三级电影| 狠狠色狠狠色综合人人| 六月丁香综合| 国产又粗又长免费视频| 91精品久久久久久久91蜜桃 | 国产精品电影网| 四虎国产精品免费观看| 欧美高清精品一区二区| 国产欧美日韩一区二区三区四区 | 182在线视频观看| 九色91在线视频| 日本亚洲一区二区| 国产精品99久久久久久成人| 欧美大肚乱孕交hd孕妇| xx欧美视频| 伊人久久大香线蕉综合75| 国产精品1区2区3区在线观看| 日本在线观看中文字幕| 亚洲美腿欧美激情另类| 四虎精品一区二区免费| avav在线播放| 国产日韩精品一区二区浪潮av| 国产精品伦一区二区三区| 性欧美xxxx| 三区四区不卡| 97人妻精品一区二区三区免费| 欧美主播一区二区三区| 欧美videosex性欧美黑吊| 欧美午夜精品久久久久免费视 | 亚洲最大av网站| 免费日韩av| 亚洲欧美一区二区三区四区五区| 日韩成人在线视频观看| 婷婷丁香久久| 久久国产色av免费观看| 亚洲美女一区二区三区| 久久精品蜜桃| 国产66精品久久久久999小说|