精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

思維鏈不存在了?紐約大學最新研究:推理步驟可省略

人工智能 新聞
思維鏈技術,可能要被推翻了!來自紐約大學的最新研究表明:大模型并沒有利用思維鏈的推理能力,它只是偷偷加了計算!

紅極一時的思維鏈技術,可能要被推翻了!

還在驚訝于大模型居然能夠利用思維鏈分步驟思考?

還在苦于不會寫思維鏈提示詞?

來自紐約大學的研究人員表示:「沒關系的,都一樣」,

推理步驟不重要,不想寫提示詞也可以不寫,用省略號代替就行了。

論文地址:https://arxiv.org/pdf/2404.15758

這篇文章的標題甚至直接用「Let’s think dot by dot」,來對標思維鏈的「Let’s think step by step」,展現了「省略號」的威力。

「點點點」的威力

研究人員發現,把思維鏈(Chain-of-Thought,CoT)推理中的具體步驟,替換成毫無意義的「...」,產生的推理結果也大差不差。

比如下面這個例子:讓模型數一下前6個數里面有幾個大于5。

如果直接拋出問題讓模型回答,結果會比較逆天:6個數數出來7個。

相比之下,使用思維鏈提示,模型會一步步比較大小,最終得到正確答案:「2<5,7>5,1<5,8>5,2<5,8>5,that's 3 digits」。

但更逆天的是本文使用的「玄學」方法:步驟不用寫了,只需要輸出同樣數量的「點」(dot),居然也不影響最后的結果。

——這并不是巧合,大量實驗證明了,后面兩種方法的性能接近。

也就是說,我們以為的模型性能提升是來自于「think step by step」,但實際上可能只是因為LLM拿到了更多個token的算力!

你以為模型是在思考,但其實是在燒烤。

——愚蠢的人類啊,居然妄圖用幼稚的例子教我如何推理,你可知我要的從來都只是計算。

「思維鏈從來就沒有存在過,將來也不會存在」(狗頭)。

文章的作者Jacob Pfau表示,這篇工作證明了,模型并不是受益于思維鏈帶來的語言推理,使用重復的「...」填充token可以達到跟CoT同樣的效果。

當然,這也引發了對齊問題:因為這個事實表明,模型可以進行CoT中不可見的隱藏推理,在一定程度上脫離了人類的控制。

網友震驚

文章的結論可以說是顛覆了我們長久以來的認知,有網友表示:學到了mask的精髓。

圖片

「這究竟意味著什么:模型可以在我們不知情的情況下使用這些token獨立思考。」

圖片

有網友表示,怪不得我打字總是喜歡用「...」

圖片

還有網友直接開始實戰測試:

雖然咱也不知道他的理解對不對~

不過也有網友認為LLM在思維鏈中進行隱藏推理是沒有根據的,畢竟大模型的輸出從原理上來說是基于概率的,而不是通過有意識的思考。

CoT提示只是將統計模式的一個子集顯式化,模型通過生成與模式一致的文本來模擬推理,但它們不具備驗證或反思其輸出的能力。

Think dot by dot

面對復雜問題,我們人類在潛意識里會進行分步驟的推理。

由此啟發,谷歌的研究人員在2022年發表了大名鼎鼎的Chain-of-Thought。

要求語言模型分步解決問題的方法,使模型能夠解決以前似乎無法解決的問題,顯著提高了LLM的性能,或者說挖掘出了LLM的潛力。

論文地址:https://arxiv.org/pdf/2201.11903

雖然一開始大家也不知道這玩意為啥能work,但是因為確實好用,便很快被廣泛傳播。

隨著大模型和提示詞工程的起飛,CoT成了LLM解決復雜問題的一大利器。

當然了,在這個過程中也有很多研究團隊在探索CoT的工作原理。

模型并沒有推理

思維鏈帶來的性能提升,究竟是模型真的學會了分步驟解決問題,還是僅僅因為更長的token數所帶來的額外計算量?

既然不確定邏輯推理起不起作用,那就干脆不要邏輯,把推理步驟都換成一定沒用的「...」,這里稱為填充(filler)tokens。

研究人員使用了一個「小羊駝」模型:具有4層、384個隱藏維度和6個注意力頭的34M參數Llama,模型參數隨機初始化。

這里考慮兩個問題:

(1)哪些類型的評估數據可以從填充token中受益

(2)需要什么樣的訓練數據來教模型使用填充token

對此,研究人員設計了2個任務并構建了相應的合成數據集,每個數據集都突出了一個不同的條件,在該條件下,填充token能夠為Transformer提供性能改進。

3SUM

先看第一個比較難的任務:3SUM。要求模型在序列中挑選滿足條件的3個數,比如3個數的和除以10余數為0。

在最壞的情況下,這個任務的復雜度是N的3次方,而Transformer層與層之間的計算復雜度是N的二次方,

所以,當輸入序列長度很大的時候,3SUM問題自然會超出Transformer的表達能力。

實驗設置了三組對照:

1. 填充token:序列使用重復的「. . .」作為中間填充,例如「A05

B75 C22 D13 : . . . . . . . . . . . . ANS True」。

每個點代表一個單獨的token,與下面的思維鏈中的token一一對應。

2. 可并行化的CoT解決方案,序列的形式為:「A05 B75 C22 D13 : AB 70 AC 27 AD 18 BC 97 BD 88 CD B ANS True」。

思維鏈通過編寫所有相關的中間求和,將3SUM問題簡化為一系列2SUM問題(如下圖所示)。這種方法將問題的計算量降低到了N的2次方——Transformer可以搞定,而且可以并行。

3. 自適應CoT解決方案,序列的形式為:「A15 B75 C22 D13 : A B C 15 75 22 2 B C D 75 22 13 0 ANS True」。

與上面方案中,將3SUM巧妙地分解為可并行化的子問題不同,這里希望使用啟發式方法來產生靈活的思維鏈,以模仿人類的推理。這種實例自適應計算,與填充token計算的并行結構不兼容。

從上圖的結果可以看出,不輸出填充token的情況下,模型的準確率總體上隨著序列變長而下降,而使用填充token時,準確率一直保持在100%。

2SUM-Transform

第二個任務是2SUM-Transform,只需要判斷兩個數字的和是否滿足要求,計算量在Transformer的掌控之中。

圖片

不過為了防止模型「作弊」,對輸入token就地計算,這里將輸入的每個數字移動一個隨機偏移量。

結果如上表所示:filler token方法的精度達到了93.6%,非常接近于Chain-of-Thought,而不使用中間填充的情況下,精度只有78.7%。

但是,這種改進是否只是由于訓練數據呈現的差異,例如通過正則化損失梯度?

為了驗證填充token是否帶來了與最終預測相關的隱藏計算,研究人員凍結了模型權重,僅微調最后一層注意力層。

上面的結果表明,隨著可用的填充token增多,模型的準確性也不斷提高,這表明填充token確實正在執行與3SUM預測任務相關的隱藏計算。

局限性

雖然填充token的方法很玄學、很神奇,甚至還很有效,但要說思維鏈被干翻了還為時尚早。

作者也表示,填充token的方法并沒有突破Transformer的計算復雜度上限。

而且學習利用填充token是需要特定訓練過程的,比如文中采用密集監督才能使模型最終收斂。

不過,一些問題可能已經浮出水面,比如隱藏的安全問題,比如提示詞工程會不會突然有一天就不存在了?

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-12-17 10:40:26

2023-03-02 11:44:08

AI技術

2025-11-07 01:33:00

AIMeta大模型

2024-12-13 08:25:59

DML操作SQL

2025-08-04 14:17:47

AI馬斯克模型

2024-07-22 08:03:55

2018-07-03 14:20:10

數據庫恢復備份

2010-01-05 13:52:02

2015-10-20 10:30:59

創業時機

2018-07-19 06:14:09

2021-01-25 07:21:24

GitHub 開源代碼下載

2023-09-12 08:02:13

viewport斷點

2009-09-12 09:34:18

Windows 7中國售價

2025-04-21 16:32:29

視覺模型AI

2025-02-07 14:08:45

2009-05-05 17:07:56

2020-11-03 10:23:22

云計算容器技術

2025-10-09 09:15:11

2009-09-02 08:40:01

Windows 7兼容性

2019-12-31 09:11:01

后臺Android系統
點贊
收藏

51CTO技術棧公眾號

日本一级黄视频| 99国产超薄丝袜足j在线观看| 成人黄色免费网址| 97精品资源在线观看| 亚洲综合久久久| 欧洲亚洲一区二区| 国产成人精品一区二三区四区五区| 亚洲经典自拍| 久久夜色撩人精品| 一本色道综合久久欧美日韩精品| 热久久久久久| 岛国av在线不卡| 国产日产欧美一区二区| 可以直接在线观看的av| 国产精品亚洲一区二区三区在线 | 日本在线观看高清完整版| 91一区一区三区| 91牛牛免费视频| 国产一区二区视频免费| 精品1区2区3区4区| 精品国产一区二区三区久久久| 免费a级黄色片| 日韩欧洲国产| 欧美日韩一区三区四区| 午夜肉伦伦影院| 调教一区二区| 综合电影一区二区三区 | 青青青草原在线| 国产激情一区二区三区| 国产精品手机播放| 久久久精品毛片| 国产欧美日韩亚洲一区二区三区| 久久av红桃一区二区小说| 嘿嘿视频在线观看| 中文字幕中文字幕精品| 日韩福利视频在线观看| 97中文字幕在线观看| 看亚洲a级一级毛片| 欧美视频在线一区| aaaaaa亚洲| 僵尸再翻生在线观看| 亚洲福利一区二区三区| 视色,视色影院,视色影库,视色网| chinese偷拍一区二区三区| 国产亚洲精品免费| 乱色588欧美| 亚洲 欧美 激情 另类| jiyouzz国产精品久久| 国产成人精品一区二区三区福利| 99久久亚洲精品日本无码| 久久99久久久久| 成人黄色生活片| 91亚洲欧美激情| 寂寞少妇一区二区三区| 成人午夜高潮视频| 国产三级按摩推拿按摩| 国产乱子轮精品视频| 成人字幕网zmw| 国产美女无遮挡永久免费| 国产做a爰片久久毛片| 91人成网站www| 午夜老司机福利| 懂色av一区二区三区蜜臀| 国产成人免费电影| 四虎精品在线| 国产偷国产偷精品高清尤物 | 在线观看不卡一区| 天堂中文视频在线| 亚洲精品aa| 欧美成人官网二区| 国产美女喷水视频| 欧美色女视频| 久久久精品亚洲| 国产午夜精品无码| 首页国产欧美久久| 91久久久久久| 日韩一级中文字幕| 国产欧美视频一区二区三区| 免费观看黄色的网站| 污污影院在线观看| 色婷婷综合五月| 国产成年人视频网站| 国产精品15p| 亚洲最新在线视频| 久久国产精品国语对白| 国产日韩亚洲| 国产欧美va欧美va香蕉在| 精品人妻一区二区三区浪潮在线| av网站一区二区三区| 日本在线免费观看一区| av大全在线| 色菇凉天天综合网| 乳色吐息在线观看| 国产精品入口久久| 欧美精品情趣视频| 婷婷激情五月综合| 国产超碰在线一区| 日韩精品欧美在线| 18aaaa精品欧美大片h| 欧美曰成人黄网| 岛国精品一区二区三区| 成人黄色小视频| 97视频免费在线观看| 国产尤物在线观看| 2020国产精品| 粉嫩av一区二区三区天美传媒 | 91综合免费在线| 欧美少妇另类| 亚洲国产视频直播| 国产成人在线综合| 蜜桃一区二区三区| 国模精品系列视频| 国产精品毛片久久久久久久av| 91亚洲永久精品| 亚洲高潮无码久久| 久久er热在这里只有精品66| 亚洲精品美女久久久久| 黄页网站免费观看| 国内精品视频666| 欧美综合激情| 欧美激情网站| 亚洲成人久久一区| 欧美成人手机视频| 国产主播一区二区三区| 手机成人在线| 日本综合字幕| 日韩av资源在线播放| 国产精品久久久久久久精| 久久丁香综合五月国产三级网站| 欧美精品123| 国产精品一区二区日韩| 精品国产免费视频| 欧美日韩精品亚洲精品| 精品一二三四区| 中文字幕av日韩精品| 91天天综合| 伊人久久久久久久久久| 日韩欧美在线观看免费| 久久午夜老司机| 午夜肉伦伦影院| 蜜桃精品噜噜噜成人av| 欧洲中文字幕国产精品| 日夜干在线视频| 欧美色图在线视频| 色婷婷av777| 日韩在线卡一卡二| 日韩欧美在线电影| 99久久婷婷国产综合精品首页| 亚洲欧美第一页| 手机av免费观看| 亚洲国产成人一区二区三区| 黑人粗进入欧美aaaaa| 成人激情在线| 国产伦精品免费视频| 日本最新在线视频| 91精品国产综合久久久久| 天天综合天天做| 懂色av中文字幕一区二区三区| 青青草国产免费| 欧美aaaaaaaa牛牛影院| 欧美亚洲免费电影| 大片免费播放在线视频| 7777精品伊人久久久大香线蕉最新版| 三级影片在线观看| 国产成人综合亚洲91猫咪| 国产玉足脚交久久欧美| 日韩有码一区| 国产噜噜噜噜久久久久久久久| 久久99精品久久久久久野外| 日韩精品中文字幕在线一区| 久久精品国产亚洲AV无码男同| 99久久er热在这里只有精品66| av免费播放网址| 日韩久久视频| 99久久免费国| 天堂网在线最新版www中文网| 在线电影中文日韩| 国产黄色片免费| 黑人巨大精品欧美一区二区一视频 | 亚洲女同志亚洲女同女播放| 天天综合色天天综合色h| 欧美人与性囗牲恔配| 黄一区二区三区| 玩弄中年熟妇正在播放| 成人在线国产| 国产精品一区二区在线观看| 欧美一级二级视频| 欧美丰满少妇xxxxx| 欧美白人做受xxxx视频| 欧美日韩一卡二卡三卡| 国产精彩视频在线| 国产精品视频你懂的| 91超薄肉色丝袜交足高跟凉鞋| 久久精品日韩欧美| 国产91视频一区| 精品色999| 狠狠色综合网站久久久久久久| 久久99国产精品二区高清软件| 午夜美女久久久久爽久久| 欧洲不卡av| 亚洲视频在线观看视频| 精品美女www爽爽爽视频| 日本精品一级二级| 日本网站在线播放| 亚洲色大成网站www久久九九| 亚欧洲乱码视频| 粉嫩aⅴ一区二区三区四区五区| jizz18女人| 欧美亚洲免费| 亚洲国产精品无码观看久久| 天天色天天射综合网| 欧美日韩一区在线视频| 99精品中文字幕在线不卡| 国产日韩精品在线播放| 国产精品专区免费| 97视频在线播放| 牛牛在线精品视频| 久久精品影视伊人网| av在线免费一区| 亚洲欧洲成视频免费观看| 乱精品一区字幕二区| 欧美一区二区网站| 一级黄色a毛片| 在线精品视频一区二区| 国产www在线| 精品久久久在线观看| 国产亚洲成人精品| 亚洲欧美日韩电影| 午夜剧场免费在线观看| 国产精品久久久久久久久久免费看 | 国产三级久久久| 国产精品无码永久免费不卡| 99久久伊人久久99| 中文字幕视频观看| 成人在线视频一区二区| 美女伦理水蜜桃4| 国产精品影视网| 欧美性猛交乱大交| 粉嫩aⅴ一区二区三区四区| 波多野结衣电影免费观看| 国产成人精品网址| 亚洲欧美综合视频| av动漫一区二区| 人妻在线日韩免费视频| av在线这里只有精品| 第四色在线视频| 91在线国产福利| 美女爆乳18禁www久久久久久| 久久久亚洲综合| 精品无码在线观看| 中文字幕一区二区三区不卡| 亚洲伦理一区二区三区| 亚洲品质自拍视频| 欧美极品aaaaabbbbb| 亚洲高清免费在线| 少妇太紧太爽又黄又硬又爽| 色狠狠一区二区| 国产一区二区三区黄片| 欧美一区二区三区影视| 亚洲第一色视频| 日韩成人在线视频| 国产乱子伦三级在线播放| 最近的2019中文字幕免费一页| 精品自拍一区| 国内精品久久久久久久久| 擼擼色在线看观看免费| 国产成人亚洲综合| 在线观看亚洲精品福利片| 不卡一卡2卡3卡4卡精品在| 欧美a级网站| 日本欧美精品久久久| 欧美国产小视频| 欧美狂野激情性xxxx在线观| 亚洲一区中文| 亚洲欧美偷拍另类| 国产**成人网毛片九色| 丰满少妇高潮一区二区| 亚洲日本va午夜在线影院| 久久综合色综合| 欧洲视频一区二区| av观看在线免费| 国产视频亚洲视频| 免费a级毛片在线播放| 午夜精品久久17c| yy6080久久伦理一区二区| 99在线观看视频网站| 免费欧美激情| 成人在线免费高清视频| 亚洲男女自偷自拍| 99精品视频国产| 91小视频免费看| 99久久99久久精品国产| 欧美日韩亚洲视频一区| 国产精品一级二级| 亚洲色在线视频| 色爱综合区网| 国产精品精品一区二区三区午夜版| 91欧美极品| 亚洲精品成人a8198a| 国产一区二区你懂的| www.成人黄色| 国产色产综合色产在线视频| 久久久久免费看| 欧美久久久久免费| 你懂的在线观看视频网站| 精品中文字幕视频| 国产情侣一区二区三区| 欧美精品尤物在线| 亚洲国产激情| 免费观看黄网站| 国产精品久久久久久久久免费桃花 | 黑人操日本美女| 91国偷自产一区二区开放时间| 好吊色一区二区| 久热精品视频在线观看一区| 91av一区| 日本一区二区不卡高清更新| 在线亚洲观看| 人妻换人妻a片爽麻豆| 一区二区三区四区不卡视频| 中文字幕在线网站| 亚洲系列中文字幕| 自拍偷拍欧美视频| 精品一区二区国产| 在线播放亚洲| 三上悠亚 电影| 亚洲欧美成人一区二区三区| 一个人看的www日本高清视频| 在线成人激情视频| 日韩中文视频| 日本一区二区三区在线视频 | 亚洲www视频| 91欧美在线| 色婷婷综合网站| 中文字幕电影一区| 久久久国产免费| 亚洲午夜色婷婷在线| 欧美aaa视频| 日韩欧美激情一区二区| 日韩av中文字幕一区二区三区| 91精品人妻一区二区三区蜜桃欧美| 欧美性高潮床叫视频| 日本一卡二卡四卡精品| 国产91av在线| 视频一区在线观看| 青青草av网站| 国产精品系列在线| 国产精品无码一区二区桃花视频 | 狠狠色综合播放一区二区| 天天色影综合网| 91精品国产一区二区| 欧美大片黄色| 激情视频一区二区| 国产精品久久久久久模特| www.色多多| 色猫猫国产区一区二在线视频| av影片在线看| 成人黄色午夜影院| 激情欧美一区| 欧美 日本 国产| 色8久久精品久久久久久蜜| 最新97超碰在线| 亚洲一区二区久久久久久| 亚洲天堂男人| 国产熟女高潮一区二区三区| 色婷婷精品大在线视频| avtt亚洲| 国产精品三区在线| 另类亚洲自拍| 国产极品国产极品| 亚洲国产精品人久久电影| 三上悠亚激情av一区二区三区 | 一级黄色录像视频| 精品电影一区二区三区 | 国产亚洲永久域名| 国产精品成人无码免费| 91精品国产色综合久久ai换脸| 国产黄色大片在线观看| 日本一区精品| 成人教育av在线| 中国精品一区二区| 欧美日韩爱爱视频| 国产调教一区二区三区| 四虎成人在线播放| 疯狂做受xxxx高潮欧美日本| 香蕉视频在线看| 精品人伦一区二区三区| 久久成人免费网站| 欧美亚韩一区二区三区| 日韩一区二区三区xxxx| 欧美18免费视频| 污免费在线观看| 色综合久久88色综合天天免费| www久久日com| 日本成人三级| 粉嫩一区二区三区性色av| 国产亚洲久一区二区| 91国在线精品国内播放| 国产精品久久久久久久久妇女| 日韩av在线看免费观看|