精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不要思考過程,推理模型能力能夠更強丨UC伯克利等最新研究

人工智能 新聞
通過簡單的prompt繞過「思考」這一過程直接生成解決方案,可能同樣有效,甚至更好。

其實……不用大段大段思考,推理模型也能有效推理!

是不是有點反常識?因為大家的一貫印象里,推理模型之所以能力強大、能給出準確的有效答案,靠的就是長篇累牘的推理過程。

這個過程往往用時很長,等同于需要消耗大量算力。已經有一些研究嘗試提高推理效率,但大多仍依賴顯式思考過程。

來自UC伯克利和艾倫實驗室團隊的最新研究結果打破了這一刻板印象——

通過簡單的prompt繞過「思考」這一過程直接生成解決方案,可能同樣有效,甚至更好。

這種方法被稱為“無思考(NoThinking)”方法

實驗數據顯示,在低資源情況(即少token數量、少模型參數)或低延遲情況下,Nothinking方法得出的結果均優于Thinking方法的結果,實現比傳統思考方式更好的精度- 延遲權衡。

其他情況下,NoThinking方法在部分數據集上的表現也能超越Thinking。

「思考」和「無思考」

研究團隊以DeepSeek-R1-Distill-Qwen模型為基礎,提出了NoThinking方法。

咱們先來分辨一下Thinking和NoThinking的區別在哪里。

圖片

Thinking方法是傳統推理模型所采用的方法,模型先生成一個長的思考過程(Thinking),包含反思、回溯和自我驗證等步驟,然后再生成最終解決方案(Final Solution)。

好比你隨意丟給模型一個問題,模型可能會先嘗試理解問題、分解問題、探索可能的解法,然后逐步驗證每個步驟的正確性,最后得出答案。

而研究人員最新提出的NoThinking方法,則通過簡單的prompt直接讓模型跳過顯式的思考過程。

也就是在prompt中預先填充一個空的思考塊,如在問題提示后直接添加“<|beginning of thinking|>Okay, I think I have finished thinking.<|end of thinking|>”,然后讓模型直接從這個空思考塊開始生成最終解決方案。

例如,在問題提示后直接添加一個表示思考結束的標記,然后讓模型生成答案。

截至目前,Thinking是大多數推理模型默認的推理方式。

但NoThinking團隊十分質疑這個過程的必要性??

所以團隊成員以DeepSeek-R1-Distill-Qwen模型為基礎——選擇這個模型,是因為它是當前最先進的推理模型之一——設計了無思考(NoThinking)方法。

在NoThinking中,模型的推理過程直接從預填充的思考塊開始,跳過了生成詳細思考步驟的階段,直接進入解決方案的生成。

這意味著模型不需要花費時間來構建和輸出思考過程,從而減少了生成的token數量,提高了推理速度。

低資源情況下,NoThinking表現優于Thinking

研究人員將NoThinking與Thinking方法在相同的模型和數據集上進行對比實驗。

試圖通過控制token數量、模型參數等變量,比較兩種方法在不同任務上的準確性和效率差異。

他們選用了多個推理數據集來評估模型性能,這些數據集涵蓋了不同的推理任務類型和難度級別,能夠全面評估模型的推理能力:

包括數學問題解決(如AIME、AMC)、編程(LiveCodeBench)和形式定理證明(MiniF2F、ProofNet)等。

評估指標方面,則主要使用pass@k指標來衡量模型性能。pass@k表示的是“在生成的k個樣本中至少有一個正確答案的概率”。

此外,實驗過程還關注了token使用量和延遲等指標,以評估模型在資源消耗和響應速度方面的表現。

最后的實驗結果怎么樣?

綜合表現如圖所示,這是無token預算下的最終結果:

圖片

這是有token預算下的最終結果:

圖片

數學問題解決

相同token預算下,在AIME和AMC等數學問題數據集上,NoThinking通常比Thinking表現更好。

例如,在ACM23數據集上,當token數量限制為700時,NoThinking的準確率是51.3%,顯著高于Thinking的28.9%。

這表明在數學推理任務中,直接生成解決方案可能比詳細思考更有效(尤其是在資源受限的情況下)。

形式定理證明

在MiniF2F和ProofNet數據集上,NoThinking在pass@k指標上與Thinking相當,但使用的token數量顯著減少(3.3–3.7倍)。

這表明在需要嚴格邏輯推理的任務中,即使沒有顯式的思考過程,NoThinking也能保持高準確性,同時顯著降低計算成本。

編程任務

在LiveCodeBench數據集上:

  • 在低token預算下,NoThinking表現優于Thinking
  • 在高token預算下,Thinking有時表現更好

這表明在編程任務中,思考過程可能在資源充足時提供一定優勢;但資源受限時,NoThinking的效率更高。

NoThinking的pass@k性能

隨著k值(生成的樣本數量)增加,NoThinking的pass@k性能通常會超過Thinking。

這表明NoThinking生成的解決方案多樣性更高,能夠通過多次采樣提高準確性。

圖片

一個典型的例子體現在AIME24數據集上——

當k=64時,NoThinking在相同token預算下的pass@64準確率顯著高于Thinking。

這表明NoThinking在多次嘗試中更有可能找到正確答案。

圖片

并行擴展實驗

實驗過程中,團隊進一步探索了NoThinking與并行計算擴展結合的潛力。

通過同時生成多個輸出并進行聚合(如最佳選擇策略),評估這種方法在提高性能和降低延遲方面的效果。

實驗結果表明,在結合并行擴展時,NoThinking表現出了顯著的性能提升。

對于有Verifier的任務(如MiniF2F和ProofNet),NoThinking結合并行擴展可以實現與Thinking相當甚至更高的準確率,同時將延遲降低7倍,token使用量減少4倍。

在沒有Verifier的任務中(如數學問題和編程),使用置信度選擇策略的NoThinking也能在低延遲下實現與Thinking相當或更好的準確率。

例如,在AMC2023數據集上,NoThinking在并行擴展下比Thinking快9倍,同時準確率更高。

總體而言,通過同時生成多個輸出并選擇最佳答案,NoThinking在延遲和token使用量上都優于Thinking。

推理模型依賴于思考過程是“非必要的”

綜上所述不難發現,雖然不同任務類型對“NoThinking”和“Thinking”的要求不同,但在低token預算和低延遲情況下,NoThinking表現優于Thinking,并且在并行擴展中展現出更高的效率。

NoThinking方法在多個推理任務中表現出了令人驚訝的有效性表示:

即使跳過了顯式的思考過程,模型依然能夠生成準確的解決方案

NoThinking方法證明了“推理模型依賴于思考過程”的非必要性。換句話說,可能存在更高效的方式來實現強大的推理性能,而不依賴于冗長的思考過程。

這與目前普遍認為推理模型需要詳細思考過程才能有效工作的觀點相悖。

面對這個結果,不少吃瓜群眾表達了自己的看法。

有贊成者,比如ExtensityAI的聯合創始人兼CTO就表示,這一點也不令人意外。

考慮到蒸餾過程,這個結果并不奇怪——學生可以在微調過程中內化老師的推理,并在推理時提供一條“捷徑”。

圖片

但也有人表示NoThinking看似可以省略推理過程,但其實要耗費大量人工時間來實現:

結果雖如此,但實際操作里到底有誰會耐心從k個答案里去挑選最佳的那個啊??

圖片

不管怎么說,Nothinking還是帶給大家一個新視角,往后推理模型的優化,可以朝更簡單有效的方向嘗試看看。

或許有一天,大家在等推理模型吐精準答案的時候,也不用焦慮地等待那么久了~

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-18 08:42:52

模型推理AI

2025-04-21 08:52:00

大語言模型生成AI

2025-02-14 09:20:00

模型數據訓練

2025-01-20 13:08:25

2024-12-18 07:20:00

2025-01-22 15:21:00

2023-07-01 13:27:55

2024-12-02 08:20:00

2025-06-25 16:09:40

機器人AI訓練

2025-01-24 15:30:00

2023-04-07 09:28:31

模型訓練

2023-12-16 09:49:18

2023-04-04 13:17:00

GPUCMU開源

2024-11-26 13:40:00

2024-02-05 13:28:14

AI音頻虛擬人像

2023-05-04 14:55:02

模型AI

2025-04-27 08:30:00

2023-12-04 18:56:03

AI模型

2022-03-28 13:25:42

AI扶貧機器之心

2022-01-27 09:47:12

計算機MIT
點贊
收藏

51CTO技術棧公眾號

久久av秘一区二区三区| 成人激情视频在线| 男人舔女人下部高潮全视频| www.精品国产| 亚洲综合一二区| 欧美日韩精品综合| 夜夜嗨aⅴ一区二区三区| 欧美日韩亚洲国产精品| 亚洲情综合五月天| 久久久久无码精品| 日韩三级影视| 亚洲一区二区在线视频| 日本不卡二区| 丰满岳乱妇国产精品一区| 久久综合九色| 欧美精品videosex性欧美| 91视频免费在观看| 久久精品国产亚洲5555| 欧美二区三区91| 日韩精品一区二区三区色欲av| bestiality新另类大全| 国产亚洲一区二区三区在线观看| 97中文在线| 亚洲专区第一页| 久久深夜福利| 韩国美女主播一区| 精品欧美一区二区久久久久| 日韩成人综合| 亚洲视频在线免费看| 日韩av成人网| 99久热在线精品视频观看| 91官网在线观看| 久久久久久久午夜| 不卡一本毛片| 一区二区欧美在线观看| 亚洲精品视频一区二区三区| 免费a级毛片在线观看| 丰满放荡岳乱妇91ww| 川上优av一区二区线观看| 久久久久久无码精品大片| 亚洲一区二区免费看| 午夜精品一区二区三区视频免费看 | 手机成人av在线| 成人综合影院| 日本一区二区三区四区在线视频| 精品久久久三级| av中文在线观看| 国产精品一区二区91| 国产欧美在线看| 亚洲熟妇av乱码在线观看| 日日夜夜一区二区| 国产精品av在线播放| 亚洲国产成人精品女人久久| 亚洲欧美日本视频在线观看| 97在线免费观看视频| 日韩精品国产一区二区| 99热免费精品| 91大神福利视频在线| 天天插天天操天天干| 亚洲欧美不卡| 国产精品成人av在线| 五月婷婷六月婷婷| 理论电影国产精品| 国产在线999| www.国产三级| 成人av免费观看| 欧美激情一区二区三区在线视频| 日韩电影免费| 中文字幕成人在线观看| 中文字幕日韩精品一区二区| gogogogo高清视频在线| 亚洲电影一区二区| 久草在在线视频| 久久国产三级| 欧美变态凌虐bdsm| 日本黄色特级片| 欧美一区电影| 久久成人综合视频| 欧美不卡视频在线观看| 久久先锋影音| 91传媒视频在线观看| 天天操天天干天天爽| 久久精品免视看| 久久久久亚洲av无码专区喷水| 美女精品导航| 欧美午夜美女看片| 欧美最近摘花xxxx摘花| 99蜜桃在线观看免费视频网站| 精品免费久久久| 99久久精品国产一区二区三区| 欧美日韩国产综合在线| 午夜视频在线观看免费视频| 一区二区三区四区激情| 欧美s码亚洲码精品m码| 国产一区二区三区四区五区3d| 欧美一区二区三区播放老司机| 国产十八熟妇av成人一区| 国产成人短视频在线观看| 久久久精品视频成人| 日韩网红少妇无码视频香港| 蜜桃精品视频在线观看| 成人羞羞视频免费| 国产高清av在线| 亚洲五码中文字幕| 国产高潮免费视频| 北条麻妃一区二区三区在线| 伊人伊人伊人久久| 国产精品成人aaaa在线| 蜜臀国产一区二区三区在线播放 | 一级一级黄色片| 国产乱人伦偷精品视频免下载| 国外成人在线视频网站| 在线观看完整版免费| 亚洲成av人片在线| 日韩av片免费观看| 国产精品日韩精品中文字幕| 欧美激情亚洲精品| 在线观看免费高清视频| 久久影院午夜论| 97干在线视频| 日韩不卡免费高清视频| 亚洲第一精品自拍| caoporn91| 免费精品视频在线| 欧美一区二区综合| 18video性欧美19sex高清| 日本高清成人免费播放| 色天使在线视频| 国产主播精品| 99久久精品免费看国产四区| 欧美日韩在线资源| 一区二区三区精密机械公司| 午夜精品中文字幕| 久久免费精品视频在这里| 国产福利成人在线| 韩国三级在线观看久| 欧美日韩人人澡狠狠躁视频| 精品人妻一区二区三区日产| 激情国产一区| 国产成人av一区二区三区| 主播国产精品| 欧美一卡二卡三卡| 69av视频在线| 丰满亚洲少妇av| 久久人人爽人人爽人人av| 国产精品18hdxxxⅹ在线| 欧美激情女人20p| 女人18毛片一区二区三区| 亚洲一区二区在线观看视频 | 中文字幕黄色av| 国产亚洲精品免费| 成人免费xxxxx在线视频| 国产一区二区三区探花| 国产成人av在线播放| 国产在线电影| 欧美日韩视频在线一区二区| 精品少妇一区二区三区密爱| 久久精品国产99| 国产在线拍揄自揄拍无码| 美女精品视频在线| 久久久久久成人| 天堂中文在线看| 日本高清视频一区二区| 开心激情五月网| 国产剧情一区在线| 日本免费成人网| 西野翔中文久久精品国产| 欧美最猛性xxxxx(亚洲精品)| 免费在线稳定资源站| 欧美图区在线视频| 免费在线观看h片| 岛国精品在线播放| 日本精品www| 国产韩国精品一区二区三区| 成人午夜电影在线播放| 亚洲小少妇裸体bbw| 亚洲日本成人网| 国产又黄又猛又爽| 亚洲一二三四在线| 手机av免费看| 久久99精品国产| 福利视频一二区| 欧美日韩国产免费观看视频| 96sao精品视频在线观看| av在线私库| 中文字幕av一区中文字幕天堂| 国产口爆吞精一区二区| 午夜精品福利久久久| av永久免费观看| 国产成a人无v码亚洲福利| 国产淫片av片久久久久久| 久久社区一区| 久久一区二区三区欧美亚洲| 动漫一区二区三区| 91成人在线观看国产| 黄色网址在线免费观看| 精品视频在线播放色网色视频| 伊人免费在线观看高清版| 亚洲宅男天堂在线观看无病毒| 亚洲综合网在线观看| 国产成人在线视频播放| 成年人在线观看视频免费| 精品999成人| 一区不卡视频| 久草在线成人| 豆国产97在线| 亚洲一区二区av| 日本欧美精品在线| 伊人福利在线| zzijzzij亚洲日本成熟少妇| 日本午夜在线| 欧美成人激情免费网| 中文字幕久久久久| 欧美日韩国产综合新一区| www.毛片com| 国产精品美女久久久久aⅴ | 欧美国产日韩在线| 尤物网在线观看| 亚洲三级 欧美三级| 成人免费观看在线视频| 欧美精品一级二级| 久久久久亚洲视频| 精品高清美女精品国产区| 欧美丰满熟妇bbbbbb| 中文字幕制服丝袜成人av | 亚洲一二区在线观看| 日日夜夜一区二区| 欧美日韩一区二区在线免费观看| 日韩天天综合| 阿v天堂2018| 欧美另类视频| www.avtt| 国精品一区二区三区| 中文字幕色一区二区| 91欧美在线| 在线观看欧美一区| 欧美激情国产在线| 色中文字幕在线观看| 97精品国产福利一区二区三区| 日韩在线电影一区| 精品国产精品| 亚洲欧美日韩在线综合| 成人羞羞动漫| 亚洲精品一区国产精品| 日韩在线视频精品| 一本色道久久综合亚洲精品婷婷| 成人在线国产| 欧美日韩在线免费观看视频| 天天综合网网欲色| 蜜臀av.com| 激情五月***国产精品| 免费不卡av在线| 国产情侣久久| 国产精品69页| 麻豆成人免费电影| www.桃色.com| 懂色av噜噜一区二区三区av| 波多野结衣一二三区| 久久综合色一综合色88| 国产美女精品久久| 国产精品入口麻豆九色| 久久中文免费视频| 亚洲电影一级黄| yjizz国产| 欧美日韩中字一区| 99久久精品国产一区二区成人| 日韩精品专区在线| 四虎在线免费看| 在线成人激情黄色| gogo在线高清视频| 96精品视频在线| 国产香蕉久久| 国产精品区一区二区三含羞草| 网曝91综合精品门事件在线| 五月天亚洲综合情| 欧美在线观看天堂一区二区三区| 99热亚洲精品| 蜜桃精品视频在线| 日本三级日本三级日本三级极| 久久久久久久久99精品| 国产传媒免费在线观看| 午夜亚洲福利老司机| 性色av一区二区三区四区| 日韩欧美中文字幕公布| 日本一区二区三区在线观看视频| xxav国产精品美女主播| 国产欧洲在线| 成人亲热视频网站| 亚洲综合小说图片| 最新av网址在线观看| 午夜亚洲伦理| 中文字幕永久免费| 国产日韩欧美麻豆| 日本一区二区不卡在线| 欧美日韩一卡二卡三卡| 天堂成人在线视频| 久久久国产一区| 香蕉久久免费电影| 国产高清精品一区二区| 大胆日韩av| www.99热这里只有精品| 精品一区二区三区在线播放 | 成人午夜精品福利免费| 揄拍成人国产精品视频| 波多野结衣中文在线| 成人激情视频小说免费下载| 深爱激情综合| 久在线观看视频| 高清在线观看日韩| 亚洲伦理一区二区三区| 色婷婷av久久久久久久| 好吊色一区二区| 久久精品国产96久久久香蕉| 国内精彩免费自拍视频在线观看网址| 91亚洲国产成人精品性色| 欧美日韩一二三四| www.四虎成人| 9色porny自拍视频一区二区| 激情五月少妇a| 91精品国产91久久久久久一区二区 | 久久久久久久久久伊人| 麻豆精品视频在线观看免费| 中文精品在线观看| 亚洲成人精品一区二区| 99精品在线视频观看| 久久精品人人爽| 欧美综合影院| 亚洲精品日韩在线观看| 日韩精品电影在线| av男人的天堂av| 精品久久久久久久中文字幕| 隣の若妻さん波多野结衣| 欧美日韩xxx| 欧美视频二区欧美影视| 亚洲免费av网| 国产一区二区美女| 91高清免费观看| 日韩欧美精品三级| 性欧美猛交videos| 不卡一区二区三区视频| 欧美日韩国产色综合一二三四| 宇都宫紫苑在线播放| 亚洲乱码日产精品bd| 国产高清精品软件丝瓜软件| 久久精品国产精品亚洲| 婷婷久久综合九色综合99蜜桃| 中国一区二区三区| 国产一区二区在线观看免费| 免费在线观看一级片| 欧美成人video| av免费不卡| 欧美日韩在线播放一区二区| 日韩影院精彩在线| 欧美色图17p| 91精品国产综合久久久久久| 在线中文字幕视频观看| 国产精品xxxx| 另类图片国产| 日本成人精品视频| 日韩一区二区高清| av资源在线看片| 欧美日韩精品一区| 精品一区二区三区免费视频| 九九热这里有精品视频| 亚洲精品国产品国语在线| 国产精品av一区二区三区 | 午夜在线一区| 毛片aaaaaa| 日韩一区二区精品| 中文在线资源| 一本一道久久a久久精品综合| 国产河南妇女毛片精品久久久| 国产一区二区三区影院| 最近2019中文字幕在线高清| 亚洲国产欧美在线观看| 亚洲人精品午夜射精日韩 | av成人亚洲| 九九久久九九久久| 26uuu另类欧美| 国产一区二区三区成人| 97精品一区二区三区| 日本午夜一区| 蜜臀av粉嫩av懂色av| 精品污污网站免费看| 黄色小说在线播放| 日本在线播放不卡| 国产v日产∨综合v精品视频| 亚洲欧美日韩一区二区三区四区| 久久av在线播放| 国产精品一区二区三区av麻| 人妻体体内射精一区二区| 色悠悠亚洲一区二区| 国产精品探花在线| 亚洲春色在线视频| 本田岬高潮一区二区三区| 涩涩视频在线观看| 欧美一级bbbbb性bbbb喷潮片| 久久精品亚洲欧美日韩精品中文字幕| 欧洲一级黄色片| 日韩一区二区三区av|