精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理“剎不住車”?新框架讓DeepSeek-R1們告別過度思考,已開源

人工智能 新聞
來自浙江大學、天津大學和MSRA的研究團隊提出了一個新方法,Self-Braking Tuning(SBT)。

DeepSeek-R1、OpenAI o1等推理模型大放異彩。但隨著能力增強,一個副作用越來越明顯——

它們開始想太多了

從奧數題到程序邏輯,能解的題越來越多、推理鏈條越來越長。

也就是說,模型在完成推理任務時,常常出現過度思考

  • 步驟繁冗:明明兩步能解完,非要繞七八步,搞得邏輯鏈又長又亂;
  • 表述拖沓:簡單結論非要用復雜語言兜圈子,說了一堆才到點子上;
  • 輸出冗長:生成了大量無效tokens,既浪費算力,又拖慢推理速度。

這不光影響效率,更可能導致錯誤——在長鏈式思考中,每一步的小誤差都會累積放大,最后可能想著想著就跑偏了。

于是,一個關鍵問題擺在了現實面前:

如何讓模型既然會思考推理,也懂得“適可而止”,知道什么時候該停下來?

針對于此,來自浙江大學、天津大學和MSRA的研究團隊提出了一個新方法,Self-Braking Tuning(SBT)。

它是一種輕量級、通用的調優機制,可無縫集成到現有大模型中。其主要目的是讓模型不再一味求“多想”,而是在最短路徑上到達正確答案。

其核心設計包括剎車信號機制、多任務微調,且無需外部模塊或改動推理流程。

其中,剎車信號機制是在訓練階段引入一類特殊的信號,指示“當前信息已經足夠完成任務”,模型據此學習何時應終止推理。

多任務微調則指揮模型同時學習如何解題&何時停步,兼顧準確性與效率。

總結成一句話,SBT就像在大模型頭腦里裝了個“限速器”,讓它不再無休止地輸出,更聰明,也更節能。

圖片

讓模型知道自己“是否想太多”

SBT框架的核心目標,是讓模型具備自我判斷是否“想得太多”的能力,能夠在無需外部干預的情況下,適時終止推理過程。

圖片

它的特別之處在于,不依賴外部規則或指令,而是從模型內部出發,重塑模型對自身思考狀態的理解與掌控力。

簡單來說,就是讓模型像人一樣,在覺得“想得差不多了”時,能夠自然地停下來,而不是無休止地繼續推理。

圖片

構建過度推理識別指標體系

為了更有效地識別推理過程中可能出現的冗余部分,研究團隊構建了一套參考標準答案的評估體系。

他們將推理劃分為兩個主要階段:基礎方案(Foundation Solution)和進化方案(Evolution Solution)。

前者是模型在初步理解問題后給出的第一輪解答,而后者則是大模型后續對這一初始方案的進一步思考、補充和驗證。

基于此,團隊提出了兩個核心指標:推理效率比和過度推理標記比。

推理效率比衡量表示的是模型在達到第一個正確答案所需的推理步驟與整個推理過程總步驟的比例。

比例越接近1,表示模型的推理效率越高,過度推理的可能性越低。

過度推理標記比則通過分析推理過程中的語言模式,識別與過度推理行為相關的特定詞匯,如 “Wait”“But”“However” 等,來量化過度推理的嚴重程度。

這兩種指標相互補充,從結構和語言兩個維度全面評估推理過程中的冗余程度。

創新性數據構建策略

研究團隊基于上述指標體系,開發了Self-Braking Tuning Exact(SBT-E)和Self-Braking Tuning Dynamic(SBT-D)兩種互補的數據構建策略。

SBT-E采用了一種統一的截斷策略,對每條推理路徑進行結構化處理。

在存在過度推理的案例中,保留模型生成的基礎解決方案以及一個進化方案,并補充一小段被掩碼的后續內容。

這樣的設計有助于模型在訓練時明確區分哪些推理是必要的,哪些則是多余的,從而逐步學會控制推理的深度,避免無效延展。

SBT-D則采用逐步適應的策略,根據不同問題的特點動態調整推理長度。

從完整保留基礎解決方案開始,逐步添加后續推理步驟,并在每一步重新計算過度推理分數。當分數超過預設的閾值時,停止添加推理步驟,并將超出部分進行掩碼處理。

這種方法使得模型能夠在不同復雜度的問題上自適應地終止推理,避免過度推理的發生。

自我調節制動策略

除了數據構建策略外,研究團隊還引入了自我調節制動策略,進一步增強模型對推理過程的自我控制能力。

在SBT-E和SBT-D構建的數據樣本里,研究團隊對推理過程的后期冗余部分進行了掩碼處理。

這就像給模型的推理之路設置關卡,擋住那些非必要的重復思考。

模型能看見這些被掩碼的內容,但在訓練時,這些部分不會計入損失函數,仿佛是“只展示不考核”。

通過這種方式,模型逐漸學會聚焦關鍵推理步驟,不再深陷無意義的冗余思考,從而提升推理效率。

除了對冗余推理部分進行掩碼處理,SBT框架還引入了自然語言提示機制,作為引導模型停步的輔助方式。

這些提示以簡潔的語言表達模型當前的判斷,例如:”Wait, my answer is too verbose. Let me answer it more concisely”。

借助語言模型對語義的理解能力,這種方式能夠在推理過程中起到提醒作用,幫助模型識別信息已足夠、無需繼續展開,從而減少無謂生成,提升整體推理的效率與簡潔性。

實現“少思考但不失準確”的效果

在數學推理基準測試(AIME、AMC、MATH500、GSM8K)上,研究團隊對SBT框架進行了廣泛的實驗評估。

從實驗結果來看,SBT框架在多個數學推理數據集上展現出了顯著的性能提升,尤其是在推理效率方面,取得了前所未有的進展。

圖片

相比于傳統的完整推理過程,SBT通過識別并主動規避冗余推理步驟,實現了“少思考但不失準確”的效果。

以Llama-3.1-8B-Instruct模型為例,應用SBT-E策略后,模型在推理過程中生成的token數量減少了62.8%,但最終的準確率仍穩定維持在94.1%。

更為重要的是,這一方法在多個模型架構和規模下均表現出高度的穩定性和通用性,充分證明了其方法論的魯棒性和推廣價值。

它不僅證明了大量推理內容在實際任務中是冗余的,而且表明這些冗余部分的剔除不會損害模型對復雜數學問題的理解與解答能力。

論文地址:https://arxiv.org/pdf/2505.14604

項目主頁:https://ZJU-REAL.github.io/SBT

GitHub:https://github.com/ZJU-REAL/Self-Braking-Tuning

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-19 08:00:00

2025-04-11 14:54:44

2025-05-06 09:09:37

2025-02-08 09:44:11

DeepSeekAI模型

2025-03-05 03:00:00

DeepSeek大模型調優

2025-03-19 09:52:50

2025-03-06 17:29:21

2025-02-13 08:51:23

DeepSeek大模型

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-12 12:45:59

2025-02-17 08:43:00

模型推理訓練

2025-02-07 13:10:06

2025-02-03 14:17:27

2025-02-19 08:33:18

2023-05-05 10:16:39

2025-02-06 09:11:54

2025-04-09 10:40:32

點贊
收藏

51CTO技術棧公眾號

激情视频一区二区| 亚洲色图在线看| 777精品视频| www久久久久久久| 国产电影一区| 欧美日韩国产中文精品字幕自在自线 | 999国内精品视频在线| 免费日韩一级片| 欧美第一精品| 亚洲精品久久久久久下一站| 欧美伦理片在线观看| 国内小视频在线看| 国产亚洲精品7777| 国产精品theporn88| 波多野结衣视频网址| 欧美国产免费| 在线播放国产一区中文字幕剧情欧美 | 日本熟女一区二区| 欧美艳星介绍134位艳星| 日韩一级片在线播放| 黑森林福利视频导航| 91最新在线视频| 国产欧美日韩不卡免费| 国产精品免费在线 | 中文字幕资源网在线观看免费| 亚洲欧洲成人精品av97| 麻豆91av| 天天干天天舔天天射| 国产最新精品免费| 国产精品高潮粉嫩av| 日韩乱码一区二区| 欧美精品99| 久久精品亚洲一区| 国产真人做爰视频免费| 另类图片第一页| 日韩久久久精品| 黄色小视频免费网站| 成人性生活视频| 精品欧美一区二区三区| 日本一本中文字幕| 污视频免费在线观看| 亚洲欧洲日韩女同| 亚洲一区二区高清视频| 久久精品国产亚洲a∨麻豆| av不卡在线播放| 久久亚洲国产精品成人av秋霞| 丰满少妇一区二区| 欧美大胆a级| 亚洲激情在线视频| 日本不卡视频一区| 国产精品一线| 亚洲国产精品久久久久秋霞蜜臀| 9.1在线观看免费| 视频二区欧美| 精品久久国产老人久久综合| 中文字幕在线观看91| 一区二区三区免费在线看| 欧美一区日韩一区| 欧美性猛交xx| av日韩在线播放| 亚洲精品国产精品国产自| 中文字幕在线播放一区| 精品女人视频| 亚洲欧美日韩精品久久奇米色影视| 性久久久久久久久久久| 小说区图片区色综合区| 亚洲精品综合精品自拍| 最近中文字幕免费| 欧美日韩一二| 久久国产色av| 国产性猛交普通话对白| 亚洲第一黄网| 日本精品久久久久影院| 人人妻人人爽人人澡人人精品| 日本v片在线高清不卡在线观看| 国产精品免费福利| 国产情侣自拍小视频| 国产精品一区二区无线| 国内不卡一区二区三区| 每日更新在线观看av| 国产精品美女久久久久av爽李琼 | 99精品欧美| 日韩av电影免费观看高清| 波多野结衣视频免费观看| 国内精品伊人久久久久av影院| 成人做爰66片免费看网站| 深夜福利视频网站| 国产清纯白嫩初高生在线观看91| 麻豆中文字幕在线观看| 日本孕妇大胆孕交无码| 欧美午夜激情在线| 亚洲一区二区福利视频| 国产欧美一区二区三区米奇| 亚洲视频自拍偷拍| 丝袜 亚洲 另类 欧美 重口| 亚洲欧洲综合| 国产人妖伪娘一区91| 亚洲高清精品视频| 日本一区二区三区国色天香 | 黄页网站大全在线免费观看| 黑人巨大精品欧美一区免费视频| a在线观看免费视频| 高潮按摩久久久久久av免费| 在线观看欧美日韩国产| 久久久久99精品| 免费高清在线一区| 精品欧美一区二区在线观看视频 | 99re6这里只有精品| 欧美精品18videosex性欧美| 亚洲国产无线乱码在线观看| 成人免费视频视频在线观看免费| 亚洲乱码一区二区三区| 草美女在线观看| 欧美高清激情brazzers| 右手影院亚洲欧美 | 日本中文字幕片| 亚洲综合网站| 色老头一区二区三区在线观看| 久久精品欧美一区二区| 国产在线观看免费一区| 青青草久久网络| 牛牛精品一区二区| 欧美一区二区大片| 成人午夜免费影院| 国产日韩亚洲欧美精品| 福利视频一区二区三区| 国产调教视频在线观看| 在线观看欧美日本| 女尊高h男高潮呻吟| 欧美午夜影院| 99re在线视频观看| 国产精品久久欧美久久一区| 91色视频在线| 免费一级特黄特色毛片久久看| 清纯唯美激情亚洲| 日韩中文字幕免费视频| 成年人视频免费| ww久久中文字幕| 日本网站免费在线观看| 另类图片第一页| 久久久久中文字幕2018| 午夜精品久久久久久久99热黄桃| 亚洲欧洲日韩女同| 日本特黄在线观看| 亚洲精品成人无限看| 国产欧美日韩精品丝袜高跟鞋| 中文在线免费看视频| av成人老司机| 成年人视频网站免费观看| 日本亚洲不卡| 人人做人人澡人人爽欧美| 亚洲 国产 欧美 日韩| 午夜精品福利在线| 日本japanese极品少妇| 国产日韩欧美一区在线| 欧美黄色直播| 91精品店在线| 久久久成人的性感天堂| 中文在线观看av| 亚洲欧美日韩精品久久久久| 欧美高清精品一区二区| 精品av久久久久电影| 国产亚洲一区在线播放| 成人性生交大片免费观看网站| 国产亚洲欧洲在线| 伊人网综合在线| 亚洲精品乱码久久久久久日本蜜臀| 美女流白浆视频| 制服诱惑一区二区| 日本一区免费看| 欧美日一区二区三区| 精品激情国产视频| 亚洲第一天堂影院| 日韩欧美一区二区在线| www..com.cn蕾丝视频在线观看免费版| 美日韩一区二区三区| 四虎精品欧美一区二区免费| 国产ts一区| 日韩av免费在线看| 成人午夜在线影视| 亚洲国产成人久久综合| 一级黄色av片| 亚洲人午夜精品天堂一二香蕉| 成人欧美精品一区二区| 久久国产日韩| 可以免费看的黄色网址| 久久丝袜视频| 国产日韩欧美91| 金瓶狂野欧美性猛交xxxx| 亚洲欧美日韩精品久久亚洲区 | 免费看欧美女人艹b| 在线观看17c| 蜜臀91精品国产高清在线观看| 成人精品网站在线观看| 日韩电影毛片| 久久久精品一区二区三区| 天堂成人在线视频| 欧美日韩大陆一区二区| 国产一级特黄aaa大片| 中文字幕不卡的av| 国产伦精品一区二区三区88av| 日韩—二三区免费观看av| 日本人妻伦在线中文字幕| 精品一区电影| 国产精品自拍首页| 日日夜夜综合| 国产成人av在线播放| 色爱综合区网| 中文字幕v亚洲ⅴv天堂| 天天爱天天干天天操| 91精品国产入口| 波多野结衣激情视频| 亚洲成人av在线电影| 91香蕉视频在线播放| 国产午夜精品一区二区三区四区 | 红杏视频成人| 亚洲free嫩bbb| 国产69精品久久久久按摩| 97久久精品人人澡人人爽缅北| 国产一二三区在线观看| 中文精品99久久国产香蕉| 头脑特工队2免费完整版在线观看| 91精品国产综合久久婷婷香蕉| 99re国产在线| 色综合天天在线| 久久99精品波多结衣一区| 夜夜揉揉日日人人青青一国产精品| 国产美女网站视频| 国产亚洲欧美激情| 中文字字幕码一二三区| 成人黄色网址在线观看| 男男受被啪到高潮自述| 韩国精品久久久| 日本xxxx黄色| 蜜桃精品视频在线| 美女喷白浆视频| 免费在线亚洲欧美| 国产精品333| 国产一区二区三区成人欧美日韩在线观看| 国产一级大片免费看| 综合久久精品| 女女百合国产免费网站| 国产精品久久观看| 婷婷视频在线播放| 国产精品99视频| 在线免费一区| 亚洲91中文字幕无线码三区| 裸体裸乳免费看| 午夜国产精品视频| 久久亚洲a v| 精品av久久久久电影| 亚洲熟妇av日韩熟妇在线| 亚洲精品乱码| 99re在线视频免费观看| 日本美女一区二区三区| 亚洲欧美日韩三级| 国产一区二区福利视频| 亚洲av无一区二区三区久久| 国产成人精品一区二| 亚洲午夜久久久久久久久| 成人va在线观看| 国产全是老熟女太爽了| 欧美极品另类videosde| 影音先锋男人资源在线观看| 亚洲欧美电影一区二区| 国产一级视频在线| 福利一区视频在线观看| 亚洲午夜无码久久久久| 91超碰这里只有精品国产| 国产又粗又猛又爽| 亚洲精品一区二区在线观看| 日韩av免费观影| 色偷偷88888欧美精品久久久| 2021国产在线| 午夜精品福利电影| 456亚洲精品成人影院| 成人免费福利在线| 韩国精品福利一区二区三区| 日本一区二区视频| 欧美三级免费| av无码精品一区二区三区| 国产老女人精品毛片久久| 97人妻精品一区二区三区免| 国产精品进线69影院| 亚洲国产综合久久| 欧美亚男人的天堂| 肥臀熟女一区二区三区| 国产亚洲a∨片在线观看| 国产1区在线| 欧美一级在线播放| 成人免费91| 欧美日韩一区二区视频在线 | 91成人福利在线| 伊人久久综合网另类网站| 狠狠色综合欧美激情| 四季av一区二区三区免费观看| 日韩欧美不卡在线| 理论电影国产精品| 欧美日韩一区二区三区四区五区六区| 国产欧美精品区一区二区三区| 国产亚洲欧美久久久久| 欧美日韩一区二区在线观看| 亚洲欧洲视频在线观看| 久久偷看各类女兵18女厕嘘嘘| 345成人影院| 成人欧美一区二区三区视频| 欧美色蜜桃97| 男女高潮又爽又黄又无遮挡| 国产精品综合一区二区三区| 中文字幕伦理片| 精品久久香蕉国产线看观看亚洲| 国产视频aaa| 中文字幕精品一区二区精品| 日本不良网站在线观看| 999精品视频一区二区三区| 精品国产美女| 僵尸世界大战2 在线播放| 国产在线一区二区| 日本猛少妇色xxxxx免费网站| 欧美色道久久88综合亚洲精品| 成人午夜免费在线观看| 久久精品亚洲一区| 欧美日韩破处视频| 日韩一区国产在线观看| 老色鬼久久亚洲一区二区| 国产精品扒开腿做爽爽爽a片唱戏 亚洲av成人精品一区二区三区 | 国产精品日韩一区二区免费视频 | 日本a在线免费观看| 国产自产视频一区二区三区| 免费一级黄色录像| 欧洲av在线精品| 黄色在线播放| 清纯唯美亚洲综合| 天海翼亚洲一区二区三区| 国产96在线 | 亚洲| 成人午夜短视频| 精品一区二区三区四| 欧美岛国在线观看| 四虎影院观看视频在线观看| 91免费版黄色| 黄色亚洲精品| 亚洲av成人片无码| 亚洲二区在线观看| 天堂成人在线视频| 2019亚洲男人天堂| 夜色77av精品影院| 久久精品99国产| 欧美国产精品中文字幕| 日韩国产成人在线| 中文字幕日韩欧美在线视频| 高清欧美日韩| 亚洲小说欧美另类激情| 国产精品一区二区久久不卡| 免费一级片在线观看| 精品va天堂亚洲国产| 色偷偷色偷偷色偷偷在线视频| 久久资源亚洲| 日韩精品午夜视频| 少妇愉情理伦三级| 欧美老女人第四色| 欧美家庭影院| 老牛影视免费一区二区| 天堂影院一区二区| 制服丨自拍丨欧美丨动漫丨| 欧美一区2区视频在线观看| 国内老司机av在线| 欧美xxxx黑人又粗又长密月| 日韩二区三区四区| 777777国产7777777| 日韩欧美亚洲一区二区| 俺来也官网欧美久久精品| 鲁丝片一区二区三区| 老司机一区二区| 精品无码m3u8在线观看| 精品性高朝久久久久久久| 成人免费av电影| 精品无码av无码免费专区| 99久久精品国产一区| 欧美 亚洲 另类 激情 另类| 超薄丝袜一区二区| 日韩欧美四区| 久久99爱视频| 亚洲国产精品久久久久秋霞影院| 青青青草网站免费视频在线观看| 国产欧美在线播放| 极品少妇一区二区三区| 国产精成人品免费观看| 日韩精品最新网址| 深夜视频一区二区| 国产精品自拍合集| 欧美—级在线免费片| 免费观看毛片网站| 国产精品手机播放| 亚洲欧洲日本一区二区三区| www.黄色com| 亚洲男女性事视频| 日韩精品视频在线看| 成人在线免费播放视频| 亚洲精品成人天堂一二三| 久久久久国产精品嫩草影院|