精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

騰訊發布SpecExit算法,無損壓縮端到端加速2.5倍!解決大模型長思考效率難題

人工智能 新聞
為破解大模型長思維鏈的效率難題,并且為了更好的端到端加速落地,我們將思考早停與投機采樣無縫融合,提出了 SpecExit 方法,利用輕量級草稿模型預測 “退出信號”,在避免額外探測開銷的同時將思維鏈長度縮短 66%,vLLM 上推理端到端加速 2.5 倍。

以 DeepSeek-R1 等為代表的推理模型(Large Reasoning Models, LRMs),通過生成更長的思維鏈,在各類復雜任務中取得了更優的表現。但長思維鏈是推理模型的 “雙刃劍”,雖能提升性能,但 “過度思考” 帶來的語義冗余會大幅推高推理成本。

為破解大模型長思維鏈的效率難題,并且為了更好的端到端加速落地,我們將思考早停與投機采樣無縫融合,提出了 SpecExit 方法,利用輕量級草稿模型預測 “退出信號”,在避免額外探測開銷的同時將思維鏈長度縮短 66%,vLLM 上推理端到端加速 2.5 倍。

  • 論文:https://arxiv.org/abs/2509.24248
  • 開源代碼:https://github.com/Tencent/AngelSlim

1.“思考早停” 的挑戰

目前對 LRMs 思維鏈壓縮的相關研究大致可以分為兩類,一類是基于訓練的方法,另一類是 Training-Free 的方法,它們都有各自的局限性:

(1)基于訓練的方法,通過標注數據進行有監督微調,或通過強化學習減少思維鏈長度。盡管壓縮效果顯著,但往往伴隨高昂的訓練成本,并導致模型輸出分布被改變,引發模型可靠性及性能上的擔憂。

(2)Training-Free 的方法,無需高昂的訓練開銷,通過介入模型的長思考過程,監控模型的 Logits 或其他輸出信號,來判斷當前思考長度下,能否提前終止推理。這類方法表明,通過提前停止可以在不降低準確率的前提下縮短推理長度,但其依賴探測機制會帶來額外計算開銷,并且往往更關注詞元數量的減少,而非真正的端到端推理時延優化。

圖 1 SpecExit 實現端到端加速   

 圖 2 從模型隱藏狀態中學習到的推理進度信號

針對以上的問題,我們發現了投機采樣的天然優勢,既能保證模型輸出的一致性,又能從草稿模型隱藏狀態中提取推理進程信號,基于此思路我們提出了 SpecExit 框架。如圖 2 所示,模型的隱藏狀態中天然蘊含了例如置信度、推理進度和剩余推理長度等信號,SpecExit 通過將這些信號與投機采樣結合,在不引入額外探測開銷的前提下,實現動態、可靠的思考早停。并且如圖 1 所示,相比于基線和 DEER 等方法,SpecExit 在 vLLM 上端到端加速 2 倍以上,準確性和推理效率得到雙重保障。

2.SpecExit 方法創新

大模型中多詞元預測(Multi-Token Prediction, MTP)的隱藏狀態可以預測未來 N 個位置的詞元,這表明隱藏狀態中蘊含了豐富的信息。受 MTP 的啟發,SpecExit 的目標是:同時從隱藏狀態中學習表征推理狀態的「信號」及未來 N 個詞元,在保留 MTP 原有加速能力的基礎上,引導思考過程提前終止,進一步提升推理效率。SpecExit 整體框架如圖 3 所示,僅需對 MTP 的隱藏層進行低成本的擴展,即可高效加速并壓縮推理模型的思維鏈。

圖 3 SpecExit 方法架構總覽

2.1 SpecExit 訓練流程

(1)數據構建:我們首先獲取基礎模型生成的完整輸出,并提取位于 <think> 和 </think> 詞元之間的推理內容。為了識別有效的推理軌跡,我們迭代嘗試在段落結束位置插入推理結束詞元 </think>,并驗證生成的最終答案是否與原始輸出匹配。如果答案保持一致,則后續的推理內容被視為冗余。因此,僅保留產生正確答案所需的最小推理片段作為訓練數據。

(2)信號標注:置信度 Confidence 定義為預測步驟中概率的幾何平均數,反映生成的可靠性;剩余推理長度 Remain 定義為從當前詞元位置到最早有效 </think> 插入點的剩余詞元數量,量化推理的剩余工作量;推理進度 Progress 表示為從 0 到 1 的歸一化值,捕捉思維鏈的相對進度。

(3)信號回歸:我們提出了一種簡便高效的擴展方法,通過在 MTP 模塊的線性投影層中引入少量額外維度來回歸推理信號。這些維度與詞元分類權重正交,確保信號回歸不會干擾推測解碼訓練的收斂。多任務學習(Multi-Task Learning, MTL)將詞元分類損失和信號回歸損失聯合優化,整體訓練目標如下:

其中,詞元分類預測使用標準交叉熵損失,置信度和推理進度使用均方誤差(Mean Squared Error, MSE),剩余推理長度使用均方對數誤差(Mean Squared Logarithmic Error, MSLE),λc、λp、λr 表示動態權重系數。置信度、推理進度、剩余推理長度三個信號量的損失函數公式如下:

由于信號回歸損失的收斂速度比詞元分類損失更快,我們采用基于梯度的動態權重策略來平衡不同任務的貢獻。該機制為梯度幅度較小的任務分配更高權重,防止梯度較大的任務主導學習過程,從而確保所有任務都能得到有效優化,訓練損失收斂曲線如圖 4 所示。

圖 4 訓練 Loss 收斂曲線 

圖 5 信號引導的投機采樣思考早停 Inference 過程

2.2 SpecExit 在 vLLM 推理流程

我們基于投機采樣框架構建了思考早停機制,其中草稿模型首先產出一系列候選詞元,隨后由目標模型并行驗證。特別的,在目標模型驗證流程中,除了計算下一個詞元的 Logits 外,還計算最后一個被接受詞元對應的最終隱藏狀態。如圖 6 所示,該表征通過草稿模型的輕量級線性層處理后,額外生成置信度分數、推理進度以及剩余推理長度三個信號的預測值。

原始信號存在一定的波動性,可能導致過早或不穩定的思考早停。因此 SpecExit 采用指數加權移動平均(Exponentially Weighted Moving Average, EWMA)方法對信號進行平滑處理。在每次 Decoding 中,平滑值更新為當前信號與先前平滑值的加權平均,確保了思考早停在持續解碼階段的高魯棒性。

圖 6 SpecExit 思維鏈壓縮示例

同時,為確保思考早停的決策發生在語義連貫的邊界處,我們引入了一類稱為步驟分割詞元的特殊標識符,用于指示生成文本中的自然分段點。具體而言,步驟分割詞元可分為兩類:

(1)段落分隔符(如.\n\n),標記段落或推理單元的結束;

(2)語義上的句子間邏輯連接詞(如 "But"、"So" 或 "Therefore"),常在推理過程中標示語義轉換或邏輯轉折。

由于基于段落分隔符的分割策略更具普適性,我們的實驗默認采用該策略。當采樣到的詞元屬于上述集合時,且預測的信號超過預設閾值,則判定推理過程已充分。此時,SpecExit 會在當前分割詞元位置截斷已接受的草稿詞元,并將目標模型的最新詞元替換為 </think>,從而確保終止點位于自然邊界的同時保持生成文本的連貫性。并且 SpecExit 在 vLLM 框架上已端到端支持,在實踐應用上可以很便捷的集成。

3. 實驗結果

我們在數學、科學、編程和邏輯基準測試上對 SpecExit 方法進行了評估,如表 1 實驗結果顯示,SpecExit 顯著縮短了推理過程。在 Qwen3-4B-Thinking-2507 模型上,GSM8K 和 ARC-Challenge 的數據集推理長度分別減少了 54% 和 53%;在 DeepSeek-R1-Distill-Llama-8B 模型上,推理長度分別減少了 66% 和 64%。推理長度大幅縮短的同時,SpecExit 基本無額外探測開銷,所以 vLLM 上端到端加速提升顯著,例如在 GSM8K 數據集上,與投機采用基線 EAGLE3 相比,SpecExit 在兩個模型上分別實現了 1.9 倍和 2.5 倍的加速比。與此同時,SpecExit 在各基準測試上 Acc 基本無損。

表 1 SpecExit 評估與性能測試,Acc 表示精度,Tok 表示輸出詞元數量,Lat 表示端到端時延

與此相比,其他思考早停方法雖然也可以減少輸出長度,但延遲增益很有限,甚至在某些數據集上,額外的計算開銷反而導致推理速度變慢。而 SpecExit 不僅縮短思考長度,而且推理時延加速非常明顯,在實際應用中更加實用。

對于思考停止信號的選擇,我們進行了融合信號與分別單獨使用置信度 Confidence、推理進度 Progress、剩余推理長度 Remain 的消融實驗。實驗結果如圖 7 所示,融合多種信號的策略能夠在減少輸出長度和維持精度表現之間做到更好的平衡。

圖 7 信號類型消融實驗

4. 總結

SpecExit 結合投機采樣,在不影響準確性的前提下在 vLLM 上實現最高達 2.5 倍的端到端推理速度提升,是 LRMs 實踐落地的非常有效的加速算法。正是利用了投機采樣的草稿模型,SpecExit 能在解碼過程中同時預測未來詞元和思考早停信號,不會增加額外的探測開銷,與其他方法相比有更多的性能優勢,在實踐落地非常實用。

在多樣化任務和模型上的實驗表明,SpecExit 泛化能力非常好,并且該方法揭示了隱藏狀態作為高效推理信息信號的潛力,也將為繼續深入發掘隱藏狀態作用的后續研究工作提供很大的借鑒意義。歡迎關注我們的 SpecExit 方法。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-10 08:52:43

PNG類型Chinchilla

2025-07-11 08:54:00

2025-10-11 18:05:23

AI大模型工具

2025-06-30 08:42:00

模型訓練AI

2025-05-26 09:41:26

2022-06-15 16:06:29

LZ4 算法硬件加速

2024-03-15 10:20:14

自動駕駛模型

2022-06-30 10:38:53

Lepton無損壓縮圖片圖片質量

2015-08-31 10:10:48

Dropbox無損壓縮算法云存儲

2023-12-14 13:30:00

AI模型

2025-01-16 10:11:58

2025-10-27 09:06:00

2024-09-10 12:11:18

2022-06-08 16:29:45

無損壓縮方案分布式

2019-04-11 09:22:31

AI 數據人工智能

2025-04-11 09:15:00

語言模型AI數據
點贊
收藏

51CTO技術棧公眾號

人妻av中文系列| 91精品久久久久久蜜桃| 手机看片福利视频| 97色婷婷成人综合在线观看| 1024成人网| 激情五月综合色婷婷一区二区| 欧美日韩乱国产| 欧美a级成人淫片免费看| 欧美不卡一区二区三区| 成年人免费在线播放| 日本中文字幕在线观看| 成人黄色网址在线观看| 国产精品国语对白| 国产真实乱人偷精品视频| 九九综合在线| 欧美成人伊人久久综合网| 亚洲国产精品久久久久婷蜜芽| 最新国产在线观看| 91网站在线观看视频| 成人疯狂猛交xxx| 日日骚av一区二区| 欧美日韩影院| 最近日韩中文字幕中文| 日本黄色片在线播放| 精品国产亚洲一区二区三区在线 | 亚洲日本欧美中文幕| 婷婷激情小说网| 欧洲av一区二区| 亚洲18女电影在线观看| 特色特色大片在线| 91在线免费看| 国产视频一区二区在线| 激情视频在线观看一区二区三区| 精品欧美一区二区精品少妇| 免费在线观看一区二区三区| 日韩av成人在线观看| 日韩欧美大片在线观看| 欧美区一区二| 欧美成人高清视频| 夫妻性生活毛片| 成人在线视频免费观看| 日韩精品在线免费| 人妻体内射精一区二区三区| 欧美精品三级在线| 91精品国产综合久久精品app | 国产无遮挡又黄又爽又色| 天堂网在线观看国产精品| 在线国产精品播放| 亚洲国产日韩一区无码精品久久久| 加勒比色综合久久久久久久久| 日韩精品中文字幕在线不卡尤物 | 日韩一中文字幕| 日本高清黄色片| 日本一区二区高清不卡| 国产亚洲精品高潮| 黄色国产在线播放| 成人情趣视频网站| 亚洲性无码av在线| 少妇精品无码一区二区免费视频| 久9久9色综合| 一区二区欧美久久| 91麻豆制片厂| 999久久久精品国产| 久久九九热免费视频| 日本一级二级视频| 一区在线免费| 91干在线观看| 国产午夜无码视频在线观看| 久久只有精品| 成人黄色在线免费| 成人1区2区3区| 99久久免费视频.com| 久久国产精品-国产精品| 你懂的免费在线观看视频网站| 久久久精品黄色| 一区二区在线观看网站| 3d玉蒲团在线观看| 精品免费在线视频| 丝袜制服一区二区三区| 日韩久久一区| 欧美精品一区男女天堂| 三上悠亚影音先锋| 天天综合精品| 7m精品福利视频导航| 中文字幕在线播| 久久精品国产99| 国产精品综合久久久久久| 欧美美乳在线| 亚洲三级电影网站| 欧美一级在线看| 最新日韩一区| 日韩精品一区二区三区蜜臀| 黄瓜视频污在线观看| 欧美成人激情| 欧美亚洲在线视频| 国产精品高潮呻吟av| av一区二区三区四区| 亚洲国产欧美不卡在线观看 | 最新天堂在线视频| 卡通动漫国产精品| 日韩有码在线播放| 可以免费看的av毛片| 美女一区二区三区| 极品日韩久久| 成人黄色在线电影| 色8久久人人97超碰香蕉987| 性一交一黄一片| 国产成人精品一区二区免费看京 | 视频一区三区| a√中文在线观看| 欧美日韩大陆在线| 亚洲熟妇一区二区三区| 欧美日韩成人| 国产日韩在线免费| 日韩国产福利| 亚洲国产精品视频| www.51色.com| 不卡一区2区| 91av在线播放| 午夜精品久久久久久久99老熟妇| 国产精品色一区二区三区| 少妇无码av无码专区在线观看 | heyzo一区| 91精品婷婷国产综合久久竹菊| 国产精品高清无码在线观看| 亚洲成人中文| 99久久精品免费看国产四区 | 国产aⅴ爽av久久久久| 亚洲色图美女| 97久久伊人激情网| 全国男人的天堂网| 一区二区三区中文在线观看| 一区二区xxx| 欧美另类69xxxxx| 日本国产欧美一区二区三区| 蜜桃视频污在线观看| 亚洲女同一区二区| 亚洲一区二区福利视频| 久久一级电影| 91精品国产自产在线| 97在线观看免费观看高清| 色www精品视频在线观看| 色欲av无码一区二区三区| 一区二区国产在线观看| 丁香五月网久久综合| 欧美巨大xxxx做受沙滩| 日韩一级视频免费观看在线| 中文字幕av免费在线观看| 国产美女娇喘av呻吟久久| 视色,视色影院,视色影库,视色网| 欧美激情三区| 久久久国产一区| 97精品人妻一区二区三区香蕉| 国产精品丝袜在线| 8x8x成人免费视频| 欧美先锋影音| 国产自产精品| 成人性生交大片免费观看网站| 亚洲欧美在线看| 中文字幕一区二区免费| 中文字幕亚洲不卡| 久久久精品视频国产| 欧美三区美女| 久久久综合香蕉尹人综合网| 欧美福利在线播放| 色狠狠久久aa北条麻妃| 国产绿帽刺激高潮对白| 亚洲综合一区二区三区| av网页在线观看| 日韩国产精品久久| 中文字幕av日韩精品| 日韩视频1区| 88xx成人精品| 第三区美女视频在线| 91麻豆精品国产91久久久更新时间| 欧美成人精品欧美一级| 99久久久国产精品| 日本在线观看免费视频| 中文字幕人成人乱码| 国语精品免费视频| 精品欧美一区二区三区在线观看 | 免费精品视频在线| 色一情一乱一乱一区91| 香蕉视频一区| 成人自拍性视频| 人人草在线视频| www.午夜精品| 天天综合在线视频| 精品视频免费在线| 国产成人在线免费观看视频| 国产三级三级三级精品8ⅰ区| 五月六月丁香婷婷| 久久影院亚洲| 女人帮男人橹视频播放| 精品日韩在线| 国产日韩精品一区观看| 久久精品黄色| 91精品国产99久久久久久| 欧美边添边摸边做边爱免费| 亚洲激情中文字幕| 99久久国产免费| 欧美性受极品xxxx喷水| 国产一级在线视频| 亚洲图片欧美激情| 国产三级av在线播放| 丁香桃色午夜亚洲一区二区三区| 热久久精品国产| 激情综合亚洲| 最新视频 - x88av| 欧美亚洲高清| 久久久水蜜桃| 极品尤物一区| 97超碰人人模人人爽人人看| jizz欧美| 日本亚洲欧洲色α| 成人性生交大片免费看在线播放| www.国产一区| yw视频在线观看| 亚洲精品一区中文字幕乱码| 性中国古装videossex| 欧美日韩精品系列| 无码人妻精品一区二区三区9厂| 一区二区三区在线视频免费观看| 天天操天天舔天天射| 久久亚洲综合色| 欧美xxxxx精品| 国产成人av电影免费在线观看| 一本色道久久亚洲综合精品蜜桃 | 国产精品狼人色视频一区| 天堂中文在线播放| 国内伊人久久久久久网站视频 | 国产男女猛烈无遮挡91| 日韩av首页| 热99在线视频| 午夜影院一区| 性亚洲最疯狂xxxx高清| 麻豆蜜桃在线| 欧美精品成人在线| 欧美性猛片xxxxx免费中国| 欧美丰满片xxx777| 亚洲资源一区| 欧美精品少妇videofree| 中文在线观看免费| 欧美第一黄色网| 久久一卡二卡| 久久久久国产一区二区三区| 日本色护士高潮视频在线观看| 久久亚洲综合国产精品99麻豆精品福利 | 粉嫩欧美一区二区三区高清影视| 国产人妻精品久久久久野外| 国产精品一级片在线观看| 欧美熟妇另类久久久久久多毛| 国产乱子轮精品视频| www.cao超碰| 韩国女主播成人在线| 色婷婷激情视频| 国产福利不卡视频| 佐佐木明希电影| 成人18精品视频| 91视频在线网站| 国产精品素人一区二区| 国产色无码精品视频国产| 亚洲精品国久久99热| 精品少妇爆乳无码av无码专区| 亚洲午夜成aⅴ人片| 91美女免费看| 欧美丝袜自拍制服另类| 99久久精品国产成人一区二区| 精品剧情在线观看| 色综合久久网女同蕾丝边| 国产一区二区三区丝袜| 国产传媒在线播放| 97激碰免费视频| 偷拍精品精品一区二区三区| 国产欧美精品日韩| 99re91这里只有精品| 免费观看成人在线| 99国产**精品****| 亚洲国产精品无码观看久久| 久久性色av| 天堂社区在线视频| 成人免费黄色在线| 懂色av蜜桃av| 亚洲国产日韩精品| 亚洲综合五月天婷婷丁香| 日韩精品一区二区三区三区免费| 青青免费在线视频| 色狠狠久久aa北条麻妃| 2018av在线| 成人性教育视频在线观看| 精品伊人久久久| 中文精品一区二区三区 | 一区二区三区蜜桃| 天天干天天操天天操| 日韩欧美一区二区久久婷婷| 你懂的在线网址| 欧美成人精品一区二区| 另类专区亚洲| 国产日韩在线一区二区三区| 久久激情电影| jizzjizzxxxx| 国产成人综合网| 极品尤物一区二区| 欧美三级免费观看| 成人免费观看在线视频| 在线播放国产一区中文字幕剧情欧美 | 国产99精品| 免费的一级黄色片| 久久精品国产99国产| 老司机福利av| 亚洲国产一区视频| 国产又粗又猛又黄又爽| 亚洲色图美腿丝袜| 不卡视频观看| av免费精品一区二区三区| 91视频一区| 亚洲 欧美 日韩系列| 91丨porny丨最新| 久久精品国产亚洲AV无码麻豆 | 日本一区二区三区在线观看视频| 美日韩精品视频免费看| 免费在线成人激情电影| 久久久水蜜桃| 中文高清一区| 99re这里只有| 一区二区日韩av| 精品国产九九九| 伦理中文字幕亚洲| 综合久久av| 在线成人性视频| 捆绑调教一区二区三区| 黄色三级生活片| 色婷婷av一区二区| 国内三级在线观看| 日韩av片电影专区| 女人丝袜激情亚洲| 成年人免费在线播放| 26uuu精品一区二区在线观看| 日本一区二区欧美| 日韩av影视综合网| 深夜成人在线| 免费在线成人av电影| 性色一区二区| 中文字幕在线1| 欧洲一区二区三区在线| 成人在线观看黄色| 国产精品日韩欧美综合| 久久神马影院| 国内av免费观看| 亚洲男人的天堂在线aⅴ视频| 99精品视频免费看| 欧美激情中文字幕乱码免费| 国产一区二区在线视频你懂的| 国产极品在线视频| 久久亚洲综合色| 免费在线不卡av| 久久久电影免费观看完整版| 日本一区二区三区电影免费观看| 日本福利视频网站| 99久久久国产精品| 男人天堂2024| 色噜噜亚洲精品中文字幕| 国产精品美女久久久久| 屁屁影院ccyy国产第一页| 波多野结衣一区二区三区| 欧美精品韩国精品| 日韩中文字幕网址| 成人动态视频| 日韩中文字幕免费在线| 国产精品高清亚洲| 亚洲av少妇一区二区在线观看| 国内揄拍国内精品少妇国语| 校花撩起jk露出白色内裤国产精品 | 欧洲精品二区| 久久涩涩网站| 极品少妇一区二区| 久久综合综合久久| 亚洲品质视频自拍网| 国产免费区一区二区三视频免费 | 黑人巨大精品一区二区在线| 精品国产乱码91久久久久久网站| 在线观看欧美日韩电影| 一本一道久久a久久综合精品| 国产福利精品导航| 亚洲欧美日韩激情| 欧美激情视频在线观看| 蜜桃成人av| 深爱五月综合网| 色综合久久中文字幕| 成年人网站在线| 欧美日韩精品久久| 国产成人h网站| 中文字幕乱码在线观看| 欧美精品video| 首页国产精品| 精品国产av无码| 精品国产免费久久 | 日韩一区二区三区精品视频 | 欧美婷婷在线| 潮喷失禁大喷水aⅴ无码|