精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

推理提速4倍!莫納什、浙大提出動態拼接,大小模型智能協作

人工智能 新聞
針對「大模型推理速度慢,生成token高延遲」的難題,莫納什、北航、浙大等提出R-Stitch框架,通過大小模型動態協作,衡量任務風險后靈活選擇:簡單任務用小模型,關鍵部分用大模型。實驗顯示推理速度提升最高4倍,同時保證高準確率。

近兩年,思維鏈(Chain-of-Thought, CoT)推理讓大語言模型在復雜推理任務上展現出前所未有的能力——從數學解題到邏輯分析,表現令人驚嘆。

然而,這種強大的推理能力也帶來了一個長期存在的挑戰:推理過程過于緩慢。

每生成一個 token,模型都要完整算一遍前向傳播。長一點的推理鏈,幾千上萬個 token,不僅延遲高,成本也成倍增加。

在加速大語言模型的諸多方向中,Speculative Decoding(投機解碼) 一直是備受關注的方案。

它的思路簡單:讓小模型(SLM)先預測一段輸出,大模型(LLM)校驗一致性。若一致,大模型就能夠一次接受小模型的輸出,減少大模型解碼的次數,從而加速。

莫納什、北航、浙江大學等機構的研究者提出了一種動態拼接的大模型推理框架R-Stitch,讓大小模型智能協作,在vLLM推理框架下提速最高可達4倍。

項目主頁:https://caesarhhh.github.io/R-Stitch

論文鏈接:https://arxiv.org/abs/2507.17307

研究團隊在AMC數據集上,對投機解碼測試了多組模型組合,包括DeepSeek-R1-Distill-Qwen-1.5B/7B、L1-1.5B-Short、以及 Qwen2.5-Math-1.5B/7B-Oat-Zero等。

結果顯示出一致的趨勢:token 一致性越高,加速越明顯;一致性越低,速度提升就越有限。

并且,并非所有樣本都能加速。團隊觀察到相當一部分輸入的速度提升低于 1×,即比原始推理還慢——說明當模型間差異較大時,投機解碼的一致性校驗可能反而帶來開銷。

圖1 Token一致性與推理加速分析。 (a) 不同大模型–小模型組合在AMC數據集上的token一致率與加速比關系;(b) 各樣本的加速比分布,可見部分樣本出現低于1×的情況;(c) 在兩者都答對的問題上,L1-1.5B-Short的推理更短、更簡潔。

更有意思的是,在DeepSeek-R1-Distill-Qwen -7B與L1-1.5B-Short的實驗中,研究人員發現:

當兩者都答對時,L1-Short的推理長度遠小于該7B模型。

這意味著:小模型可能以更短的推理路徑到達相同結論,而投機解碼對token一致性的強調,則忽略了這些更高效的路徑。

經驗熵分析

不確定性揭示推理風險

圖2 熵與錯誤位置的關系。 (a) 錯誤解答的整體熵明顯高于正確解答;(b) 熵分布高度集中在0附近,大多數token具有極低或接近零的熵;(c) 首個導致錯誤的 token 附近區域平均熵更高,說明模型往往在不確定區域產生錯誤。

在讓大小模型協同推理之前,需要弄清楚一個關鍵問題:

小模型在什么時候能被信任?又是什么跡象預示它可能要「翻車」?

為此,團隊在AMC數據集 上,對推理過程中的token熵分布進行了深入分析,使用DeepSeek-R1-Distill-Qwen-7B作為大模型,L1-1.5B-Short作為小模型,逐步揭示出三個穩定的規律。

首先,大多數token的熵極低。統計結果顯示,只有約10%的token熵超過 0.1,而絕大部分幾乎為零。這意味著模型在大部分生成過程中都非常「自信」,真正的不確定區域其實只占很小一部分。

其次,錯誤推理的平均熵顯著更高。在同樣的題目上,錯誤答案的 token 熵明顯更高,說明模型在這些題目的推理中更不確定。

并且,團隊觀察到一個關鍵細節:在小模型出錯的樣本中,錯誤往往起源于局部的高熵區域。

在第一個導致錯誤的 token 附近 token的平均熵顯著高于全局水平,因此上述現象可以說明高熵的地方更容易導致錯誤。

大小模型協同動態解碼

圖3 R-Stitch方法流程圖

熵引導的動態切換

基于上述實驗觀察,團隊提出了一種能根據熵動態切換大小模型的解碼框架R-Stitch,讓推理既快又穩。

核心思路是:

讓小模型 (SLM) 盡可能多地負責推理,以提升速度;

讓大模型 (LLM) 只在「高熵、高風險」的時刻介入,以保證正確率;

當LLM處理完復雜部分、進入「低熵」區間時,它又能把控制權交還給SLM,繼續快速生成。

在每一步生成中,模型都會對所有候選詞計算一個概率分布,研究人員用這個分布的歸一化熵值(介于0到1之間)來衡量不確定性。

當SLM的熵值低于閾值τ(表示確定性高)時,它繼續生成;

當熵值高于閾值時,說明「有點拿不準」,此時就交由LLM接手;

反過來,當 LLM 的熵再次降到閾值以下時,它會把控制權還給SLM

這種基于熵的雙向切換策略,使系統能在推理鏈中靈活往返,實現速度與精度的動態平衡。

基于強化學習的動態切換

在R-Stitch 基礎之上,團隊進一步提出了 R-Stitch?,通過強化學習讓一個輕量級路由器學會更智能地決策何時切換。

這個路由器會在高熵時段讀取當前模型隱狀態,判斷是繼續用 SLM 還是交給 LLM。

團隊為它設計了兩種獎勵信號:

準確率獎勵:答案正確則加分;

效率獎勵:計算越快越好,但前提是不能犧牲正確率。

為準確評估推理成本,R-Stitch?引入了真實延遲感知的獎勵函數。

總的獎勵形式為:

其中表示預測正確與否,是整條推理軌跡的估計延遲,λ為平衡系數。

延遲只在輸出正確時被懲罰,確保模型不會「為快而快」。

由于在強化學習中直接測量每個樣本每條采樣軌跡的真實延遲代價太高,R-Stitch?采用了延遲估計器。

團隊為每個模型在不同輸入長度和緩存大小下采樣延時數據,并用線性回歸擬合出它們的延遲曲線。

預填充的延遲被建模為:

其中表示當前處理的token數量,為緩存長度,系數a, b, c, d由實測數據回歸得到。

解碼階段只需將,得到:

最終,整條推理軌跡的延遲由所有步驟的時間求和獲得。

通過這種方式,路由器在訓練時就能「腦補」每個決策的時間成本,真正實現延遲感知的策略學習——既考慮答得準,也懂得算得快。

實驗結果

速度提上去,精度穩得住

圖4 所提方法在數學推理數據集上的表現,所有延時均在vLLM推理框架下實測

團隊將所提方法集成到vLLM中,并在多個數學推理基準上評估了所提方法。結果顯示,R-Stitch在幾乎不損失準確率的前提下,顯著降低了推理延遲:以7B 與14B模型為例,在合理閾值下可實現約2–3×的整體加速,而在更大模型上提速可達 約3–4×

當閾值進一步提高時,速度繼續上升,但會帶來精度下降,形成穩定的效率–精度平衡。

相比之下,投機采樣在一致性較低的模型組合中常因頻繁回退導致開銷上升,甚至比原生 LLM 更慢;僅用小模型雖快但精度顯著下降。

總體來看,R-Stitch的熵路由機制在不同模型規模和推理預算下都表現穩健,實現了「快而不失準」的推理路徑。

進一步地,R-Stitch?通過引入強化學習路由器,使切換策略更加穩定,在不同閾值下都能保持較優的速度–精度表現。

圖5 R-Stitch?與投機解碼的逐樣本對比(LLM-7B, AMC 數據集)。 每個柱狀條表示單個樣本相對于大模型基線的加速比,顏色表示推理是否正確。虛線為無加速(1×),黑色曲線展示了各樣本的token減少比例。

從樣本級對比可以看到,R-Stitch?在大多數樣本上都能實現穩定提速,而投機解碼僅在少量樣本中表現出加速,大部分情況下反而因為一致性不足而變慢。 

理論上,投機解碼的加速上限受限于大小模型的延遲差距,在7B以及1.5B的模型組合上當一致性極高時最多只能接近2×;而 R-Stitch?額外利用了小模型生成更簡潔的表達,保持答案正確的同時,實際加速最高可達約 14×

圖6 R-Stitch與提早退出方法結合的效果

在此之外,團隊還驗證了R-Stitch能否與免訓練的提早退出方法DEER協同工作,以進一步提升解碼效率。DEER會在模型信心超過閾值時提前結束推理,而 R-Stitch 通過熵路由在生成過程中動態切換大小模型。兩者結合后,在縮短推理路徑的同時,也顯著降低了每個token的計算成本

從結果來看,R-Stitch與DEER的組合在多個數據集上都實現了顯著加速:在AIME上,生成token數量減少一半以上,延遲從210秒降至92秒;

在GPQA-D上,推理時間從117秒降至18秒,同時準確率還略有提升,對比原始LLM-7B推理相當于約9.5×加速

這說明兩種機制天然互補:DEER 縮短了生成序列,而R-Stitch降低了單步成本且進一步縮短生成序列。

總結

R-Stitch提出了一種基于熵的不確定性路由機制,讓大小模型在推理過程中動態協作:小模型負責簡單部分,大模型處理關鍵步驟,從而在不損失精度的前提下顯著提速。 

在此基礎上,R-Stitch?通過強化學習路由器進一步提升了切換的智能性與穩定性,實現了更平衡的速度–精度表現。

整體來看,R-Stitch提供了一種讓大小模型協同加速、兼顧靈活性與效率的高效推理方案。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-05-30 14:17:00

模型推理

2021-12-01 10:05:12

模型人工智能計算

2023-12-11 15:40:32

PyTorch代碼大模型

2024-08-06 11:30:00

2025-04-03 09:27:44

2025-04-18 09:25:00

2025-08-18 08:40:00

模型AI算法

2024-01-18 12:37:31

SOTA3D方法

2022-05-11 14:45:48

模型人工智能

2024-12-30 08:50:00

AI數據訓練

2025-08-26 08:50:00

AI開源LLM

2020-05-14 14:21:50

谷歌AI數據

2009-12-21 09:13:09

Ubuntu啟動速度

2025-01-13 12:33:42

2024-09-12 12:46:36

2009-09-23 18:14:48

2025-08-25 08:45:00

模型代碼開源

2025-06-10 02:30:00

智能體ARTIST強化學習

2025-06-05 08:40:00

2021-09-30 11:27:58

模型人工智能神經網絡
點贊
收藏

51CTO技術棧公眾號

国产大尺度在线观看| 国产日韩综合一区二区性色av| 一级片免费在线观看视频| caoporn免费在线| www.亚洲精品| 国产精品久久久久久久7电影| 91n在线视频| 精品少妇一区| 欧美日韩一卡二卡三卡| 成人av在线不卡| 免费在线观看一级毛片| 国精品**一区二区三区在线蜜桃 | 7777精品视频| 亚洲aaa视频| 日韩激情毛片| 日韩免费视频线观看| 精品免费国产一区二区| 天使と恶魔の榨精在线播放| 欧美激情一区二区三区蜜桃视频| 国产91精品一区二区绿帽| 中文字幕在线天堂| 中国成人一区| 中国日韩欧美久久久久久久久| 中文字幕99页| 粉嫩av国产一区二区三区| 亚洲国产人成综合网站| 亚洲午夜精品一区二区三区| 青春有你2免费观看完整版在线播放高清| 日韩av网站免费在线| 91精品国产色综合久久不卡98| 2025国产精品自拍| 日本精品三区| 亚洲天天在线日亚洲洲精| 国内精品免费视频| 亚洲高清999| 欧美视频在线一区| 国产激情在线观看视频| 9999精品成人免费毛片在线看 | 欧美日韩中文视频| 综合久久99| 一区二区福利视频| 乐播av一区二区三区| 色88888久久久久久影院| 亚洲成avwww人| 精品国产午夜福利在线观看| 小说区图片区亚洲| 欧美日韩国产片| 亚洲最大成人在线观看| 成人午夜精品| 欧美在线一二三| 国产成人无码av在线播放dvd| 最近高清中文在线字幕在线观看1| 亚洲最新视频在线播放| 伊人网在线免费| 黄网站app在线观看| 国产精品盗摄一区二区三区| 欧美在线播放一区| www.黄在线观看| 国产精品欧美一区二区三区| 亚洲国产一区在线| 亚洲成人影院麻豆| 亚洲色图20p| 红桃一区二区三区| 成年网站在线视频网站| 自拍偷拍国产精品| 一区视频二区视频| 久久亚洲导航| 欧美视频二区36p| 成人免费无码av| 国产成人免费| 日韩欧美一级在线播放| 国产麻豆剧传媒精品国产| 高潮按摩久久久久久av免费| 欧美一区二区三区电影| 国内自拍偷拍视频| 美女网站色精品尤物极品姐弟| 国产视频综合在线| 精品人体无码一区二区三区| 91精品观看| 国产69精品久久久| 日韩欧美视频在线免费观看| 裸体一区二区| 成人av在线亚洲| 黄色aaa大片| 97精品电影院| 在线看视频不卡| 色噜噜狠狠狠综合欧洲色8| 欧美日韩性视频在线| 激情视频免费网站| 91综合精品国产丝袜长腿久久| 亚洲精品wwwww| 国产性猛交xx乱| 国产中文一区| 91sa在线看| 国产乱码精品一区二区三区精东| 成人午夜精品一区二区三区| 视频一区视频二区视频三区视频四区国产 | 久久久精品一区二区涩爱| 欧美午夜在线视频| 高清欧美一区二区三区| 夜夜狠狠擅视频| 99精品视频一区| 制服丝袜综合日韩欧美| 国产激情视频在线看| 色综合久久久久| 免费高清视频在线观看| 国产99久久精品一区二区300| 日韩亚洲欧美中文在线| www..com国产| 狠狠网亚洲精品| 欧美亚洲一级二级| 国产盗摄一区二区| 欧美日韩激情一区二区| 搡老熟女老女人一区二区| 亚洲一区色图| 国产精品久久久久久久久久ktv| 好吊视频一区二区三区| 中文字幕人成不卡一区| 国产精品视频一区二区三区四区五区| 亚洲精品三区| 一区二区三区视频免费| 国产成人在线观看网站| 国产一区二区在线影院| 亚洲人成网站在线播放2019| 在线手机中文字幕| 精品国产麻豆免费人成网站| 亚洲精品电影院| 亚洲九九精品| 国产成人精品一区二区三区福利| 麻豆免费在线视频| 亚洲国产成人av网| 深爱五月综合网| 欧美高清视频手机在在线| 日韩美女主播视频| 涩涩视频在线观看免费| 亚洲一二三四在线| 日本亚洲一区二区三区| 888久久久| 亚洲最大av在线| 97caopron在线视频| 91精品免费观看| 成人无码精品1区2区3区免费看| 日韩有码一区二区三区| 日本亚洲导航| 懂色aⅴ精品一区二区三区| 亚洲视频免费一区| 日本少妇做爰全过程毛片| 懂色av一区二区三区免费观看| 日本老太婆做爰视频| 国产精品久久久久久av公交车| 日韩视频第一页| 中文字幕网址在线| 亚洲欧洲三级电影| 黄色片子免费看| 欧美va天堂在线| 91精品黄色| 韩国日本一区| 亚洲国产精品99久久| 91午夜视频在线观看| 99久久er热在这里只有精品66| 国产精品自拍片| 国内精品麻豆美女在线播放视频| 免费不卡欧美自拍视频| 亚洲精品中文字幕成人片| 亚洲国产成人av网| 91视频免费观看网站| 日韩精品三区四区| 亚洲综合五月天| 深夜福利亚洲| 欧美国产亚洲视频| 深夜福利免费在线观看| 欧美性猛片xxxx免费看久爱| 91嫩草丨国产丨精品| 国产精品一级二级三级| 每日在线更新av| 日韩成人激情| 99热国产免费| 涩涩涩在线视频| 中文字幕日韩av电影| www.成人免费视频| 狠狠操狠狠色综合网| 福利视频第一页| www.亚洲激情.com| 99re精彩视频| 亚洲高清不卡| 亚洲国产一区二区精品视频 | 日韩高清在线一区| 亚洲自拍偷拍一区二区三区| 精品人人人人| 国产在线日韩在线| 2019中文字幕在线电影免费| 在线视频欧美日韩精品| 丰满人妻一区二区三区四区53 | 国产精品欧美经典| www.美色吧.com| 奇米精品一区二区三区四区| 日本精品久久久久久久久久| 日本黄色精品| 精选一区二区三区四区五区| 亚洲承认视频| 欧美国产乱视频| 午夜精品一区| 日韩精品一区二区视频| 精品国产aⅴ麻豆| 2020国产在线视频| 亚洲天堂av电影| 午夜美女福利视频| 欧美日韩久久久| 天堂а√在线中文在线新版| 亚洲欧美国产三级| 国产传媒在线看| 91老师片黄在线观看| 青娱乐国产精品视频| 美女一区二区三区在线观看| 欧美日本视频在线观看| 午夜精品久久久久99热蜜桃导演| 视频一区视频二区视频三区视频四区国产 | 国产精品偷伦一区二区| 在线高清av| 欧美精品久久一区二区| 黄色在线论坛| 正在播放欧美视频| 国产高清免费在线播放| 日韩电影大全免费观看2023年上| 国产夫绿帽单男3p精品视频| 欧美日韩一区在线| 樱花视频在线免费观看| 欧美性xxxxhd| 国产性xxxx高清| 一区二区三区丝袜| 国产一区二区精彩视频| 国产精品乱人伦中文| 久久美女免费视频| 久久久久久久精| 精品夜夜澡人妻无码av | 精品国产成人亚洲午夜福利| 99久久精品国产一区二区三区| 性生交大片免费看l| 国产综合久久久久影院| 第一区免费在线观看| 蜜臀av性久久久久蜜臀aⅴ| 成人羞羞国产免费网站| 午夜在线视频观看日韩17c| 美女扒开大腿让男人桶| 激情综合自拍| 少妇高潮喷水在线观看| 最新国产拍偷乱拍精品 | 日本二区三区视频| 中文字幕制服丝袜成人av| 日韩在线观看免| 亚洲婷婷在线视频| 成年人av电影| 亚洲图片有声小说| 天天操中文字幕| gogogogo高清视频在线| 日韩av在线导航| 亚洲AV第二区国产精品| 亚洲乱码国产乱码精品精天堂| 男人天堂网在线观看| 亚洲一级免费视频| 日本高清中文字幕在线| 久久这里只有精品视频首页| 伊人福利在线| 97精品国产97久久久久久免费| 男人的天堂免费在线视频| 国产高清在线不卡| 亚洲精品自拍| 国产精品一 二 三| 国产一区二区三区电影在线观看 | 姬川优奈aav一区二区| 亚洲天堂视频网站| 欧美三区在线视频| 国产人妻精品一区二区三| 欧美xxxxxxxxx| 日韩二区三区| 久久九九免费视频| 成人免费高清观看| 国产91久久婷婷一区二区| 精品久久福利| 国产免费一区二区三区| 视频一区在线观看| 丰满人妻一区二区三区53号| 国产午夜久久| www.欧美激情.com| 99精品久久久久久| 国精产品视频一二二区| 亚洲一区av在线| 天天射天天干天天| 日韩欧美一区二区在线视频| 欧美黄色小说| 欧美黑人国产人伦爽爽爽| 欧美电影免费观看高清完整| 91在线观看免费观看| 秋霞在线一区| 亚洲小说欧美另类激情| 久久久精品网| 久久久久国产免费| 亚洲国产精品成人综合色在线婷婷 | 免费观看成人网| 国产成人综合在线播放| 精品无码人妻一区二区免费蜜桃| 亚洲最新在线观看| 一级二级三级视频| 亚洲欧美日韩综合| 麻豆传媒在线完整视频| 日韩男女性生活视频| 另类在线视频| 国产成人一二三区| 麻豆精品视频在线| 成年人在线观看av| 一区二区三区不卡视频在线观看| 波多野结衣视频观看| 亚洲高清av在线| 中文字幕在线观看播放| 国产精品自产拍高潮在线观看| 日韩电影不卡一区| 日韩极品视频在线观看| 国产一区二区三区免费播放| 五月天精品在线| 欧美性高潮床叫视频| 黑人精品一区二区三区| 欧美日韩成人黄色| 中文字幕综合| 欧美中日韩一区二区三区| 一本久道久久综合婷婷鲸鱼| 麻豆短视频在线观看| 亚洲免费在线电影| 97成人免费视频| 日韩中文在线视频| 欧洲成人一区| 日韩福利影院| 久久精品道一区二区三区| 50一60岁老妇女毛片| 亚洲成人黄色影院| 色呦呦视频在线| 97超级碰碰碰久久久| 精品亚洲自拍| 青青艹视频在线| 97久久精品人人爽人人爽蜜臀| 91蜜桃视频在线观看| 亚洲国产精品一区二区久| 大黄网站在线观看| 极品日韩久久| 国产精品一页| 日韩中文字幕电影| 一道本成人在线| 韩国中文免费在线视频| 国产成人短视频| 不卡在线一区二区| 中文字幕精品一区二区三区在线| 国产精品久久久久久久久晋中| 一级α片免费看刺激高潮视频| 美女av一区二区三区| 国产厕拍一区| 久久精品国产精品亚洲色婷婷| 91老师国产黑色丝袜在线| 国产91国语对白在线| 深夜福利一区二区| 欧美成人精品一级| 精品少妇在线视频| 久久综合久色欧美综合狠狠| 老熟妇一区二区三区| 最近更新的2019中文字幕| 国产精品亚洲四区在线观看| 久久久久久久9| 99久久婷婷国产| 国产日韩久久久| 超在线视频97| 婷婷激情久久| 中文字幕免费高清在线| 一区二区三区在线观看动漫 | 上原亚衣av一区二区三区| 96视频在线观看欧美| 久久精品无码中文字幕| 久久亚洲综合色| 国产原创中文av| 97精品国产91久久久久久| 欧美日韩高清| 性色av浪潮av| 日韩欧美一区二区三区久久| 亚洲图片88| 国产亚洲精品自在久久| 日产国产欧美视频一区精品| 特级片在线观看| 亚洲欧美国产另类| 日本少妇精品亚洲第一区| 日韩视频第二页| 亚洲另类中文字| 免费人成黄页在线观看忧物| 亚洲va电影大全| 久久国产日韩| 久久综合激情网| 最新亚洲国产精品| 日本精品影院| 永久看看免费大片| 91国产成人在线| 99re6在线精品视频免费播放| 中文字幕成人一区| 久久久久国产成人精品亚洲午夜 | 亚洲人亚洲人色久|