精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擴散語言模型九倍推理加速!上海交大:KV Cache并非自回歸模型的專屬技巧

人工智能 新聞
上海交通大學EPIC Lab團隊提出了一種無需訓練、即插即用的高效推理緩存機制:dLLM-Cache。

首個用于加速擴散式大語言模型(diffusion-based Large Language Models, 簡稱 dLLMs)推理過程的免訓練方法。

上海交通大學EPIC Lab團隊提出了一種無需訓練、即插即用的高效推理緩存機制:dLLM-Cache。

其核心思想在于,在一個多步去噪過程中,復用相鄰時間步上變化較小的特征,僅更新那些變化較大的特征,從而實現了計算量的大幅降低,并保持了原有的生成質量。

圖片

圖1 不同dLLMs使用dLLM–Cache和不使用dLLM–Cache在速度和質量上的對比

dLLM-Cache具有幾個重要的亮點:

1. 訓練無關,即插即用。dLLM-Cache完全在推理過程中工作,無需修改模型參數或重訓練。dLLM-Cache可以在完全不損失模型輸出質量的前提下,帶來最高9.1倍的推理速度提升 。

2. 通用于主流dLLM架構,如LLaDA、Dream以及LLaDA-V、MMaDA、Dimple等多模態模型。

3. 在推理過程中,首次識別出了prompt部分的Transformer中間層特征(Key、Value、Attention output、FFN output)長期穩定,而response部分僅有一小部分tokens的特征變化較大,為緩存特征并后續復用提供了理論基礎。

4. 獨創了以V-verify機制為核心的選擇更新策略。以Value向量的變化為選擇基準,成功識別出了response部分變化較大的那些tokens,通過僅更新這些特征,摒棄了高達75%的冗余計算。

本論文共同第一作者劉知遠和楊奕存是哈爾濱工業大學2022級本科生,目前在上海交通大學EPIC Lab進行科研實習,師從張林峰助理教授,主要研究方向為高效深度學習,此前曾在CVPR2025上收獲滿分論文。

圖片

接下來,我們一起來看看該研究的細節。

研究動機

基于擴散的大語言模型正成為語言生成領域最受關注的新范式之一。隨著模型架構的發展、去噪算法的優化以及Masked Diffusion在語言建模中逐步展現出與自回歸模型不同的建模能力,這類模型正在逐步成為挑戰 GPT 等主流模型的重要力量。

以LLaDA、Dream為代表的擴散語言模型,基于迭代去噪的生成過程,不再依賴嚴格的自回歸因果結構,天然支持雙向建模、全局依賴和反向推理等能力,已經在“逆轉詛咒”、數學推理等任務上展現出領先性能。

然而,這種范式的優勢也伴隨著巨大的代價。為了確保生成的質量,dLLMs在推理過程中通常需要執行長達數百步的去噪迭代,每一步都需重新計算attention、FFN等所有層的特征,計算量相當于多次完整前向傳播。這為dLLMs的推理效率帶來了嚴重的瓶頸,制約了其實際部署。更重要的是,主流的加速手段如用于自回歸模型的KV Cache,由于不兼容雙向注意力架構,在dLLMs中完全失效。

與傳統的自回歸語言模型不同,dLLMs不再依賴順序生成下一個token,而是采用隨機遮蔽(mask) + 逐步還原的方式建模token分布,這種機制使得模型具備天然的雙向建模能力,理論上能夠更好地處理逆向邏輯、長距離依賴等任務。

LLaDA 等模型已經在多個基準任務中超越主流ARMs,尤其在“逆轉詛咒”上明顯勝出。

然而,這種擴散式推理帶來一個嚴重的挑戰:為了確保生成質量,dLLMs通常需要上百步的去噪迭代,每一步都需全量計算Attention、FFN等模塊,導致其推理速度相比ARMs慢一個數量級,落地成本高。同時,ARMs 通用的加速方法如KV-Cache因dLLMs的雙向注意力設計而無法兼容。這些造成了dLLMs在推理時既慢又缺乏加速手段的現象。這正是 dLLM-Cache所要破解的核心問題。

方法簡介

本文作者仔細研究了dLLMs推理的中間特征變化過程,發現如下關鍵現象:

圖片

圖2 dLLM中兩個相鄰去噪步驟之間的Key、Value、Attention Output和FFN Output的余弦相似度

Prompt tokens的特征在整個去噪過程中基本保持穩定,每一步都重新計算這些特征是完全不必要且浪費計算資源的;

Response tokens多數變化很小,僅少部分變化劇烈,全量計算所有response tokens存在冗余。

由此,問題轉化為了如何高效識別出這些變化劇烈的response tokens。

圖片

圖3 Response tokens的K或V變化與其他特征變化的相關性

本文作者首創性得提出了V-verify機制。它的提出源于另一項重要的發現:作者量化了response tokens的底層特征(Key, Value向量)的變化與其上層復雜特征(Attention Output, FFN Output)的變化之間的關系,結果顯示它們存在著極強的正相關性,皮爾遜相關系數最高可達0.944。

這意味著,一個token底層的Value向量是否發生變化,是其整體狀態是否發生改變的一個極佳的、且計算成本極低的“指示器”。

基于以上這些關鍵的觀察,本文作者提出了dLLM-Cache ,具體的框架設計如下:

圖片

圖4 dLLM-Cache方法整體pipeline

Prompt緩存:長間隔重用

對于prompt部分,作者設計了長間隔Prompt緩存,每隔Kp步(在實驗中一般設置為100)更新一次prompt的Key、Value、Attention Output、FFN Output,其余步驟全部復用先前結果。這樣避免了對穩定不變的特征的重復計算,大幅減少了計算量

Response緩存:自適應部分更新

對生成目標response區域,由于response tokens的特征并不是一直保持穩定不變的,作者設計了較短間隔的Response緩存,每隔Kr步(在實驗中一般設置為8左右)全量更新一次response的Key、Value、Attention Output、FFN Output,在其余的步驟,作者提出了基于V-verify的自適應緩存策略

  • 在每個去噪步驟,首先計算所有response tokens最新的Value向量。
  • 然后,通過計算新Value向量與緩存中舊Value向量的余弦相似度,將余弦相似度作為每個response tokens的一個“變化分”。
  • 選出“變化分”最高(即相似度最低)的極少數tokens(例如,變化最劇烈的25%),將它們標記為“待更新” 。
  • 最后,模型只對這些被標記的“待更新”tokens,進行完整的特征重計算。而其余75%的“穩定”tokens,則繼續高效地從緩存中復用其特征

通過這種“長間隔”與“自適應”相結合的緩存策略,dLLM-Cache在Transformer的每一層都實現了計算量的極致優化,且整個過程無需任何額外訓練,做到了真正的即插即用

3 實驗結果

本文在 LLaDA 8B和Dream 7B兩大代表性的開源dLLM的基礎版與指令微調版上,針對數學與科學、通用任務、代碼生成三大領域的8個主流基準測試,對dLLM-Cache的有效性進行了嚴苛的檢驗 。評估維度不僅包括推理速度(TPS)計算效率(FLOPs),更核心的是模型性能得分(Score),以確保加速不是以犧牲模型能力為代價。

本文在LLaDA 8B的基礎版和指令微調版上都部署了dLLM-Cache,下圖的實驗結果充分展示了其強大的加速能力和卓越的生成質量保持。在幾乎所有的基準測試中,達到了5倍以上的加速效果,且在絕大部分情況下,生成質量都沒有降低,甚至有輕微的提升。特別是當面對LongBench任務時,prompt的穩定性帶來了更顯著的加速效果,在HotpotQA上實現了高達9.1倍的無損加速。

圖片

圖5 dLLM-Cache在LLaDA模型上的效果

為了進一步證明dLLM-Cache的通用性和魯棒性,作者將其無縫遷移至另一款架構略有不同的dLLM——Dream 7B上。下圖的實驗結果再次印證了dLLM-Cache方法的有效性,充分說明了其通用于主流dLLM架構

圖片

圖6 dLLM-Cache在Dream模型上的效果

作者還將dLLM和主流的基于ARM的LLM進行了對比,下圖展示了LLaDA 8B與LLaMA3 8B在GSM8K任務上的比較。結果顯示,原始的LLaDA在準確率上以近20個點的巨大優勢領先于LLaMA3,但在推理速度上卻遠不及。然而,在使用了本文的dLLM-Cache之后,LLaDA的推理速度獲得了超過3.3倍的提升,首次超過了LLaMA3的推理速度。這一結果有力地證明,本文提出的dLLM-Cache能夠讓dLLMs在保持其顯著準確率優勢的同時,獲得與ARMs相當競爭力的推理速度。

圖片

圖7 使用dLLM-Cache的dLLM vs 使用KV-Cache的ARM

論文鏈接: https://github.com/maomaocun/dLLM-cache/blob/main/asset/paper.pdf
代碼已開源: https://github.com/maomaocun/dLLM-Cache

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-10 14:54:13

AI模型圖像生成

2024-04-26 12:51:48

2025-08-04 08:23:00

2025-06-30 08:42:00

模型訓練AI

2022-03-14 10:53:12

谷歌模型研究

2025-11-03 08:40:00

2025-04-21 09:10:00

2025-08-14 09:10:00

2025-06-18 11:16:50

大模型性能KV-Cache

2025-08-12 09:08:00

2025-09-10 09:15:00

AI模型數據

2025-10-14 08:58:00

2025-08-14 09:02:00

2025-06-16 14:41:07

模型開源AI

2019-11-17 22:45:12

谷歌Android開發者

2023-11-19 23:36:50

2024-02-29 09:28:08

自動駕駛模型

2024-09-09 08:31:15

2025-06-11 09:21:28

2025-07-09 09:25:10

點贊
收藏

51CTO技術棧公眾號

给我免费播放片在线观看| 国产日韩欧美成人| 亚洲狠狠婷婷综合久久久久图片| 日韩伦理在线一区| 久久亚洲精品小早川怜子| 国产精品视频免费观看www| 成人在线观看免费完整| 日韩成人一级| 91精品国产综合久久小美女| 免费无码毛片一区二三区| 触手亚洲一区二区三区| 国产精品一区二区免费不卡| 欧美一级视频一区二区| 欧美风情第一页| 亚洲区小说区| 日韩亚洲欧美中文三级| 日韩精品无码一区二区三区免费| 高潮毛片在线观看| 国产丝袜在线精品| 丁香五月网久久综合| 中国女人真人一级毛片| 国内久久视频| 日韩一区二区福利| 男女一区二区三区| 精品国产第一国产综合精品| 色先锋久久av资源部| 国产一级片91| 国产色a在线| av不卡一区二区三区| 成人做爰www免费看视频网站| 免费观看成人毛片| 国产精品va| 色七七影院综合| 中文字幕a在线观看| 永久免费精品视频| 欧美精品xxxxbbbb| 丝袜制服一区二区三区| 六月婷婷综合| 欧美日韩精品国产| 天堂8在线天堂资源bt| 超碰人人在线| 国产精品不卡一区二区三区| 日韩欧美亚洲日产国产| 日韩在线无毛| 久久综合五月天婷婷伊人| 国产伦视频一区二区三区| www.成人精品| 国产精品白丝jk黑袜喷水| 成人写真视频福利网| 怡红院男人的天堂| 日韩经典一区二区| 国产精品久久久久久久久久ktv| 国产午夜精品无码一区二区| 伊人久久大香线蕉综合热线 | 久久久久综合| 91精品国产91久久久久久久久| 国产在线一区视频| 狠狠88综合久久久久综合网| 欧美精品电影在线| 国产一级视频在线播放| 亚洲激情婷婷| 91av视频在线免费观看| 久久亚洲精品国产| 丝袜美腿亚洲色图| 国产精品爽黄69| 一级特黄色大片| 国产在线乱码一区二区三区| 99在线看视频| 手机看片国产1024| 91麻豆国产香蕉久久精品| 免费观看国产成人| 国产天堂在线| 亚洲视频在线一区二区| 中文字幕日韩精品无码内射| 高清精品在线| 色婷婷精品大视频在线蜜桃视频| 91香蕉视频污版| 成人污污视频| 亚洲国产欧美一区二区三区同亚洲 | 韩国日本一区| 日韩欧美国产黄色| 波多野结衣xxxx| 国产午夜精品一区在线观看 | 青青草在线视频免费观看| 国产夜色精品一区二区av| 一区二区精品在线| 免费av不卡在线观看| 欧美日韩美女在线| av亚洲天堂网| 麻豆一区一区三区四区| 伊人激情综合网| 99久久婷婷国产综合| 最新亚洲激情| 成人妇女免费播放久久久| 国产成人无码www免费视频播放| 91丨porny丨户外露出| 一区二区精品国产| 在线观看爽视频| 欧美一区二区三区视频在线| 国产精品一级黄片| 99久久九九| 欧美有码在线视频| 99热这里只有精品99| 99久久精品国产导航| 这里只有精品66| 午夜不卡影院| 日韩视频一区二区在线观看| 大又大又粗又硬又爽少妇毛片| 亚洲高清影视| 国产精品高潮在线| 蜜桃视频污在线观看| 国产精品无人区| a在线视频观看| 成人污版视频| 日日骚av一区| 国产乱码77777777| 99久久伊人网影院| 女女百合国产免费网站| 成人国产网站| 亚洲欧美中文另类| 日本中文字幕网| 国产在线不卡一区| 亚洲v国产v| 亚洲天堂资源| 亚洲第一区中文字幕| 国产成人自拍网站| 理论电影国产精品| 日本在线观看一区二区| gay欧美网站| 日韩国产精品一区| 国产一级一片免费播放| 国产精品自拍网站| 中文字幕中文字幕一区三区| 国产成人久久精品麻豆二区| 亚洲毛片在线免费观看| 国产午夜在线播放| 不卡视频一二三四| 欧美又粗又长又爽做受| 亚洲日本视频在线| 色综合久久久888| 精品国产伦一区二区三| 亚洲乱码国产乱码精品精的特点| 色婷婷成人在线| 日韩高清欧美| 国产精品影院在线观看| 天堂中文а√在线| 欧美精品在线视频| 久草福利资源在线| 国产一区在线看| 日本一区二区三区四区五区六区| 9999在线精品视频| 久久综合久久88| aaa一区二区三区| 一区二区免费看| 在线播放第一页| 亚洲激情在线| 久久久久久一区| av高清一区| 中文字幕亚洲无线码在线一区| 中文字幕免费高清网站| 一区精品在线播放| 中文字幕人妻无码系列第三区| 女生裸体视频一区二区三区| 成人h视频在线观看| 不卡专区在线| 亚洲日本成人女熟在线观看| 中文字幕日韩经典| 亚洲人被黑人高潮完整版| 久久久久久久久久久影视| 精品1区2区3区4区| 欧美18视频| 日韩成人综合网| 欧美黑人性视频| 青青草视频免费在线观看| 欧美视频在线一区| 紧身裙女教师波多野结衣| 成人午夜av电影| 黄色一级大片在线观看| 中文乱码免费一区二区三区下载| 国产精品区免费视频| 婷婷六月国产精品久久不卡| 色婷婷**av毛片一区| www.日日夜夜| 色一区在线观看| 九九免费精品视频| 久久色中文字幕| 在线观看视频你懂得| 午夜亚洲视频| 久久免费视频2| 日本一道高清一区二区三区| 国产精品自拍偷拍视频| 77thz桃花论族在线观看| 伊人激情综合网| 日本高清视频在线| 欧美三区在线观看| 日本在线视频免费观看| 中文字幕五月欧美| 人妻丰满熟妇av无码久久洗澡| 捆绑紧缚一区二区三区视频| 极品美女扒开粉嫩小泬| 天天天综合网| 欧美精品一区在线| 亚洲国产欧美在线观看| 国产精品福利在线| gratisvideos另类灌满| www国产91| 国产午夜在线视频| 亚洲精品成人久久电影| 国产精品天天操| 在线精品视频小说1| 日韩av在线电影| 亚洲欧美日韩国产手机在线| 中文字幕免费高清| 99re这里只有精品首页| 日本少妇一级片| 极品美女销魂一区二区三区 | 成人综合婷婷国产精品久久蜜臀| 精品久久久久久久无码| av成人激情| 日韩在线观看a| 欧美~级网站不卡| 香蕉精品视频在线| 欧美中文字幕一区二区| 欧美精品成人一区二区在线观看| 凹凸av导航大全精品| 999视频在线免费观看| 亚洲精品aa| 国产精品人成电影在线观看| 性国裸体高清亚洲| 97在线免费视频| 国产精品69xx| 欧美人成在线视频| av大全在线| 久久夜精品香蕉| 免费在线毛片网站| xxx欧美精品| 三级外国片在线观看视频| 亚洲午夜久久久久久久| 激情小说 在线视频| 亚洲女人被黑人巨大进入al| 午夜av免费在线观看| 亚洲精品在线观看视频| 内射后入在线观看一区| 精品粉嫩超白一线天av| 蜜桃久久一区二区三区| 亚洲第一中文字幕在线观看| 人妻va精品va欧美va| 亚洲高清久久久久久| 色噜噜一区二区三区| 亚洲国产精品悠悠久久琪琪| 亚洲色图欧美视频| 日韩国产精品亚洲а∨天堂免| 青青草观看免费视频在线| 亚洲精品中文字幕女同| 黄色av网址在线免费观看| 夜夜嗨av色一区二区不卡| 日本福利在线| 久热精品视频在线观看| 国内在线免费视频| 午夜精品福利电影| 自拍偷拍欧美视频| 国产精品jizz在线观看麻豆| 国产乱子精品一区二区在线观看| 国产欧美日韩综合精品| 麻豆久久一区| 国产欧美韩日| 国产精品嫩草影院在线看| 亚洲高清123| 欧美一区成人| 国产黄页在线观看| 日本欧美韩国一区三区| 伊人色在线观看| 成人动漫一区二区在线| 中文字幕第4页| 亚洲人妖av一区二区| 国产真实夫妇交换视频| 日韩欧美国产骚| 97在线播放免费观看| 精品成a人在线观看| 狠狠v欧美ⅴ日韩v亚洲v大胸| 日韩在线中文字| 国产色婷婷在线| 国产精品18久久久久久首页狼| 成人在线分类| 精品中文字幕一区| 99久久婷婷这里只有精品 | 巨乳诱惑日韩免费av| 国内av一区二区| 91在线丨porny丨国产| 国产精品综合激情| 亚洲国产精品一区二区www| 精品无码一区二区三区的天堂| 91精品国产福利| 色中色在线视频| 久久av中文字幕| 成人天堂yy6080亚洲高清| 亚洲一区久久久| 精品日韩毛片| 国产一区二区三区小说| 美女国产一区二区| 加勒比精品视频| 亚洲日本丝袜连裤袜办公室| 亚洲欧美偷拍视频| 日韩欧美国产一区二区三区| 国产区av在线| 91精品国产一区| 欧美三级一区| 亚洲精品无人区| 男女精品网站| 国产又黄又粗又猛又爽的视频 | 伊人久久大香线蕉综合影院首页| 黑人中文字幕一区二区三区| 国产精品久久久乱弄| 久草精品在线播放| 国产精品一区二区无线| 992在线观看| 在线视频综合导航| 艳母动漫在线看| 91国语精品自产拍在线观看性色 | 国产精品538一区二区在线| 熟女少妇内射日韩亚洲| 精品久久久精品| 色网站免费观看| 欧美国产日本在线| 国产精品视频一区视频二区| 亚洲国内在线| 免费在线视频一区| 国产真人做爰视频免费| 日韩欧美视频一区二区三区| 天天干天天爽天天操| 久久久久国产视频| 一区二区三区四区精品视频| 精品日韩在线播放| 狠狠久久亚洲欧美| 成人黄色短视频| 欧美男人的天堂一二区| 天堂地址在线www| 国产日本欧美一区二区三区| 热久久天天拍国产| 国产v亚洲v天堂无码久久久| 久久欧美一区二区| 欧美h在线观看| 亚洲另类激情图| 欧美福利在线播放| 日韩三级电影网站| 秋霞成人午夜伦在线观看| 久久久久久久久福利| 欧美日韩在线电影| 黄色网址在线免费| 亚洲最大的免费| 欧美精品日韩| 污污污www精品国产网站| 疯狂做受xxxx欧美肥白少妇| 久久视频www| 国产精品久久久久久久久久久久 | 一级二级三级视频| 日韩专区在线观看| 久久亚洲精精品中文字幕| 精品久久久无码人妻字幂| 床上的激情91.| 国产成人精品一区二三区| 亚洲区中文字幕| 男人天堂久久| 久久亚洲a v| 91亚洲精品一区二区乱码| 国产寡妇亲子伦一区二区三区四区| 亚洲午夜av久久乱码| 成人51免费| 国产freexxxx性播放麻豆 | 日韩国产欧美精品| 久久99最新地址| 九九九免费视频| 亚洲人成毛片在线播放| 青青在线精品| 国产九色porny| 国产日产亚洲精品系列| 国产伦理吴梦梦伦理| 国内免费久久久久久久久久久| 美女毛片一区二区三区四区最新中文字幕亚洲 | 福利在线视频网站| 黑人中文字幕一区二区三区| 免费观看成人av| 精品一区二区三区四| 亚洲夜晚福利在线观看| 国产一区一区| 免费无码av片在线观看| 日韩美女久久久| 人人九九精品| 97人人做人人人难人人做| 免费日韩视频| 久久久精品人妻一区二区三区四| 亚洲欧美中文字幕| 日韩中文一区二区| 日韩中文字幕免费在线| 亚洲一二三四在线观看| a√资源在线| 久久国产精品亚洲va麻豆| 国产在线精品一区二区| av毛片在线免费观看| 欧美高清videos高潮hd|