精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DPad:擴散大語言模型的中庸之道,杜克大學陳怡然團隊免訓推理加速61倍

人工智能 新聞
杜克大學陳怡然團隊另辟蹊徑,揭示了 dLLM 中實現全局規劃的「草稿紙機制」,并發現其存在高度冗余。

論文作者團隊:來自杜克大學 CEI Center,由實習生陳欣驊、黃思韜及郭聰博士共同完成,指導教師為李海教授、陳怡然教授。

擴散大語言模型(dLLMs)憑借并行解碼與獨特的全局規劃能力,有望解決自回歸(AR)大模型的效率瓶瓶頸和規劃能力缺陷。但其「全局規劃」能力依賴于其雙向注意力對所有后文的關注,這帶來了嚴重的計算冗余,從而導致現有開源模型的潛力遠遠未被釋放。

當前的 dLLM 存在「路線之爭」:一是保留全局規劃能力但推理效率極低的「全局雙向注意」(如 LLaDA),二是追求速度卻犧牲規劃能力的「塊內雙向注意」(如 Block Diffusion)。如何在這兩條路線之間調和折中,讓模型既能「著眼全局」,又能加速推理,已成為學界日益關注的問題。

針對以上問題,杜克大學陳怡然團隊另辟蹊徑,揭示了 dLLM 中實現全局規劃的「草稿紙機制」,并發現其存在高度冗余。據此,他們提出免訓練方法 DPad(Diffusion Scratchpad),通過先驗地丟棄大量無效后綴 token,既極大地降低了計算量,又保留了核心規劃能力,嘗試在兩條路線中走出一條「中間路線」。該方法與現有優化技術結合后,在幾乎無損的模型精度下,可實現高達 61.4 倍的推理加速。

  • 論文標題:DPad: Efcient Difusion Language Models with Sufx Dropout
  • 論文地址:https://arxiv.org/abs/2508.14148
  • 代碼地址:https://github.com/Crys-Chen/DPad

dLLM 獨特的「草稿紙」機制:實時記錄語義信息

不同于自回歸模型,dLLM 采用雙向注意力機制,在解碼時既能回顧前文,也能「展望」后文。基于這一點,文本序列可被清晰地劃分為三部分:

  • 前綴 token (Prefix Tokens):已完全解碼的文本,語義和位置信息完整。
  • 當前塊 token (Current Block):正在解碼的文本,擁有部分語義和完整的位置信息。
  • 后綴 token (Suffix Tokens):使用 Mask 初始化的未來文本,僅有位置信息,初始沒有語義信息。可在每層 Transformer block 執行的過程中,逐步記錄語義信息,對未來的文本進行規劃。

研究團隊通過分析雙向注意力機制后發現:dLLM 中的后綴 token 是一種獨特的「草稿紙」。模型在解碼「當前塊」時,會巧妙將這些后綴 token 作為臨時存儲空間,用于在每一層 Transformer block 中記錄自己對后文的構思。這種方法能夠實現對整個文本的規劃,使輸出的前后文更一致,提高語言模型的整體性能。

草稿紙機制示意圖。左圖顯示在淺層(Layer 0),信息從 Prefix 和 Current「寫入」(DPad Writing)到 Suffix 區域。右圖顯示在深層(Layer 1),信息被 Current Block 從 Suffix 區域「讀取」(DPad Reading)回來,輔助解碼。

如上圖所示,前綴、當前和后綴三種類型將注意力分數分為了 9 個區域,使得模型的前向過程存在一個「寫—讀」的工作流:

  • 寫入 (Write):在第 0 層 Transformer block,后綴 token 通過注意力機制,從前綴(⑦)和當前(⑧)塊中捕獲信息。這個過程相當于模型對后文的構思作為「草稿」記錄下來。
  • 讀取 (Read):在第 1 層 Transformer block,當前塊反過來從后綴 token 讀取信息(⑥)。此時的后綴 token 已不再是「白板」,而是承載了上一層寫入的「草稿」。所以從后文讀取的信息可以用于輔助當前塊的解碼。

研究團隊認為,這種「寫—讀」的行為就像一本「草稿紙」,將模型在淺層對后文的構思傳遞到深層——這正是 dLLM 具備強大全局規劃能力的關鍵。它讓模型在生成當前內容的同時,能初步構思和約束未來的生成方向,實現了前后文的協同共進。

符合直覺的發現:「草稿紙」也要詳略得當

DPad 的核心思想,源于一個非常符合直覺的類比。想象一下您在創作一部鴻篇巨制:

  • 對于當前章節,你會反復修改,精雕細琢。
  • 對于臨近幾章,你會先列好提綱,構思重點情節,確保情節自然銜接。
  • 對于后續章節,或許只是隨手記下幾個天馬行空的靈感,寥寥幾筆。

DPad 正是基于這一思想,避免讓作者(dLLM)在創作每個章節(當前塊 Token)時,對所有未來的「草稿紙」(后綴 Token)進行強行填充,從而,才能集中注意力并節省資源(降低算力和存儲)。其核心思想便是聚焦當下,展望未來,留白長遠,讓模型的每一次「下筆」都更加高效。

通過對 dLLM 注意力機制的分析,研究團隊發現了支撐這種核心思想的關鍵性數據:

  • 「草稿紙」大量冗余:離當前塊較遠的后綴 token 往往被寫入了極其相似的「草稿」,其中大部分成了無效計算。
  • 注意力隨距離衰減:對當前解碼起關鍵作用的,主要是附近少數幾頁「草稿紙」,遠處的「草稿」重要性顯著降低。

預先解碼出來的后綴 token 存在大量重復。

當前塊對后綴 token 的注意力分數圖。可以看到,注意力(綠線)在進入 Suffix 區域后迅速衰減,表明遠處 token 的影響力逐漸減小。

那么,是否可以更大膽一些呢?如下圖所示,研究人員進行了一個反直覺的實驗:強行刪除那些注意力分數最高的遠端 token。出人意料的是,準確率幾乎沒有任何損失!dLLM 似乎有「自愈能力」,會將注意力自動轉移到鄰近 token 上,補償丟失的信息。

這個「注意力遷移」現象有力地證明:比起某一張特定位置的「草稿紙」,dLLM 其實僅要求在未來某個位置區間內存在可用的「草稿紙」即可。因此,與其空耗算力確定重要 token 的位置,不如直接先驗丟棄。

左圖展示了 dLLM 中當前塊 token 對后綴 token 的注意力分布:整體隨距離衰減,遠端 token 偶爾出現「尖峰」(如 d = 362)。當刪除這些尖峰 token 后(右圖),模型的注意力并沒有消失,而是自然地轉移到了鄰近的 token 上(如,362 號 token 的注意力被轉移到 359 號)。

DPad:簡單高效的「先驗丟棄」

基于以上洞見,DPad 方法應運而生。它的核心思想是:與其等模型算完再「剪枝」,不如在解碼開始前,就先驗地丟掉一批冗余的「草稿紙」。DPad 的實現非常簡潔,主要包含兩大策略:

  • 滑動窗口 (Sliding Window):只保留當前解碼位置附近一個固定長度的后綴窗口作為「草稿紙」,遠處的直接丟棄。
  • 「近多遠少」采樣 (Distance-decay Dropout):在滑動窗口內部,根據「越近越重要」的原則,以一個隨距離遞減的概率保留后綴 token。

(a) 自回歸模型;(b) 傳統 dLLM,需要關注所有后綴 token;(c) DPad,僅關注附近少數經過篩選的后綴 token。

實驗結果:更快更準

DPad 在 LLaDA 和 Dream 系列等多個主流 dLLM 上進行了全面測試,結果喜人。

大幅提升推理效率

在現實的長輸出場景(少示例、長回答)中,DPad 可謂大放異彩:

  • 在 GSM8K 數據集上,DPad 為 LLaDA-1.5 帶來了 20.3 倍的單獨加速比。
  • 與 Fast-dLLM 等并行解碼技術結合后,綜合加速比高達 61.39 倍。
  • 在 HumanEval 數據集上,當輸出長度達到 2048 個 token 時,DPad 與 Fast-dLLM 的組合為 Dream 模型帶來了 97.32 倍的驚人加速。

圖 6 在 GSM8K(1024 tokens, 1-shot)任務上,DPad 結合其他優化技術,讓 LLaDA-1.5 實現了 61.39 倍的加速。

在 HumanEval(2048 tokens, 0-shot)任務上,DPad 結合其他優化技術,讓 Dream-Base 實現了 97.32 倍的加速。

意外之喜:顯著提升語境學習能力 (In-Context Learning)

通常,推理加速會以犧牲部分模型精度為代價。但 DPad 卻帶來了意外的驚喜:在多個任務上,尤其是在 LLaDA 系列模型上,它不僅沒有降低精度,反而顯著提升了模型的準確率,尤其是「嚴格匹配」(Strict Match)得分。

「嚴格匹配」不僅要求答案正確,還要求模型嚴格遵循輸入示例給出的格式,是衡量模型語境學習能力的關鍵指標。

在 GSM8K 任務中,原始模型(左)雖然算對了答案(通過 Flexible-Match),但未能按要求格式輸出答案,未能通過 Strict-Match。而應用了 DPad 的模型(右),則精準復刻了示例格式,同時給出了正確答案。

DPad 在 LLaDA-Instruct 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 在 LLaDA-1.5 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 在 Dream-Base 上與原始模型 (Vanilla) 和 Fast-dLLM 的對比

DPad 團隊認為,這是因為丟棄了大量冗余的后綴 token 后,模型能將更多注意力集中在信息量豐富的前綴 token(prompt)上,從而更好地理解和學習示例中蘊含的格式與規范。

總結與展望

面對當前 dLLM 的兩條路線之爭,DPad 巧妙地介于兩者之間,嘗試著開辟一條「中間路線」。它既通過「草稿紙機制」,揭示了后綴 token 對于 dLLM 全局規劃能力的重要性;又向 Block Diffusion 靠攏,通過稀疏化后綴 token 大幅提升了推理效率。

DPad 的提出預示著我們似乎并不需要在速度和規劃能力之間做出非此即彼的選擇。未來,若將 DPad 的思想引入到模型的微調甚至預訓練階段,或許能博采眾長,訓練出更高效、更強大的下一代擴散大語言模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 09:10:00

2022-04-24 10:26:38

人工智能深度學習軟件

2023-02-01 13:33:19

科學技術

2023-03-10 13:05:17

AI就職

2015-03-12 15:08:27

CIO

2025-05-27 15:28:11

模型訓練AI

2021-07-20 05:38:08

Vue 2 Vite 開發工具

2024-09-09 08:31:15

2025-06-30 08:42:00

模型訓練AI

2025-05-30 15:52:05

訓練代碼推理

2025-10-14 08:58:00

2023-01-05 09:33:37

視覺模型訓練

2025-03-28 11:59:10

2020-06-18 11:10:16

AI人工智能神經網絡

2024-07-19 09:59:31

2024-12-02 13:50:00

模型訓練

2020-06-19 09:57:24

AI 數據人工智能

2025-09-22 17:03:09

2025-01-08 13:15:02

2023-12-14 13:30:00

AI模型
點贊
收藏

51CTO技術棧公眾號

日韩在线视频第一页| 一区二区国产精品精华液| 小视频免费在线观看| www一区二区| 国产精品美女主播| 538精品在线观看| 网友自拍一区| 欧美一区二区三区四区久久| 日本午夜激情视频| 97最新国自产拍视频在线完整在线看| 国产一区亚洲一区| 91av在线看| 日韩成人短视频| 中文有码一区| 日韩欧美一区二区免费| 四虎永久在线精品无码视频| 国产高清一区在线观看| 国产精品一区二区免费不卡| 日本高清视频一区| 国产女人18水真多毛片18精品| 天堂av一区二区三区在线播放 | 9色视频在线观看| 天天干天天爱天天操| 精品制服美女丁香| 日本三级久久久| 久艹视频在线观看| 久久国产亚洲| 亚洲人成亚洲人成在线观看| 美女伦理水蜜桃4| 91成人福利社区| 欧美在线观看视频在线| 成人黄色av片| 香蕉成人app免费看片| 国产精品欧美经典| 日本不卡在线播放| 嫩草研究院在线| 成人美女在线观看| 91久色国产| 国产尤物在线观看| 蜜桃视频在线观看一区| 青青草原一区二区| 日韩精品一区二区av| 欧美国产日本| 欧美老肥婆性猛交视频| 三级黄色在线观看| 天天射—综合中文网| 中文字幕欧美日韩| 国产亚洲精品熟女国产成人| 综合亚洲色图| 亚洲欧美日韩爽爽影院| ass精品国模裸体欣赏pics| 久久精品福利| 亚洲精品久久7777777| 在线观看成人动漫| 加勒比色综合久久久久久久久| 精品电影一区二区三区| 99riav国产精品视频| 日韩中文字幕在线一区 | 日本美女一级片| 丰满放荡岳乱妇91ww| 99蜜桃在线观看免费视频网站| 国产又粗又猛又黄又爽| 国产一区二区三区四区五区入口 | 一区二区乱子伦在线播放| 欧美亚洲免费| 国产精品视频专区| 国产美女明星三级做爰| 国产成人综合在线观看| 国产欧美一区二区三区另类精品 | 99久久精品一区二区| 国产亚洲精品自在久久| 免费福利在线视频| 国产欧美一区二区三区在线老狼 | 亚洲av无码国产精品久久| 日韩欧美在线精品| 一区二区亚洲精品国产| 无码人妻精品中文字幕| 亚洲小说欧美另类婷婷| 欧美亚洲日本网站| 夜夜嗨av禁果av粉嫩avhd| 国产美女主播视频一区| 国内精品二区| аⅴ资源新版在线天堂| 亚洲美女免费在线| 国产免费一区二区三区视频| 99亚洲伊人久久精品影院| 欧美丰满少妇xxxxx高潮对白 | 热99这里只有精品| 黄色综合网址| 91精品国产色综合久久不卡电影| 动漫美女无遮挡免费| 国产乱码精品一区二区三区四区 | 啊啊啊久久久| 欧美日韩一区二区三区视频| 国产又黄又嫩又滑又白| 综合国产视频| 欧美成人精品影院| 成人公开免费视频| 国产精品一区二区无线| 日韩hmxxxx| 欧美黄色视屏| 欧美系列亚洲系列| 一二三区视频在线观看| 精品国产91久久久久久浪潮蜜月| 欧美精品在线免费观看| 99精品人妻国产毛片| 国产乱子伦一区二区三区国色天香| 久久天天狠狠| 手机在线免费观看av| 欧美伊人久久久久久久久影院| 成人做爰69片免费| 波多野结衣的一区二区三区| 午夜欧美不卡精品aaaaa| 亚洲一区二区三区高清视频| 99riav一区二区三区| 青青草影院在线观看| 日韩成人影音| 亚洲国产精品一区二区久| 日韩国产第一页| 奇米一区二区三区| 欧美亚州在线观看| 妞干网免费在线视频| 日韩欧美一级片| 日本免费网站视频| 日韩精品每日更新| 久久亚洲高清| 超碰在线最新网址| 日韩精品一区二区三区蜜臀 | 手机看片1024日韩| 亚洲精品免费视频| 日韩在线一区视频| 日韩欧美字幕| 国产精品免费久久久久影院| 邻居大乳一区二区三区| 狠狠爱在线视频一区| 国产大尺度视频| 欧美~级网站不卡| 国产精品天天狠天天看| 国产黄色免费在线观看| 日本韩国精品在线| 无码 人妻 在线 视频| 久久精品官网| 日本视频精品一区| sis001欧美| 亚洲人a成www在线影院| 午夜毛片在线观看| 91麻豆高清视频| 免费黄色日本网站| 欧美一级二级三级视频| 欧美一级在线亚洲天堂| 日韩在线免费看| 欧美色另类天堂2015| 无码熟妇人妻av| 久久亚洲综合| 五月婷婷综合色| 黄色日韩网站| 成人444kkkk在线观看| av在线免费在线观看| 一区二区三区四区不卡在线| 丰满饥渴老女人hd| 国产亚洲在线观看| 日本精品一区二区| 欧美久久久网站| 欧美xxxx做受欧美| 欧日韩在线视频| 欧美性猛交xxxx富婆弯腰| 国产精品免费无码| 久久99最新地址| 男人天堂网站在线| 日韩中文av| 国产精品狼人色视频一区| 欧美18hd| 亚洲缚视频在线观看| 性色av免费观看| 亚洲欧洲精品天堂一级 | 国产精品av久久久久久无| 久久婷婷蜜乳一本欲蜜臀| 国产在线拍揄自揄视频不卡99| 麻豆视频在线播放| 精品国产a毛片| 免费污污视频在线观看| 国产精品第四页| 国产av一区二区三区传媒| 久久性色av| 国产免费xxx| 欧美日韩一区二区三区在线电影 | 精品国产亚洲一区二区三区在线 | 日本污视频在线观看| 久久综合狠狠综合久久综合88| 亚洲一区二区蜜桃| 这里只有精品在线| 久久手机视频| 久久国产精品美女| 国产97在线视频| 在线看三级电影| 亚洲欧美另类人妖| 精品毛片在线观看| 色婷婷久久久久swag精品| 午夜剧场免费在线观看| 91老师片黄在线观看| 欧美性受xxxxxx黑人xyx性爽| 亚洲国产黄色| 亚洲视频在线二区| 青青草这里只有精品| 91精品视频在线免费观看| 中文字幕在线看片| 九九久久国产精品| 在线免费av网站| 日韩精品一区二区三区第95| 99精品在线看| 欧美色窝79yyyycom| 97人人澡人人爽人人模亚洲| 中文字幕制服丝袜成人av| 国产熟妇搡bbbb搡bbbb| 国产不卡免费视频| 亚洲一区精品视频在线观看| 久久av在线| youjizz.com在线观看| 99成人超碰| 五码日韩精品一区二区三区视频| 日韩极品少妇| 国产精品美女久久久久av福利| 亚洲一区有码| 国产精自产拍久久久久久| 欧美成人a交片免费看| 久久久综合免费视频| 手机在线免费看av| 亚洲三级影院| 久久久久久久久久久久久久一区| 日本免费精品| 亚洲一区制服诱惑| 日本久久一区| 国产精品嫩草影院一区二区 | 国产精品极品尤物在线观看| 黄色aa久久| 亚洲97在线观看| 成人高潮aa毛片免费| 欧美极品少妇xxxxⅹ免费视频| 国产精品一区二区三区视频网站| 色婷婷成人综合| 自拍视频在线网| 视频直播国产精品| 日本电影在线观看网站| 中文字幕日韩电影| 超碰国产在线观看| 最新中文字幕亚洲| 免费大片在线观看www| 色婷婷综合久久久久中文字幕1| 噜噜噜噜噜在线视频| 亚洲一区999| 午夜激情视频在线| 欧美成人激情视频| 污视频网站在线免费| 欧美日韩国产va另类| 538在线精品| 2019中文字幕在线免费观看| av综合电影网站| 国产激情999| 伊人国产精品| 福利视频一区二区三区| 欧美黑人巨大videos精品| 麻豆成人小视频| 欧洲乱码伦视频免费| 一区二区三区四区免费视频| 亚洲先锋影音| 97在线国产视频| 亚洲综合不卡| 蜜臀av免费观看| 精品一区二区三区久久| 亚洲午夜精品在线观看| av成人动漫在线观看| 一级黄色性视频| 亚洲日本一区二区| 久久精品欧美一区二区| 欧美日韩加勒比精品一区| 日韩不卡高清视频| 在线综合+亚洲+欧美中文字幕| www.色呦呦| 亚洲精品视频在线观看视频| 成av人电影在线观看| 欧美大片va欧美在线播放| 国产精品电影| 成人日韩在线电影| 欧美绝顶高潮抽搐喷水合集| 先锋影音一区二区三区| 亚洲午夜久久久久久尤物| 国产欧美婷婷中文| 人妻偷人精品一区二区三区| 精品国产一区二区三区不卡| 国产在线观看网站| 久久夜色撩人精品| 蜜桃视频动漫在线播放| 国产主播在线一区| 久久夜色电影| 中文字幕一区二区三区四区五区六区| 亚洲无吗在线| 手机看片福利日韩| 成人一区二区三区中文字幕| 免费看黄色av| 亚洲一区二区三区四区在线免费观看 | 国产日韩成人内射视频| 国产成人免费在线视频| 国产精品av久久久久久无| 亚洲国产精品欧美一二99| 中文字幕乱码在线观看| 精品久久人人做人人爱| h视频在线观看免费| 91高清免费视频| 老司机亚洲精品一区二区| 欧美一区2区三区4区公司二百| 欧美激情五月| 超碰超碰在线观看| 2023国产一二三区日本精品2022| 欧美三级 欧美一级| 欧美私人免费视频| 三级视频网站在线| 国内精品久久久久久中文字幕| 宅男噜噜噜66国产精品免费| 欧美日韩一区二区三区在线视频 | 欧美激情小视频| 四虎影视国产精品| 日韩免费三级| 久久狠狠一本精品综合网| 国产视频精品视频| 亚洲乱码精品一二三四区日韩在线| 波多野结衣家庭主妇| 日韩精品在线第一页| 狠狠操一区二区三区| 国产精品久久久久久久久婷婷| 亚洲精品成人无限看| 污色网站在线观看| 亚洲国产精品精华液ab| 中文字幕第四页| 亚洲精品久久久久久久久| 俺来俺也去www色在线观看| 亚洲xxxx在线| 午夜激情一区| 日韩欧美中文在线视频| 中文字幕一区二区三区精华液| 嫩草影院一区二区三区| 亚洲视频电影图片偷拍一区| 久久爱91午夜羞羞| 久久综合久久综合这里只有精品| 国产精品日韩精品欧美精品| 五十路六十路七十路熟婆 | 无码人妻丰满熟妇区bbbbxxxx | 理论片午午伦夜理片在线播放| 国产999精品| 国产99亚洲| 别急慢慢来1978如如2| 国产人久久人人人人爽| 亚洲 小说区 图片区| 国产一区二区三区欧美| 99久久婷婷国产综合精品首页| 亚洲人成人77777线观看| 美女www一区二区| fc2ppv在线播放| 日韩三级视频在线看| 色呦呦在线看| 国产欧美一区二区三区另类精品| 国产日韩一区二区三区在线| 久久久久亚洲av无码专区桃色| 在线观看一区不卡| 老司机在线永久免费观看| 51国偷自产一区二区三区| 一区视频在线| 国产ts在线播放| 欧美日韩国产区一| 丝袜在线观看| 欧美日韩在线高清| 激情综合网天天干| 黄色激情视频在线观看| 国产视频久久久久| 人人精品久久| 亚洲精品少妇一区二区| av男人天堂一区| 中文字幕理论片| 久久久亚洲欧洲日产国码aⅴ| 亚洲亚洲免费| 视频免费1区二区三区| 亚洲18色成人| 成人性爱视频在线观看| 亚洲一区二区三区乱码aⅴ| 91久久视频| 少妇高潮惨叫久久久久| 精品日产卡一卡二卡麻豆| 91精品产国品一二三产区| 一区二区日本伦理| av中文字幕一区| 97精品人妻一区二区三区在线| 欧美黄色小视频| 欧美日韩国产一区二区三区不卡| 中文字幕第10页| 色婷婷综合久久久久中文一区二区 | 国产一区二区三区免费观看在线 | 国产精品无码乱伦| 91麻豆视频网站| av综合在线观看| 国产成人在线播放| 欧美日韩亚洲一区二区三区在线|