精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

舍棄自回歸,離散擴散語言模型如何演化?NUS綜述解構技術圖譜與應用前沿

人工智能 新聞
本綜述系統梳理了離散擴散方向的研究圖譜,呈現了離散擴散語言模型(dLLMs)與離散擴散多模態語言模型(dMLLMs)的理論基礎、代表模型、訓練與推理技術,以及在推理、視覺、生物等多個領域的應用進展。

本論文共同第一作者于潤芃和李奇是新加坡國立大學 xML 實驗室博士生,指導老師為王鑫超,研究方向是多模態大模型與可信深度模型。

本文主要介紹 xML 團隊的論文:Discrete Diffusion in Large Language and Multimodal Models: A Survey。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2506.13759
  • GitHub 倉庫:https://github.com/LiQiiiii/DLLM-Survey

自 GPT 引爆大語言模型熱潮以來,自回歸的大語言模型(LLMs)與多模態模型(MLLMs)已成為智能系統的基石。然而,當人們著眼于更快、更可控、更智能的生成范式時,一條新興路徑悄然浮現:離散擴散(Discrete Diffusion)。

本綜述系統梳理了離散擴散方向的研究圖譜,呈現了離散擴散語言模型(dLLMs)與離散擴散多模態語言模型(dMLLMs)的理論基礎、代表模型、訓練與推理技術,以及在推理、視覺、生物等多個領域的應用進展。

圖片

圖 1 綜述的框架結構與內容

自回歸的局限與離散擴散的崛起

傳統大模型采用自回歸(Autoregressive, AR)架構,其從左至右逐詞生成方式雖然自然,但存在顯著的性能瓶頸:無法并行解碼、難以精確控制輸出、局限于對輸入的靜態感知、對補全和逆向推理的建模能力差。這使其在需要結構化控制與動態感知的復雜場景中表現受限。

離散擴散模型打破了這一范式。它不再逐詞預測,而是將生成視為一個「掩碼 - 去噪」迭代過程,并行處理所有 Token,并借助全局注意力機制實現動態感知。這種設計帶來了三大核心優勢:

  • 推理并行性(Parallel Decoding): 并行推理是離散擴散模型最大的特點和優勢。并行推理使得離散擴散每次迭代都可以解碼出多個 Token,從而帶來解碼速度上的提升。
  • 輸出可控性(Controllability)與補全能力(Infilling): 掩碼 - 去噪的解碼機制,使得每一次回答都可以預設回答的長度、格式、結構,為回答設定一個模板。
  • 動態感知能力(Dynamic Perception): 全局注意力機制下模型對左側 Token 的處理受到右側 Token 的影響;多輪迭代的解碼機制使得對所有 Token 的處理都可以反復多次進行。這使得 dLLM 和 dMLLM 可以對長語料和多模態輸入進行多輪、有條件的動態感知,而不是如單向注意力一樣僅僅能夠感知一次。

圖片

圖 2 自回歸模型與典型離散擴散模型的對比

離散擴散語言模型的數理基礎

D3PM(Discrete Denoising Diffusion Probabilistic Models)框架是眾多離散擴散數理模型的起點。D3PM 給出了在離散時間上、離散狀態空間中的馬爾可夫模型。整個模型由兩個對偶過程構成:前向擴散過程和反向去噪過程。

在前向過程中,原始序列圖片被逐步擾動為噪聲表示圖片,其轉移機制由一系列時間依賴的轉移矩陣圖片控制,不同形式的圖片對應不同的擴散行為。例如,均勻(Uniform)轉移會將 Token 等概率擾亂;吸收態(Absorbing)轉移則將所有 Token 都映射至特定的 [MASK] Token。因此,使用吸收態轉移的擴散過程也被稱為 Masked Diffusion,是當前 dLLM 和 dMLLM 中使用最多的一類。此外,還有基于嵌入相似度的擴散矩陣、帶狀(band-diagonal)或離散高斯轉移等,增強模型在語義空間或局部結構中的建模能力。

反向過程則學習如何一步步去噪,還原出高質量文本。常見的圖片,通過一個神經網絡圖片來預測原始 Token 的概率分布,再結合前向轉移概率,從而構造出反向轉移概率圖片。訓練時的損失函數由變分下界(ELBO)導出。在 Masked Diffusion 框架下,損失函數還可以被化簡成加權的 Masked Language Modeling 損失。

在 D3PM 的基礎上,連續時間擴散模型將離散時間步泛化為連續時間步,構建了在連續時間上 離散狀態空間的馬爾可夫過程,通過引入速率矩陣圖片來建模任意時刻的狀態躍遷。Concrete Score 模型將反向過程的轉移速率矩陣圖片拆解為前向速率矩陣圖片和聯合概率比 c 的乘積,通過 Score Matching、基于 Bregman 散度的 Score Entropy 等損失函數來學習概率比 c。 Discrete Flow Matching 將流匹配思想引入到離散空間,在給定源目標分布和噪聲分布之間,構造連續變化的概率路徑。訓練過程通過定義 Token 級速度場來驅動序列生成,配合交叉熵損失優化。

離散擴散語言模型生態概覽

圖片

圖 3 離散擴散模型的發展歷程

隨著離散擴散語言模型(dLLMs)快速崛起,近年來該領域涌現出一系列代表性模型。從早期探索性的輕量模型,到近期可比肩自回歸 LLM 的離散擴散大模型,再到多模態與統一建模范式的拓展,離散擴散正逐漸演化為一條獨立而完整的技術路徑。綜述將當前模型生態大致劃分為以下四類:

1. 輕量級模型:早期的離散擴散模型參數量往往不超過 1B,代表作包括 D3PM、DiffusionBERT、RDM、Diffusion-NAT、TESS、SEDD、MDLM、MD4 等。這些模型重點在于探索基礎的建模機制與去噪策略,驗證離散擴散在文本和多模態生成任務上的可行性。

2. 大規模 dLLM:隨著技術成熟,多個工作開始將擴散架構拓展至 10 億以上參數量,構建具備完整語言理解與生成能力的「非自回歸大模型」,代表模型包括:LLaDA 系列、DiffuGPT / DiffuLLaMA 和 DREAM 等。這些工作從規模上拓展了擴散語言模型的邊界,系統性地探索了其工程可行性。

3. 多模態擴展(dMLLM):在語言能力日趨完善之后,研究者開始探索 dLLMs 在多模態任務中的適應性,典型代表有:Dimple、LaViDa 和 LLaDA-V。

4. 統一生成模型:離散擴散在圖片生成中的可行性很早就被驗證了,隨著語言生成能力的完善,MMaDA、FUDOKI 和 Muddit 等模型給出了一種統一的架構,使用離散擴散模型在一個神經網絡中同時建模文本和視覺的生成。

訓練與推理技術

方興未艾的 dLLM 與 dMLLM 正在不斷演進,伴隨而來的還有訓練與推理技術的持續創新。本綜述系統地梳理并歸納了已有模型中采用的核心方法,同時也在不斷收錄和更新該領域的最新進展。

訓練技術

離散擴散模型在訓練過程中面臨一系列獨特挑戰,包括語料利用率低、生成長度偏差(length bias)、隨機時間采樣帶來的監督信號覆蓋率低等。為解決這些問題,研究人員提出了多種創新性的訓練機制。綜述中主要歸納了以下幾類:

  • 初始化機制:使用已經訓練好的 BERT 模型或者 AR 模型作為訓練起點,或者對模型首先進行 AR 訓練再進行擴散訓練。典型的模型包括 DiffuLLaMA、DiffuGPT 和 Dimple 。這一類初始化技術化能夠加速訓練過程,保證模型性能,在資源受限的訓練時效果顯著。
  • 互補掩碼策略(Complementary Masking):為提升語料使用效率,構造一對互補的掩碼樣本,兩次掩碼的位置互斥,但是拼起來可以使所有 Token 都被覆蓋,從而解決信息利用稀疏問題。典型的模型包括 LaViDa 和 DiffuCoder。
  • 掩碼調度(Masking Scheduling)函數:掩碼調度函數決定了訓練過程中各個時間步上掩碼比例的大小。在訓練過程中既可以為所有的 Token 設置統一的調度函數,也可以針對各個 Token 設置不同的調度函數。在線性調度函數下,掩碼比例隨時間線性變化,使每一步加噪的 Token 數量大致相同。在凸(convex)調度函數下,掩碼函數斜率的絕對值先大后小,在時間步不大時就能夠掩碼大量的 Token,從而使得模型訓練時能夠接觸到更 noisy 的樣本,也鼓勵推理時從慢到快,每一步解碼出來的 Token 數量先少后多。
  • 重加權策略(Reweighting):對不同 Token 處的損失函數值進行調整,強化對特定 Token 的學習。比如,MGDM 提升損失函數大的 Token 的權重,提升對困難位置的關注,加速收斂。
  • 知識蒸餾(Distillation): 通過知識蒸餾實現對推理步數的壓縮,將多步的「教師模型」知識傳遞給步數更少的「學生模型」。

這些技術從訓練目標、數據使用到網絡初始化等方面優化了擴散訓練流程,使 dLLMs 得以在更大規模、更復雜任務上保持穩定、有效的訓練表現。

圖片

圖 4 幾種掩碼調度函數

推理技術

dLLMs 和 dMLLMs 的推理過程中的每一步都會對所有的 token 進行并行的同步預測,之后基于特定的規則來決定要保留哪些位置的預測。為兼顧生成質量與效率,研究人員提出了一系列推理技術。綜述中主要歸納了以下幾類:

  • Unmasking 策略決定「什么時候生成什么」。推理中每輪只會保留對部分 Token 的預測,Unmasking 策略負責決定解哪里、解多少。解碼的位置既可以是隨機選取,也可以是度量驅動(Metric-based),根據模型置信度、負熵等指標優先解碼「最確定」的位置。每一步解碼的 Token 數量可以設置為固定值,也可以根據訓練時的調度函數計算得到。如果使用了度量驅動的解碼策略,還可以使用 Confident Decoding 算法,通過閾值動態調整每一步解碼出來的 Token 數量。
  • Remasking 技術實現「修正」,解決吸收態擴散模型「寫完不能改」的局限。Remasking 允許將已經解碼出來的 Token 再次設置為 [Mask],從而對回答進行修改,實現 Test-Time-Scaling。
  • 緩存機制(Caching):AR 框架下的 Prefilling 和 KV-Cache 機制也被引入了 dLLM 和 dMLLM 中,通過緩存注意力計算的中間結果,并選擇性動態更新,以加速生成。
  • Guidance 技術:類比于連續擴散模型中的 Guidance 機制,Classifier-Free Guidance、Reward Guidance、Energy-Based Guidance 等技術也被應用在離散擴散模型中,實現對模型輸出的定向調整。

這些推理技術不僅提升了生成效率,更賦予了 dLLMs 修正和控制的能力,逐步構建出具備實用價值的非自回歸語言推理范式。

圖片

圖 5 對 Unmasking 策略的展示

結語

除了以上內容,綜述中也介紹了 dLLM 和 dMLLM 在生物、視覺、推理等方面的應用,探討了其未來可能的發展方向。

隨著大語言模型不斷拓展其邊界,離散擴散模型(dLLMs 與 dMLLMs)為傳統自回歸范式提供了強有力的替代路徑。并行解碼、結構控制與動態感知等優勢使它們突破了自回歸模型在效率與控制性上的瓶頸。從基礎理論到工程優化,再到多模態與跨領域應用,離散擴散范式正在逐步走向成熟。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-26 12:51:48

2024-08-05 14:36:17

大型語言模型量化

2025-07-10 14:54:13

AI模型圖像生成

2025-05-27 15:35:02

大模型技術AI

2024-03-07 12:31:29

AI技術

2025-08-12 09:08:00

2025-06-11 09:21:28

2024-10-10 08:33:06

2023-07-04 10:28:15

模型論文

2025-03-17 08:25:00

模型AI訓練

2024-03-11 09:37:01

模型圖片編輯

2024-06-05 16:22:11

2025-05-27 15:28:11

模型訓練AI

2025-02-27 13:45:00

2025-03-25 09:04:12

2024-11-12 13:10:49

2022-09-13 14:54:08

模型AI

2023-11-17 08:46:26

2024-12-23 13:30:00

2024-05-10 07:58:03

點贊
收藏

51CTO技術棧公眾號

中文.日本.精品| 日韩一级片免费| 9191国语精品高清在线| 日韩精品专区在线影院观看| www.av毛片| av在线电影播放| 国产成人aaaa| 国产精品久久久久久av福利软件| 午夜激情福利网| 国产精品一区高清| 日韩亚洲欧美成人一区| 毛片一区二区三区四区| 在线xxxx| 国产精品欧美一级免费| 精品中文字幕一区| 国产模特av私拍大尺度| 久久婷婷一区| 欧美剧在线观看| 综合 欧美 亚洲日本| 卡通动漫精品一区二区三区| 欧美日韩精品免费| 久久久久久久久久久久久国产精品| 国产鲁鲁视频在线观看特色| 国产午夜精品久久久久久免费视| 国产v亚洲v天堂无码| 一区二区视频在线免费观看| 亚洲三级毛片| 色综合色综合久久综合频道88| 亚洲ⅴ国产v天堂a无码二区| 秋霞影院一区二区三区| 精品国产一区二区三区久久久蜜月 | 1769国内精品视频在线播放| 亚洲国产精品免费在线观看| 9999国产精品| 中文字幕日韩有码| av电影网站在线观看| 午夜a一级毛片亚洲欧洲| 精品噜噜噜噜久久久久久久久试看| 亚洲欧美视频二区| 成人在线爆射| 一本久久a久久免费精品不卡| 欧美国产视频一区| 色呦呦在线看| 亚洲综合另类小说| 97在线免费视频观看| 成人三级网址| 一区二区免费在线播放| 性做爰过程免费播放| 亚洲视频tv| 中文字幕一区视频| 中文字幕在线乱| v天堂福利视频在线观看| 亚洲色图制服丝袜| 99热都是精品| 亚洲精品天堂| 亚洲不卡一区二区三区| 黄色www网站| 在线日韩影院| 日本高清成人免费播放| 亚洲成人av免费看| 日韩美香港a一级毛片| 777久久久精品| 6080国产精品| 2020最新国产精品| 亚洲精品电影在线| 男人舔女人下部高潮全视频| 日韩精品永久网址| 久久视频免费观看| 国产一级av毛片| 亚洲女优在线| 国产精品美腿一区在线看| 91福利在线观看视频| 国内一区二区在线| 国产亚洲精品自在久久| 九色视频在线观看免费播放| 国产精品色在线| 国产精品国三级国产av| 精品国产第一福利网站| 欧美夫妻性生活| 乳色吐息在线观看| 亚洲高清极品| 久久精品最新地址| 日韩少妇高潮抽搐| 日韩激情视频网站| 5g国产欧美日韩视频| 婷婷色在线视频| 国产精品毛片大码女人| 国产精品一色哟哟| 日韩经典一区| 亚洲精品一区二区三区影院| 成年人免费观看视频网站| 国产精品99一区二区三区| 久久免费视频在线观看| 国产情侣小视频| 福利电影一区二区| 水蜜桃一区二区三区| 免费影视亚洲| 欧美午夜不卡视频| 国产二级一片内射视频播放| 日韩在线中文| 91av中文字幕| 99在线无码精品入口| 国产亚洲欧美一区在线观看| 免费看日b视频| 91精品国产66| 亚洲免费视频在线观看| 九九视频在线免费观看| 免费人成黄页网站在线一区二区| 国产一区二区中文字幕免费看 | 欧美老少配视频| 无码人妻丰满熟妇精品区| 成人午夜激情片| 在线观看亚洲视频啊啊啊啊| 一区二区三区四区日本视频| 欧美一级搡bbbb搡bbbb| 精品无码人妻一区二区免费蜜桃| 国产在线日韩| 51国偷自产一区二区三区| 午夜在线视频播放| 色婷婷精品大视频在线蜜桃视频| 黄色性视频网站| 91成人精品视频| 国产精品一区二区三| 日韩欧美亚洲系列| 亚洲成人av免费| 无码国产精品久久一区免费| 国产高清欧美| 国产精品欧美日韩久久| 久久综合九色综合久| 欧美日韩激情网| 在线看黄色的网站| 影音先锋国产精品| av日韩免费电影| 在线看一级片| 欧美一区二区三区四区五区| 肉色超薄丝袜脚交69xx图片| 日本亚洲三级在线| 日韩中文字幕av在线| 345成人影院| 亚洲欧美成人在线| 天天干天天干天天操| 99天天综合性| 欧美v在线观看| 自拍欧美一区| 国产成+人+综合+亚洲欧美丁香花| 天天摸夜夜添狠狠添婷婷| 午夜精品aaa| 亚洲一区二区三区四区五区六区| 亚洲国产精品第一区二区三区| av成人在线电影| 3344国产永久在线观看视频| 亚洲精品电影网站| 国产午夜精品久久久久| 久久久不卡网国产精品一区| 丁香婷婷激情网| 日韩欧美字幕| 亚洲综合在线播放| 91白丝在线| 亚洲日本成人网| 夜夜躁很很躁日日躁麻豆| 成人免费在线播放视频| 成年人性生活视频| 亚洲美女色禁图| 欧美日韩成人一区二区三区| av久久网站| 久久成人精品电影| 日本高清视频免费观看| 色综合久久久久综合体| 美女av免费看| 国产成人综合视频| 亚洲熟妇无码一区二区三区| 亚洲精品无吗| 国产欧美日韩中文字幕在线| 四虎影院观看视频在线观看| 日韩精品久久久久久久玫瑰园| 精品国产xxx| 亚洲欧美日韩一区二区| av2014天堂网| 久久爱www久久做| 日韩中文字幕在线免费| 国产剧情在线观看一区| 91精品视频在线播放| 97超碰在线免费| 中文字幕亚洲综合久久筱田步美 | 国产精品一区二区免费不卡| 成人在线观看你懂的| 成人在线国产| 韩国成人动漫在线观看| 国精品产品一区| 91国内产香蕉| 黄色动漫在线| 亚洲新中文字幕| 亚洲精品国产精| 欧美三级欧美一级| 欧美日韩精品区| 一色桃子久久精品亚洲| 无套内谢大学处破女www小说| 极品少妇一区二区三区精品视频| 欧美日韩在线一| 中文字幕人成人乱码| 欧美日韩最好看的视频| 日本久久伊人| 国产日韩换脸av一区在线观看| 91超碰国产在线| 欧美成人精品一区二区| 四虎电影院在线观看| 91精品国产全国免费观看| a片在线免费观看| 欧美日韩午夜剧场| 精品无码一区二区三区电影桃花| 中文字幕中文字幕一区二区| 能免费看av的网站| 成人一区二区三区在线观看| av免费一区二区| 日本va欧美va精品| 波多野结衣家庭教师视频| 国产一区亚洲| 大地资源网在线观看免费官网| 欧美熟乱15p| 欧美日韩成人一区二区三区| 欧美a大片欧美片| julia一区二区中文久久94| 一区二区三区日本视频| 国产精品亚洲综合天堂夜夜| 国产精品迅雷| 2023亚洲男人天堂| www.51av欧美视频| 久久久久中文字幕2018| 欧美激情成人动漫| 欧美日本中文字幕| av在线麻豆| 粗暴蹂躏中文一区二区三区| 在线免费看a| 色偷偷综合社区| 97电影在线观看| 中文字幕av日韩| avtt亚洲| 久久激情视频免费观看| 免费黄网站在线播放| 日韩视频亚洲视频| 免费的黄网站在线观看| 精品国产一区二区三区久久狼黑人| www黄在线观看| 日韩中文在线观看| 久草中文在线观看| 九九久久国产精品| 牛牛在线精品视频| 97精品久久久| 白浆在线视频| 日韩美女在线观看| 成人国产网站| 91网站在线免费观看| 欧美成人精品午夜一区二区| 亚洲自拍在线观看| 国产日韩三级| 欧美aaaaa喷水| 成人一区二区| avove在线观看| 亚洲第一黄网| 国产真实乱子伦| 久久成人久久爱| xxxx国产视频| 91视频一区二区| 久久午夜精品视频| 亚洲黄色免费网站| 中文字幕精品三级久久久| 色婷婷久久99综合精品jk白丝| 中文在线观看免费高清| 欧美一级欧美三级| 亚洲日本在线播放| 色悠悠国产精品| 日本在线观看高清完整版| 欧美一级片一区| 最新日韩一区| 成人国产1314www色视频| 日韩欧美在线精品| 在线观看福利一区| 亚洲美女啪啪| 看看黄色一级片| 99精品国产视频| 三级黄色免费观看| 图片区日韩欧美亚洲| 中文字幕在线观看免费| 亚洲精品一区在线观看| 日本中文字幕在线播放| 韩日欧美一区二区| 小说区图片区亚洲| 久久精品第九区免费观看| 99国产精品一区二区| 日日摸日日碰夜夜爽无码| 另类中文字幕网| 国产国语性生话播放| 1024成人网| 99久久久无码国产精品免费蜜柚| 日韩视频在线一区二区| 都市激情一区| 午夜精品久久久99热福利| 日韩av黄色| 欧美污视频久久久| 在线成人国产| 天天久久综合网| 中文字幕高清不卡| 亚洲久久在线观看| 精品日韩成人av| 超鹏97在线| 91精品久久久久久久久久久久久久 | 国产一区二区网址| 欧美 日韩 成人| 亚洲福利一二三区| aaa级黄色片| 日韩资源在线观看| 麻豆精品蜜桃| 欧美福利一区二区三区| 亚洲人www| 性高潮久久久久久| 最新中文字幕一区二区三区| 波多野结衣绝顶大高潮| 亚洲第一级黄色片| 肉体视频在线| 亚洲最大的网站| 忘忧草精品久久久久久久高清| 91av俱乐部| 337p粉嫩大胆噜噜噜噜噜91av| 国产一级片久久| 日韩一区二区三区视频| 二区三区四区高清视频在线观看| 国产精品一区二区三区久久| 国产精品亚洲片在线播放| 91黄色小网站| 91视频免费观看| 黄色片中文字幕| 亚洲欧美一区二区精品久久久| 国产精选在线| 精品久久蜜桃| 国产精品综合| 中文字幕xxx| 日韩欧美在线中文字幕| 欧美日韩免费做爰大片| 欧亚精品中文字幕| 久久av综合| 999精品视频在线| 一区在线中文字幕| 99久久国产免费| 九九热r在线视频精品| 日韩黄色av| 欧美一级欧美一级| 91视频一区二区三区| 久久国产乱子伦精品| 中文字幕亚洲综合| 激情五月综合婷婷| 久久久久久久久久伊人| 成人性色生活片免费看爆迷你毛片| 国产在线观看免费视频今夜| 欧美精品一区二区三区高清aⅴ| aaa在线播放视频| 欧美日韩在线精品| 蜜桃久久久久久久| 波多野结衣家庭教师| 精品少妇一区二区三区日产乱码| 成年人黄色大片在线| 日本高清久久一区二区三区| 日韩黄色免费网站| 2025国产精品自拍| 日韩av中文字幕在线播放| 婷婷激情一区| 制服国产精品| 成人午夜私人影院| 日韩中文字幕高清| 久久综合久久八八| 国产 日韩 欧美 综合 一区| 欧美视频第一区| 亚洲三级久久久| 无码精品视频一区二区三区 | 久久久久久爱| 国产精品又粗又长| 国产日韩欧美综合在线| 国产免费一区二区三区最新不卡| 国内精品小视频| 欧美熟乱15p| xfplay5566色资源网站| 欧美偷拍一区二区| 蜜桃传媒在线观看免费进入| 欧美尤物一区| 国产精品888| 精人妻无码一区二区三区| 久久久久99精品久久久久| 欧美毛片免费观看| www.超碰97.com| 一本色道综合亚洲| 性xxxxfjsxxxxx欧美| 日韩三级电影免费观看| 国产成人亚洲精品狼色在线| 天天干天天干天天| 九九热r在线视频精品| 欧美一级淫片| 日本护士做爰视频| 欧美一区二区三区在线观看视频 | 99久久久精品免费观看国产| 先锋影音久久| 日韩毛片在线播放|