精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解 原創 精華

發布于 2025-4-17 11:14
瀏覽
0收藏

編者按: 當你面對需要高質量逆向推理能力的應用場景時,傳統大語言模型是否讓你感到力不從心?在詩歌逆向補全、邏輯逆向推導等任務中,為什么即使是 GPT-4o 這樣的強大模型也會表現失常?

文章深入介紹了 LLaDA(Large Language Diffusion with mAsking) 這一創新模型的工作原理、訓練過程與性能表現。與傳統自回歸模型不同,LLaDA 借鑒了計算機視覺領域的擴散模型思想,通過逐步去除掩碼來生成文本,而非從左到右逐個生成 token。

性能測試顯示,8B 參數的 LLaDA 基礎模型明顯優于同等規模的 LLaMA 2,并與 LLaMA 3 表現相當。更令人驚喜的是,LLaDA 在逆向推理任務中表現出色,有效解決了自回歸模型在“逆向詛咒”上的局限性,甚至在詩歌逆向補全任務中超越了 GPT-4o 和 Qwen 2.5。

作者 | AI Papers Academy

編譯 | 岳揚

在這篇文章,我們將對《Large Language Diffusion Models》這篇論文進行解析,介紹首個基于擴散模型的 LLM,該模型可與強大的 LLM 相媲美。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

Paper authors (Source[1])

01 引言

近年來,大語言模型(LLMs)變得極其強大,為通向通用人工智能(AGI)鋪平了道路。這些模型本質上是自回歸的,即根據給定的 token 序列預測下一個 token。我們可以把這個過程想象成它們在一個詞一個詞地生成回答內容,其中的每個新詞都基于前面已有的詞匯。事實證明,這種方法非常強大,讓我們取得了今天的成就。

然而,這種方法也面臨著一些挑戰。例如,按順序逐個生成 token 的計算成本很高。此外,固有的從左到右的建模方式限制了模型在逆向推理(reversal reasoning)任務中的有效性。 后文將提到一個案例 —— 逆向詩歌補全任務,即給定詩歌中的一句話,模型需要預測詩中這句話前一句的內容。無論如何,有一點值得探討:自回歸建模是否唯一可行的方式?

《Large Language Diffusion Models》對這一假設提出了挑戰。正如 LLMs 是自然語言處理的基石一樣,擴散模型則是計算機視覺領域的王者,是頂級文生圖模型的核心技術。在本文中,我們將解讀研究人員如何將擴散模型應用于語言建模領域。

02 什么是擴散模型?

讓我們先快速回顧一下計算機視覺中的擴散模型,這將有助于我們理解本文的核心思想。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

擴散模型逐步去除圖像中的噪聲(Cat images source[2])

擴散模型以提示詞作為輸入,例如“一只貓坐在一臺筆記本電腦上”。模型通過學習逐步去除圖像中的噪聲來生成清晰的圖像。模型從最左側所示的隨機噪聲圖像開始,每一步都去除部分噪聲。去噪過程是以輸入提示詞為條件的,因此最終生成的圖像會匹配提示詞內容。上圖中的三個點(...)表示本例中我們跳過了一些中間步驟。最終我們得到一張清晰的貓圖像,這就是擴散模型根據給定提示詞生成的最終輸出。

在訓練過程中,為了學習如何去除噪聲,我們會逐步向清晰圖像添加噪聲,這個過程稱為擴散過程。該領域已取得一系列進展,但這不是本文的重點。

03 大型語言擴散模型的直觀理解

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 逐步去除 token 序列中的掩碼

本文介紹的模型名為 LLaDA,全稱是 Large Language Diffusion with mAsking。我們從最左側的 token 序列開始,其中黑色部分表示被掩碼的 token。黃色的未掩碼 token 代表提示詞,黑色的被掩碼 token 代表待生成的響應。請注意,這里的被掩碼的 token 由特殊符號表示,不同于我們之前提到的圖像中疊加的噪聲。

我們逐步去除 token 序列中的掩碼,藍色代表已解除掩碼的 token。最終,我們移除所有掩碼,得到針對輸入提示詞的完整響應。在本例中,清晰的響應 token 序列對應文字為:"從前,在一個小村莊里,住著一只聰明的老貓頭鷹(Once upon a time, in a small village, there lived a wise old owl)"。

04 LLaDA 訓練與推理過程概述

讓我們來深入探討大型語言擴散模型的更多細節。下圖展示了該模型的兩個訓練階段(預訓練與監督式微調)以及推理過程。

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 訓練過程與推理示意圖(Source[1])

4.1 LLaDA 訓練階段1 —— 預訓練階段

我們從預訓練階段開始,如上圖最左側所示。

頂部是訓練集中的一個樣本序列。我們隨機選擇掩碼比例 t(0 到 1 之間的值),隨后獨立地為每個 token 隨機決定是否掩碼,概率為 t。這一步會產生部分被掩碼的 token 序列。該序列被輸入模型的核心組件 —— mask predictor(這是一個基于 Transformer 的模型),該模型通過計算掩碼 token 上的交叉熵損失,訓練其還原被掩碼的 token。預訓練數據集規模為 2.3 萬億 token。

4.2 LLaDA 訓練階段2 —— 監督式微調

第二個訓練階段是監督式微調,如上圖中間部分所示。此階段的目的是增強 LLaDA 遵循指令的能力。

頂部是包含提示詞和響應的樣本。我們希望訓練模型根據提示詞生成響應。與預訓練類似,我們隨機掩碼樣本中的部分 token,但此次僅掩碼響應部分的 token,保留提示詞完整。隨后,我們將提示詞和部分被掩碼的響應輸入 mask predictor,以恢復響應中被掩碼的 token。此過程與預訓練階段非常相似,區別在于此過程僅掩碼樣本的響應部分。

訓練過程的掩碼比例(決定多少 token 被掩碼)對每個樣本都是隨機的。這意味著在訓練過程中,模型會接觸到幾乎未掩碼的樣本和高度掩碼的樣本。

在這一階段,研究人員使用了 450 萬樣本訓練 LLaDA。由于樣本長度不一致,因此研究人員使用特殊的序列結束 tokens 填充樣本。通過這種方式,模型就能在人類設置的固定長度的(artificial fixed-length)輸入上進行訓練,并能預測序列結束 tokens,從而終止生成過程。

4.3 推理階段:LLaDA 如何生成文本

了解完 LLaDA 的訓練方式后,接下來讓我們回顧一下上圖右側所示的推理過程。

給定提示詞后,會創建包含完整提示詞和被完全掩碼的響應的樣本。然后通過稱為逆向擴散過程(reverse diffusion process)的迭代流程,逐步解除響應部分的掩碼。每次迭代開始時,我們會得到一個包含完整提示詞和被部分掩碼的響應的序列。將其輸入 mask predictor 后,它會預測出所有被掩碼的 token。然而,部分預測出的 token 會被重新掩碼,因此響應仍保持部分掩碼狀態,直到最后一次迭代,我們才會獲得完整響應。

4.4 推理期間的重新掩碼策略

迭代次數是模型的超參數,需要在計算成本與生成質量間權衡(更多迭代次數可提升生成質量)。在每次迭代中,重新掩碼的 token 數量基于總迭代次數。但如何決定哪些 token 需要重新掩碼?研究者未采用隨機方法,而是使用了兩種更有效的策略:

  1. 低置信度重新掩碼(Low-confidence remasking)—— 此方法中,預測置信度最低的 token 會被重新掩碼。對于每個 token,mask predictor 都會從詞表中選擇概率最高的 token 作為預測結果。此處的最高概率代表 token 預測的置信度,反映模型對此 token 相較于其他選項的正確性確定程度。
  2. 半自回歸重新掩碼(Semi-autoregressive remasking)—— 響應長度可能因提示詞而異。對于需要簡短回答的提示詞,大部分響應內容可能是序列結束標記。為避免生成過多高置信度的序列結束標記,會將待生成的響應劃分為多個區塊,并按從左到右順序依次處理。在每個區塊內部應用逆向擴散過程進行采樣。

05 LLaDA Results

5.1 Benchmark Results

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 與 LLaMA 模型對比(Source[1])

在上圖中,我們對比了 8B 參數的 LLaDA 基礎模型與規模相近的 LLaMA 3 和 LLaMA 2 在多項任務上的表現。使用紅色標注的 LLaDA 明顯優于使用藍色標注的 LLaMA 2,并與使用紫色標注的 LLaMA 3 表現相當,甚至在部分任務上優于 LLaMA 3。

圖中結果為各模型基礎版本的測試結果。未在此圖表展示的經過指令調優的模型性能對比中,LLaMA 3 更具優勢。但需注意,指令調優版 LLaMA 3 在預訓練階段后既進行了監督式微調也進行了強化學習訓練,而指令調優版 LLaDA 僅在預訓練階段后進行了監督式微調。

5.2 LLaDA 在不同規模下的性能擴展規律(LLaDA Scaling Trends)

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

LLaDA 在語言任務上的性能擴展規律(Source[1])

論文中另一張有趣的圖表展示了 LLaDA 在語言任務上的擴展能力。研究人員以不同訓練計算資源(x 軸顯示)訓練了規模相近的 LLaDA 和自回歸基線模型(autoregressive baselines)。每張子圖代表不同任務,y 軸顯示模型性能。LLaDA 展現出強大的擴展能力,與自回歸基線模型競爭力相當。 在數學數據集 GSM8K 上,LLaDA 的擴展優勢尤為顯著;而在推理數據集 PIQA 上,LLaDA 稍落后于自回歸模型,但隨著浮點運算量(FLOPs)的增加,差距逐漸縮小。

5.3 打破「逆向詛咒」

能否將擴散模型思想應用于 LLMs 領域?大型語言擴散模型(LLDM)詳解-AI.x社區

詩歌補全任務上的模型性能對比(Source[1])

上表展示了詩歌補全任務上的模型性能對比。該任務要求模型根據給定詩句生成下一句(正向任務)或前一句(逆向任務)。觀察 GPT-4o 的表現,其在正向任務中的性能顯著優于逆向任務,這是自回歸訓練固有的局限性。LLaDA 則在此取得突破,在正向和逆向任務中表現更均衡,并在逆向任務中超越 GPT-4o 和 Qwen 2.5。大型語言擴散模型在更大規模的模型訓練中表現如何,讓我們拭目以待!

06 結語:語言模型迎來新時代?

LLaDA 通過將擴散模型應用于文本生成任務,掀起了語言建模的范式轉變。其雙向推理能力與強大的擴展性,向傳統的自回歸模型發起了挑戰。雖然該模型尚處探索初期,但這場技術躍遷或將定義 AI 發展的下一程,未來可期。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

AI Papers Academy

At AI Papers Academy, we simplify AI research papers and concepts, making AI more accessible.
Our goal is to save you time by breaking down complex ideas into clear, digestible insights.

END

本期互動內容 ??

?有人認為擴散模型對文本生成是‘殺雞用牛刀’,你同意嗎?為什么?

??文中鏈接??

[1]??https://arxiv.org/abs/2502.09992??

[2]??https://developer.nvidia.com/blog/improving-diffusion-models-as-an-alternative-to-gans-part-1/??

原文鏈接:

??https://aipapersacademy.com/large-language-diffusion-models/??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
欧美高清性xxxxhdvideosex| 欧美日韩成人精品| 蜜桃免费在线视频| 精品国产丝袜高跟鞋| 粉嫩一区二区三区在线看| 91精品国产免费久久久久久| 国产探花视频在线播放| 日韩高清一区| 色999日韩国产欧美一区二区| 色香蕉在线观看| 亚洲av片一区二区三区| 精油按摩中文字幕久久| 韩国19禁主播vip福利视频| 国产精品一二三区在线观看| 亚洲日本va午夜在线电影| 欧美性生交xxxxx久久久| 中国一级大黄大黄大色毛片| 国产精品免费播放| a级精品国产片在线观看| 国产女人精品视频| yjizz国产| 国内精品亚洲| 最新国产精品拍自在线播放| 特大黑人巨人吊xxxx| 成人污污视频| 欧美视频一二三区| 黄色免费观看视频网站| 2024最新电影免费在线观看| 国产精品无遮挡| 免费观看成人高| 亚洲经典一区二区三区| 国产真实乱对白精彩久久| 国产精品十八以下禁看| 亚洲日本视频在线观看| 伊人久久亚洲影院| 欧美另类精品xxxx孕妇| 91高清免费观看| 国产精品福利在线观看播放| 影音先锋欧美精品| 3d动漫精品啪啪一区二区下载| 国产成人一二片| 日韩欧美在线综合网| 99999精品| 久久av网站| 69久久99精品久久久久婷婷| 久久久精品在线视频| 91资源在线观看| 亚洲国产精品一区二区久久恐怖片 | 精人妻无码一区二区三区| 一本久道久久综合婷婷鲸鱼| 欧美激情视频免费观看| 黄网站免费在线| 国产精品videosex极品| 久久久久久亚洲精品| 久久久久久久久久久久久久免费看| 91精品推荐| 欧美刺激性大交免费视频| www.5588.com毛片| 欧美区日韩区| 久久久久久有精品国产| 日本一级黄色录像| 一本色道88久久加勒比精品| 91干在线观看| 日韩精品一区二区亚洲av观看| 久久精品日韩欧美| 国产精品av电影| 一级黄色片视频| 国产一区二区三区在线观看免费 | 性一交一乱一乱一视频| 国产91精品欧美| 精品高清视频| 电影在线一区| 亚洲欧洲av另类| 欧美激情亚洲天堂| 日韩精品美女| 欧美三级三级三级| 国产福利精品一区二区三区| 日韩成人视屏| 亚洲女成人图区| 长河落日免费高清观看| 亚洲二区三区不卡| 国产69精品久久久久9| 国产免费观看av| 久久国产精品99久久久久久老狼| 91久久国产精品91久久性色| 丰满少妇被猛烈进入| 久久女同精品一区二区| 制服诱惑一区| 91超碰免费在线| 色婷婷av一区二区三区之一色屋| 欧美午夜精品理论片| 国产精品白丝av嫩草影院| 亚洲男人天堂九九视频| 国产精品 欧美激情| 国产亚洲精品v| 国产精品无码专区在线观看| 免费的黄色av| 国产精品卡一卡二卡三| 成人午夜精品久久久久久久蜜臀| a∨色狠狠一区二区三区| 日韩视频免费观看高清完整版 | 亚洲资源在线观看| 男人舔女人下面高潮视频| 国产精品一区二区三区www| 亚洲成人黄色在线观看| 日本女人性生活视频| 亚洲精品乱码久久久久久蜜桃麻豆| 国产精品国产三级国产aⅴ9色| av中文字幕在线免费观看| 久久久久亚洲综合| 国产乱子伦精品视频| 国模一区二区| 日韩av网站导航| 欧美黄色aaa| 蜜臀av性久久久久蜜臀aⅴ| 国产欧美日韩综合一区在线观看| 91青青在线视频| 狠狠干狠狠久久| 国产精品99精品无码视亚| 日本一区二区免费高清| 欧美一区二区三区免费观看 | 深夜成人福利| 精品国产凹凸成av人导航| 三级黄色录像视频| 日本欧洲一区二区| 久久手机视频| 国产v日韩v欧美v| 日韩欧美国产三级电影视频| 人与动物性xxxx| 日本怡春院一区二区| 麻豆精品视频| 中文字幕21页在线看| 精品国产三级电影在线观看| 日本午夜在线观看| 久久丁香综合五月国产三级网站| 欧美日韩一区在线视频| 小早川怜子影音先锋在线观看| 欧美成人伊人久久综合网| 日韩高清dvd碟片| 九九视频精品免费| 熟妇熟女乱妇乱女网站| 欧美网站免费| 日韩小视频在线| 国产又粗又长视频| 亚洲免费观看视频| 欧美69精品久久久久久不卡| 综合日韩在线| 北条麻妃高清一区| 欧美极品少妇videossex| 日韩欧美高清一区| 久久精品国产亚洲av麻豆色欲 | 日韩激情美女| 精品国产乱码久久久久久久| 国产在线成人精品午夜| 99精品桃花视频在线观看| jizzjizz国产精品喷水| 亚洲三级精品| 国产精品久久久久久久天堂| 在线观看免费版| 51精品国自产在线| 精品一级少妇久久久久久久| 成人av电影免费观看| 人人妻人人添人人爽欧美一区| 羞羞答答一区二区| 国产精品老女人精品视频| 在线免费看a| 91精品国产色综合久久久蜜香臀| 久草视频在线资源站| 成人av在线播放网站| 99爱视频在线| 97在线精品| 国产精品三区在线| 精品欧美一区二区三区在线观看| 色七七影院综合| 精品区在线观看| 欧美性高潮在线| 欧美乱大交做爰xxxⅹ小说| 国产精品18久久久久| 青青草免费在线视频观看| 粉嫩久久久久久久极品| 国产精品免费久久久| 色a资源在线| 亚洲天堂影视av| a天堂在线视频| 色婷婷综合视频在线观看| 手机在线中文字幕| 91色在线porny| 中文字幕日韩综合| 国产精品综合| 五月天男人天堂| 久久91在线| 91久久久久久久久久| 松下纱荣子在线观看| www.久久色.com| 午夜在线视频观看| 欧美日韩国产综合一区二区| 国产精久久久久久| 国产精品日日摸夜夜摸av| 色哟哟无码精品一区二区三区| 日韩高清一区二区| 国产二区视频在线| 久久美女精品| 欧美激情专区| 在线视频亚洲欧美中文| 国产精品69av| 成人观看网址| 久久亚洲电影天堂| 国产黄色免费在线观看| 亚洲福利在线看| 国产免费一区二区三区最新不卡| 一本大道av伊人久久综合| 极品盗摄国产盗摄合集| 日本一区二区三区四区| 亚洲视频在线播放免费| 国产做a爰片久久毛片| 妺妺窝人体色www在线观看| 亚洲电影成人| 国产 欧美 日本| 91精品电影| 一区二区三区久久网| 亚洲丁香日韩| 久久国产精品一区二区三区| 日韩一区网站| 114国产精品久久免费观看| 国产成人午夜性a一级毛片| 日本亚洲精品在线观看| caoprom在线| 欧美精品久久一区二区| 色呦呦视频在线观看| 久热精品视频在线| 国产原创精品视频| www.日韩欧美| 男人天堂久久久| 日韩在线视频二区| 三区四区在线视频| 日韩视频免费看| 日本在线观看| 日韩中文字幕在线视频| 瑟瑟视频在线| 久久亚洲精品成人| 麻豆免费在线视频| 久久久国产精品x99av | 欧美欧美黄在线二区| 免费亚洲精品视频| 久久99蜜桃| 婷婷久久伊人| 99国产精品一区二区| 综合视频在线观看| 欧美~级网站不卡| 激情成人开心网| 亚洲黄色在线| 欧美三级一级片| 一本久道久久久| 欧美色图另类小说| 视频一区中文字幕国产| youjizzxxxx18| 精品一区二区在线播放| 亚洲图片 自拍偷拍| 国产成人免费在线视频| 中文字幕第3页| 久久蜜桃一区二区| 国产精品久久久久久久av| 国产精品久久久久久久久免费桃花| 蜜桃av.com| 亚洲午夜精品一区二区三区他趣| 久久久午夜影院| 欧美在线观看视频在线| 国产精品久久久久久久久久久久久久久久 | 五月婷婷综合在线| 国产精品久久久久久久久久久久久久久久久 | 色94色欧美sute亚洲线路一久 | eeuss中文| 亚洲欧洲一区二区天堂久久| av网站在线观看不卡| 日本免费新一区视频| 亚洲av无日韩毛片久久| 懂色av一区二区三区蜜臀| 最新中文字幕视频| 国产精品电影一区二区| 精品一区二区三区人妻| 色欧美片视频在线观看| 国产视频一区二区三区四区五区| 精品久久一区二区| 国产精品毛片一区二区三区四区| 久久夜色精品国产| 英国三级经典在线观看| 成人久久精品视频| 一区二区三区日本久久久| 国产av不卡一区二区| 国产精品一卡| 亚洲欧美激情一区二区三区| 久久久久高清精品| 精品国产乱码久久久久久鸭王1| 欧美性猛交xxxx乱大交极品| 91tv国产成人福利| 亚洲精品资源美女情侣酒店| 成人在线直播| 国产成人精品免费久久久久| 久久av偷拍| 台湾成人av| 亚洲在线黄色| 丰满少妇一区二区三区专区| 国产亚洲美州欧州综合国| 麻豆亚洲av成人无码久久精品| 色婷婷综合五月| 天天躁日日躁狠狠躁喷水| 精品国模在线视频| 桃花岛成人影院| 精品免费视频123区| 亚洲成人日韩| 色婷婷.com| 亚洲国产高清aⅴ视频| 五月天婷婷综合网| 日韩午夜电影在线观看| 日本视频在线| 国产精品久久久久999| 欧美色图五月天| 国产色一区二区三区| 国产老女人精品毛片久久| 一级二级黄色片| 日本乱人伦一区| 亚洲人妻一区二区三区| 高清一区二区三区日本久| 日韩在线视频一区二区三区| 曰韩不卡视频| 久久爱另类一区二区小说| 国产精品美女高潮无套| 在线视频欧美精品| 免费福利在线视频| 日本亚洲欧洲色α| 中文有码一区| 国产无套内射久久久国产| 91在线视频观看| 日韩aaaaaa| 精品国产免费视频| 黄色影院在线看| 国产一区免费观看| 日韩午夜电影| 在线免费观看成年人视频| 日韩欧美福利视频| 天堂资源中文在线| 国产97在线亚洲| 欧美伦理影院| gai在线观看免费高清| 国产精品久久久久久户外露出| 波多野结衣家庭主妇| 在线视频欧美日韩精品| 成人高清一区| 中文字幕免费在线不卡| 黄色小说综合网站| 永久免费看黄网站| 亚洲第一福利在线观看| 久草免费在线视频| 青青成人在线| 青青草成人在线观看| 国产精品夜夜夜爽阿娇| 欧美一二三在线| 91吃瓜在线观看| 久久综合精品一区| 日本视频一区二区三区| 黄色a级片在线观看| 精品国产乱码久久久久久夜甘婷婷 | 偷窥少妇高潮呻吟av久久免费| av女名字大全列表| 国产不卡精品视男人的天堂| 成人婷婷网色偷偷亚洲男人的天堂| 毛片毛片毛片毛| 亚洲一区二区三区四区不卡| 三级小视频在线观看| 国产精品黄页免费高清在线观看| 色999日韩| 在线免费看黄色片| 欧美亚洲国产bt| 在线heyzo| 免费一区二区三区在在线视频| 喷白浆一区二区| 久草综合在线视频| 国产偷亚洲偷欧美偷精品| 久草综合在线| 精品国偷自产一区二区三区| 久久久国际精品| 99久久久国产精品无码网爆| 2019中文字幕全在线观看| 北条麻妃国产九九九精品小说| 黄色一级片免费播放| 福利一区福利二区微拍刺激| 1024视频在线| 国外成人在线视频网站| 日韩高清不卡一区| 久久久精品91| 中文字幕国产亚洲| 国产精品乱战久久久| 亚洲无吗一区二区三区| 一区二区三区在线观看国产 | 欧美黑人极品猛少妇色xxxxx | 国产精品啪啪啪视频| 久久久亚洲精品石原莉奈| av高清一区二区| 国产91色在线|| 亚洲二区精品|