精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用更一致的軌跡、更少的解碼步數「馴服」掩碼擴散語言模型,擴散語言模型的推理性能和效率大幅提升

人工智能 新聞
近期,復旦大學、上海人工智能實驗室、上海交通大學聯合研究團隊發布最新論文《Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step》。

擴散大語言模型得到了突飛猛進的發展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一個商業級擴散大型語言模型,同期人民大學發布第一個開源 8B 擴散大語言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。種種跡象表明,擴散大語言模型很可能是下一代大語言模型基礎范式的有力競爭者。但是針對于擴散大語言模型的解碼策略和強化學習算法仍然是欠探索的。

近期,復旦大學、上海人工智能實驗室、上海交通大學聯合研究團隊發布最新論文《Taming Masked Diffusion Language Models via Consistency Trajectory Reinforcement Learning with Fewer Decoding Step》。

他們提出了一套對于掩碼擴散大語言模型(Masked Diffusion Large Language Model,MDLM)的高效解碼策略 + 強化學習訓練組合,顯著提升了掩碼擴散大語言模型的推理性能與效率,為擴散大語言模型的發展開辟了新路徑。

  • 代碼倉庫:https://github.com/yjyddq/EOSER-ASS-RL
  • 論文鏈接:https://arxiv.org/pdf/2509.23924

解決了什么問題?

掩碼擴散大語言模型(MDLM)如 LLaDA 展現出與自回歸模型相媲美的能力,并具備并行解碼、靈活生成順序、潛在少步推理等優勢。然而,完全擴散式(Full Diffusion-Style)解碼策略并未被廣泛使用,取而代之的是分塊解碼(Block-wise)。因為目前的完全擴散式解碼存在一大痛點 —— 性能大幅度遜色于分塊解碼。

但令人疑惑的是,掩碼擴散大語言模型在預訓練和指令微調階段并未針對分塊解碼這種方式進行適配微調,所以這一現象背后的原因仍不為人所知。該團隊基于這點發現刨根問底,最終定位到 MDLM 的全擴散式解碼的三個特點:

  • 解碼過程中的 token 置信度變化趨勢:由平緩到陡升;
  • 解碼過程中 <EOS> token 的置信度一直顯著大于其他非 <EOS> token;
  • 以上兩點導致在早期解碼時都會有很大概率解碼出 <EOS> token,模型像是陷入了 <EOS > 的陷阱無法自拔。而分塊解碼由于塊的限制存在,則不會深陷其中。

此外,在將為 AR LLMs 定制的強化學習算法遷移到 MDLM 時,可能會遇到 rollout 軌跡和優化軌跡不一致的問題,因為 AR 模型具有因果性掩碼,獲得完整軌跡后計算得到的 token 概率與 rollout 時保持一致。而 MDLM 采用的是雙向注意力,獲得完整軌跡再計算得到的 token 概率與 rollout 時不一致。而現有的方法是(1)使用 prompt masking 近似的一步優化,或者(2)從 fully masked response 進行一步去噪優化。但是這二者都面臨 rollout 軌跡和實際優化軌跡不一致的問題,可能會引起較大的優化誤差。

基于此,該團隊將以上問題匯總為三個關鍵問題:

  • 解碼陷阱:全擴散解碼容易在早期步驟中過早生成過多的 <EOS>token,導致生成中斷,性能下降。
  • 等間隔解碼步長:根據 token 置信度的變化曲線,等間隔的解碼步長可能不是最優的,因為解碼前期對解碼置信度并不高,而解碼后期很確定。
  • rollout 軌跡和優化軌跡不一致:直接將自回歸模型的強化學習算法遷移至 MDLM 可能會面臨 rollout 軌跡和優化軌跡不一致問題,影響優化效果。

 提出了什么方法?

該團隊提出三大核心貢獻,致力于解決了上述問題:

針對于 <EOS > 陷阱!該團隊提出 <EOS > 早期拒絕機制在解碼早期主動抑制 <EOS> 的置信度,避免生成過早終止。后期逐步恢復 <EOS > 的置信度,確保句子正常結束。顯著提升全擴散式解碼性能,在部分任務上顯著超越半自回歸解碼。

基于「早期置信度低、后期急劇上升」的觀察,前期謹慎解碼,后期大膽解碼,設計冪次遞增解碼步長調度器。將推理步數從 O (L) 降至 O (logL),大幅加速推理過程。

針對 rollout 軌跡和優化軌跡不一致問題,該團隊提出一致性軌跡分組策略優化(CJ-GRPO),在 rollout 過程中存儲每一步解碼的中間狀態,逐步優化相鄰兩個狀態之間的轉變,從而有效緩解跳步優化(或者說是不一致軌跡優化)帶來的誤差,提升訓練穩定性與效果。

但是,由于過長的步數會引入較大的存儲開銷,而結合遞增步長調度器后,既能保證軌跡的一致性,同時能大大縮減中間狀態存儲開銷。于是該團隊結合 <EOS > 早期拒絕機制、遞增步長調度器和 CJ-GRPO 算法,削減訓練時 CJ-GRPO 的中間狀態存儲開銷,同時使得訓練后的模型在少解碼步數推理下甚至能達到 Baseline 方法多解碼步數時的性能 —— 一石三鳥。

模型在少解碼步數 (logL) 時仍能保持可觀的性能(與 L/2 解碼步數性能可比),真正激發擴散語言模型的推理速度優勢的潛能。 訓練時的解碼時間 / 空間復雜度從 O (L) 降至 O (logL),大幅加速訓練過程。

實驗結果

在數學推理(GSM8K、MATH500)和規劃任務(Countdown、Sudoku)上,使用 LLaDA-8B-Instruct 模型進行了廣泛的實驗,結果顯示:

  • 一致性軌跡優化在數學和規劃任務上實現了對 baseline 的全面超越。
  • CJ-GRPO + Semi-AR 在數學類任務上表現尤為突出。
  • CJ-GRPO + EOSER + ASS 在規劃類任務上表現尤為突出,某些 benchmark 的性能提升高達 2–4 倍。
  • 發現規劃任務適合并行推理,數學問題適合順序推理。

  • 在都僅使用 log (L) 步數的情況下,EOSER + ASS 性能仍優于分塊解碼和全擴散式解碼策略。
  • 一致性軌跡優化結合遞增步長調度器和 EOSER 解碼策略,在少步數推理場景下保持良好的競爭力,真正實現「又快又好」。

研究意義與未來展望

本工作探究了擴散語言模型的全擴散式解碼策略,并對其使用更一致的軌跡、更少的解碼步數進行優化,用更少的步數,越快越好地完成更復雜的推理任務,推動擴散語言模型的全擴散式解碼、少步數解碼、強化學習算法的發展。

并行推理 v.s. 順序推理:裝配了并行解碼的 MDLM 在規劃類任務中表現更佳,而數學類任務則更適合半自回歸 / 分塊解碼,這比較符合人類的直觀感受。

未來可探索混合推理模式,結合擴散與自回歸優勢,適應多樣化任務需求。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-03 08:40:00

2025-10-14 08:58:00

2025-11-04 01:43:00

循環語言模型架構

2025-05-28 03:30:00

AI人工智能大數據

2024-12-26 16:00:00

英特爾推理模型

2025-08-20 12:38:26

2025-03-17 11:35:36

LLaDALLM大型語言模型

2025-05-27 15:28:11

模型訓練AI

2024-04-26 12:51:48

2025-09-03 10:02:19

2024-06-05 16:22:11

2023-04-13 15:55:00

AI開源

2025-10-17 09:00:00

AI模型代碼

2024-09-10 11:21:30

2025-03-25 09:04:12

2025-09-03 13:59:34

AI模型數據

2025-04-07 08:50:00

模型AI數據

2025-02-17 12:30:00

2025-10-28 08:50:00

AI模型訓練

2025-10-23 08:50:32

點贊
收藏

51CTO技術棧公眾號

亚洲成人动漫在线| 97久草视频| 欧美老女人性生活视频| 91精品国产一区二区在线观看| 亚洲视频1区2区| 国产成人精品一区二区三区福利| 日本一二三区不卡| 欧美在线电影| 亚洲аv电影天堂网| 无码人妻丰满熟妇区毛片| 欧美三级黄网| av午夜精品一区二区三区| 国产成人精品日本亚洲| 中文字幕影音先锋| 精品免费在线| 精品国产乱码久久久久久1区2区| 老头吃奶性行交视频| 欧美人与动牲性行为| 国产日产欧美一区二区三区 | 麻豆天美蜜桃91| 国产精品宾馆| 欧美精品在线一区二区| jizzjizz国产精品喷水| 黄色网址免费在线观看| 久久网站最新地址| 成人资源视频网站免费| 亚洲天堂免费av| 国产精品日本| 欧美大片欧美激情性色a∨久久| 成人免费毛片糖心| 猫咪成人在线观看| 日韩女优毛片在线| 亚洲精品综合在线观看| 欧美成人影院| 黑人巨大精品欧美一区免费视频| 裸体裸乳免费看| 91在线不卡| 久久婷婷久久一区二区三区| 成人免费91在线看| 99久久精品免费看国产交换| 青青草国产成人99久久| 人妖精品videosex性欧美| 国产精品二区一区二区aⅴ| 伊人久久大香线蕉综合四虎小说| 亚洲新声在线观看| 色欲av无码一区二区三区| 精品国内亚洲2022精品成人| 日韩视频永久免费| 初高中福利视频网站| 欧美黄页免费| 欧美日韩午夜精品| 少妇一级淫免费播放| 网友自拍亚洲| 一本到不卡免费一区二区| 拔插拔插海外华人免费| www.8ⅹ8ⅹ羞羞漫画在线看| 亚洲影院免费观看| 男人天堂a在线| 超碰在线网站| 亚州成人在线电影| 欧美日韩精品在线一区二区| 3344国产永久在线观看视频| 夜夜亚洲天天久久| 日本熟妇人妻xxxx| 亚洲第一av| 日韩欧美亚洲综合| 日韩精品无码一区二区三区免费| 最近在线中文字幕| 欧美亚洲愉拍一区二区| 在线观看免费成人av| 国产精品伊人| 日韩一区和二区| 天天躁日日躁狠狠躁免费麻豆| 精品国产一区二区三区不卡蜜臂| 亚洲激情免费观看| 亚洲精品国产熟女久久久| 日本欧美国产| 两个人的视频www国产精品| 精国产品一区二区三区a片| 欧美精品三级| 欧美激情精品在线| 6080午夜伦理| 久久99在线观看| 成人国产一区二区| 欧美3p视频在线观看| 国产精品乱码一区二三区小蝌蚪| 欧美一级黄色录像片| av手机免费在线观看| 日韩欧美中文在线| 一区二区免费av| 国产精品国产| 这里只有精品丝袜| 欧美成人免费看| 午夜在线一区| 亚洲xxxxx性| 天天干免费视频| 国产精品色噜噜| www.亚洲成人网| 欧美www.| 日韩欧美一区二区久久婷婷| 韩国无码一区二区三区精品| 欧美色女视频| 欧美黑人巨大xxx极品| www.com国产| 久久99精品国产91久久来源| 国产欧美日韩一区二区三区| 国产粉嫩一区二区三区在线观看| 亚洲免费电影在线| 国产裸体舞一区二区三区| 中文字幕日本一区| 精品亚洲aⅴ在线观看| 亚洲天堂网av在线| 国产精品久久久亚洲一区| 成人疯狂猛交xxx| 天堂91在线| 伊人色综合久久天天| 密臀av一区二区三区| 国产成人一二| 久久亚洲精品小早川怜子66| 一级黄色av片| 成人动漫在线一区| 一本一本a久久| 国偷自产一区二区免费视频| 日韩午夜小视频| 中字幕一区二区三区乱码| 亚洲精品孕妇| 91九色视频在线观看| 国产黄色免费在线观看| 亚洲不卡av一区二区三区| 天天综合成人网| 精品久久影院| 欧美中文字幕在线视频| 亚洲免费视频网| 亚洲色图.com| 久久婷五月综合| 视频一区中文| 欧美一级电影在线| 蜜臀av午夜精品| 亚洲精品欧美激情| 一二三av在线| 久久综合av| 国产女人18毛片水18精品| 欧美男男同志| 色婷婷综合久久久中文字幕| yy1111111| 最新亚洲视频| 粉嫩精品一区二区三区在线观看| 成人av毛片| 欧美性一级生活| 免费看黄色av| 奇米色777欧美一区二区| 欧美在线激情| 国产伦精品免费视频| 欧美日韩在线观看一区| 九色网友自拍视频手机在线| 欧美午夜激情视频| 91视频啊啊啊| 国产精品综合| 免费成人看片网址| 中文日产幕无线码一区二区| 亚洲精选在线观看| 精品国产xxx| 国产亚洲一二三区| 最新中文字幕2018| 欧美xxxx中国| 成人免费淫片视频软件| 欧美jizz18性欧美| 欧美一区午夜视频在线观看| 亚洲最大的黄色网址| 韩国成人精品a∨在线观看| 天天干天天操天天干天天操| 激情视频亚洲| 久久久久久一区二区三区| 日韩中文字幕综合| 一本在线高清不卡dvd| 免费福利视频网站| 精品一区二区三区免费观看| 色乱码一区二区三区熟女| 深夜激情久久| 7777精品视频| 98在线视频| 欧美一区二区三区公司| 日本亚洲色大成网站www久久| 91免费视频网址| 亚洲一级免费在线观看| 欧美成人tv| 看欧美日韩国产| av成人免费看| 欧美激情精品久久久久久黑人| 天堂网在线中文| 欧美日韩一区二区三区在线| 欧美黑人猛猛猛| 91香蕉视频黄| 99re精彩视频| 激情欧美一区| 亚洲高清视频在线观看| 午夜日韩影院| 国产va免费精品高清在线观看| 久久精品视频观看| 日韩国产中文字幕| 91欧美日韩麻豆精品| 亚洲成a人v欧美综合天堂| 丁香激情五月少妇| 丁香五精品蜜臀久久久久99网站 | 国产综合在线观看| 欧美一区二区私人影院日本| 国产精品美女久久久久av爽| 日韩一区欧美小说| 国产黄色网址在线观看| 狠狠色狠狠色综合| 黄色一级免费大片| 国产综合视频| 一本一道久久久a久久久精品91 | 日韩成人av电影在线| 玖玖精品一区| 国产精品国产自产拍高清av水多| 丝袜综合欧美| 丝袜亚洲另类欧美重口| 欧美色图另类| 精品日韩在线一区| 亚洲一区二区三区高清视频| 狠狠躁天天躁日日躁欧美| 国产一区二区三区在线视频观看| 26uuu久久综合| 久久久无码人妻精品无码| 秋霞成人午夜伦在线观看| 你懂的av在线| 欧美视频导航| 不卡中文字幕在线| 成人在线亚洲| 免费看成人午夜电影| 黄色网一区二区| 91亚色免费| 精品国产乱码久久久久久樱花| 国产精品老女人视频| 中文字幕色婷婷在线视频| 九九热精品在线| 精品国产99久久久久久| 中文字幕日韩有码| 国产精品久久久久一区二区国产| 日韩精品黄色网| 蜜桃视频污在线观看| 日韩欧美国产综合一区 | a一区二区三区| 97人洗澡人人免费公开视频碰碰碰| www久久日com| 久久亚洲国产精品| 精品视频在线一区二区| 色噜噜狠狠狠综合曰曰曰| av在线免费观看网站| 亚洲区中文字幕| 韩国三级在线观看久| 亚洲日本aⅴ片在线观看香蕉| 欧美xxx.com| 亚洲欧美中文字幕在线一区| 你懂的在线观看| 亚洲欧美一区二区三区久久| 黄色大片在线看| 伊人男人综合视频网| 成人高清在线| 中文日韩电影网站| 91在线高清| 米奇精品一区二区三区在线观看| 亚洲精品一线| 久久久久久久久久久国产| 91白丝在线| 国产91在线高潮白浆在线观看| 日韩在线影院| 国产精品美女久久久久久免费| 久久亚洲国产精品尤物| 91香蕉嫩草影院入口| 6080成人| 狠狠色伊人亚洲综合网站色 | 亚洲激情一区二区| 91亚洲国产| 国产 国语对白 露脸 | 国产肥臀一区二区福利视频| 亚洲男女自偷自拍| 超碰在线人人爱| 黄色精品一二区| 久久久久久久人妻无码中文字幕爆| 91在线视频播放地址| 亚洲a v网站| 国产精品传媒入口麻豆| 久青草免费视频| 日本久久一区二区三区| 一区二区三区精彩视频| 欧美va在线播放| 天堂中文字幕在线| 色综合影院在线| 大黄网站在线观看| 国产成人精品在线视频| 成人久久精品| 国产一区免费在线观看| 精品欧美激情在线观看| 免费国产成人看片在线| 在线一区免费观看| 天堂av在线8| av激情综合网| www.4hu95.com四虎| 亚洲高清免费视频| 自拍偷拍色综合| 精品久久久久久亚洲综合网 | 九色精品蝌蚪| 鲁鲁狠狠狠7777一区二区| 91精品国产91久久综合| 黄色www网站| 精品一区二区三区av| av在线播放网址| 中文字幕一区不卡| 国产精品777777| 日韩欧美中文字幕制服| av在线三区| 2019精品视频| 日本精品视频| 午夜精品福利一区二区| 99精品99| 中文字幕 欧美 日韩| 欧美激情综合网| 日韩精品在线观看免费| 日韩一区二区视频在线观看| 国产免费视频在线| 国产做受高潮69| 精品国产乱码久久久久久樱花| 色女孩综合网| 久久婷婷av| 久久丫精品国产亚洲av不卡| 亚洲一区国产视频| 97超碰人人模人人人爽人人爱| 亚洲性日韩精品一区二区| av蜜臀在线| 国产99在线免费| 亚洲美女视频| 国产精品自在自线| 国产精品人人做人人爽人人添| 国产原创视频在线| 亚洲激情在线观看| 青草影视电视剧免费播放在线观看| 国产欧美久久久久久| 欧美日韩激情| 六月激情综合网| 91亚洲精品久久久蜜桃| 日本熟妇成熟毛茸茸| 欧美成人性福生活免费看| 在线你懂的视频| 成人中文字幕在线观看 | 国产日本在线播放| 国产999精品久久久久久绿帽| 日韩一级片大全| 制服丝袜国产精品| 国产成人在线视频免费观看| 国产精品无码专区在线观看| 成人直播大秀| 福利视频999| 日韩美女啊v在线免费观看| 国产精品高潮呻吟久久久| www.亚洲天堂| 亚洲男人在线| 一级特黄妇女高潮| 国产福利一区在线| 九九免费精品视频| 精品福利一二区| 91破解版在线观看| 久久精品日产第一区二区三区精品版 | 欧美成人欧美edvon| 暧暧视频在线免费观看| 国产亚洲情侣一区二区无| 妖精视频成人观看www| 菠萝菠萝蜜网站| 色成人在线视频| 1769在线观看| 91青草视频久久| 好看的av在线不卡观看| 黑人玩弄人妻一区二区三区| 午夜国产精品影院在线观看| 青青色在线视频| 国产日韩欧美在线| 黄色国产精品| 国产麻豆天美果冻无码视频 | 奇米影视亚洲色图| 91免费观看国产| 免费看av在线| 九九热视频这里只有精品| 日韩高清影视在线观看| 爱情岛论坛成人| 亚洲美女屁股眼交| 五月婷中文字幕| 国产精品视频网| 中文字幕一区二区三三| 人妻av一区二区| 欧美性色综合网| 青草影视电视剧免费播放在线观看| 蜜桃91精品入口| 国产资源在线一区| 日韩精品一区二区av| 日日骚久久av| 国产成人夜色高潮福利影视 | 国产福利91精品| 欧美a视频在线观看| 欧美成人精品激情在线观看 |