精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

dLLM的「Free Lunch」!浙大&螞蟻利用中間結(jié)果顯著提升擴(kuò)散語言模型

人工智能 新聞
這項(xiàng)工作揭示了 dLLM 生成過程中的「先對后錯(cuò)」現(xiàn)象,并提出了兩種創(chuàng)新方法——Temporal Self-Consistency Voting 和 Temporal Consistency Reinforcement。

本文第一作者王文,浙江大學(xué)博士生,研究方向是多模態(tài)理解與生成等。本文通訊作者沈春華,浙江大學(xué)求是講席教授,主要研究課題包括具身智能、大模型推理增強(qiáng)、強(qiáng)化學(xué)習(xí)、通用感知模型等。

近年來,擴(kuò)散大語言模型(Diffusion Large Language Models, dLLMs)正迅速嶄露頭角,成為文本生成領(lǐng)域的一股新勢力。與傳統(tǒng)自回歸(Autoregressive, AR)模型從左到右逐字生成不同,dLLM 依托迭代去噪的生成機(jī)制,不僅能夠一次性生成多個(gè) token,還能在對話、推理、創(chuàng)作等任務(wù)中展現(xiàn)出獨(dú)特的優(yōu)勢。當(dāng)你還在等傳統(tǒng) LLM「一個(gè)字一個(gè)字」地憋出答案時(shí),dLLM 早已通過幾輪迭代「秒」出完整結(jié)果,帶來前所未有的生成效率。

然而,速度的提升并不意味著完美的答案。現(xiàn)有 dLLM 的解碼策略往往只關(guān)注最后一次迭代的生成結(jié)果,直接舍棄了中間多輪迭代中蘊(yùn)含的豐富語義與推理信息。這些被忽視的中間預(yù)測,實(shí)際上可能暗藏著更準(zhǔn)確、更接近真相的答案。一旦被丟棄,不僅造成信息浪費(fèi),還可能讓模型錯(cuò)失做對題目的最佳時(shí)機(jī)。

更令人意外的是,研究團(tuán)隊(duì)在數(shù)學(xué)推理任務(wù)中觀察到了一種「先對后錯(cuò)」的現(xiàn)象:模型先是得出了正確答案,卻在隨后的迭代中將其「推翻」,轉(zhuǎn)而采用錯(cuò)誤答案,最終導(dǎo)致整體回答錯(cuò)誤。以下圖為例,模型在第 55 步時(shí)明明已經(jīng)得到正確的 25,卻在后續(xù)生成中改成了 2,并一直堅(jiān)持到最后也未能修正。

正是基于這一關(guān)鍵觀察,來自浙江大學(xué)的研究團(tuán)隊(duì)從時(shí)序視角切入,提出了 Temporal Self-Consistency Voting 與 Temporal Consistency Reinforcement 兩種方法,對模型的性能進(jìn)行優(yōu)化與提升。


  • 論文標(biāo)題:Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models
  • 論文地址:https://arxiv.org/abs/2508.09138
  • 項(xiàng)目主頁:https://aim-uofa.github.io/dLLM-MidTruth/
  • Github:https://github.com/aim-uofa/dLLM-MidTruth
  • Huggingface Paper:https://huggingface.co/papers/2508.0913

Temporal Self-Consistency Voting:從時(shí)間維度「抓住」模型最靠譜的答案

在傳統(tǒng)的自回歸(AR)模型中,majority vote 通常需要針對同一個(gè) prompt 多次生成完整回答,再根據(jù)出現(xiàn)頻率選出最高票的答案。雖然這種方法在提升準(zhǔn)確率方面有效,但代價(jià)是成倍增加計(jì)算開銷,往往需要耗費(fèi)數(shù)倍的推理時(shí)間與資源。

而研究團(tuán)隊(duì)結(jié)合 dLLM 的迭代生成特性,提出了 Temporal Self-Consistency Voting (TCV) 方法。它不必額外生成多條回答,而是直接利用 dLLM 在去噪過程中每個(gè)時(shí)間步的中間結(jié)果,進(jìn)行一次「時(shí)間軸上的投票」來選出最終答案。考慮到 dLLM 在迭代去噪中理論上會(huì)逐漸趨于穩(wěn)定與確定,TCV 還為不同時(shí)間步的結(jié)果分配了不同權(quán)重,從而更精準(zhǔn)地捕捉最可靠的預(yù)測。

該方法的主要?jiǎng)?chuàng)新之處在于,它巧妙地將「多數(shù)投票」理念與 dLLM 的時(shí)間維度信息結(jié)合起來,實(shí)現(xiàn)了幾乎零額外計(jì)算成本的性能提升,同時(shí)充分挖掘了中間預(yù)測中的潛在價(jià)值。

Temporal Consistency Reinforcement:用時(shí)序一致性訓(xùn)練出更穩(wěn)的 dLLM

研究團(tuán)隊(duì)針對 dLLM 的中間預(yù)測結(jié)果,創(chuàng)造性地提出了 Temporal Semantic Entropy (TSE) 這一概念。TSE 通過計(jì)算模型在不同迭代步驟中預(yù)測結(jié)果的語義熵,來衡量生成過程中的一致性程度。直觀來說,熵越低,說明模型在迭代中越穩(wěn)定、越堅(jiān)定自己的選擇;熵越高,則意味著生成路徑搖擺不定、易于被干擾。

在實(shí)驗(yàn)分析中,他們發(fā)現(xiàn)了一些頗具規(guī)律性的現(xiàn)象:在相對簡單、模型準(zhǔn)確率較高的數(shù)據(jù)集(如 GSM8K 和 SVAMP)上,TSE 值普遍較低;而在同一個(gè)數(shù)據(jù)集中,模型答對的問題的 TSE 往往顯著低于答錯(cuò)的問題。這一發(fā)現(xiàn)表明,穩(wěn)定的生成路徑往往與更好的任務(wù)表現(xiàn)高度相關(guān)。

基于這一洞察,研究團(tuán)隊(duì)提出了 Temporal Consistency Reinforcement (TCR) 方法,將 TSE 直接作為獎(jiǎng)勵(lì)信號,引導(dǎo)模型在訓(xùn)練中主動(dòng)降低 TSE,從而提升生成路徑的穩(wěn)定性。進(jìn)一步地,他們還利用 scoring rule,將 TSE 與傳統(tǒng)的正確性獎(jiǎng)勵(lì)相結(jié)合,實(shí)現(xiàn)「雙重監(jiān)督」——既讓模型追求正確答案,又保持推理過程的一致性,最終訓(xùn)練出更穩(wěn)定、性能更優(yōu)的 dLLM。

實(shí)驗(yàn)結(jié)果

研究團(tuán)隊(duì)在三個(gè)主流數(shù)學(xué)推理數(shù)據(jù)集(GSM8K、MATH500、SVAMP)以及一個(gè)邏輯推理數(shù)據(jù)集(Countdown)上進(jìn)行了系統(tǒng)測試。結(jié)果顯示,Temporal Self-Consistency Voting 幾乎不增加額外計(jì)算成本,就能在多個(gè)數(shù)據(jù)集上穩(wěn)定帶來性能提升,驗(yàn)證了從中間迭代中挖掘信息的有效性。

與此同時(shí),Temporal Consistency Reinforcement 的表現(xiàn)同樣令人驚艷——僅僅利用 Temporal Semantic Entropy (TSE) 作為唯一獎(jiǎng)勵(lì)信號,就能在 Countdown 數(shù)據(jù)集上實(shí)現(xiàn) 24.7% 的顯著提升。更進(jìn)一步,當(dāng)將 TSE 與傳統(tǒng)的正確性獎(jiǎng)勵(lì)結(jié)合時(shí),不僅在 Countdown 上提升至 25.3%,在 GSM8K、MATH500、SVAMP 上也分別取得了 +2.0%、+4.3%、+6.6% 的絕對增幅,全面超越了僅依賴正確性獎(jiǎng)勵(lì)的效果。

訓(xùn)練后模型性質(zhì)分析

研究團(tuán)隊(duì)對訓(xùn)練后模型進(jìn)行分析發(fā)現(xiàn):模型生成更穩(wěn)定、輸出更簡潔。具體表現(xiàn)為:

  • 時(shí)間一致性提升:生成過程更穩(wěn),中間預(yù)測波動(dòng)減少;
  • 仍有提升空間:雖然表現(xiàn)更好,但模型在中間預(yù)測上仍有可優(yōu)化空間;
  • 輸出更精煉:有效 token 數(shù)下降,答案更簡短,可能也更不容易「自打臉」。

這表明,通過 Temporal Consistency Reinforcement,不僅讓模型跑得快,也更能穩(wěn)穩(wěn)抓住正確答案。

總結(jié)

總體來看,這項(xiàng)工作揭示了 dLLM 生成過程中的「先對后錯(cuò)」現(xiàn)象,并提出了兩種創(chuàng)新方法——Temporal Self-Consistency Voting 和 Temporal Consistency Reinforcement。它們利用中間預(yù)測的時(shí)間一致性和語義穩(wěn)定性,不僅顯著提升了模型在數(shù)學(xué)與邏輯推理任務(wù)上的表現(xiàn),也為未來挖掘 dLLM 潛力提供了全新的思路。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-10-14 08:58:00

2025-05-30 15:52:05

訓(xùn)練代碼推理

2017-10-09 16:51:34

機(jī)器學(xué)習(xí)No Free Lun

2024-03-14 09:57:35

華為模型

2025-11-03 08:40:00

2025-11-06 08:45:00

AI語言模型算法

2024-09-12 13:50:00

模型訓(xùn)練

2024-11-04 10:05:00

AI模型

2024-03-11 12:20:56

AI訓(xùn)練

2025-06-11 09:21:28

2025-05-28 03:30:00

AI人工智能大數(shù)據(jù)

2025-10-28 08:50:00

AI模型訓(xùn)練

2025-06-09 08:47:00

2025-02-18 13:00:00

2022-04-12 14:36:58

達(dá)摩院訓(xùn)練模型

2025-02-27 13:45:00

2025-03-17 11:35:36

LLaDALLM大型語言模型

2025-06-18 16:39:02

視頻生成AI模型

2025-06-04 08:35:00

2025-03-25 09:04:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲国产欧美日本视频| 久久高清内射无套| 波多野结衣中文在线| 国产精品一区二区三区四区| 久久影视电视剧免费网站清宫辞电视 | 成人午夜精品福利免费| 欧美涩涩网站| 国产偷国产偷亚洲清高网站 | 性伦欧美刺激片在线观看| 亚洲色图15p| 亚洲男人天堂2021| а√在线中文网新版地址在线| 久久久九九九九| 成人激情av在线| 日韩美女一级片| 日韩大片在线播放| 亚洲国产成人精品久久| 日日噜噜噜噜久久久精品毛片| 怡红院在线播放| 国产欧美日韩麻豆91| av成人免费观看| 羞羞色院91蜜桃| 红桃视频国产精品| 中文字幕在线看视频国产欧美| youjizz.com国产| 成人不卡视频| 亚洲超丰满肉感bbw| 一个色的综合| 青青青草原在线| 国产精品白丝jk黑袜喷水| 国产精品高潮在线| 日本三级免费看| 久久精品国产68国产精品亚洲| 亚洲国产天堂久久国产91| 国产日韩欧美久久| 色8久久影院午夜场| 亚洲图片欧美综合| 午夜在线视频免费观看| 成年在线电影| www国产精品av| 国产精品传媒毛片三区| 一级淫片免费看| 日本女人一区二区三区| 欧美国产日韩免费| 内射一区二区三区| 亚洲色图美女| 亚洲成人免费网站| 免费看91视频| 亚洲乱码一区| 7777精品伊人久久久大香线蕉 | 欧美一区二区三区白人| 天天干天天爽天天射| 亚洲黄色中文字幕| 精品久久香蕉国产线看观看gif| 99精品一级欧美片免费播放| 淫片在线观看| 中文字幕av不卡| 日本一区不卡| 黄上黄在线观看| 91在线看国产| 蜜桃视频日韩| 嫩草在线播放| 久久理论电影网| 欧美日韩一区二区三区在线观看免| 色婷婷视频在线| av网站一区二区三区| 国产伦一区二区三区色一情| 男人天堂网在线视频| 国产91丝袜在线播放0| 99久久伊人精品影院| 性欧美一区二区三区| 国产精品911| 成人av资源| 六月丁香综合网| zzijzzij亚洲日本少妇熟睡| 国产伦精品一区二区三区视频免费| 国模人体一区二区| 国产99久久久久| 国产一区在线观| 免费成人av电影| 国产精品美女www爽爽爽| 亚洲图片都市激情| www日韩tube| 91蜜桃网址入口| 日韩激情视频| 国产黄大片在线观看画质优化| 亚洲精品免费电影| 男女超爽视频免费播放| 日本综合字幕| 777久久久精品| 激情综合激情五月| 蜜桃国内精品久久久久软件9| 亚洲一区二区精品| 成人免费视频国产免费观看| 亚洲高清免费| 国产精品国语对白| 99热这里只有精品9| 菠萝蜜视频在线观看一区| 久久偷看各类wc女厕嘘嘘偷窃| 成人免费高清在线播放| 亚洲欧美偷拍三级| 久久精品欧美日韩| 五月天丁香综合久久国产| 日本三级在线视频| 亚洲国产日韩一区二区| 免费日韩视频在线观看| 成人黄色91| 亚洲国产精久久久久久久| 日本乱子伦xxxx| 在线观看免费一区二区| 88xx成人精品| 国产一区二区三区四区视频| 成人动漫一区二区| 亚洲成人精品电影在线观看| 精品日韩av| 欧洲中文字幕精品| 最新版天堂资源在线| 欧美一区二区性| 久久全球大尺度高清视频| 一级一级黄色片| 成人夜色视频网站在线观看| 亚洲精品人成| mm视频在线视频| 欧美日韩亚洲不卡| 亚洲天堂成人av| 亚洲国产精品日韩专区av有中文| 欧美最顶级丰满的aⅴ艳星| 国产日韩欧美一区二区东京热| 91视频免费观看| 777久久精品一区二区三区无码| 免费观看成人性生生活片 | 久久琪琪电影院| 一区二区三区精彩视频| 久久综合久色欧美综合狠狠| 日韩在线视频在线| 国产精品久久久久久久久免费高清 | 国产福利精品av综合导导航| www日本高清| 国产精品天干天干在观线| 1024av视频| 99精品在免费线中文字幕网站一区 | 亚洲美女福利视频网站| 久草视频在线资源| 精品一区二区三区在线视频| 水蜜桃一区二区三区| 天堂√8在线中文| 精品国产免费人成在线观看| 婷婷丁香综合网| 日韩一区精品字幕| 麻豆传媒一区| 在线中文字幕播放| 亚洲精品电影在线观看| 国产无码精品久久久| 国产成人在线观看免费网站| 法国空姐在线观看免费| 青草综合视频| 色诱女教师一区二区三区| 国产成人a v| 国产三级一区二区| 久久久久久久少妇| 国产一区二区三区探花| 日韩暖暖在线视频| 日本黄在线观看| 欧美日韩国产中文字幕 | 视频在线观看一区二区| 欧美激情一区二区三区免费观看 | 久久精品国产理论片免费| 国产色婷婷在线| 欧美精品一区二区三| 国产性生活网站| 成人永久免费视频| 极品粉嫩国产18尤物| 老司机aⅴ在线精品导航| 97人人模人人爽人人喊中文字| 无码h黄肉3d动漫在线观看| 婷婷丁香久久五月婷婷| 捆绑裸体绳奴bdsm亚洲| 国产深夜精品| 日本一区二区三区视频免费看| 成人视屏在线观看| 少妇精69xxtheporn| 国产乱淫片视频| 一区二区三区不卡在线观看| 亚洲av人人澡人人爽人人夜夜| 亚洲伦理精品| 欧洲av一区| 亚洲精品一区av| 色中色综合影院手机版在线观看| 二区三区在线视频| 欧美日韩亚洲一区二| 亚洲午夜精品久久久久久高潮| 久久精品av麻豆的观看方式| www国产免费| 图片婷婷一区| 国产欧美精品在线| 污视频网站在线免费| 亚洲精品日韩久久久| 91精品在线视频观看| 亚洲一区二区黄色| 久久福利小视频| 青青青伊人色综合久久| 九一免费在线观看| 精品人人人人| 91精品久久久久久久久青青| 欧美1234区| 亚洲人成在线一二| 国产v在线观看| 日韩欧美aaa| 婷婷色中文字幕| 久久人人97超碰com| 亚洲精品乱码久久久久久动漫| 国产精品普通话对白| 久久久国产精华液999999| 欧美理伦片在线播放| 成人免费在线视频网址| 国产精品一线二线三线| 亚洲免费成人av在线| 91日本在线视频| 三级中文字幕在线观看| 久久久成人av| 久青草国产在线| 欧美不卡在线视频| 中文字幕人成人乱码亚洲电影| 亚洲成人1区2区| 亚洲人做受高潮| 久久免费视频色| 亚洲精品激情视频| 黄色资源网久久资源365| 日韩av资源在线| 国产一区亚洲| 亚洲在线观看一区| 九九综合在线| 黄色小网站91| 精品国产一区二| 国产美女精彩久久| 成人私拍视频| 96精品视频在线| 青青草原国产在线| 久久国产精品久久久久久久久久 | 成人精品一区二区三区四区| 日本中文字幕二区| 日日夜夜免费精品| 日日橹狠狠爱欧美超碰| 亚洲国产网站| www成人免费| 欧美不卡一区| 2021狠狠干| 亚洲区综合中文字幕日日| 一本久道久久综合| 日韩一区二区在线免费| 日韩伦理一区二区三区av在线| 亚洲+变态+欧美+另类+精品| 精品一区二区三区自拍图片区| 91久久精品无嫩草影院| 97久久人人超碰caoprom欧美| 精品视频国内| 91久久爱成人| 91成人噜噜噜在线播放| a级国产乱理论片在线观看99| 精品视频91| 99三级在线| 都市激情亚洲| 精品国产乱码久久久久| 任你弄精品视频免费观看| 精品免费日产一区一区三区免费| 欧美三级自拍| 麻豆av一区二区三区久久| 国产一区二区在线| 性欧美.com| 一本一道久久a久久精品蜜桃| 午夜啪啪福利视频| 欧美日韩视频| 成年人网站免费视频| 国产精品美女| 韩国视频一区二区三区| 国产一区二区三区久久悠悠色av | 日本午夜精品久久久久| 91精品国产自产在线| 亚洲综合伊人| 国产精品二区二区三区| 国产成人夜色高潮福利影视| 久久精品国产99国产精品澳门| 91精品久久久久久| 亚洲一区二区在线视频观看| 国产美女www爽爽爽| a'aaa级片在线观看| 欧美精选一区二区三区| 成人午夜激情在线| 91久久精品网| …久久精品99久久香蕉国产| 日本人妻伦在线中文字幕| 精品人妻一区二区三区蜜桃视频| 亚洲人成无码www久久久| 国产一级在线观看视频| 国产超级va在线视频| 日韩在线视频一区二区三区| 国产精品亚洲欧美| 最新国产精品久久精品| 中文字幕亚洲字幕| 亚洲日本精品一区| 日本美女视频网站| 一级片视频播放| 欧美午夜网站| 国产美女视频91| 在线不卡欧美精品一区二区三区| 国产精品久久久久久久久久久久久| 免费黄色日本网站| 久久久久久久久影院| 精品中文视频| 中文字幕第一区综合| 天天躁日日躁狠狠躁av麻豆男男 | 精品一区二区无码| 欧美一级日韩免费不卡| 日韩毛片在线一区二区毛片| 精品国产一区二区三区久久狼黑人| 97在线超碰| 国产精品一区二区在线| 欧美一区二区三区红桃小说| 在线国产精品网| 亚洲专区免费| 韩国一区二区三区四区| 国产欧美日韩综合| 久久高清免费视频| 91麻豆精品久久久久蜜臀| 可以在线观看的av| 久久久久久久网站| 亚洲综合资源| 精品国产乱码久久久久久免费 | 欧美精品色视频| 色噜噜一区二区三区| 国产精品久久久久久麻豆一区软件 | 99香蕉久久| 久久色中文字幕| 国产精品福利片| 亚洲黄色三级视频| 1024成人| 在线日韩第一页| 国产区二区三区| 国精产品乱码一区一区三区四区| 久久国产精品免费精品3p| 国产精品卡一卡二卡三| 国产精品第一视频| 久久偷拍免费视频| 26uuu亚洲电影在线观看| 日韩成人一级片| 亚洲深夜福利视频| 一本一生久久a久久精品综合蜜| 国产孕妇孕交大片孕| 国产情侣一区| 日韩中文字幕在线| 中国极品少妇videossexhd| 国产伦理精品| 欧美高清在线视频| 3d动漫啪啪精品一区二区免费| 日韩精品久久久久久久酒店| 国产免费av一区二区三区| 天天操天天干天天综合网| 美女黄毛**国产精品啪啪| 日本一区二区三区久久| 成人自拍视频网| 无码av中文一区二区三区桃花岛| 欧美在线日韩精品| 深夜福利视频网站| 日本网站在线观看一区二区三区| 欧美日韩成人网| 97人妻精品一区二区免费| 外国电影一区二区| 亚洲欧美乱综合| 色综合视频二区偷拍在线| 人妻精品一区一区三区蜜桃91| 日日夜夜免费精品视频| 欧美激情第1页| 国产三级在线观看完整版| 亚洲视频国产| 欧美精品视频www在线观看 | 亚洲欧美一区二区精品久久久| 天天久久综合网| 日韩欧美精品一区二区综合视频| 日韩欧美亚洲国产一区| 黄网站色视频免费观看| 国产1区2区3区在线| 中文字幕精品—区二区四季| 无码播放一区二区三区| 天然素人一区二区视频| 亚洲国产综合在线| 日韩av片在线看| 国产精品诱惑| 在线观看91av| 这里只有精品在线观看视频 | 最新欧美人z0oozo0| 成年人性生活视频| 亚洲成av人片一区二区| 国产乱视频在线观看| 国产精品亚洲自拍| 午夜精品久久99蜜桃的功能介绍| a视频免费观看| 欧美精品久久一区| 欧美13videosex性极品| 在线精品亚洲一区二区| 99视频超级精品|