精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華、NVIDIA、斯坦福提出DiffusionNFT:基于前向過程的擴散強化學習新范式,訓練效率提升25倍

人工智能 新聞
DiffusionNFT 的提出,不僅為擴散模型的強化學習提供了一個高效、簡潔且理論完備的新框架,也對更廣泛的生成模型對齊研究具有啟發(fā)意義。

清華大學朱軍教授團隊, NVIDIA Deep Imagination 研究組與斯坦福 Stefano Ermon 團隊聯(lián)合提出了一種全新的擴散模型強化學習(RL)范式 ——Diffusion Negative-aware FineTuning (DiffusionNFT)。該方法首次突破現(xiàn)有 RL 對擴散模型的基本假設,直接在前向加噪過程(forward process)上進行優(yōu)化,在徹底擺脫似然估計與特定采樣器依賴的同時,顯著提升了訓練效率與生成質量。文章共同一作鄭凱文和陳華玉為清華大學計算機系博士生。

  • 論文標題:DiffusionNFT: Online Diffusion Reinforcement with Forward Process
  • 論文鏈接:https://arxiv.org/abs/2509.16117
  • 代碼倉庫:https://github.com/NVlabs/DiffusionNFT

背景 | 擴散模型的 RL 困境

近年來,強化學習在大語言模型(LLMs)后訓練中的巨大成功,催生了人們將類似方法遷移到擴散模型的探索。例如,F(xiàn)lowGRPO 等方法通過將擴散采樣過程離散化為多步?jīng)Q策問題,從而在反向過程上應用策略梯度優(yōu)化。然而,這一思路存在多重根本性局限:

1. 似然估計困難:自回歸模型的似然可精確計算,而擴散模型的似然只能以高開銷近似,導致 RL 優(yōu)化過程存在系統(tǒng)性偏差。

2. 前向–反向不一致:現(xiàn)有方法僅在反向去噪過程中施加優(yōu)化,沒有對擴散模型原生的前向加噪過程的一致性進行約束,模型在訓練后可能退化為與前向不一致的級聯(lián)高斯。

3. 采樣器受限:需要依賴特定的一階 SDE 采樣器,無法充分發(fā)揮 ODE 或高階求解器在效率與質量上的優(yōu)勢。

4.CFG 依賴與復雜性:現(xiàn)有 RL 方案在集成無分類器引導 (CFG) 時需要在訓練中對雙模型進行優(yōu)化,效率低下。

因此,如何設計一種既能保留擴散模型原生訓練框架,又能高效融入強化學習信號的統(tǒng)一方法,是亟待探索的問題。

方法 | 基于前向過程的負例感知微調

DiffusionNFT 提出了一個全新的思路:把強化學習直接作用于擴散的前向加噪過程,而非反向去噪軌跡。這一設計帶來了范式性的轉變。

核心機制包括:

正負對比的改進方向:在采樣生成中,利用獎勵信號將樣本劃分為正例與負例,從而定義出一個隱式的 “改進方向”。與只使用正樣本的拒絕采樣微調(Rejection FineTuning, RFT)不同,DiffusionNFT 顯式利用負樣本信號,確保模型有效 “避開” 低質量區(qū)域。

負例感知微調 (Negative-aware FineTuning, NFT):通過一種巧妙的隱式參數(shù)化方式,從目標模型同時定義正向策略與負向策略,將正負分布對比轉化為單一網(wǎng)絡的訓練目標,不需額外判別器或引導模型。

強化指導 (Reinforcement Guidance):在數(shù)學上,DiffusionNFT 將優(yōu)化目標刻畫為對舊策略分布的偏移量 ?,這一過程與 CFG 類似,但不依賴雙模型結構,而是內生于訓練目標中。

這樣的設計使 DiffusionNFT 同時滿足以下優(yōu)勢:

1. 前向一致性:訓練目標嚴格符合擴散的 Fokker–Planck 方程,不破壞與前向過程的一致性,使得訓練后的模型仍然是良定義的擴散模型。

2. 采樣器自由:訓練與采樣徹底解耦,可使用任意黑盒 ODE/SDE 求解器,擺脫對一階 SDE 的依賴;同時在訓練時只需存儲最終樣本與對應獎勵值,無需整條采樣軌跡。

3. 似然無關:不再需要變分下界或反向軌跡似然估計,訓練只依賴生成圖像與獎勵。

4.CFG-free 原生優(yōu)化:直接學習到獎勵引導的生成能力,避免 CFG 的推理開銷,同時仍可兼容 CFG 進一步提升性能。

實驗 | 高效性與生成質量

研究團隊在多個獎勵模型上驗證了 DiffusionNFT 的有效性。主要結果包括:

大幅效率提升:在 GenEval 任務上,DiffusionNFT 僅需 1k 步 即可將得分從 0.24 → 0.98,而 FlowGRPO 需超過 5k 步才能達到 0.95。整體上,DiffusionNFT 在不同任務上表現(xiàn)出 3×~25× 的訓練效率優(yōu)勢。

CFG-free 場景下顯著提升:即便完全不依賴 CFG,DiffusionNFT 也能在美感、對齊度等方面顯著優(yōu)于原始模型。

多獎勵聯(lián)合優(yōu)化:在 SD3.5-Medium 上同時優(yōu)化 GenEval、OCR、PickScore、ClipScore、HPSv2.1 等多種獎勵,最終模型在所有指標上均超越原始模型,與只針對單一獎勵進行優(yōu)化的 FlowGRPO 持平,并超過更大規(guī)模的 SD3.5-L 與 FLUX.1-Dev 模型。

展望 | 向統(tǒng)一的生成對齊范式邁進

DiffusionNFT 的提出,不僅為擴散模型的強化學習提供了一個高效、簡潔且理論完備的新框架,也對更廣泛的生成模型對齊研究具有啟發(fā)意義。從語言模型到視覺生成,DiffusionNFT 展示了負例感知 + 前向一致性普適價值。它打破了似然估計與反向軌跡的限制,建立起監(jiān)督學習與強化學習之間的橋梁。在未來,DiffusionNFT 有望推廣至多模態(tài)生成、視頻生成以及大模型對齊等更復雜場景,成為統(tǒng)一的生成優(yōu)化范式。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-11-03 14:13:52

強化學習方法

2023-11-13 07:51:58

ChatGPT研究

2025-04-25 13:34:53

R1DeepSeekAgent

2025-06-09 09:32:35

2025-06-30 09:08:00

2020-04-15 16:44:38

谷歌強化學習算法

2025-10-20 08:50:00

2025-07-02 09:21:30

2024-09-18 10:37:00

強化學習AI模型

2025-10-21 09:06:00

2022-10-20 15:38:02

谷歌模型

2018-12-03 09:35:26

互聯(lián)網(wǎng)

2025-10-10 08:33:49

2025-02-10 08:40:00

訓練數(shù)據(jù)模型

2025-06-27 10:10:43

AI模型技術

2022-11-02 14:02:02

強化學習訓練

2021-02-07 10:01:31

AI 數(shù)據(jù)人工智能

2025-08-21 09:10:00

2025-10-11 09:23:28

RLPT強化學習預訓練數(shù)據(jù)

2025-10-24 17:29:54

點贊
收藏

51CTO技術棧公眾號

三级网站免费看| 神马影院我不卡午夜| 九九九久久久久| 五月天亚洲一区| 日韩人在线观看| 四虎免费在线观看视频| 日本高清视频免费看| 日韩成人dvd| 欧美高清第一页| 亚洲永久精品ww.7491进入| 外国成人毛片| 午夜免费久久看| 一区二区三区四区五区视频| 日本精品一二区| 久久精品国产在热久久| 97久久精品人人澡人人爽缅北| 男女做爰猛烈刺激| 成人高潮a毛片免费观看网站| 欧美性大战久久久| 奇米精品一区二区三区| 国内精品久久久久国产| 91蜜桃网址入口| 91九色视频导航| 无码人妻精品一区二区50| 欧美另类综合| xxxxxxxxx欧美| 大乳护士喂奶hd| 精品久久亚洲| 欧美精品在线视频| 精品一卡二卡三卡| 99爱在线观看| 一区二区在线观看av| 亚洲精品中文综合第一页| 亚洲人成色777777精品音频| 国产成人啪午夜精品网站男同| 国产精品欧美日韩久久| 天天干天天色综合| 亚洲一区二区三区免费在线观看| 欧美日韩国产二区| 国产免费美女视频| 日韩电影二区| 一区二区三区四区在线观看视频| 性欧美丰满熟妇xxxx性久久久| 欧美影院在线| 欧美一区二区性放荡片| 99一区二区| 亚洲欧洲av另类| 欧美精品成人一区二区在线观看| 亚洲第一成人av| 国产美女视频91| 国产综合久久久久久| 波多野结衣不卡| 午夜在线播放视频欧美| 91国产精品电影| 日本少妇性生活| 亚洲性感美女99在线| 美日韩精品免费视频| 国产大片免费看| 婷婷亚洲综合| 欧美xxxx14xxxxx性爽| 在线观看美女av| 中文字幕免费一区二区| 欧美成人一区二区三区电影| 97成人资源站| 国产一区二区三区自拍| 久久久久亚洲精品| 欧美亚韩一区二区三区| 国产日韩高清一区二区三区在线| 2025国产精品视频| 亚洲 国产 日韩 欧美| 免费欧美在线视频| 成人性生交大片免费看小说 | 一区三区视频| 97在线观看视频国产| 五月婷婷开心网| 美女久久一区| 国产精品永久在线| 99精品久久久久久中文字幕| 高清成人在线观看| 久久爱av电影| www.av在线| 亚洲色图在线播放| 国产手机免费视频| 日韩毛片免费观看| 欧美日韩不卡视频| 9191在线视频| 亚洲自拍电影| 最近中文字幕2019免费| 1024手机在线视频| 亚洲综合精品| 国产日韩欧美成人| 黑人精品一区二区| 久久精品人人做人人爽97| 自拍视频一区二区三区| 福利在线导航136| 在线观看av一区二区| 成人不卡免费视频| 久久久免费毛片| 伊人久久久久久久久久久久久| 国产wwwwxxxx| 99伊人成综合| 国产有码在线一区二区视频| 国产成人三级一区二区在线观看一| 99在线热播精品免费| 日韩免费看网站| 成人av播放| 美州a亚洲一视本频v色道| 国产精品伦理一区二区| 久久这里只有精品18| 日韩av一级| 亚洲电影在线观看| 国产日产在线观看| 99精品热6080yy久久| 91精品国产综合久久久久久久久 | 欧美一级高清大全免费观看| 久久精品综合视频| 中文字幕一区二区三区欧美日韩 | 综合网在线观看| 国模少妇一区二区三区 | 香港欧美日韩三级黄色一级电影网站| 精品一二三四区| 成人av片网址| 激情在线小视频| 色综合中文字幕| 欧美日韩一区二区三区四区五区六区| 日韩精品一区二区久久| 欧美一区二区色| 亚洲黄色精品视频| 亚洲色图19p| 欧美大尺度做爰床戏| 亚洲aaa级| 国产+人+亚洲| 亚洲成人一二三区| 亚洲靠逼com| 免费av不卡在线| 国产欧美高清视频在线| 欧洲成人免费视频| 亚洲aaaaaaa| 亚洲国产精品嫩草影院| 韩国三级在线播放| 亚洲蜜桃视频| 91天堂在线视频| 麻豆网站在线| 欧美老年两性高潮| 国产精品视频在| 米奇777在线欧美播放| 国产综合av一区二区三区| 性欧美videos高清hd4k| 日韩视频永久免费| 精品爆乳一区二区三区无码av| 国产精品影视在线| 91传媒免费视频| 综合激情网...| 国内精品400部情侣激情| 亚洲乱码在线观看| 亚洲已满18点击进入久久| 男插女视频网站| 午夜精品免费| 国产麻豆乱码精品一区二区三区| 国产精品一品| 日韩av一区二区在线| 国产香蕉视频在线| 久久久久久久久99精品| 亚洲一区二区蜜桃| 日韩理论片av| 91精品久久久久久蜜桃| 国产探花在线观看| 亚洲国产日韩欧美综合久久| 激情五月色婷婷| 26uuu亚洲综合色| 青青在线视频免费| 欧美aaaa视频| 不卡视频一区二区三区| caoporn视频在线| 日韩精品在线观看视频| 在线永久看片免费的视频| 国产精品丝袜久久久久久app| 三日本三级少妇三级99| 激情久久一区| 色噜噜狠狠一区二区三区| 四虎影视国产精品| 色综合久久中文字幕综合网小说| 四季av日韩精品一区| 在线看日韩精品电影| 91精品国产闺蜜国产在线闺蜜| 成人不卡免费av| 精品久久久噜噜噜噜久久图片 | 精品一区91| 97视频在线观看视频免费视频 | 韩国成人av| 在线观看特色大片免费视频| 中文字幕不卡av| 国产福利小视频| 日韩欧美第一页| 午夜精品福利在线视频| 99国产欧美久久久精品| 污视频网站观看| 在线日本成人| 亚洲综合网中心| 欧美一级一片| 亚洲国产精品成人久久综合一区| 激情五月宗合网| 98精品视频| 久久伊人一区二区| 成人久久精品| 日本精品性网站在线观看| 黄网站在线免费看| 亚洲精品自在久久| 亚洲a视频在线观看| 欧美伊人久久大香线蕉综合69| 国产在线综合网| 中文字幕在线一区二区三区| 在线观看av中文字幕| 国内精品不卡在线| 日韩免费高清在线| 宅男噜噜噜66一区二区| 喜爱夜蒲2在线| 人人狠狠综合久久亚洲婷婷| 鬼打鬼之黄金道士1992林正英| 国产日本久久| 日本精品久久久久久久| 黄色美女视频在线观看| 日韩色av导航| 成年人视频免费在线观看| 日韩av综合中文字幕| 国产激情久久久久久熟女老人av| 欧美探花视频资源| 国产成人无码专区| 欧美日韩精品中文字幕| 欧美日韩一级大片| 亚洲欧美国产三级| 女同久久另类69精品国产| 久久色在线视频| 香港三日本8a三级少妇三级99| 国产一区二区三区在线观看免费| 欧美 日韩 国产 激情| 亚洲欧美日韩视频二区| 日日鲁鲁鲁夜夜爽爽狠狠视频97 | 日本在线观看天堂男亚洲| 99在线视频影院| 欧美激情在线播放| 欧美卡一卡二| 欧美激情一区二区三区在线视频观看| 青青青国内视频在线观看软件| 美日韩在线视频| 日本一本在线免费福利| 色综合久久久久久中文网| 欧美日韩经典丝袜| 性欧美亚洲xxxx乳在线观看| 不卡视频观看| 69影院欧美专区视频| 日韩av影片| 国产精品91久久久| 搜成人激情视频| 国产精品综合不卡av| **日韩最新| 99精彩视频| 久久香蕉精品香蕉| 久久综合给合久久狠狠色| 蜜桃一区二区| 亚洲二区自拍| 久久久久久久久久久妇女 | 极品尤物一区二区三区| 伦理一区二区三区| 欧美精品成人一区二区在线观看| 精品国产乱码久久久| 一区二区三区在线视频看| 重囗味另类老妇506070| 韩日视频在线观看| 国产精品一区毛片| 男女无套免费视频网站动漫| 精品一区免费av| 国内自拍偷拍视频| 91香蕉国产在线观看软件| 91激情视频在线观看| 亚洲人被黑人高潮完整版| 国产精品theporn动漫| 欧美性生交大片免网| 中文字幕在线播放av| 日韩欧美一区二区在线视频| 人妻一区二区三区| 亚洲视频综合网| 蜜芽在线免费观看| 国内成人精品一区| av成人亚洲| 大波视频国产精品久久| 欧美天堂社区| 亚洲在线视频一区二区| 亚洲国内欧美| 三级在线视频观看| 国产福利91精品一区二区三区| 中文在线永久免费观看| 国产精品欧美一区喷水| 国产无套在线观看| 精品视频全国免费看| 日本人妻丰满熟妇久久久久久| 国产一区二区欧美日韩| 污污的网站在线看| 国产精品久久久久久一区二区 | 精品一区二区国语对白| 三级视频网站在线观看| 中文字幕av在线一区二区三区| 久久精品免费av| 欧美日韩一区二区在线观看视频 | 深夜成人在线观看| 日韩激情av| 国产精品在线看| 同性恋视频一区| 欧美黄色免费网址| 久久精品理论片| 人妻少妇一区二区| 亚洲线精品一区二区三区八戒| 九九热最新视频| 日韩成人中文字幕| 精品精品导航| 91久久久精品| 久久国产成人精品| 熟女人妇 成熟妇女系列视频| 不卡av在线网| 欧美黄色免费观看| 88在线观看91蜜桃国自产| 国产黄色免费在线观看| 欧美亚洲在线视频| 都市激情亚洲| 国产精品视频网站在线观看 | 亚洲天堂av网站| 亚洲欧美日韩国产中文在线| 久久久久久久久久一级| 亚洲美女久久久| 深夜在线视频| 精品国产综合久久| 日韩一级网站| 好吊色视频一区二区三区| 亚洲一区二区三区影院| 亚洲国产av一区二区| 欧美大奶子在线| 精品一区二区三区亚洲| 中文字幕在线中文字幕日亚韩一区| 日本成人中文字幕| 欧美激情视频二区| 91成人免费网站| 国产黄色免费在线观看| 国产成人亚洲综合青青| 国产精品免费不| 丝袜老师办公室里做好紧好爽| proumb性欧美在线观看| 日韩成人免费在线观看| 亚洲电影免费观看| av美女在线观看| 久中文字幕一区| 日韩成人av影视| 2014亚洲天堂| 欧美不卡一二三| 超碰在线公开| 欧美中文娱乐网| 日韩国产一区二| а天堂中文在线资源| 69堂成人精品免费视频| 最新国产露脸在线观看| 成人黄动漫网站免费| 亚洲成人直播| 中文字幕狠狠干| 欧美午夜宅男影院| 久操视频在线观看| 痴汉一区二区三区| 美女精品网站| 欧美性受xxxx黑人| 日韩视频一区二区三区在线播放| 不卡的av影片| 青青草久久网络| 久久99热国产| 日本熟妇毛茸茸丰满| 亚洲人成网站777色婷婷| 日本精品久久| 免费人成自慰网站| 久久免费美女视频| 91资源在线视频| 国外色69视频在线观看| 国产一区二区在线| 深爱五月综合网| 色综合中文综合网| 成年人网站在线| 久久久久久久免费| 精品在线播放午夜| 日韩精品在线免费视频| 色综合影院在线| 高潮按摩久久久久久av免费| 免费看a级黄色片| 亚洲精品中文字幕在线观看| 日韩偷拍自拍| 91久久综合亚洲鲁鲁五月天| 亚洲深夜福利| 最新一区二区三区| 亚洲天堂一区二区三区| 最新精品在线| 中文字幕av不卡在线| 亚洲成av人片在线观看| 免费av不卡| 青娱乐国产91| 99热99精品|