精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擴散模型獎勵微調新突破:Nabla-GFlowNet讓多樣性與效率兼得

人工智能 新聞
我們利用生成流網絡(GFlowNet)的框架,嚴謹地得到一個可以更好保持多樣性和先驗的高效的擴散模型獎勵微調方法,并且在 Stable Diffusion 這一常用的文生圖擴散模型上顯示出相較于其他方法的優勢。

本文作者劉圳是香港中文大學(深圳)數據科學學院的助理教授,肖鎮中是德國馬克思普朗克-智能系統研究所和圖賓根大學的博士生,劉威楊是德國馬克思普朗克-智能系統研究所的研究員,Yoshua Bengio 是蒙特利爾大學和加拿大 Mila 研究所的教授,張鼎懷是微軟研究院的研究員。此論文已收錄于 ICLR 2025。

在視覺生成領域,擴散模型(Diffusion Models)已經成為生成高質量圖像、視頻甚至文本的利器。然而,生成結果往往離我們所偏好的不一致:結果不美觀,圖文不符,等等。

雖然我們可以像大語言模型中的 RLHF(基于人類反饋的強化學習)一樣直接用傳統強化學習來微調擴散模型,但收斂速度往往慢;而基于可微計算圖直接最大化獎勵函數的方法又往往陷入過擬合和多樣性缺失的問題。

有沒有一種方法,既能保留生成樣本的多樣性,又能快速完成微調?我們基于生成流網絡(Generative Flow Network,GFlowNet)提出的 Nabla-GFlowNet 實現了這一速度和質量間的平衡。

圖片

圖片

利用 Nabla-GFlowNet 在 Aesthetic Score 獎勵函數(一個美學指標)上高效微調 Stable Diffusion 模型。

擴散過程的流平衡視角

圖片

生成流網絡 GFlowNet 示意圖。初始節點中的「流」通過向下游的轉移概率流經不同節點,最后匯聚到終端節點。每個終端節點所對應的流應匹配該終端節點對應的獎勵。

在生成流網絡(Generative Flow Network, GFlowNet)的框架下,擴散模型的生成過程可以視為一個「水流從源頭流向終點」的動態系統:

  • 從標準高斯分布采樣的噪聲圖像圖片作為初始狀態,其「流量」為圖片
  • 去噪過程圖片 如同分配水流的管道網絡,把每一個圖片節點的水流分配給下游每一個圖片節點;
  • 而加噪過程圖片則可以回溯每一個圖片的水流來自哪里;
  • 最終生成的圖像圖片將累積總流量圖片。

圖片

擴散模型示意圖

流梯度平衡條件

在 GFlowNet 框架下,前后向水流需要滿足一定的平衡條件。我們通過推導提出我們稱為 Nabla-DB 的平衡條件:

圖片

其中圖片是殘差去噪過程,圖片圖片分別是微調模型和預訓練模型的去噪過程。圖片是這個殘差過程對應的對數流函數。

這個殘差去噪過程應該滿足圖片,其中 β 控制微調模型在獎勵函數和預訓練模型之間的平衡。如果 β 為零,那么殘差過程為零,也就是微調網絡等于預訓練網絡。

稍作變換,就可以得到我們提出的 Nabla-GFlowNet 對應的損失函數 Residual Nabla-DB(其中 sg 為 stop-gradient 操作):

前向匹配損失:

圖片

后向匹配損失:

圖片

終端匹配損失:

圖片

對數流梯度參數化設計

上述損失函數需要用一個額外的網絡估計圖片,但我們觀察到:如果我們對圖片 做單步預測得到不準確的去噪結果圖片,那么圖片是一個很好的估計,其中圖片是一個權重常數。因此,我們提出如下參數化:

圖片

其中圖片是用 U-Net 參數化的殘差梯度,而單步去噪估計為圖片圖片是擴散模型ε-預測參數化的網絡)。

圖片

方法示意圖。每條采樣路徑的每個轉移對圖片中每張圖的上下兩個「力」需要相互平衡。

直觀解釋

如果我們只計算圖片這一轉移對的前向匹配損失對擴散模型參數的梯度,我們有:

圖片

其中第一項是基于內積的匹配度函數(殘差擴散模型與獎勵梯度估計之間的匹配),第二項是讓微調模型趨近于預訓練模型的正則化。

偽代碼實現

圖片

實驗結果

我們分別用以下獎勵函數微調 Stable Diffusion 網絡:

  • Aesthetic Score,一個在 Laion Aesthetic 數據集上訓練的美學評估獎勵函數;
  • HPSv2 和 ImageReward,衡量指令跟隨能力的獎勵函數。

定性實驗結果表明,通過 Nabla-GFlowNet 微調,我們可以快速得到獎勵更高但避免過擬合的生成圖像。

ReFL 和 DRaFT 等直接獎勵優化的方法雖然收斂速度快,但很快會陷入過擬合;而 DDPO 這一基于傳統策略梯度的強化學習微調方法由于沒有理由梯度信息,微調速度顯著劣于其他方法。

同時,我們的定量實驗表明,我們的 Nabla-GFlowNet 可以更好保持生成樣本的多樣性。

圖片

Aesthetic Score 獎勵函數上的微調結果(微調 200 步,取圖片質量不坍塌的最好模型)。Nabla-GFlowNet(對應 Residual Nabla-DB 損失函數)方法微調的網絡可以生成平均獎勵更高且不失自然的生成圖片。

圖片

相較于 ReFL,DRaFT 等直接獎勵優化的方法,Nabla-GFlowNet 更難陷入過擬合。

圖片

Aesthetic Score 獎勵函數上的定量結果 Nabla-GFlowNet 在獎勵收斂快的同時,保持更高的 DreamSim 多樣性指標(越高代表多樣性越好)和更低的 FID 分數(越低代表越符合預訓練模型的先驗)。

圖片

HPSv2 獎勵函數上的微調結果

圖片

ImageReward 獎勵函數上的微調結果

結語

我們利用生成流網絡(GFlowNet)的框架,嚴謹地得到一個可以更好保持多樣性和先驗的高效的擴散模型獎勵微調方法,并且在 Stable Diffusion 這一常用的文生圖擴散模型上顯示出相較于其他方法的優勢。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-08 06:00:00

2025-02-24 14:15:00

模型訓練AI

2009-12-22 09:56:36

2022-05-29 07:31:14

加密密碼數據安全

2025-09-28 09:02:00

2020-03-09 20:52:43

數據多模型數據庫數據庫

2013-08-22 13:44:30

Linux桌面GNOME桌面

2022-05-13 09:52:52

Google膚色研究開源

2020-08-11 23:19:08

人工智能生物多樣性A

2025-05-30 02:00:00

獎勵模型RRMAI

2015-07-13 13:35:01

2020-03-12 10:24:37

大數據技術人工智能

2014-04-16 13:24:42

2021-04-26 09:41:41

數字化

2025-03-14 09:59:54

2020-11-04 10:29:42

數據分析工作多樣性大數據

2014-07-08 09:14:54

Hadoop局限性

2021-03-12 10:06:58

人工智能機器學習技術
點贊
收藏

51CTO技術棧公眾號

亚洲在线观看网站| 九9re精品视频在线观看re6| 精品少妇一区二区三区密爱| 久久久久久久久成人| 亚洲国产精品久久久久婷婷884 | 4438全国成人免费| 国产18无套直看片| 91久久精品无嫩草影院| 日韩欧美主播在线| www.黄色网址.com| 日本一区高清| 国产一区二区免费在线| 青青草国产精品一区二区| 亚洲精品久久久久久国| 日韩欧美四区| 日韩一级高清毛片| 久久综合久久色| 18网站在线观看| 久久综合狠狠综合久久综合88 | www.爱爱.com| www.国产高清| 天堂√8在线中文| 综合色天天鬼久久鬼色| 国产综合欧美在线看| 亚洲一区二区激情| 亚洲在线日韩| 久久久久久久久久国产| 神马午夜精品91| 少妇精品久久久一区二区| 日韩欧美亚洲国产精品字幕久久久| 可以免费观看av毛片| 91视频欧美| 亚洲人成网站精品片在线观看| 日本电影一区二区三区| 手机福利在线| av在线播放一区二区三区| 91精品国产99久久久久久红楼| 欧美一级做a爰片免费视频| 在线一区免费观看| 久久免费视频网站| 国产在线视频二区| 日韩女同强女同hd| 日韩成人午夜| 亚洲第一免费播放区| 欧美国产日韩在线视频| 老司机精品视频网| 欧美体内she精视频| 国产日韩一区二区在线观看| 在线看片福利| 欧美性猛交xxxx久久久| 国产免费毛卡片| 中文在线免费二区三区| 调教+趴+乳夹+国产+精品| 黄色大片中文字幕| 久草在线资源站手机版| 婷婷成人激情在线网| 一区二区传媒有限公司| 男人天堂视频在线观看| 欧美性猛交xxx| 欧美精品一区二区三区免费播放| 色尼玛亚洲综合影院| 日本久久一区二区| 一区二区三区 日韩| 国产精品久久久久久久久久齐齐| 欧美日韩在线影院| 国产高清视频网站| 伊人久久精品| 欧美成人三级在线| 无码人妻精品一区二区三应用大全| 偷拍亚洲精品| 在线成人免费网站| 亚洲天堂一级片| 欧美日韩1区| 亚州成人av在线| 7799精品视频天天看| 美女视频黄 久久| 亚洲一区二区三区视频播放| 成人毛片视频免费看| 91丨九色丨国产丨porny| 日本一区二区高清视频| 男人影院在线观看| 亚洲午夜三级在线| 成人三级视频在线播放| 欧美成人福利| 精品久久99ma| 97人妻人人揉人人躁人人| 91九色精品| 久久人人爽人人| 日韩久久久久久久久久| 国产自产2019最新不卡| 精品乱码一区二区三区| 波多野结衣在线影院| 一区二区三区在线视频免费 | aa国产精品| 国产精品吴梦梦| 亚洲欧美另类一区| 国产情人综合久久777777| 麻豆中文字幕在线观看| 涩涩视频在线播放| 欧美日韩成人激情| 亚洲精品在线视频免费观看| 日韩毛片视频| 97久久精品人搡人人玩| 一级黄色片免费| av毛片久久久久**hd| 亚洲欧美在线网| av资源网在线播放| 538在线一区二区精品国产| 国产激情视频网站| 国产高清欧美| 日韩av大片免费看| 亚洲伦理在线观看| 国产精品久久久久影院亚瑟| 国内自拍在线观看| 精品一区二区三区在线观看视频| 亚洲欧美日韩高清| 日本少妇xxxx动漫| 国产一区二区三区精品视频| 天堂一区二区三区| 香蕉伊大人中文在线观看| 欧美一区二区三区四区五区 | 亚洲女性喷水在线观看一区| 日韩av播放器| 日本福利一区| 久久久久久久一| 国产精品无码久久久久成人app| 26uuu亚洲综合色| 成人黄色大片网站| 日本亚洲视频| 欧美xxxx做受欧美.88| 在线视频播放大全| 国产日韩欧美精品综合| 欧美日韩一道本| 国产毛片久久久| 欧美日韩999| 国产免费一区二区三区最新不卡 | 精品视频国内| zzjj国产精品一区二区| 成人一级免费视频| 久久午夜电影网| 欧美国产激情视频| 人体久久天天| 77777亚洲午夜久久多人| 亚洲国产精品18久久久久久| 亚洲美女屁股眼交3| 婷婷中文字幕在线观看| 91亚洲自偷观看高清| 国产精品久久久久福利| 成人欧美亚洲| 欧美性做爰猛烈叫床潮| 69精品无码成人久久久久久| 青青草国产成人av片免费| 日韩精品福利视频| 欧美精品高清| 最新69国产成人精品视频免费| 国产情侣免费视频| 国产精品国产a级| 欧美一级特黄aaa| 无需播放器亚洲| 97超级碰碰| 欧美男男video| 精品国产乱码久久久久久图片| 免费在线视频观看| 成人午夜免费av| 男女激情无遮挡| 中文精品一区二区| 国产精品一区二区三区在线播放 | 欧美岛国激情| 亚洲影影院av| 黄色在线网站噜噜噜| 日韩国产中文字幕| 日本黄色一级视频| 欧美国产日韩在线观看| 亚洲高清在线不卡| 在线看片一区| 日韩中文字幕av在线| 成人豆花视频| 国内外成人免费激情在线视频| 色在线免费视频| 欧美日韩一区三区四区| 欧美日韩三级在线观看| 91香蕉视频在线| 国产三级三级看三级| 女人色偷偷aa久久天堂| 久久久精彩视频| 亚洲高清影院| 97国产精品久久| 色开心亚洲综合| 精品国一区二区三区| 神马久久久久久久| 亚洲免费在线观看视频| 欧美黑人欧美精品刺激| 日本欧美加勒比视频| 男人添女人下部视频免费| 亚洲精品亚洲人成在线观看| 成人免费福利视频| 欧美三级网站| 久久久极品av| 男男激情在线| 精品久久久久久久久久久院品网 | 亚洲欧美国产精品| 99精品国产99久久久久久97| 精品美女久久久久久免费| 国产又粗又猛又爽又黄的视频四季| 国产成人精品免费| 一区二区三区入口| 亚洲人成在线影院| 少妇熟女一区二区| 深爱激情综合网| av在线亚洲男人的天堂| 另类一区二区| 日本高清+成人网在线观看| 怡红院红怡院欧美aⅴ怡春院| 亚洲人成五月天| 亚洲欧美激情在线观看| 欧美精品一卡二卡| 激情视频网站在线观看| 午夜在线成人av| www欧美com| 久久久不卡影院| 日批视频免费看| 九九精品视频在线看| 91黄色小网站| 红桃视频欧美| 国产高清免费在线| 日韩在线观看| 日韩欧美视频第二区| 欧美亚洲大陆| 极品日韩久久| 动漫av一区| 9a蜜桃久久久久久免费| 国产精品va视频| 国产精品久久9| 夜鲁夜鲁夜鲁视频在线播放| 欧美激情一区二区久久久| 黄色av网站在线播放| 有码中文亚洲精品| 国产一区二区三区福利| 日韩精品极品毛片系列视频| 欧美视频一二区| 精品国产99国产精品| 亚洲精品97久久中文字幕| 欧美一级淫片007| 一级黄色片在线播放| 欧美色综合网站| 丰满人妻一区二区三区四区| 欧美性猛交xxxx乱大交极品| 天堂中文在线网| 天天色综合天天| 国产免费观看av| 天天av天天翘天天综合网| 日本系列第一页| 天天操天天干天天综合网| 四虎成人永久免费视频| 日韩欧美亚洲综合| 欧美超碰在线观看| 欧美日韩一区二区三区四区 | 精品国产免费视频| 人妻无码一区二区三区久久99| 日韩欧美成人一区二区| 精品黑人一区二区三区在线观看| 538prom精品视频线放| 国产又粗又猛又爽又黄的视频一| 91精品国产丝袜白色高跟鞋| 97国产精品久久久| 日韩欧美国产小视频| 亚洲精品无码久久久| 精品sm捆绑视频| 人成免费电影一二三区在线观看| 亚洲欧美在线一区| 91在线视频免费看| 欧美成人免费全部观看天天性色| 少女频道在线观看高清 | 粉嫩在线一区二区三区视频| 成年人看片网站| 91热门视频在线观看| 日本少妇xxxxx| 亚洲色图视频网| 国产中文字幕免费| 色美美综合视频| 国产又大又黑又粗| 亚洲第一视频在线观看| 牛牛澡牛牛爽一区二区| 在线视频欧美日韩精品| gogogogo高清视频在线| 亚州精品天堂中文字幕| 成人午夜亚洲| 国产99视频精品免费视频36| 午夜精品福利影院| 99精品视频网站| 日韩午夜激情| 在线免费看污网站| 91在线小视频| 国产97免费视频| 色噜噜狠狠成人中文综合| 国产99999| 国产一区二区三区在线播放免费观看| av免费在线观| 国产精品入口尤物| 开心激情综合| 国产又粗又大又爽的视频| 亚洲一区二区三区四区五区午夜| 天堂中文av在线| 久久久综合精品| 久久久.www| 欧美日韩电影在线播放| 色视频在线观看免费| 欧美高清视频在线播放| 国产资源一区| 欧美国产视频在线观看| 激情自拍一区| 欧洲在线免费视频| 亚洲国产成人私人影院tom| 国产成人精品片| 日韩欧美高清dvd碟片| 五月天婷婷在线视频| 日本亚洲欧洲色| 欧洲亚洲成人| 18黄暴禁片在线观看| 国产一区二区久久| 欧美日韩生活片| 欧美专区日韩专区| 九色在线视频蝌蚪| 97成人超碰免| 欧美网色网址| 成人在线免费在线观看| 99久久99久久综合| 日韩精品久久久久久久| 欧美成人乱码一区二区三区| caopon在线免费视频| 成人网在线观看| 成人短视频在线| 国产欧美日韩亚州综合| 91麻豆免费视频网站| 欧美日韩高清一区二区三区| 川上优的av在线一区二区| 人人澡人人澡人人看欧美| 日韩av午夜| 无码人妻精品一区二区三区在线| 高清不卡在线观看av| 久久久久久久久久91| 日韩精品在线一区| 丝袜国产在线| 粉嫩精品一区二区三区在线观看| 欧美日韩1区| 香蕉视频污视频| 亚洲一区二区在线播放相泽| 性一交一乱一透一a级| 欧美国产亚洲精品久久久8v| 9国产精品午夜| www.av片| 久久婷婷国产综合国色天香| 综合网在线观看| 伊人久久久久久久久久久久久| 日韩制服一区| 伊人久久青草| 粉嫩高潮美女一区二区三区 | 激情小说欧美色图| 亚洲一卡二卡三卡四卡五卡| 婷婷在线观看视频| 91高清视频免费| 欧美丝袜激情| 91网址在线观看精品| 亚洲一区二区精品3399| 少妇性bbb搡bbb爽爽爽欧美| 国产97在线播放| 97国产精品| 无码国产69精品久久久久网站 | 在线播放亚洲精品| 欧美另类极品videosbestfree| av综合网页| 国产又黄又猛视频| 亚洲欧洲三级电影| 囯产精品一品二区三区| 日本亚洲欧洲色| 亚洲国产精品综合久久久 | 蜜臀久久99精品久久久酒店新书| 国产区在线观看成人精品| 国产探花精品一区二区| 1769国产精品| 婷婷精品进入| 这里只有精品在线观看视频| 欧美专区亚洲专区| av理论在线观看| 欧美另类高清视频在线| 国内精品伊人久久久久影院对白| 中文在线观看免费网站| 国产一级揄自揄精品视频| 一区二区视频| av在线无限看| 亚洲成人手机在线| 成人高潮成人免费观看| 成人欧美一区二区三区在线观看| 老司机午夜精品视频| 午夜写真片福利电影网| 日韩国产精品亚洲а∨天堂免| 国产aa精品| 欧美少妇性生活视频| 亚洲午夜在线电影| 免费在线午夜视频|