精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

圖像領域再次與LLM一拍即合!idea撞車OpenAI強化微調,西湖大學發布圖像鏈CoT

人工智能
MAPLE實驗室提出通過強化學習優化圖像生成模型的去噪過程,使其能以更少的步驟生成高質量圖像,在多個圖像生成模型上實現了減少推理步驟,還能提高圖像質量。

OpenAI最近推出了在大語言模型LLM上的強化微調(Reinforcement Finetuning,ReFT),能夠讓模型利用CoT進行多步推理之后,通過強化學習讓最終輸出符合人類偏好。

無獨有偶,齊國君教授領導的MAPLE實驗室在OpenAI發布會一周前公布的工作中也發現了圖像生成領域的主打方法擴散模型和流模型中也存在類似的過程:模型從高斯噪聲開始的多步去噪過程也類似一個思維鏈,逐步「思考」怎樣生成一張高質量圖像,是一種圖像生成領域的「圖像鏈CoT」。

與OpenAI不謀而和的是,機器學習與感知(MAPLE)實驗室認為強化學習微調方法同樣可以用于優化多步去噪的圖像生成過程,論文指出利用與人類獎勵對齊的強化學習監督訓練,能夠讓擴散模型和流匹配模型自適應地調整推理過程中噪聲強度,用更少的步數生成高質量圖像內容。

圖片圖片

論文地址:https://arxiv.org/abs/2412.01243

研究背景

擴散和流匹配模型是當前主流的圖像生成模型,從標準高斯分布中采樣的噪聲逐步變換為一張高質量圖像。在訓練時,這些模型會單獨監督每一個去噪步驟,使其具備能恢復原始圖像的能力;而在實際推理時,模型則會事先指定若干個不同的擴散時間,然后在這些時間上依次執行多步去噪過程。

這一過程存在兩個問題:

1. 經典的擴散模型訓練方法只能保證每一步去噪能盡可能恢復出原始圖像,不能保證整個去噪過程得到的圖像符合人類的偏好;

2. 經典的擴散模型所有的圖片都采用了同樣的去噪策略和步數;而顯然不同復雜度的圖像對于人類來說生成難度是不一樣的。

如下圖所示,當輸入不同長度的prompt的時候,對應的生成任務難度自然有所區別。那些僅包含簡單的單個主體前景的圖像較為簡單,只需要少量幾步就能生成不錯的效果,而帶有精細細節的圖像則需要更多步數,即經過強化微調訓練后的圖像生成模型就能自適應地推理模型去噪過程,用盡可能少的步數生成更高質量的圖像。

圖片

值得注意的是,類似于LLM對思維鏈進行的動態優化,對擴散模型時間進行優化的時候也需要動態地進行,而非僅僅依據輸入的prompt;換言之,優化過程需要根據推理過程生成的「圖像鏈」來動態一步步預測圖像鏈下一步的最優去噪時間,從而保證圖像的生成質量滿足reward指標。

方法

MAPLE實驗室認為,要想讓模型在推理時用更少的步數生成更高質量的圖像結果,需要用強化微調技術對多步去噪過程進行整體監督訓練。既然圖像生成過程同樣也類似于LLM中的CoT:模型通過中間的去噪步驟「思考」生成圖像的內容,并在最后一個去噪步驟給出高質量的結果,也可以通過利用獎勵模型評價整個過程生成的圖像質量,通過強化微調使模型的輸出更符合人類偏好。

圖片圖片

OpenAI的O1通過在輸出最終結果之前生成額外的token讓LLM能進行額外的思考和推理,模型所需要做的最基本的決策是生成下一個token;而擴散和流匹配模型的「思考」過程則是在生成最終圖像前,在不同噪聲強度對應的擴散時間(diffusion time)執行多個額外的去噪步驟。為此,模型需要知道額外的「思考」步驟應該在反向擴散過程推進到哪一個diffusion time的時候進行。

為了實現這一目的,在網絡中引入了一個即插即用的時間預測模塊(Time Prediction Module, TPM)。這一模塊會預測在當前這一個去噪步驟執行完畢之后,模型應當在哪一個diffusion time下進行下一步去噪。

具體而言,該模塊會同時取出去噪網絡第一層和最后一層的圖像特征,預測下一個去噪步驟時的噪聲強度會下降多少。模型的輸出策略是一個參數化的beta分布。

由于單峰的Beta分布要求α>1且β>1,研究人員對輸出進行了重參數化,使其預測兩個實數a和b,并通過如下公式確定對應的Beta分布,并采樣下一步的擴散時間。

圖片圖片

圖片圖片

在強化微調的訓練過程中,模型會在每一步按輸出的Beta分布隨機采樣下一個擴散時間,并在對應時間執行下一個去噪步驟。直到擴散時間非常接近0時,可以認為此時模型已經可以近乎得到了干凈圖像,便終止去噪過程并輸出最終圖像結果。

通過上述過程,即可采樣到用于強化微調訓練的一個決策軌跡樣本。而在推理過程中,模型會在每一個去噪步驟輸出的Beta分布中直接采樣眾數作為下一步對應的擴散時間,以確保一個確定性的推理策略。

設計獎勵函數時,為了鼓勵模型用更少的步數生成高質量圖像,在獎勵中綜合考慮了生成圖像質量和去噪步數這兩個因素,研究人員選用了與人類偏好對齊的圖像評分模型ImageReward(IR)用以評價圖像質量,并將這一獎勵隨步數衰減至之前的去噪結果,并取平均作為整個去噪過程的獎勵。這樣,生成所用的步數越多,最終獎勵就越低。模型會在保持圖像質量的前提下,盡可能地減少生成步數。

圖片圖片

將整個多步去噪過程當作一個動作進行整體優化,并采用了無需值模型的強化學習優化算法RLOO [1]更新TPM模塊參數,訓練損失如下所示:

圖片圖片

在這一公式中,s代表強化學習中的狀態,在擴散模型的強化微調中是輸入的文本提詞和初始噪聲;y代表決策動作,也即模型采樣的擴散時間;

代表決策器,即網絡中A是由獎勵歸一化之后的優勢函數,采用LEAVE-One-Out策略,基于一個Batch內的樣本間獎勵的差值計算優勢函數。

通過強化微調訓練,模型能根據輸入圖像自適應地調節擴散時間的衰減速度,在面對不同的生成任務時推理不同數量的去噪步數。對于簡單的生成任務(較短的文本提詞、生成圖像物體少),推理過程能夠很快生成高質量的圖像,噪聲強度衰減較快,模型只需要思考較少的額外步數,就能得到滿意的結果;對于復雜的生成任務(長文本提詞,圖像結構復雜)則需要在擴散時間上密集地進行多步思考,用一個較長的圖像鏈COT來生成符合用戶要求的圖片。

圖片圖片

通過調節不同的γ值,模型能在圖像生成質量和去噪推理的步數之間取得更好的平衡,僅需要更少的平均步數就能達到與原模型相同的性能。

圖片圖片

同時,強化微調的訓練效率也十分驚人。正如OpenAI最少僅僅用幾十個例子就能讓LLM學會在自定義領域中推理一樣,強化微調圖像生成模型對數據的需求也很少。不需要真實圖像,只需要文本提詞就可以訓練,利用不到10,000條文本提詞就能取得不錯的明顯的模型提升。

經強化微調后,模型的圖像生成質量也比原模型提高了很多。可以看出,在僅僅用了原模型一半生成步數的情況下,無論是圖C中的筆記本鍵盤,圖D中的球棒還是圖F中的遙控器,該模型生成的結果都比原模型更加自然。

圖片圖片

針對Stable Diffusion 3、Flux-dev等一系列最先進的開源圖像生成模型進行了強化微調訓練,發現訓練后的模型普遍能減少平均約50%的模型推理步數,而圖像質量評價指標總體保持不變,這說明對于圖像生成模型而言,強化微調訓練是一種通用的后訓練(Post Training)方法。

圖片圖片

結論

這篇報告介紹了由MAPLE實驗室提出的,一種擴散和流匹配模型的強化微調方法。該方法將多步去噪的圖像生成過程看作圖像生成領域的COT過程,通過將整個去噪過程的最終輸出與人類偏好對齊,實現了用更少的推理步數生成更高質量圖像。

在多個開源圖像生成模型上的實驗結果表明,這種強化微調方法能在保持圖像質量的同時顯著減少約50%推理步數,微調后模型生成的圖像在視覺效果上也更加自然。可以看出,強化微調技術在圖像生成模型中仍有進一步應用和提升的潛力,值得進一步挖掘。

參考資料:

https://arxiv.org/abs/2412.01243

責任編輯:武曉燕 來源: 新智元
相關推薦

2011-12-21 09:18:52

云計算開源

2013-08-20 09:31:48

2012-03-19 14:00:06

HP M275激光打印機

2020-07-02 13:10:49

PyWeChatSpy拍一拍Python

2021-10-11 20:19:16

AI

2020-06-22 10:40:35

Python微信技術

2016-04-13 20:37:42

EasyStack

2020-09-15 16:05:01

QQ微信移動應用

2023-03-22 14:05:00

微軟AI

2017-12-13 17:00:14

2020-08-28 09:15:36

微信拍一拍移動應用

2020-08-21 17:39:15

微信拍一拍移動應用

2024-10-24 23:37:33

2021-01-14 10:58:03

Python表情包微信

2020-06-18 15:45:42

微信拍一拍功能

2025-06-10 05:00:00

2025-08-29 07:47:54

2020-06-19 14:55:10

微信拍一拍社交

2023-11-08 07:55:48

2025-06-03 08:28:00

點贊
收藏

51CTO技術棧公眾號

中日韩免费视频中文字幕| 欧美日韩国产一区精品一区| 精品视频免费看| 一区二区三区午夜视频| 国精一区二区| 欧美亚州韩日在线看免费版国语版| 亚洲乱码一区二区三区| 亚洲av永久纯肉无码精品动漫| 亚洲一级淫片| 亚洲跨种族黑人xxx| 国产黑丝在线视频| 亚洲黄色免费看| 亚洲久草在线视频| 日韩激情久久| 人妻中文字幕一区| 精品亚洲国内自在自线福利| 欧美一乱一性一交一视频| 国产女人18水真多毛片18精品| 亚洲宅男一区| 精品美女在线播放| 午夜剧场在线免费观看| 英国三级经典在线观看| 一区二区国产视频| 中文字幕一区二区中文字幕| 欧美视频综合| 成人一区二区三区在线观看| 成人欧美一区二区三区黑人孕妇 | 国产精品99蜜臀久久不卡二区| 免费在线观看h片| 成人久久一区| 亚洲日韩欧美视频| 人妻丰满熟妇aⅴ无码| 91欧美极品| 欧美一区二区免费观在线| 青青草精品视频在线观看| 小视频免费在线观看| 亚洲一级二级在线| 成人免费高清视频在线观看| 好吊妞国产欧美日韩免费观看网站 | 国产精品x8x8一区二区| 3d动漫精品啪啪1区2区免费 | 青青草免费av| 久久精品青草| xvideos成人免费中文版| 久久亚洲无码视频| 国产成人精品免费视| 日韩av中文字幕在线| 国产精品一区二区人妻喷水| 成人av综合网| 精品电影一区二区| 国内精品免费视频| 国产suv精品一区| 亚洲国产精品人久久电影| 中国特级黄色大片| 精品视频在线你懂得| 欧美一级电影网站| 国产91精品最新在线播放| 国产精品丝袜一区二区| 91精品一区二区三区综合在线爱| 中文字幕亚洲情99在线| 国产三级短视频| 久久精品国产亚洲夜色av网站 | 日本中文字幕在线视频| 国产精品福利一区二区三区| 正在播放一区| 亚洲大胆人体大胆做受1| 一区二区三区资源| 精品无码一区二区三区爱欲| 日韩伦理在线一区| 色婷婷综合视频在线观看| 亚洲免费av一区二区三区| 亚洲男人在线| 精品国产伦一区二区三区免费| 亚洲精品乱码久久| 国产亚洲一区| 久久夜精品香蕉| 国产一级视频在线播放| 国产精品亚洲产品| 国产精品久久久久av| 国产婷婷在线视频| 96av麻豆蜜桃一区二区| 日韩av免费电影| 免费av在线网址| 亚洲成人激情自拍| 国产成人黄色网址| 日韩高清一区| 亚洲人成网站在线播| 久久久久久久麻豆| 国产日韩亚洲欧美精品| 国产欧美精品一区二区三区介绍| 性做久久久久久久| 久久久久88色偷偷免费| 国产日韩欧美大片| 在线免费日韩片| 欧美一区日韩一区| 成人精品999| 国产一区观看| 国产日韩欧美一二三区| 欧美 日韩 人妻 高清 中文| 国产精品剧情在线亚洲| 国产美女主播在线播放| 祥仔av免费一区二区三区四区| 精品欧美乱码久久久久久1区2区| 中文字幕网站在线观看| 亚洲一级影院| 91精品久久久久久久久久久| 婷婷国产在线| 日韩在线观看视频网站| 欧美视频久久| 国产精品v片在线观看不卡| 国产绳艺sm调教室论坛| 久久久国产午夜精品| av一区二区三区免费观看| 成人国产精品入口免费视频| 亚洲精品v欧美精品v日韩精品| 女教师淫辱の教室蜜臀av软件| 亚洲激情二区| 91天堂在线观看| 成人在线免费观看| 狠狠久久五月精品中文字幕| 老司机av网站| 亚洲国产一区二区三区在线播放| 日本视频久久久| 日本黄色三级视频| 亚洲乱码日产精品bd| 久久久久久久久久久久91| 免费精品国产的网站免费观看| 欧美第一黄色网| 国产日韩欧美中文字幕| 中文字幕一区日韩精品欧美| 免费观看成人在线视频| 国产精品巨作av| 九九热精品在线| 99久久精品国产一区二区成人| 国产精品成人网| 色婷婷成人在线| 精品久久影视| 国产精品免费一区二区三区都可以| 日韩资源在线| 一本在线高清不卡dvd| 国产精品伦子伦| 99精品国产福利在线观看免费 | 国产精品久久久午夜夜伦鲁鲁| 久久九九99视频| 欧美激情国产精品日韩| 色婷婷综合久久久久久| 91高清免费在线观看| 香蕉久久一区二区三区| 狠狠爱在线视频一区| xxx在线播放| 石原莉奈一区二区三区在线观看 | 欧美日韩一区二区三区四区五区六区| 亚洲人成免费网站| 亚洲xxx视频| 丁香花视频在线观看| 亚洲激情自拍图| 99久久精品国产亚洲| 久久久久久久免费视频了| 国产xxxxx视频| 91一区二区| 亚洲aⅴ日韩av电影在线观看| av免费在线观| 精品日韩一区二区| www.国产com| 欧美国产亚洲另类动漫| 在线视频观看91| 狠狠88综合久久久久综合网| 国产精品免费区二区三区观看| missav|免费高清av在线看| 亚洲欧美日韩国产精品| 亚洲天堂手机版| 亚洲精品国产第一综合99久久| 稀缺呦国内精品呦| 香蕉国产精品偷在线观看不卡| 日本一区二区三区视频在线播放 | 欧美精品一区二区三区久久久| 国产性xxxx高清| 欧美激情综合五月色丁香小说| 亚洲日本黄色片| 亚洲小说区图片区| 欧美一区1区三区3区公司| 一区二区三区日本视频| 97免费在线视频| 在线观看黄av| 欧美精品一区男女天堂| 在线中文字幕网站| 午夜伊人狠狠久久| 无码人妻精品一区二区中文| 国产剧情一区二区三区| www.久久久久久.com| 亚洲欧洲在线观看| 樱花草www在线| 亚洲国产三级| 四虎影院一区二区三区| 亚洲一区二区三区日本久久九| 欧美亚洲另类制服自拍| av在线影院| 亚洲欧洲国产伦综合| 一区两区小视频| 日本福利片高清在线观看| 手机福利小视频在线播放| 黄色毛片在线看| 黄色成人91| 精品日产一区2区三区黄免费 | 国产91精品对白在线播放| 欧美日韩欧美一区二区| 成年人在线观看av| 国产一区999| 国产无套粉嫩白浆内谢的出处| 欧美日本一区二区高清播放视频| 欧美理论一区二区| 波多野结衣欧美| 国产精品一二三在线| 欧美办公室脚交xxxx| 操日韩av在线电影| 在线观看av的网站| 亚洲精品午夜精品| 全国男人的天堂网| 日韩免费高清av| 91久久国语露脸精品国产高跟| 午夜一区二区三区视频| www青青草原| 亚洲欧美欧美一区二区三区| 2019男人天堂| 久久精品一区二区三区av| 欧美大喷水吹潮合集在线观看| 国产精品自在在线| 99国产精品久久久久久| 蜜桃在线一区二区三区| 国产淫片av片久久久久久| 日韩午夜激情| 99在线精品免费视频| 欧美涩涩网站| 日韩精品久久一区二区| 欧美黄色免费| 亚洲精品国产suv一区88| 亚洲成人精选| 欧美另类videos| 欧美国产另类| 国产精品三级一区二区| 你懂的一区二区| 丰满人妻一区二区三区53号| 欧美成人日本| 日韩一级性生活片| 夜夜嗨一区二区三区| 精品久久久久久无码中文野结衣| 激情综合网址| 阿v天堂2017| 国产精品毛片在线| 成人精品视频一区二区| 欧美a级理论片| 亚洲视频一二三四| 国产精品1024| 最新国产精品自拍| 99久久久精品免费观看国产蜜| 国产精品无码一区二区三| 久久新电视剧免费观看| 国产人妻一区二区| 国产欧美日韩视频在线观看| 久久一级免费视频| 亚洲精选在线视频| xxxx.国产| 在线免费观看日本一区| 国产一区二区麻豆| 欧美tk—视频vk| 无码国产精品一区二区色情男同| 亚洲人午夜精品| 黄色动漫在线观看| 久久久久久久久久久成人| 黄色成人免费网| 成人a在线视频| 久久99精品国产自在现线 | 久久美女视频| 波多野结衣 作品| 久久国产精品久久w女人spa| 国产v亚洲v天堂无码久久久| 国产在线精品视频| 97人妻精品一区二区三区免费| 久久久久久久免费视频了| 男人在线观看视频| 天天做天天摸天天爽国产一区| 国产乱码77777777| 日韩一区二区三区电影在线观看 | 色偷偷88888欧美精品久久久| 精产国品自在线www| 国内成人精品一区| 六九午夜精品视频| 国产欧美日韩亚洲| 天天久久综合| 青青青免费在线| 免费观看在线色综合| 国产综合内射日韩久| 欧美激情中文字幕一区二区| 国产在线拍揄自揄拍| 欧美视频精品在线观看| 风流老熟女一区二区三区| 色香阁99久久精品久久久| 国产丝袜在线播放| 成人性生交大片免费看视频直播 | 国产ts变态重口人妖hd| 亚洲人成在线免费观看| 超碰在线97国产| 国产女人18毛片水18精品| 三级小说欧洲区亚洲区| 中文字幕黄色大片| 日韩**一区毛片| www.四虎在线| 亚洲天堂精品在线观看| 国产成人一级片| 精品国免费一区二区三区| 视频免费一区| 国产成人在线精品| 麻豆一区二区麻豆免费观看| 真人做人试看60分钟免费| 青椒成人免费视频| 99久久久无码国产精品性 | 92看片淫黄大片一级| 国产精品一区二区久久精品爱涩| 欧美丰满美乳xxⅹ高潮www| 午夜激情久久久| 亚洲av综合色区无码一区爱av| 色偷偷噜噜噜亚洲男人的天堂| 欧美黑人一区| 久久爱av电影| 在线欧美日韩| 在线播放第一页| 一区二区三区欧美| av中文字幕免费| 九九久久综合网站| 日韩一区二区三区色| 亚洲第一综合网站| 精品亚洲aⅴ乱码一区二区三区| 中文字幕有码在线播放| 色老综合老女人久久久| 欧美中文在线| 欧美最顶级丰满的aⅴ艳星| 欧美一区二区三区久久| 霍思燕三级露全乳照| 99视频一区二区| 日本视频免费在线| 亚洲精品乱码久久久久久金桔影视 | 亚洲欧洲日韩| 四川一级毛毛片| 亚洲一区欧美一区| 国产综合视频在线| 国内免费久久久久久久久久久| 国产精品videossex| 久久国产成人精品国产成人亚洲| 99久久免费视频.com| 亚洲av中文无码乱人伦在线视色| 日韩极品精品视频免费观看| 美女在线视频免费| 欧美一区国产一区| 秋霞国产午夜精品免费视频| 国产一级淫片久久久片a级| 欧美日韩高清在线播放| 成人av黄色| 国产成人免费观看| 亚洲午夜伦理| 制服丝袜第二页| 欧美午夜精品免费| 浪潮av一区| 国产亚洲精品自在久久| 玖玖国产精品视频| 国产喷水在线观看| 日韩视频免费观看高清完整版| 男人添女人下部高潮视频在线观看| 精品欧美一区二区久久久伦| 免费视频久久| 国产视频精品免费| 精品久久久久久久人人人人传媒 | 色婷婷激情一区二区三区| 成人午夜电影在线观看| 91精品国产99久久久久久红楼| 99精品国产一区二区青青牛奶| 久久久久久久久久久久久久久| 欧美色区777第一页| 国产三线在线| 先锋影音欧美| 成人免费电影视频| 中文字幕免费播放| 欧美激情视频网址| 精品日韩免费| 涩视频在线观看| 在线观看国产日韩| 国产在线xxx| 亚洲国产综合自拍| 粉嫩一区二区三区性色av| 免费无码国产精品| 欧美成人免费全部| 精品国产乱码久久久久久果冻传媒 | 亚洲黄色免费观看| 不卡中文字幕av| 国产一区二区三区日韩精品| a级大片免费看| 日本高清成人免费播放| 日皮视频在线观看| 视频一区三区| 91香蕉视频在线| 性生交生活影碟片|