精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首次!流匹配模型引入GRPO,GenEval幾近滿分,組合生圖能力遠超GPT-4o

人工智能 新聞
港中文 MMLab、快手可靈、清華大學等團隊聯合提出?Flow-GRPO,首個將在線強化學習引入 Flow Matching 模型的工作。

本文由香港中文大學與快手可靈等團隊聯合完成。第一作者為香港中文大學 MMLab 博士生劉杰,他的研究方向為強化學習和生成模型,曾獲 ACL Outstanding Paper Award。

流匹配模型因其堅實的理論基礎和在生成高質量圖像方面的優異性能,已成為圖像生成(Stable Diffusion, Flux)和視頻生成(可靈,WanX,Hunyuan)領域最先進模型的訓練方法。然而,這些最先進的模型在處理包含多個物體、屬性與關系的復雜場景,以及文本渲染任務時仍存在較大困難。與此同時,在線強化學習因其高效探索與反饋機制,在語言模型領域取得顯著進展,但在圖像生成中的應用仍處于初步階段。

為此,港中文 MMLab、快手可靈、清華大學等團隊聯合提出 Flow-GRPO,首個將在線強化學習引入 Flow Matching 模型的工作。在 Flow-GRPO 加持下,SD3.5 Medium 在 GenEval 基準測試中的準確率從 63% 提升到 95%,組合式生圖能力超越 GPT4o,這說明流匹配模型還有很大提升空間,Flow-GRPO 的成功實踐,為未來利用 RL 進一步解鎖和增強各類流匹配生成模型(包括但不限于圖像、視頻、3D 等)在可控性、組合性、推理能力方面的潛力,開辟了充滿希望的新范式。

圖片

  • 論文標題:Flow-GRPO: Training Flow Matching Models via Online RL
  • 論文鏈接:https://www.arxiv.org/pdf/2505.05470
  • 代碼地址:https://github.com/yifan123/flow_grpo
  • 模型地址:https://huggingface.co/jieliu/SD3.5M-FlowGRPO-GenEval

作者團隊也會盡快提供 Gradio 在線 demo 和包含大量生成 case,強化學習訓練過程中圖片變化的網頁,幫助讀者更好地體會 RL 對于流匹配模型的極大提升。

一、核心思路與框架概覽

Flow-GRPO 的核心在于兩項關鍵策略,旨在克服在線 RL 與流匹配模型內在特性之間的矛盾,并提升訓練效率:

  1. ODE-SDE 等價轉換: 流匹配模型本質上依賴確定性的常微分方程(ODE)進行生成。為了強化學習探索所需的隨機性,作者采用了一種 ODE 到隨機微分方程(SDE)的轉換機制。該機制在理論上保證了轉換后的 SDE 在所有時間步上均能匹配原始 ODE 模型的邊緣分布,從而在不改變模型基礎特性的前提下,為 RL 提供了有效的探索空間。
  2. 去噪步數「減負」提效: 在 RL 訓練采樣時,大膽減少生成步數(例如從 40 步減到 10 步),極大加速數據獲取;而在最終推理生成時,仍然使用完整步數,保證高質量輸出。在極大提升 online RL 訓練效率的同時,保證性能不下降。

圖片

圖 1 Flow-GRPO 框架

二、ODE to SDE

GRPO 的核心是依賴隨機采樣過程,以生成多樣化的軌跡批次用于優勢估計和策略探索。但對于流匹配模型,其確定性的采樣過程不滿足 GRPO 要求。為了解決這個局限性,作者將確定性的 Flow-ODE 轉換為一個等效的 SDE,它匹配原始模型的邊際概率密度函數,在論文附錄 A 中作者提供了詳細的證明過程。原始的 flow matching 模型 inference 的時候按照如下公式:

圖片

轉變成 SDE 后,最終作者得到的采樣形式如下:

圖片

之后就可以通過控制噪聲水平的參數很好地控制 RL 策略的探索性。

三、Denoising Reduction

為了生成高質量的圖像,流模型通常需要大量的去噪步驟,這使得在線強化學習的訓練數據收集成本較高。作者發現,對于在線強化學習訓練,較大的時間步長在樣本生成時是多余的,只需要在推理時保持原有的去噪步驟仍能獲得高質量的樣本。作者在訓練時將時間步長設置為 10,而推理時的時間步長保持為原始的默認設置 40。通過這樣的「訓練時低配,測試時滿配」的設置,達到了在不犧牲最終性能的情況下實現快速訓練。

四、核心實驗效果

Flow-GRPO 在多個 T2I(文本到圖像)生成任務中表現卓越:

  • 復雜組合生成能力大幅提升: 在 GenEval 基準上,將 SD3.5-M 的準確率從 63% 提升至 95%,在物體計數、空間關系理解、屬性綁定上近乎完美,在該評測榜單上效果超越 GPT-4o! 

圖片

圖 2 Flow-GRPO 訓練過程中的性能持續上升

圖片

圖 3 GenEval 各項指標詳細結果

圖片

圖 4 在 GenEval 基準上的定性比較

  • 文字渲染精準無誤: 視覺文本渲染準確率從 59% 大幅提升至 92%,可以較為準確地在圖片中渲染文字。

圖片

  • 更懂人類偏好: 在人類偏好對齊任務上也取得了顯著進步。

圖片

  • 獎勵黑客行為顯著減少: Flow-GRPO 在性能提升的同時,圖像質量和多樣性基本未受影響,有效緩解 reward hacking 問題。

圖片

五、總結與展望

作為首個將在線強化學習引入流匹配模型的算法,Flow-GRPO 通過將流模型的確定性采樣機制改為隨機微分方程(SDE)采樣,并引入 Denoising Reduction 技術,實現了在流匹配模型上的高效在線強化學習。實驗結果顯示,即便是當前最先進的 flow matching 模型,在引入強化學習后依然有顯著的性能提升空間。Flow-GRPO 在組合式生成、文字渲染和人類偏好等任務上,相比基線模型均取得了大幅改進。

Flow-GRPO 的意義不僅體現在指標上的領先,更在于其揭示了一條利用在線強化學習持續提升流匹配生成模型性能的可行路徑。其成功實踐為未來進一步釋放流匹配模型在可控性、組合性與推理能力方面的潛力,尤其在圖像、視頻、3D 等多模態生成任務中,提供了一個充滿前景的新范式。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-27 12:45:30

2024-05-15 17:34:15

2024-05-20 08:20:00

OpenAI模型

2024-06-05 13:09:26

2025-04-16 09:15:00

AI模型數據

2024-11-28 15:51:19

GPT-4o微軟

2025-05-26 09:05:00

2025-03-26 09:13:02

2025-08-07 14:05:40

OpenAI大模型開源

2024-05-21 12:23:17

2024-06-05 08:29:35

2025-03-31 09:35:00

GPT-4oAI模型

2025-04-27 15:40:02

GPT-4oSTEMChatGPT

2025-10-28 02:11:00

2024-05-28 08:25:09

2024-05-14 11:29:15

2024-05-24 14:04:04

2025-04-08 02:26:00

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

點贊
收藏

51CTO技術棧公眾號

久久久久久穴| 视频一区中文字幕精品| 久久精品一区二区三区不卡| 国产精品久久久久久久午夜| 国产精品www爽爽爽| 韩国三级成人在线| 欧美视频在线看| 亚洲国产一区二区三区在线播| 99热这里只有精品5| 国产美女诱惑一区二区| 日韩中文娱乐网| 一本加勒比波多野结衣| 免费成人毛片| 粉嫩老牛aⅴ一区二区三区| 亚洲国产欧洲综合997久久 | 91在线精品播放| 日韩精品视频免费播放| 久久一本综合| 亚洲人成网7777777国产| 四虎成人在线播放| 精品视频一区二区三区四区五区| 一区二区三区在线免费| 日韩精品一区二区三区外面| 丰满少妇一级片| 久久国产综合精品| 日韩免费在线播放| 亚洲视频免费播放| 国精品一区二区三区| 中文字幕综合在线| 插吧插吧综合网| 一区二区在线视频观看| 欧美日韩一区小说| 92看片淫黄大片一级| 美女日批视频在线观看| 中文字幕一区二区三区不卡 | 国产精品影院在线观看| 中文字幕激情小说| 在线播放一区| 欧美黄色成人网| 欧美人妻精品一区二区免费看| 久久中文字幕av| 一区二区三区www| 无码人妻aⅴ一区二区三区| 日韩在线视频一区二区三区| 91精品在线免费观看| 艹b视频在线观看| 成人看片在线观看| 色综合久久久网| 99福利在线观看| 蜜桃视频在线观看播放| 亚洲高清不卡在线观看| 你真棒插曲来救救我在线观看| 在线免费观看a视频| 亚洲你懂的在线视频| 好色先生视频污| 成人午夜在线影视| 亚洲免费观看视频| 日本大胆人体视频| 女子免费在线观看视频www| 一个色在线综合| 日本男女交配视频| www.色在线| 福利微拍一区二区| 欧美成人黑人猛交| jizz亚洲女人高潮大叫| 欧美日韩国产首页| 永久免费黄色片| 操欧美女人视频| 精品国产乱码久久| 在线视频 日韩| 九一成人免费视频| 色先锋资源久久综合5566| 破处女黄色一级片| 在线不卡视频| 国产精品电影观看| 亚洲手机在线观看| 国产精品一级在线| 国产专区一区二区| 岛国最新视频免费在线观看| 欧美国产禁国产网站cc| 黄色片免费在线观看视频| 7777kkk亚洲综合欧美网站| 福利一区视频在线观看| 亚洲另类第一页| 天堂精品久久久久| 精品视频一区在线视频| 五月婷婷六月香| 欧美成人精品| 国产精品v日韩精品v在线观看| 日本wwwxxxx| a亚洲天堂av| 日本不卡二区| 天堂va在线| 欧美日韩亚洲天堂| 亚洲欧美自偷自拍另类| 成人精品毛片| 3d欧美精品动漫xxxx无尽| 国产精品久久午夜| 日韩人妻无码精品久久久不卡| 天堂av在线| 欧美精品在线一区二区| 久久久久国产免费| 伊人久久大香线蕉| 欧美成人一二三| 久久影视中文字幕| 免费av网站在线| 欧美ab在线视频| 茄子视频成人在线| 国产精品欧美亚洲| 久久综合狠狠综合久久激情 | 亚洲精选视频免费看| 欧美一级爱爱视频| 老汉色老汉首页av亚洲| 亚洲日本中文字幕区| 免费在线观看亚洲视频| 24小时成人在线视频| 精品视频久久久久久久| 国产女人18水真多毛片18精品 | 欧美在线观看www| 24小时成人在线视频| 一区二区成人av| 91porny在线| 国产不卡一区视频| 制服丝袜综合日韩欧美| 亚洲mmav| 亚洲男人天堂网| 日产精品久久久久久久| 国产一区91精品张津瑜| 亚洲看片网站| 亚州一区二区三区| 日韩精品免费在线视频观看| 免费中文字幕在线观看| 狠狠色丁香婷综合久久| 日韩成人av电影在线| 女人让男人操自己视频在线观看| 日韩欧美亚洲另类制服综合在线| 中文字幕无码日韩专区免费| 日日摸夜夜添夜夜添亚洲女人| 精品在线一区| 极品美鲍一区| 亚洲国产高清自拍| 久久精品视频日本| 丁香婷婷深情五月亚洲| 天堂а√在线中文在线| 亚洲综合影院| 国内自拍欧美激情| 天天操天天操天天干| 亚洲动漫第一页| 欧美xxxxx精品| 99精品国产在热久久婷婷| 国产精品入口免费| 国产色播av在线| 亚洲精品456在线播放狼人| 国产成年人免费视频| 99久久夜色精品国产网站| 日本www在线播放| 九九综合在线| 国产精品自产拍在线观看中文| av网站无病毒在线| 9191成人精品久久| 久久黄色小视频| 9久草视频在线视频精品| 国产九九九九九| 免费看成人哺乳视频网站| 国产大片精品免费永久看nba| 国产在线电影| 欧美精品少妇一区二区三区| 亚洲欧美一区二区三区四区五区| 成人一区二区视频| 中文字幕无码精品亚洲35| 自拍偷拍一区| 91精品国产综合久久男男| 亚洲www色| 日韩h在线观看| 国产99免费视频| 亚洲色图第一区| 95视频在线观看| 天堂午夜影视日韩欧美一区二区| 亚洲二区三区四区| 在线视频亚洲欧美中文| 欧美在线视频免费| 一级毛片视频在线观看| 欧美成人伊人久久综合网| 亚洲精品午夜国产va久久成人| 国产精品人妖ts系列视频| 91人妻一区二区三区| 999在线观看精品免费不卡网站| 久久综合九色99| 99久久99九九99九九九| 久久久人成影片一区二区三区| 视频一区二区三区在线看免费看| 欧美在线不卡视频| 18精品爽视频在线观看| 国产三级欧美三级日产三级99| 波多野结衣网页| 免费日韩视频| 青青视频免费在线观看| 亚洲宅男一区| 高清国产在线一区| 成人日韩精品| 国模吧一区二区| 欧美成人二区| 亚洲久久久久久久久久| 国产区精品在线| 在线免费亚洲电影| 日韩av无码中文字幕| 中文字幕在线视频一区| 草草地址线路①屁屁影院成人| 精品一区二区免费在线观看| 国产91对白刺激露脸在线观看| 欧美一区二区三区另类| 日本欧美精品久久久| 极品尤物一区| 亚洲xxxx在线| 91丨精品丨国产| 国产精品99久久久久久人| а√中文在线8| 中文字幕日韩高清| 免费av在线电影| 亚洲级视频在线观看免费1级| 精品人妻无码一区二区| 欧美美女喷水视频| 国产精品无码粉嫩小泬| 欧美性猛xxx| 日韩黄色精品视频| 亚洲一区二区三区中文字幕| 亚洲天堂黄色片| 亚洲四区在线观看| 亚洲天堂网av在线| 欧美国产成人精品| 国产123在线| 久久久久久久免费视频了| 超碰97在线资源站| av亚洲精华国产精华| 艳妇乳肉豪妇荡乳xxx| 国产69精品久久777的优势| 天堂在线精品视频| 国产一区二区三区免费看| 激情黄色小视频| 久久成人羞羞网站| 手机av在线网| 欧美少妇一级片| 91大神精品| 3d精品h动漫啪啪一区二区| 伊人亚洲精品| 91亚洲精品在线| 激情综合五月| 97超碰资源| 中文在线综合| 国产精品对白一区二区三区| 综合伊人久久| 国产美女99p| 欧美精品密入口播放| 精品一区久久| 国产传媒欧美日韩成人精品大片| 欧美高清一区二区| 国模吧精品视频| 日韩国产欧美一区| 91免费精品| 亚洲五码在线观看视频| 国产精品mm| 无罩大乳的熟妇正在播放| 午夜亚洲一区| 久久午夜夜伦鲁鲁一区二区| 日本不卡123| xxxx在线免费观看| 国产成人免费视频精品含羞草妖精 | 日本xxx在线播放| 亚洲国产精品黑人久久久| 精品亚洲乱码一区二区| 一区二区三区四区亚洲| 日韩免费av片| 在线观看亚洲专区| 国产影视一区二区| 亚洲成人激情视频| 精品推荐蜜桃传媒| 久久亚洲精品一区| 偷拍自拍在线看| 成人在线一区二区| 精品福利一区| 亚洲一区二区精品在线| 欧美久久成人| 日韩亚洲在线视频| 国产福利不卡视频| 午夜理伦三级做爰电影| 综合欧美亚洲日本| 好吊操这里只有精品| 欧美午夜不卡视频| 日本成人动漫在线观看| 中文字幕日本欧美| rebdb初裸写真在线观看| 国产精品老牛影院在线观看| 久久gogo国模啪啪裸体| 久久综合久久综合这里只有精品| 久久在线视频免费观看| 99精品在线免费视频| 久久99精品国产麻豆婷婷| 色综合久久五月| 亚洲欧洲成人精品av97| 成人免费视频毛片| 日韩一区二区三区电影| 久久久久国产精品嫩草影院| 美女av一区二区| 91大神在线观看线路一区| 国产精品一区在线观看| 日韩一区自拍| 欧美韩国日本在线| 成人激情免费网站| 国产精品免费人成网站酒店 | 2022亚洲天堂| 国产高清精品网站| 欧美性生交大片| 色婷婷久久久亚洲一区二区三区| 精品人妻少妇AV无码专区| 色悠悠国产精品| 成人免费福利| 久久久久高清| 亚洲国产美女| 99国产精品免费视频| 中文字幕字幕中文在线中不卡视频| 丁香社区五月天| 亚洲精品理论电影| 日本大胆在线观看| 91在线|亚洲| 水蜜桃久久夜色精品一区| jizz欧美激情18| 91毛片在线观看| 国产三级av片| 日韩国产激情在线| yellow字幕网在线| 国产麻豆乱码精品一区二区三区 | 欧美另类xxx| 国产精品一区三区在线观看| 亚洲国产另类久久久精品极度| 久久中文在线| 性高潮久久久久久久| 欧美性高潮在线| 午夜视频免费在线| 欧美一级成年大片在线观看| 日韩欧美黄色| 国产精品免费观看久久| 久久亚洲综合色一区二区三区 | 2021国产在线| 97夜夜澡人人双人人人喊| 在线精品视频在线观看高清| 在线观看日本www| 最新国产精品久久精品| 国产精品久久久国产盗摄| 久久国产精彩视频| 久久视频社区| 男人添女荫道口女人有什么感觉| 成人午夜在线播放| 成年免费在线观看| 亚洲免费精彩视频| 成人国产精选| 欧美爱爱视频网站| 国产成人在线看| 日产精品久久久久| 亚洲视频欧美视频| 亚洲男男av| 黄色大片中文字幕| 久久综合九色综合久久久精品综合 | 成人在线一区二区| 狠狠干成人综合网| 丰满少妇一区二区| 欧美日韩精品一区二区三区四区| 麻豆网站视频在线观看| 91免费版网站在线观看| 亚洲国内自拍| 久久亚洲无码视频| 91麻豆精品国产91久久久久久| 免费电影网站在线视频观看福利| 精品免费日产一区一区三区免费| 久久综合亚州| 亚洲综合网在线| 日韩极品精品视频免费观看| 8av国产精品爽爽ⅴa在线观看| 国产911在线观看| 91网上在线视频| 国产一区二区三区视频免费观看| 久久久久成人精品| 精品国产一区二区三区噜噜噜 | 久久久久免费精品| 亚洲视频一区二区免费在线观看| 二区三区在线视频| 国产a级全部精品| 欧美 日韩 国产一区二区在线视频| 日本少妇毛茸茸| 欧美精品一二三四| 国产99在线| 国产奶头好大揉着好爽视频| 北条麻妃一区二区三区| 这里只有久久精品视频| 久久久久久18| 天天综合久久| 国产美女免费网站| 精品成人一区二区| 中文字幕成人| 国产成人精品无码播放| 亚洲一区日韩精品中文字幕|