精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

NeurIPS 2025 | CMU、清華、UTAustin開源ReinFlow,用在線RL微調機器人流匹配策略

人工智能 新聞
來自卡內基梅隆大學、清華大學和德克薩斯大學奧斯汀分校的研究團隊提出了一個用于微調流匹配策略的在線強化學習框架 ReinFlow, 該工作已被 NeurIPS 2025 接收,并開源了詳細的復現教程,包括代碼、訓練權重、和訓練結果。

作者簡介:本文第一作者為卡耐基梅隆大學機器人所研究生 Tonghe Zhang,主要研究方向為機器人操作大模型和全身控制算法。合作者為德克薩斯大學奧斯汀分校博士生 Sichang Su, 研究方向為強化學習和通用機器人策略。指導教師是清華大學和北京中關村學院的 Chao Yu 教授以及清華大學 Yu Wang 教授。

今年,流匹配無疑是機器人學習領域的大熱門:作為擴散模型的一種優雅的變體,流匹配憑借簡單、好用的特點,成為了機器人底層操作策略的主流手段,并被廣泛應用于先進的 VLA 模型之中 —— 無論是 Physical Intelligence 的 ,LeRobot 的 SmolVLA, 英偉達的 GR00T 和近期清華大學發布的 RDT2。

想要進一步增強開源 VLA 模型的能力,除了增加數據多樣性,強化學習也是一種高度有效的方法。來自卡內基梅隆大學、清華大學和德克薩斯大學奧斯汀分校的研究團隊提出了一個用于微調流匹配策略的在線強化學習框架 ReinFlow, 該工作已被 NeurIPS 2025 接收,并開源了詳細的復現教程,包括代碼、訓練權重、和訓練結果。

  • 論文標題:ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning
  • 論文鏈接:https://arxiv.org/abs/2505.22094
  • 項目主頁:https://reinflow.github.io
  • 開源資源(代碼、模型、數據、W&B 訓練記錄)https://github.com/ReinFlow/ReinFlow

ReinFlow 的算法特點

  • 理論基礎:基于策略梯度理論推導,將確定性流轉換為離散時間馬爾可夫過程,直接優化整條流匹配鏈;
  • 訓練高效:相比 DPPO 節省 60% 以上訓練時間,支持少步甚至單步推理;
  • 實驗驗證:在多個基準任務上相較預訓練模型取得了顯著性能提升;
  • 復現友好:提供完整訓練教程、數據集、檢查點、WandB 指標,支持許多 legged locomotion 和 manipulation benchmark, 以及在 SimplerEnv 中使用規模化并行仿真微調模型。

ReinFlow 核心原理

ReinFlow 是一個針對常微分方程策略的通用策略梯度算法。想要進行策略梯度優化,首先要設法獲取動作的邊緣概率分布 。對于流匹配模型而言,這與推理時動作生成的機理相關。流匹配策略每一步推理時進行了如下步驟:

流匹配模型推理公式:

  1. 第一步動作來自高斯噪聲;
  2. 對速度積分得到中間動作;
  3. 最后一步動作與環境交互。

如果使用流匹配的理論公式,我們可以計算流策略的最終動作的似然函數。但是由于流匹配動作通過積分來定義,這個方法計算相當復雜,而且存在估計噪聲,并不適合于強化學習。那么有沒有辦法可以簡單獲得流匹配策略推理時候的似然函數呢?其實可以, 但是要做一些小改動……

流匹配模型的推理是一個馬爾科夫過程。如果我們貯存所有的中間動作,雖然難以獲得最終動作的最終動作的邊緣分布,但是可以用鏈式法則獲得擴散鏈條的聯合概率分布:

但是由于使用常微分方程進行積分,預訓練流匹配模型的每步轉移概率都是狄拉克函數, 據此仍然無法導出數值穩定的計算公式。因此,在 ReinFlow 中,我們向流策略的確定性路徑中注入少量可學習的噪聲,將其轉移過程改回一個隨機的擴散過程:

其中,第一項是預訓練得到的速度,對應隨機微分方程的漂移項;第二項是端到端訓練的噪聲注入網絡,對應微分方程的擴散項。這樣,由于相鄰擴散步的轉移概率都是高斯分布,流匹配的聯合概率便可以被嚴格計算出來:

好消息是,我們的研究表明利用聯合概率也可以進行策略梯度優化。根據如下定理,我們可以使用多種經典的策略梯度方法對流匹配策略進行強化學習。

雖然引入噪聲改變了流匹配模型的軌跡,但是我們把噪聲控制到較小范圍內,以減少與預訓練策略的偏離,防止微調時性能大幅受損。但同時,我們也為噪聲設置強度下限,以鼓勵適當的探索。另外,ReinFlow 雖然引入了額外的噪聲網絡,但是其參數量遠小于預訓練的速度場,并且與之共用視覺特征:這樣可以減少微調時帶來的額外開銷。

任務評測

ReinFlow 是一個通用的框架。原理上,ReinFlow 可以適用于所有常微分方程定義的策略,比如 Rectified Flow 和 Shortcut Models,甚至支持極少步數下,如 1,2,4 步時的推理。而且,更新公式可以適用于幾乎所有強化學習梯度算法,比如 PPO。

足式運動控制

在 D4RL 足式運動控制任務中,ReinFlow 微調后的 Rectified Flow 策略取得了平均 135.36% 的凈性能增長。與當前的擴散 RL 微調方法 DPPO 相比,ReinFlow 在保持類似性能的同時,可以極大減少擴散步驟,從而節省了微調所用的 82.63% 的墻鐘時間。

長程操作任務

在接收稀疏獎勵和高維輸入的操作任務中(Franka Kitchen、Robomimic) ,ReinFlow 微調的 Shortcut Model 策略在 4 步甚至 1 步去噪的情況下,比預訓練模型平均凈增了 40.34% 的成功率。其性能與使用 DPPO 微調的 DDIM 策略相當,但訓練時間平均節省 23.20%。

VLA + 大規模并行強化學習

除了標準基準,研究團隊還成功地使用 ReinFlow 利用 ManiSkill3 框架在 SimplerEnv 環境中微調了 模型。 在包含 25 種不同物品和、十余種桌面設置和上百種初始化位姿的高度隨機化場景中,ReinFlow 可以大幅提高  模型的抓取成功率。 

消融實驗

研究團隊進行了詳細的消融研究,研究以下因素對訓練結果的影響:

1. 數據擴展 vs RL 微調:實驗顯示僅靠增加數據或推理步數較快達到性能瓶頸,而 RL 微調能進一步提升性能。

2. 時間采樣策略:ReinFlow 對均勻、Logit-normal 和 Beta 分布等多種時間采樣方式都表現良好的性能。

3. 噪聲條件和大小:同時以狀態和時間為條件生成噪聲,有助于產生更多樣化的動作。噪聲過小訓練會陷入瓶頸,一定閾值后可以探索的新策略。

4. 熵正則化:可以進一步促進探索。

保姆級開源

ReinFlow 的 GitHub 項目已經全面開源,并在積極維護中。歡迎通過郵件或 GitHub 與作者交流。項目包含了:

完整代碼庫

  • 支持 Rectified Flow、Shortcut Models 等多種流模型;
  • 涵蓋 OpenAI Gym(D4RL)、Franka Kitchen、Robomimic 等多個經典 RL 環境;
  • 詳細的安裝指南和使用教程。

模型 Checkpoints

  • 提供所有實驗的預訓練模型;
  • 包含行為克隆和 RL 微調后的權重;
  • 支持一鍵加載和評估。

WandB 指標

  • 公開所有實驗的訓練曲線(損失、獎勵、學習率等);
  • 可直接訪問:https://wandb.ai/reinflow/projects;
  • 便于社區下載基線和本方法測試結果,進行公平驗證和對比。

詳盡文檔

  • 完整復現實驗的步驟:https://github.com/ReinFlow/ReinFlow/blob/release/docs/ReproduceExps.md
  • 復現論文圖表的指南:https://github.com/ReinFlow/ReinFlow/blob/release/docs/ReproduceFigs.md
  • 關鍵超參數說明:https://github.com/ReinFlow/ReinFlow/blob/release/docs/Implement.md
  • 添加自定義數據集 / 環境:https://github.com/ReinFlow/ReinFlow/blob/release/docs/Custom.md
  • 常見問題解答:https://github.com/ReinFlow/ReinFlow/blob/release/docs/KnownIssues.md

未來展望

ReinFlow 將在未來公布更多結果,包括:

  • 發布更多大型視覺語言模型微調結果;
  • 支持用在線 RL 微調 Mean Flow;
  • 研究如何使用該方法進行 sim2real 和真機強化學習微調。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-11-07 08:51:41

2025-05-07 13:48:48

AIGC生成機器人

2020-04-13 08:00:00

機器人開源自動化工具

2021-02-19 11:09:45

機器人機器人流程自動化RPA

2023-11-01 17:41:59

RPA機器人

2025-10-13 09:08:00

2025-03-13 11:07:30

2023-10-04 10:55:42

機器狗AI

2025-09-26 10:59:55

AI模型數據

2022-02-21 14:46:36

機器人RPA

2020-07-24 14:54:17

人工智能機器學習技術

2025-03-19 09:15:00

AI算法模型

2025-05-28 11:46:18

開源模型數據

2024-12-19 14:44:22

2025-10-09 13:19:47

2020-04-29 11:28:54

智能自動化機器人流程自動化AI

2020-04-29 11:19:13

機器人流程自動化RPA

2025-11-20 08:44:32

2025-02-10 09:35:00

2025-11-11 08:45:00

點贊
收藏

51CTO技術棧公眾號

wwwww在线观看| 青少年xxxxx性开放hg| 日本免费在线观看视频| 久久综合成人| 精品国产一二三| 日韩欧美精品在线观看视频| 久草免费在线| 久久综合中文字幕| 91久久在线视频| 日韩在线视频免费播放| 91蜜臀精品国产自偷在线| 欧美成人官网二区| 亚洲色图 在线视频| 俄罗斯一级**毛片在线播放| 国产精品初高中害羞小美女文| 国产精品二区三区| 国产一区二区三区黄片| 国产精品呻吟| 欧美激情视频网站| 天堂网中文在线观看| 亚洲涩涩av| 亚洲成av人影院在线观看| 毛片毛片毛片毛| 捆绑调教日本一区二区三区| 亚洲人亚洲人成电影网站色| 日日夜夜精品网站| 外国精品视频在线观看 | 无码少妇一区二区三区| 欧美精品黑人性xxxx| 欧美亚洲日本在线观看| 美女露胸视频在线观看| 亚洲专区一二三| 日本高清xxxx| 欧美极品视频| 国产欧美久久久精品影院| 国语精品免费视频| 亚洲欧美黄色片| 国产精品亚洲第一| 国产在线观看精品| 在线观看日韩一区二区| 日本在线不卡一区| 国产精品91视频| 成人公开免费视频| 久久av在线| 欧洲成人在线观看| 五月天婷婷久久| 国产亚洲精品bv在线观看| 国语自产精品视频在线看| 激情小说中文字幕| 国内精品嫩模av私拍在线观看| 久久精品中文字幕| 在线看的片片片免费| 小小影院久久| 久久香蕉频线观| 99热精品免费| 亚洲日韩视频| 91精品国产色综合| 欧美特黄aaaaaa| 久久精品盗摄| 国产精品三级美女白浆呻吟| 中文字幕av片| 精品无人码麻豆乱码1区2区 | 亚洲丝袜美腿一区| 亚洲人成网7777777国产| 久久只有这里有精品| 国产影视一区| 日韩一区二区av| 69av视频在线| 最新日韩欧美| 国产成人中文字幕| 一级片免费观看视频| 国产中文一区二区三区| 亚洲一区二区免费在线| 高潮一区二区三区乱码| 91网上在线视频| 日韩一区国产在线观看| 黄色网址视频在线观看| 亚洲综合在线第一页| 国产在线青青草| 一区二区视频免费完整版观看| 欧美日韩免费在线视频| 最好看的中文字幕| 奇米狠狠一区二区三区| 久久九九免费视频| 日韩少妇高潮抽搐| 日本中文字幕一区二区视频| 91传媒在线免费观看| 五月激情婷婷网| 国产精品麻豆视频| 国产真人做爰毛片视频直播| 韩国成人在线| 日韩欧美国产一区二区在线播放| 添女人荫蒂视频| 99九九热只有国产精品| 午夜精品久久久久久久99热浪潮 | 麻豆mv在线看| 在线观看av一区二区| 亚洲911精品成人18网站| 免费一区二区三区视频导航| 久久在线免费视频| 色屁屁影院www国产高清麻豆| 麻豆91在线播放| 国产精品永久入口久久久| 国产原创av在线| 亚洲一区二区三区四区不卡| 无码日韩人妻精品久久蜜桃| 6080亚洲理论片在线观看| 中文字幕精品久久久久| 日本中文字幕网| 韩国v欧美v日本v亚洲v| 神马影院午夜我不卡影院| a√中文在线观看| 欧美日韩国产综合视频在线观看| 久久中文字幕人妻| 伊人久久亚洲影院| 成人在线中文字幕| 国产青青草在线| 午夜影视日本亚洲欧洲精品| www,av在线| 色狮一区二区三区四区视频| 日本高清久久天堂| 色呦呦视频在线| 一区二区三区精品| 亚洲一级片av| 欧美国产一级| 国产精品久久久久久av下载红粉 | 一区二区三区日| 久久免费电影网| 六月婷婷在线视频| 伊人精品久久| 九九精品视频在线| 国产夫绿帽单男3p精品视频| 国产精品久久久久久福利一牛影视| 日韩免费毛片视频| 亚洲成人一品| 91禁外国网站| 91在线播放视频| 国产乱码一区二区三区四区| 国产伦精品一区二区三区视频 | 亚洲美女尤物影院| 亚洲黄色www| 国产精品18p| 国产99久久久国产精品免费看| 自拍偷拍99| 永久免费观看精品视频| 日韩在线视频一区| 国产又粗又黄又爽视频| 日韩一区中文字幕| 一二三av在线| 自拍偷拍欧美专区| 成人黄色在线免费观看| 黄色的视频在线观看| 精品国产免费一区二区三区香蕉| 久久久久久久久久一区二区三区| 国产69精品久久777的优势| 成人av在线播放观看| 亚洲1区在线| 欧美极品少妇xxxxⅹ喷水 | 日韩欧美2区| 中文字幕一区二区三区电影| 97视频免费在线| 亚洲黄色在线视频| 88av在线播放| 久久综合激情| 在线国产99| 少妇精品在线| 97人人模人人爽人人喊中文字| 亚洲欧美色视频| 在线视频一区二区三区| 日韩av毛片在线观看| 国产成人av一区二区三区在线观看| 东北少妇不带套对白| 秋霞综合在线视频| 国产精品久久久久久网站| 成人毛片av在线| 亚洲精品国产suv| 成人一二三四区| 亚洲人成网站色在线观看| 中文字幕天堂av| 久久中文字幕一区二区三区| 黄色网络在线观看| 伊人久久大香线蕉av不卡| 国产在线精品播放| 五月天av在线| 久久国产精品久久国产精品| 午夜小视频在线播放| 欧美猛男男办公室激情| 日韩欧美激情视频| 国产精品系列在线| 日本人添下边视频免费| 日本中文一区二区三区| 日韩精品在线视频免费观看| 成人激情电影在线| 国产精品乱码| 91成人小视频| 3344国产精品免费看| 黄色网在线播放| 亚洲天堂久久av| 蜜臀av中文字幕| 4438x亚洲最大成人网| 国产在线观看黄色| 亚洲精品综合在线| 高清国产在线观看| zzijzzij亚洲日本少妇熟睡| 一区二区xxx| 香蕉久久国产| 白白操在线视频| 欧美超碰在线| 区一区二区三区中文字幕| av成人男女| 成人在线中文字幕| 久久不卡日韩美女| 国产va免费精品高清在线| av影视在线看| 欧美日本在线视频中文字字幕| av影片在线看| 亚洲人成五月天| 四虎在线免费看| 亚洲а∨天堂久久精品喷水| 国产欧美一级片| 欧美撒尿777hd撒尿| 一级成人黄色片| 激情av一区二区| 久久网一区二区| 一区二区三区欧美日| 神马午夜精品91| 一区在线观看视频| www.4hu95.com四虎| 久久精品一区二区三区四区| 久久偷拍免费视频| 91在线观看高清| 五月开心播播网| 成人蜜臀av电影| 亚洲色图欧美另类| 高清在线成人网| 日本天堂在线播放| 懂色av一区二区三区免费看| 黑人无套内谢中国美女| 国产一区二区三区久久悠悠色av| 亚洲精品久久久久久宅男| 麻豆91小视频| 怡红院亚洲色图| 极品美女销魂一区二区三区| 特黄视频免费观看| 国产一区二区三区黄视频 | 免费在线观看日韩av| 国产不卡在线一区| 69xxx免费视频| 成人亚洲精品久久久久软件| 国产午夜在线一区二区三区| 99久久99久久精品国产片果冻| 中文成人无字幕乱码精品区| 91视频com| 阿v天堂2014| 亚洲欧洲日韩女同| 亚洲女人毛茸茸高潮| 亚洲国产电影在线观看| 黄色精品视频在线观看| 亚洲激情图片一区| 国产做受高潮漫动| 日本高清不卡aⅴ免费网站| 在线免费观看日韩视频| 6080午夜不卡| 亚洲精品一区二区三区区别| 精品香蕉一区二区三区| 成人在线播放视频| 九九精品视频在线| 涩涩涩在线视频| 国产精品一区二区三区成人| 亚洲性视频在线| 欧美精品成人一区二区在线观看| 精品久久91| 大片在线观看网站免费收看| 亚洲久久成人| 杨幂毛片午夜性生毛片| 国产成人自拍网| 性少妇bbw张开| 亚洲日本丝袜连裤袜办公室| 日韩污视频在线观看| 欧美日韩一级二级三级| 亚洲免费黄色片| 在线看国产精品| 欧美xxxx视频| 国产精品第七影院| 国产精品99久久免费观看| 天堂一区二区三区| 日韩一级在线| 狠狠干狠狠操视频| 26uuu国产电影一区二区| 天堂а√在线中文在线鲁大师| 亚洲国产成人av好男人在线观看| 成人毛片一区二区三区| 日韩欧美123| 国产大片在线免费观看| 欧美激情在线有限公司| 久久亚洲人体| 九九热久久66| 伊人久久大香线| 密臀av一区二区三区| 粉嫩aⅴ一区二区三区四区| 成年人看的免费视频| 欧美日韩国产页| 亚洲a视频在线观看| 色狠狠久久aa北条麻妃| 2022成人影院| 国产精品麻豆免费版| 久久网站免费观看| 欧美激情国产精品日韩| 成人午夜视频在线| 2018天天弄| 欧美福利视频导航| 国产九九在线| 日本高清不卡在线| 欧美激情影院| 日韩国产成人无码av毛片| 激情伊人五月天久久综合| 免费看的黄色网| 色屁屁一区二区| 天堂影院在线| 97国产真实伦对白精彩视频8| 日韩精品一区国产| 免费cad大片在线观看| 久久99精品国产.久久久久久| 久久婷婷五月综合| 日韩欧美一区二区三区久久| 香港一级纯黄大片| 久久久之久亚州精品露出| 日韩三级精品| avav在线播放| 国产不卡视频一区二区三区| 国产成人久久久久| 日韩三级视频在线看| 黄色片网站在线观看| 国产欧美日韩高清| 久久成人综合| 久久6免费视频| 亚洲精品中文在线观看| 国产免费一区二区三区最新不卡| xxx一区二区| 天天综合91| 日本道在线视频| 国产91精品一区二区| 国产一级性生活| 亚洲国产精品一区二区三区| f2c人成在线观看免费视频| 国产乱子伦精品| 校园春色综合网| 法国空姐电影在线观看| 欧美亚日韩国产aⅴ精品中极品| av资源种子在线观看| 成人久久18免费网站图片| 亚洲在线久久| 国产高潮视频在线观看| 日韩欧中文字幕| 二区三区在线播放| 成人写真福利网| 亚洲欧美伊人| 影音先锋黄色资源| 色域天天综合网| 91社区在线观看| 97超碰人人模人人爽人人看| 亚洲网址在线| 日本性高潮视频| 欧美精品一二三| 波多野结衣中文在线| 久久婷婷开心| 麻豆成人综合网| 18精品爽视频在线观看| 亚洲欧美另类自拍| 欧美成人高清视频在线观看| 综合色婷婷一区二区亚洲欧美国产| 国产传媒久久文化传媒| 成年人视频在线免费看| 精品国产一区二区在线 | 日韩久久在线| 黑人巨大精品欧美一区| 日本三级黄色大片| 伊是香蕉大人久久| 日韩av综合| 国产成人av影视| 亚洲精品亚洲人成人网在线播放| 欧美一级淫片aaaaaa| 国产精品久久久91| 国产精品theporn| 高清国产在线观看| 精品国一区二区三区| 欧洲精品一区二区三区| 国产一区 在线播放| 久久久精品tv| а√天堂资源在线| 国产精品久久久久久久一区探花| 欧美大片一区| 亚洲色图 激情小说| 欧美精品一区二区精品网| 欧美v亚洲v综合v国产v仙踪林| 国内少妇毛片视频| 中文字幕五月欧美| 免费在线毛片| 精品国产一区二区三区麻豆免费观看完整版 | 午夜国产精品影院在线观看|