精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開啟RL Scaling新紀元,siiRL開源:完全分布式強化學習框架,支持超千卡規模高效訓練

人工智能 新聞
來自上海創智學院的研究團隊正式推出 siiRL,一個支持大規模高效強化學習訓練的 RL 框架!

還在為強化學習(RL)框架的擴展性瓶頸和效率低下而煩惱嗎?當模型和集群規模達到上千塊 GPU 時,傳統的中心化控制器架構難免會遇到性能瓶頸、內存溢出甚至系統崩潰。

事實上,當前最頂尖的基礎模型,從 DeepSeek-R1,到 o3-pro, Gemini 2.5-pro 和 Claude-4,其卓越的推理能力都離不開大規模強化學習的加持。這充分表明,RL Scaling 已經成為大模型領域邁向更高智能的 “軍備競賽” 核心,是大勢所趨。而 xAI 最近發布的 Grok 4,更是將這一趨勢推向了新的高度,他們直接在其擁有的 200,000 塊 GPU 大集群上,以前所未有的 “后訓練規模” 來運行強化學習,旨在精進模型的推理能力。

Grok 4 和其他頂尖推理模型的成功共同揭示了一個明確的事實:解決強化學習的擴展性瓶頸,已不再僅僅是一個工程挑戰,而是解鎖下一代 AI 高級推理能力、實現更強通用智能的關鍵所在。因此,對 RL Scaling 的投入和研究,是未來 AI 發展的重要方向和核心戰略。

現在,來自上海創智學院的研究團隊正式推出 siiRL,一個支持大規模高效強化學習訓練的 RL 框架!

siiRL 的核心在于其創新的 多控制器 范式和 全分布式 架構,它將數據加載、計算和數據流轉等任務均勻地分散到所有工作節點,從根本上解決了傳統 RL 框架中由單一控制器引發的性能瓶頸。 

  • 線性擴展:全分布式架構帶來近乎線性的擴展能力,已在 1024 GPU 規模下成功驗證 。
  • 性能再飛躍:徹底消除單點瓶頸,實現最高達到 7 倍 的端到端訓練吞吐提升 。
  • 極致靈活:基于 DAG 的工作流定義,將算法邏輯與物理資源解耦,讓算法創新和實驗迭代快如閃電,并且能夠更靈活的支持多智能體協同訓練。
  • 跨硬件平臺兼容:siiRL 現已正式支持華為昇騰(Ascend)NPU,為用戶提供在不同的硬件平臺上進行 RL 訓練的高性能選擇。
  • 開箱即用:全面開源,輕松部署。

圖片

  • 論文鏈接: https://arxiv.org/abs/2507.13833 
  • 代碼鏈接: https://github.com/sii-research/siiRL

傳統 RL 框架為何遭遇瓶頸?

解構單控制器之痛

圖片

圖 1:傳統單控制器架構瓶頸。所有數據操作(初始加載、中間數據流轉)都需經過中心控制器,導致嚴重的通信開銷和擴展限制 。

在主流的強化學習框架中,系統通常采用一種混合或單一控制器架構,即由一個中心化的控制器節點來調度整個執行邏輯和管理數據流 。無論是初始的數據集加載,還是各計算階段間海量中間數據的收集與分發,所有數據都必須流經這個中心節點 。

這種設計在小規模下尚可運行,但一旦擴展到數百乃至上千 GPU,該中心節點就會因巨大的 I/O 和通信開銷而成為系統的性能瓶頸 。更糟糕的是,海量數據很容易壓垮中心節點的內存,導致系統崩潰(OOM),從根本上限制了系統的可擴展性和穩定性 。此外,固化的算法流程也大大增加了研究者進行算法創新的難度 。

siiRL 的高效秘訣:全分布式架構

為了徹底解決上述痛點, siiRL 創新性地采用了 全分布式架構 和 多控制器范式,移除了中心節點,將數據與計算的調度權下放到每一個工作單元 。

圖片

圖 2:siiRL 架構概覽 

siiRL 的整體設計包含三大核心組件:

a. DAG Planner (DAG 規劃器):用戶可以通過配置文件靈活定義一個代表完整 RL 工作流的 有向無環圖(DAG) 。DAG Planner 負責接收這個邏輯圖,并將其自動解析、分解為一系列線性的執行任務,分發給每個 Worker 。這種設計將算法邏輯與物理執行完全解耦,賦予了研究者極大的靈活性 。

b. DAG Worker (DAG 工作單元):作為框架的基本執行單位,每個 DAG Worker 綁定到一個 GPU,并獨立執行由 DAG Planner 分配的任務鏈 。它通過動態函數分發機制,將 DAG 節點定義(如角色、類型)與具體的計算函數實現解耦,使得框架極易擴展 。

c. Data Coordinator (數據協調器):它負責管理整個數據生命周期,確保數據在全分布式系統中的高效、正確流動 。

i. Distributed Dataloader:在初始加載階段,每個 Worker 只加載自己所需的數據分片,通過并行加載的方式從源頭避免了單點瓶頸 。

ii. Distributed Databuffer:在階段轉換時,當并行策略(如數據并行度)發生變化,Databuffer 會自動完成跨節點的數據重組與分發,確保數據流無縫銜接 。

圖片

圖 3:Distributed Databuffer 示意圖。當數據并行從 2(生成階段)變為 4(訓練階段)時,Databuffer 自動將數據重新切分并分發給正確的 Worker 。

效果驗證:速度與擴展性雙豐收,

性能依舊強勁!

我們在涵蓋 7B 到 72B 的多種模型尺寸和算法上,將 siiRL 與當前最主流的開源框架 verl 進行了全面對比。實驗結果證明了 siiRL 架構的巨大優勢。

在 PPO 和 GRPO 算法的端到端訓練中,siiRL 的性能全面超越基線。尤其是在數據交互量更大的 GRPO 算法下,siiRL 實現了高達 2.62 倍 的吞吐提升 。值得注意的是,在訓練 72B 模型時,基線框架在 32 卡配置下便遭遇了 OOM 錯誤,而 siiRL 則能輕松完成任務。

圖片

圖片

圖 4:使用 PPO (上) 和 GRPO (下) 算法的端到端吞吐對比。siiRL(藍色)在所有模型尺寸和 GPU 規模上均大幅領先基線框架 verl(紅色) 。

擴展性評估:千卡規模下的近線性擴展

得益于全分布式設計,siiRL 在擴展至 1024 個 GPU 時仍表現出近乎完美的線性擴展能力 。如下圖所示,在訓練 32B 模型時,從 64 卡擴展至 512 卡,系統依然保持了 80.5% 的線性擴展效率 。由于基線框架在同等規模下無法運行,我們轉而測試其所能支持的最大訓練批次大小,在此條件下,siiRL 在 VLM 設定下實現了驚人的 7 倍 速度提升。

圖片

圖 5:siiRL 在 VLM 任務上的擴展性評估,展示了從 32 到 1024 GPU 規模下的近線性擴展能力 。

圖片

圖 6: siiRL 和基線框架在基線框架支持最大訓練批次下對比實驗,7B 模型訓練吞吐提升最高達到 7 倍。

數據密集型場景:優勢愈發明顯

在長上下文這類數據密集型任務中,siiRL 的優勢愈發凸顯 。隨著上下文長度從 8k 增加到 64k,siiRL 相對于基線的領先優勢從 1.48 倍擴大到 2.03 倍 。這充分證明,數據通信量越大,siiRL 的全分布式數據流設計的效率提升就越高 。

圖片

圖 7:長上下文性能評估。隨著上下文長度增加,siiRL(藍色)的性能優勢愈發顯著 。

收斂性驗證:性能提升,精度無損

為了確保性能提升不以犧牲模型精度為代價,我們進行了收斂性對比實驗 。結果表明,在完全相同的超參數下,siiRL 和基線框架的獎勵值與熵值曲線幾乎完全重合 。這意味著,siiRL 在將訓練總耗時大幅減少的同時,保證了與基線完全一致的訓練效果 。

圖片

圖 8:收斂性對比。siiRL 與基線框架的訓練曲線趨勢一致,證明其優化不影響模型最終精度 。

未來計劃:

我們基于 DAG 的靈活設計,為構建復雜的 “多智能體系統” 奠定了天然且堅實的基礎。展望未來,我們計劃將多智能體支持作為系統的核心特性進行重點拓展,這包括支持更復雜的智能體交互工作流,擴展對多智能體強化學習(MARL)算法的兼容性,并實現更豐富的智能體與環境的交互機制,從而將我們的框架打造為一個功能全面的多智能體研發平臺。

總結:

開啟大規模強化學習新紀元

本文介紹了 siiRL,一個為解決大規模 RL 訓練中的擴展性和靈活性挑戰而設計的全新框架 。通過創新的全分布式架構 和用戶自定義的 DAG 驅動流程,siiRL 不僅徹底解決了傳統單控制器設計的瓶頸問題,實現了千卡規模的近線性擴展和高達 7 倍的吞吐提升,還極大地增強了框架的靈活性,加速了算法的創新迭代周期 。

我們相信這項工作為大規模強化學習研究鋪平了道路,提供了一個更高效、更靈活、真正可擴展的解決方案 。歡迎大家試用 siiRL,共同邁向大規模 AI 的未來!

上海創智學院 AI Infra 團隊介紹

siiRL 誕生于上海創智學院產學研一體化人才培養模式。

  • 團隊成員包括來自國內 31 所頂尖高校的博士生和一線大廠豐富產業經驗的導師,含萬卡集群建設者、中國第一批 CUDA 開發者、國產芯片優化專家、互聯網大廠機器學習平臺負責人等。
  • 全鏈路開源:從硬件到框架,代碼 100% 開放。
  • 團隊核心目標:讓大模型跑在中國芯,讓 AGI 基石全球共享。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2020-06-05 14:49:51

強化學習算法框架

2020-10-15 19:22:09

Menger機器學習強化學習

2021-07-22 15:25:14

開源技術 框架

2020-11-16 08:54:05

Google 開源技術

2025-06-25 13:44:09

開源訓練模型

2023-05-04 15:53:34

強化學習開發

2025-03-28 10:16:15

2023-04-19 16:51:54

分布式Primus開源

2025-05-13 13:51:20

模型AI訓練

2020-12-25 13:56:27

數據庫易用穩定

2025-06-05 08:40:00

2020-01-16 15:57:36

AI 數據人工智能

2017-09-11 15:19:05

CoCoA機器學習分布式

2023-11-08 10:25:00

模型技術

2017-10-27 08:40:44

分布式存儲剪枝系統

2022-03-09 08:05:26

框架分布式開源

2010-06-03 19:46:44

Hadoop

2021-09-09 15:45:17

機器學習人工智能Ray

2017-09-01 05:35:58

分布式計算存儲

2025-08-08 09:15:00

點贊
收藏

51CTO技術棧公眾號

尤物网站在线观看| 3d动漫精品啪啪一区二区三区免费| 国产精品19p| 麻豆理论在线观看| 国产欧美日韩综合精品一区二区| 国产一区红桃视频| 国产污视频在线看| 欧美精品一区二区三区精品| 69p69国产精品| 精品少妇在线视频| 95在线视频| 成人性生交大片| 国产精品高精视频免费| 久草成人在线视频| 色135综合网| 日韩精品欧美激情| 杨幂一区二区国产精品| 亚洲成a人片| 亚洲一区二区三区爽爽爽爽爽| 欧美一区二区三区四区五区六区| 午夜久久久久久久久久| 日本亚洲最大的色成网站www| 欧美激情精品久久久| 亚洲av无码一区二区三区人 | 蜜臀久久精品久久久久| 久久久久免费| 久久久人成影片一区二区三区观看 | 欧美美女福利视频| 欧美日韩中文字幕日韩欧美| 日本三级中文字幕在线观看| 国产鲁鲁视频在线观看免费| 成人精品视频一区二区三区尤物| 国产日韩欧美中文| 欧美brazzers| 另类天堂av| 羞羞色国产精品| 欧美色图亚洲视频| 色97色成人| 伊人久久久久久久久久| 亚洲久久久久久| 成人精品动漫一区二区三区| 欧美精选午夜久久久乱码6080| 成年人在线看片| 中文字幕不卡三区视频| 黄色精品一区二区| 男女啪啪免费视频网站| 青草在线视频| 一区二区三区不卡视频| 国产日产欧美一区二区| 男人天堂久久久| 成人欧美一区二区三区在线播放| 亚洲v国产v| 淫片在线观看| 综合色天天鬼久久鬼色| 亚洲午夜精品久久久中文影院av | 色综合男人天堂| 91视频综合网| 午夜久久99| 午夜精品福利在线观看| 久久久久久久黄色片| 一区二区久久| 国产成人精品免费视频| 日韩在线视频不卡| 蜜桃av噜噜一区二区三区小说| 国产精品久久久久久婷婷天堂 | 日韩欧美国产三级电影视频| 91网址在线观看精品| 国产精品一区二区三区av| 欧美一区二区三区人| 能看毛片的网站| 大奶一区二区三区| 日韩高清av一区二区三区| xxxx日本免费| 久久久久久免费视频| 久久综合久久88| 国产中文字字幕乱码无限| 亚洲国产日韩欧美一区二区三区| 欧美亚洲成人xxx| 日本中文字幕在线观看视频| 久久99精品一区二区三区三区| 亚洲影院污污.| 日韩一级片免费| 欧美激情一区在线| aaa免费在线观看| 99riav视频在线观看| 色综合中文综合网| 五月天中文字幕在线| a级日韩大片| 国产一区二区三区在线免费观看| 一区二区三区影视| 亚洲黄色一区| 国产精品一区二区三| 亚洲成人一级片| 久久亚洲捆绑美女| 国产又粗又硬又长| 亚洲国产福利| 91精品久久久久久蜜臀| 欧类av怡春院| 97色伦图片97综合影院| 2019日本中文字幕| 91女人18毛片水多国产| av亚洲精华国产精华精华| 亚洲三区在线观看| 黄色软件视频在线观看| 欧美剧情电影在线观看完整版免费励志电影| 亚洲五月激情网| 欧美男同视频网| 欧美激情视频一区二区| 中国黄色一级视频| 99在线精品一区二区三区| 美国av在线播放| 外国成人直播| 亚洲精品720p| 麻豆明星ai换脸视频| 六月婷婷一区| 成人三级在线| 亚洲xxxxxx| 欧美性猛交丰臀xxxxx网站| 韩国一区二区三区四区| 日韩理论电影| 国产不卡av在线免费观看| 黑人精品一区二区三区| 综合久久久久综合| 色哟哟精品视频| 四虎影视精品| 91极品视频在线| 精品国产乱码一区二区三 | 日韩精品成人在线| 国产福利一区在线观看| 在线视频亚洲自拍| 日本黄色一区| 亚洲天堂免费观看| 五月天综合激情| 成人av网在线| 免费观看亚洲视频| 成人久久精品| 久久精品视频在线播放| 亚洲天堂中文网| 国产欧美一区二区三区鸳鸯浴| 亚洲色成人一区二区三区小说| 美女视频亚洲色图| 国内偷自视频区视频综合| 国产黄色片av| 一区二区三区波多野结衣在线观看| 亚洲免费成人在线视频| 91亚洲国产成人久久精品| 国产精品免费一区| 在线国产情侣| 正在播放一区二区| 男女性高潮免费网站| 久久91精品久久久久久秒播| 日本三级福利片| **精品中文字幕一区二区三区| 色偷偷综合社区| 一级特黄色大片| 亚洲欧洲成人精品av97| 亚洲黄色av片| 欧美啪啪一区| 精品产品国产在线不卡| 中文字幕资源网在线观看免费| 亚洲精品美女在线观看| 久久久免费高清视频| 99久久99精品久久久久久| 欧美三级在线观看视频| 亚洲美女15p| 国产精品丝袜白浆摸在线| 日本网站在线免费观看视频| 欧美一区二区三区精品| 日本午夜精品理论片a级app发布| 91亚洲男人天堂| 午夜视频在线瓜伦| 99久久精品网| 国产女主播一区二区| 台湾佬中文娱乐久久久| 中文字幕一区电影| 精品人妻少妇嫩草av无码专区| 亚洲18色成人| 天天摸日日摸狠狠添| 国产做a爰片久久毛片| www.激情网| 亚洲另类av| 国产日韩中文在线| h片在线观看下载| 亚洲天堂色网站| 国产毛片毛片毛片毛片| 欧美日韩国产丝袜美女| 秋霞网一区二区三区| 国产电影一区在线| 91视频最新入口| 欧美激情成人| 久久精品二区| 深爱五月激情网| 成人在线视频免费| 欧美猛男性生活免费| 天堂av2024| 北条麻妃在线一区二区免费播放 | 国产在线播放不卡| 香蕉久久aⅴ一区二区三区| 日韩成人xxxx| 国产精品美女在线观看直播| 精品国产乱码久久久久久免费 | 极品白浆推特女神在线观看| 欧美人动与zoxxxx乱| 日韩免费不卡视频| 国产精品国产三级国产有无不卡| 在线精品视频播放| 久久99精品一区二区三区三区| 日韩三级视频中文字幕| 丰满少妇被猛烈进入一区二区| 99久久99久久精品国产片果冻| 日本高清一区二区视频| 久久av最新网址| 久久www视频| 日韩精品欧美| 久热国产精品视频一区二区三区| av日韩一区| 国产成人在线一区二区| heyzo高清中文字幕在线| 久久九九免费视频| 国产一二三区在线视频| 日韩成人xxxx| 欧美 日韩 人妻 高清 中文| 欧美二区乱c少妇| 亚洲婷婷久久综合| 日韩欧美在线免费| 国产午夜激情视频| 亚洲影视在线播放| 99久久婷婷国产综合| 亚洲国产经典视频| 91网站免费视频| 久久色在线视频| 真人bbbbbbbbb毛片| 成人一级黄色片| 国产伦精品一区二区三区88av| 国产精品一级片| 一个人看的视频www| 国产综合色精品一区二区三区| 波多结衣在线观看| 日本aⅴ亚洲精品中文乱码| 欧美日本视频在线观看| 亚洲高清二区| 黄色一级视频在线播放| 最新国产拍偷乱拍精品 | 国产精品日韩久久久| 成人国产在线看| 欧美日韩亚洲一区在线观看| 欧美精品一区二区性色a+v| 日韩欧美中文| 一道本在线观看视频| 欧美一区综合| 91午夜在线观看| 国产午夜精品一区二区三区欧美| 欧美亚洲国产成人| 久久激情一区| 亚洲成色www.777999| 免费成人在线影院| 亚洲精品综合在线观看| 国产一区999| 乱码一区二区三区| av午夜一区麻豆| 国产成人无码精品久久二区三| 国产日韩欧美激情| 少妇高潮惨叫久久久久| 日韩毛片高清在线播放| 波多野结衣爱爱视频| 亚洲一区二区三区免费视频| 国产成人无码精品久在线观看| 欧美视频国产精品| 中日韩在线观看视频| 日韩小视频在线观看专区| 亚洲欧美高清视频| 亚洲欧洲一区二区三区在线观看| 国产h视频在线观看| 日韩在线观看精品| 精精国产xxxx视频在线中文版| 欧美亚洲成人xxx| 欧美成人免费全部网站| 亚洲在线观看视频网站| 天堂av一区二区三区在线播放| 亚洲第一在线综合在线| 国内精品亚洲| 精品久久久久久中文字幕2017| 精品一区二区三区的国产在线播放| 麻豆短视频在线观看| 国产婷婷色一区二区三区| 青草草在线视频| 色琪琪一区二区三区亚洲区| 91精品国产乱码久久久| 337p日本欧洲亚洲大胆精品| 电影在线高清| 国模gogo一区二区大胆私拍| 91国拍精品国产粉嫩亚洲一区| 高清不卡日本v二区在线| 精品视频免费| av在线播放天堂| 久久99精品久久久| 亚洲永久无码7777kkk| ㊣最新国产の精品bt伙计久久| 日本亚洲欧美在线| 欧美日本一区二区在线观看| 女人18毛片水真多18精品| 日韩中文字幕av| 丝袜诱惑一区二区| 99久久伊人精品影院| 成人在线一区| 久久久久久久久久福利| 国产成人小视频| 亚洲欧洲综合网| 日韩欧美在线观看| 国模人体一区二区| 久久艹在线视频| 69堂精品视频在线播放| 九色综合婷婷综合| 欧美福利电影在线观看| 污污的网站免费| 中文字幕不卡的av| 久久久久久少妇| 亚洲第一精品夜夜躁人人躁| 国产二区三区在线| 国产欧美在线看| 欧美丝袜激情| www.色偷偷.com| 久久久99久久| 天堂网一区二区三区| 日韩欧美视频一区| 免费黄网在线观看| 国产精品欧美风情| 精品香蕉视频| 国产一区视频免费观看| 久久日韩精品一区二区五区| 日本中文字幕免费| 日韩精品一区二区三区蜜臀| 午夜在线小视频| 国产女精品视频网站免费| 成人网18免费网站| 三级a在线观看| 国产女人18水真多18精品一级做| 国产婷婷色一区二区在线观看| 日韩av在线播放资源| av影片在线| 久久99精品久久久久久久青青日本 | 999精品视频在线观看| 亚洲一区二区三区免费观看| 日本视频一区二区三区| 日本精品在线观看视频| 色婷婷一区二区三区四区| 免费一级在线观看播放网址| 日本电影亚洲天堂| 国产一区网站| 色婷婷.com| 有码一区二区三区| www日本高清| 国内精品400部情侣激情| 久久中文资源| 情侣黄网站免费看| 国产婷婷一区二区| 亚洲视频一区在线播放| 色综合亚洲精品激情狠狠| 在线观看欧美| 日本久久久网站| 成人av网址在线| 五月天激情四射| 中文字幕亚洲精品| vam成人资源在线观看| 992tv快乐视频| 91在线云播放| 一级片在线免费播放| 久久韩国免费视频| 亚洲1区在线| 乱妇乱女熟妇熟女网站| 中文字幕欧美激情一区| av老司机久久| 欧美又大粗又爽又黄大片视频| 国产一区二区三区网| 中文字幕成人免费视频| 亚洲影院在线观看| 青青草观看免费视频在线| 国产在线观看一区二区三区| 欧美三级免费| xxxx日本黄色| 日韩欧美国产精品| 户外露出一区二区三区| 九一免费在线观看| 久久亚洲精精品中文字幕早川悠里| 一本久道久久综合无码中文| 欧美黑人视频一区| 欧美日韩在线观看视频小说| 免费看三级黄色片| 色呦呦国产精品| 成年人黄视频在线观看| 久久天天狠狠| 国内成人精品2018免费看| www.国产com| 九九精品视频在线| 欧美禁忌电影| 95视频在线观看| 欧美日韩国产123区| 国产白浆在线免费观看| 中文字幕日韩一区二区三区不卡| 99久久精品免费精品国产|