精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達&MIT等推出Long-RL,長視頻訓練速度翻倍

人工智能 新聞
今天,視覺語言模型(VLM)和大語言模型(LLM)越來越強,但現實里,當它們需要處理小時級視頻、多模態輸入、需要長時一致性和上下文推理時,傳統的開源方案往往力不從心。

請想象……

一個 AI—— 它要完整看完一場幾十分鐘的世界杯決賽,不只是數球門數,更要跨越上百個鏡頭的線索、情緒、戰術細節,甚至要像人一樣推斷:誰會贏點球大戰?

圖片

足球比賽預測分析

預測《星際爭霸 2》這樣的即時戰略游戲同樣需要考慮許多不同的變量,難度也非常巨大。

圖片

星際爭霸 2 比賽預測分析

再換個場景:同樣是 AI,在一場緊張的德州撲克超級豪客賽上,面對職業牌手的每一次下注、加注、棄牌,能否像一個頂尖牌手一樣,推理出對手藏在手里的那兩張底牌?

圖片

德州撲克比賽猜牌

不只是「看」,還要記住所有公共牌、下注順序、翻牌后的心理博弈,甚至對手的打法偏好 —— 然后在最后一張河牌翻開時,做出最優推斷。

再換一個小游戲:三只杯子,一顆小球。人盯著屏幕都可能跟丟,AI 能不能像魔術師一樣,在上百幀交換里牢牢盯住那顆小球的位置?

圖片

移動杯子猜測小球位置

這背后,AI 需要的不只是「識別」,更是跨時域、跨模態的推理、記憶和博弈洞察。

這,正是 Long-RL 想要解決的挑戰:如何讓大模型在面對長視頻和復雜策略推理時,不只是看見,更能理解和推演。

今天,視覺語言模型(VLM)和大語言模型(LLM)越來越強,但現實里,當它們需要處理小時級視頻、多模態輸入、需要長時一致性和上下文推理時,傳統的開源方案往往力不從心。

要跑長序列?顯存炸了。

要多模態?上下游兼容難。

要 RL 高效?采樣慢,回報低。

針對這些難題,英偉達近日聯合 MIT、香港大學、UC Berkeley 重磅推出 Long-RL,其能提升 RL 訓練數據長度上限,讓訓練速度翻倍。

圖片

  • 論文:Scaling RL to Long Videos
  • 項目地址:https://github.com/NVlabs/Long-RL
  • 論文鏈接:https://arxiv.org/abs/2507.07966

簡單來說,Long-RL 是一個真正面向長序列推理和多模態強化學習的全棧訓練框架。支持小時級長視頻 RL:單機可穩定訓練 3600 幀(256k tokens)。

Long-RL 的核心是 MR-SP 并行框架

MR-SP 的全稱是 Multi-modal Reinforcement Sequence Parallelism,即多模態強化序列并行,可在不同幀數下顯著降低長視頻推理的訓練耗時和顯存:啟用 MR-SP 后,訓練速度提升可達 2.1×,而傳統方案會因顯存不足直接 OOM。

圖片

那么,這是如何做到的呢?具體來說,MR-SP 分為兩個階段。

圖片

Multi-modal Reinforcement Sequence Parallel (MR-SP) 系統

其中,第 1 階段是使用并行編碼的 Rollout。

為了高效地支持長視頻強化學習,該團隊在視頻編碼階段采用了序列并行 (SP) 機制。

如上圖左所示,輸入視頻幀首先會被均勻地分配到多臺 GPU(例如,GPU 1 至 GPU 3)上,每臺 GPU 都配備了各自的視覺塔(vision tower)。每臺 GPU 獨立處理視頻的一部分,并且僅對其中一部分幀進行編碼。然后,生成的視頻嵌入將通過 all-gather 操作與文本嵌入進行聚合,如圖中 All-Gather 箭頭所示。此策略可分散編碼工作負載,使系統能夠利用更多 GPU 來處理更長的視頻,同時避免 GPU 內存溢出的風險。

并行編碼方案可確保視覺塔的均衡利用,并實現可擴展的長視頻處理,而這在單臺設備上是無法實現的。

視頻嵌入在被全局收集后,將在整個強化學習流程中被下游重復使用。

如上圖所示,收集到的嵌入在多次 rollout 過程中可重復使用,且無需重新計算。例如,在每個訓練步驟中,通常會執行 8 到 16 次 rollout。如果不進行回收,同一視頻每一步都需要重新編碼數十次,這會嚴重影響訓練速度。通過緩存和重用收集到的嵌入,MR-SP 可消除這種冗余,并顯著加快訓練速度。

第 2 階段則是使用序列并行進行預填充。

對于每次 rollout,參考模型和策略模型都需要在強化學習中對長視頻進行計算密集型預填充。通過復用第 1 階段收集到的嵌入,可使用序列并行在各個設備之間并行化推理階段。

如上圖右所示,這里的方案是全局收集輸入嵌入 —— 這些嵌入首先會被填充到統一長度(Padding Sequence),然后均勻地分配到各臺 GPU(Sharding to Local GPU)。

這樣一來,每臺 GPU 在預填充期間只需處理輸入序列的一部分。這種并行性適用于策略和參考模型的預填充。然后,每臺 GPU 會在本地計算其 token 切片的 logit,并且并行進行預填充。

Long-RL 也是一個多模態 RL 工具箱

該團隊也將 Long-RL 打造成了一個完整的多模態 RL 工具箱,能適配:

  1. 多模型:除了 VILA 系列、Qwen/Qwen-VL 系列這些 LLMs/VLMs,也支持 Stable Diffusion、Wan 等生成模型。
  2. 多算法:GRPO、DAPO、Reinforce,一行切換。
  3. 多模態:不僅文本,視頻、音頻一起上。

圖片

LongVILA-R1

使用 Long-RL,英偉達的這個團隊構建了 LongVILA-R1 訓練框架。從名字也能看到出來,這個訓練框架基于 VILA—— 一個同樣來自該公司的視覺-語言模型(VLM),詳見論文《VILA: On Pre-training for Visual Language Models》。

訓練流程方面,LongVILA-R1 基于 LongVILA 的基礎訓練流程,然后進一步使用 MM-SP 以通過長 CoT 在長視頻理解任務進行 SFT。然后,通過多模態強化序列并行 (MR-SP) 進行強化 scaling 學習。

圖片

LongVILA-R1 訓練流程

框架上,LongVILA-R1 集成了 MR-SP 來實現可擴展視頻幀編碼和 LLM 預填充。強化學習采用了基于 vLLM 的引擎,并帶有緩存的視頻嵌入,并針對 LongVILA rollout 進行了定制。針對準確度和格式的獎勵將作為策略優化的引導。

圖片

LongVILA-R1 強化學習訓練框架

LongVILA-R1 可以說是 Long-RL 的「明星學員」,專門攻克長視頻推理這塊硬骨頭。

總結起來,它的創新點可以用三個關鍵詞概括:

  • 大規模高質量數據 LongVideo-Reason:52K 長視頻推理樣本,涵蓋 Temporal / Goal / Spatial / Plot 四大類推理。
  • 兩階段訓練:先用 CoT-SFT 把鏈式推理打基礎,再用 RL 強化泛化,學得更穩更深。
  • MR-SP 高效并行:多模態長序列并行,特征可復用,一次緩存多次用。

圖片

大規模數據集 LongVideo-Reason

效果如何?

在 LongVideo-Reason-eval 這種強推理基準上,隨著幀數增加,加入推理顯著提高了準確度,并且相比無推理設置優勢逐漸擴大。

圖片

該團隊也通過消融實驗驗證了各組件的有效性。

圖片

在真實世界里,無論是看一場完整的足球賽、跟人多輪對話,還是讓機器人長時間工作,都需要 AI 能在長時間里保留上下文、持續推理,并根據反饋自我調整。這正是強化學習(RL)擅長的:不斷試錯、獲取回報、做出更優決策。

該團隊表示:只有把 RL 和長序列推理結合起來,AI 才可能跨越「一次推理」走向「持續智能」—— 這也是 AGI 的必經之路。

研究團隊

圖片

陳玉康現任 NVIDIA 研究科學家,于香港中文大學獲得博士學位,從事大語言模型(LLM)、視覺語言模型(VLM)、高效深度學習等方面研究。目前已在國際頂級會議和期刊發表論文 30 余篇;多項研究成果在 ICLR、CVPR 等頂級會議上獲選口頭報告,并在 Google Scholar 上累計引用超過 5,000 次,代表作包括 VoxelNeXt, LongLoRA, LongVILA, Long-RL. 他作為第一作者主導的多個開源項目在 GitHub 上已獲得超過 6,000 星標。并在包括 Microsoft COCO、ScanNet 和 nuScenes 等多個國際知名競賽和榜單中取得冠軍或第一名的成績。

圖片

黃煒,香港大學二年級博士生。主要研究方向為輕量化(多模態)大語言模型,神經網絡壓縮以及高效多模態推理模型訓練,在 ICML、ICLR、CVPR 等會議和期刊發表多篇文章。在 NVIDIA 實習期間完成此工作。

圖片

陸垚現任 NVIDIA 杰出科學家,UCSD 博士。目前主要研究方向為視覺語言模型和視覺語言動作模型。他是開源視覺語言模型 VILA 系列的負責人。在加入 NVIDIA 之前,他是 Google DeepMind 的研究經理,曾一起領導研發 SayCan, RT-1, RT-2 等具身智能領域的奠基性工作。

圖片

韓松是 MIT 電氣工程與計算機科學系副教授、NVIDIA 杰出科學家,斯坦福大學博士。他提出了廣泛用于高效 AI 計算的「深度壓縮」技術,并首創將權重稀疏性引入 AI 芯片的「高效推理引擎」,該成果為 ISCA 50 年歷史引用量前五。他的團隊致力于將 AI 模型優化、壓縮并部署到資源受限設備,提升了大語言模型(LLM)和生成式 AI 在訓練和推理階段的效率,成果已被 NVIDIA TensorRT-LLM 采用。他曾獲 ICLR、FPGA、MLSys 最佳論文獎,入選 MIT 科技評論「35 歲以下科技創新 35 人」,并獲得 NSF CAREER 獎、IEEE「AI’s 10 to Watch」獎和 Sloan 研究獎。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-04 13:56:06

英偉達訓練模型

2025-07-08 08:50:38

MITAI視頻

2023-09-11 12:58:00

AI訓練

2025-10-20 08:58:00

2024-11-22 14:24:24

機器人AI

2025-07-09 09:25:10

2024-10-21 10:20:00

訓練模型

2025-10-20 08:55:00

2024-08-21 13:16:30

2024-11-19 19:33:49

2023-12-08 08:16:24

2023-11-01 13:47:44

2012-06-19 14:08:24

LinuxLinus Torva

2025-07-30 09:05:00

2025-06-16 09:13:00

2023-03-22 13:53:26

芯片英偉達

2025-05-12 08:24:01

2025-11-07 09:16:02

2024-08-06 14:30:00

AI模型

2021-08-20 15:32:14

機器人人工智能系統
點贊
收藏

51CTO技術棧公眾號

www.日韩免费| 欧美日韩视频在线一区二区| 精品国产二区在线| 无码人妻一区二区三区免费| 成人精品影院| 日韩欧美激情一区| 免费在线观看毛片网站| 九义人在线观看完整免费版电视剧| 国产麻豆精品95视频| 97精品国产97久久久久久| 欧美老女人性生活视频| 这里视频有精品| 色天使久久综合网天天| 奇米777四色影视在线看| 日韩av视屏| 国产麻豆精品theporn| 欧日韩不卡在线视频| 97在线观看免费高| 啄木系列成人av电影| 精品欧美乱码久久久久久| 九九热免费精品视频| 国产夫妻在线播放| 亚洲免费看黄网站| 亚洲国产精品久久久久久女王| 亚洲精品久久久久久久久久 | 中文字幕欧美专区| 这里只有精品在线观看视频| 成人国产精品久久| 欧美亚洲禁片免费| a在线视频观看| huan性巨大欧美| 中文字幕av不卡| 欧美极品色图| 视频一区 中文字幕| 国产剧情一区二区| 成人激情视频网| 日本黄色中文字幕| 亚洲女同同性videoxma| 久久久久久亚洲精品不卡| 日本中文在线视频| 久久中文亚洲字幕| 在线精品视频视频中文字幕| 国产男男chinese网站| 精品久久对白| 日韩av一卡二卡| 又黄又爽的网站| 99ri日韩精品视频| 日韩欧美高清在线| 久久久久久久久久久影视| 爱情电影网av一区二区| 欧美精品在欧美一区二区少妇| 天天碰免费视频| 欧美日韩精品免费观看视欧美高清免费大片 | 26uuu另类欧美| 国产福利一区二区三区在线观看| 亚洲av无码乱码国产精品fc2| 亚洲永久免费| 国产成人精品av在线| 亚洲影院在线播放| 首页综合国产亚洲丝袜| 国产v综合ⅴ日韩v欧美大片| 销魂美女一区二区| 蜜臀av在线播放一区二区三区| 国产精品福利在线观看| 中文字幕人妻一区二区三区视频| 日韩av在线播放中文字幕| 国产精品久久久久av免费| 探花国产精品一区二区| 免费xxxx性欧美18vr| 成人激情黄色网| 国产黄色小视频在线观看| 国产99久久久久久免费看农村| 国产精品一级久久久| 手机福利小视频在线播放| 久久久久成人黄色影片| 亚洲精品视频一二三| 黄色网页在线播放| 亚洲午夜在线电影| 免费黄色日本网站| 成人免费黄色| 日韩欧美国产一区在线观看| 岛国精品资源网站| 精品高清在线| 久久这里只有精品99| 国产第一页在线播放| 亚洲免费一区二区| 成人黄色生活片| 亚洲男女视频在线观看| www亚洲一区| 小说区视频区图片区| 国产99re66在线视频| 狠狠躁夜夜躁人人爽天天天天97| 在线观看国产成人av片| 免费在线观看你懂的| 国产韩国精品一区二区三区| 欧美日韩福利视频| 成人免费毛片男人用品| 精品制服美女丁香| 国产在线精品一区二区三区| 成人高清免费观看mv| 亚洲精品v日韩精品| 久久国产成人精品国产成人亚洲| a∨色狠狠一区二区三区| 欧美不卡123| 亚洲AV无码成人精品区明星换面 | 国产一区二区三区播放| 欧美激情20| 91精品中文字幕一区二区三区| 久久久久国产精品无码免费看| 不卡一区2区| 久久久久久久一| 中文字幕在线2019| 99在线热播精品免费| 中文字幕在线观看一区二区三区| 国产免费拔擦拔擦8x高清在线人| 欧美日本在线观看| 国产ts丝袜人妖系列视频| 天堂美国久久| 国产精品99久久久久久久久久久久 | 成年人性生活视频| 国产永久精品大片wwwapp| 欧美激情一区二区三区在线视频观看| 国产suv精品一区二区33| 国产91精品免费| 久久久一二三四| 亚洲www啪成人一区二区| 亚洲国产天堂久久综合| 国产精品白嫩白嫩大学美女| 久久99日本精品| 日韩欧美第二区在线观看| 蜜桃视频m3u8在线观看| 欧美大片免费久久精品三p| 天天色天天综合| 日韩成人一区二区| 日本一区视频在线播放| 蜜桃视频在线网站| 亚洲成人免费在线视频| 九九精品在线观看视频| 国产麻豆午夜三级精品| 91免费网站视频| 日韩电影免费观看高清完整版在线观看| 日韩av在线直播| 九九热在线视频播放| 成人美女视频在线观看18| 白白操在线视频| 午夜日韩影院| 九九热99久久久国产盗摄| 国产免费的av| 亚洲欧美在线aaa| 999在线观看| 久久一区91| 国产欧美日韩视频| 亚洲免费视频一区二区三区| 欧美伊人久久大香线蕉综合69| 麻豆精品免费视频| 久久久久久亚洲精品杨幂换脸| 免费一区二区三区| 精品91久久| 一区二区三区视频免费| 中国老头性行为xxxx| 国产精品女主播av| 久久久久久久久久毛片| 亚洲视频电影在线| 99热在线国产| 毛片在线网站| 亚洲人午夜精品免费| 中文字幕永久在线| 日韩毛片精品高清免费| 欧美体内she精高潮| 国产精品激情| 欧美黄色直播| 巨大黑人极品videos精品| 少妇激情综合网| 精品人妻一区二区三区日产乱码 | 日韩在线观看免费高清完整版| 又骚又黄的视频| 亚洲精品一卡二卡| 制服丝袜第一页在线观看| 麻豆亚洲精品| 一本一道久久a久久精品综合| 99精品视频在线免费播放| 欧美国产视频一区二区| 四虎精品成人免费网站| 欧美日韩在线不卡| 久久精品性爱视频| 国产色综合久久| 爱豆国产剧免费观看大全剧苏畅| 欧美日韩一区自拍| 欧美亚洲另类在线一区二区三区| 欧美在线一级| 午夜精品一区二区三区在线播放| 国产粉嫩一区二区三区在线观看| 69av一区二区三区| 亚洲男人第一av| 亚洲日本乱码在线观看| 日韩 中文字幕| 国模少妇一区二区三区| 国产女大学生av| 一本一道久久综合狠狠老| 精品乱码一区二区三区| 亚洲黑人在线| 欧美壮男野外gaytube| 国产淫片在线观看| 亚洲乱亚洲乱妇无码| 国产精品免费无遮挡| 欧美性xxxx极品高清hd直播| 日韩在线一卡二卡| 久久女同互慰一区二区三区| 日本一区二区三区在线免费观看| 天堂久久久久va久久久久| 男人添女人荫蒂免费视频| 日韩综合一区| 欧美精品二区三区四区免费看视频| www欧美在线观看| 国产精品国产三级国产专播精品人| 丝袜在线视频| 久久久国产精品x99av| 国产一二三在线观看| 亚洲国产美女精品久久久久∴| 国产色片在线观看| 欧美色大人视频| 黄色污污网站在线观看| 午夜av一区二区| 妺妺窝人体色www婷婷| 国产精品久久久久久久岛一牛影视 | 久久国产视频一区| 一区二区视频在线看| 91香蕉国产视频| 久久久亚洲综合| 亚洲一区二区三区综合| 国产成人亚洲综合色影视| 中文字幕22页| 久久久久久久欧美精品| 日本一本二本在线观看| 女主播福利一区| 97超碰免费观看| 99精品国产一区二区三区| 色婷婷精品国产一区二区三区| 亚洲精品456| 久久99蜜桃综合影院免费观看| 国产精品宾馆| 国产伦一区二区三区色一情| 91久久偷偷做嫩草影院电| 91在线视频九色| avtt久久| 亚洲在线第一页| 日日夜夜精品视频| 亚洲mm色国产网站| 只有精品亚洲| 亚洲xxxx18| 久久久久亚洲精品中文字幕| 91久久精品久久国产性色也91| 成人久久精品| 97se国产在线视频| 国产精久久一区二区| 92福利视频午夜1000合集在线观看 | 国产91麻豆视频| 精品成人私密视频| 天天操天天干天天| 亚洲码在线观看| yw在线观看| 精品精品国产国产自在线| 国产原创在线观看| 久久成人这里只有精品| 欧美韩日亚洲| 欧美亚洲视频一区二区| 免费欧美电影| 成人免费视频97| 91成人午夜| 热re99久久精品国产99热| 日本一区二区三区视频| 蜜臀av性久久久久蜜臀av| 欧美三级视频| 日日摸日日碰夜夜爽av| 日产欧产美韩系列久久99| av在线免费看片| 成人视屏免费看| 免费黄色片网站| 亚洲免费毛片网站| 圆产精品久久久久久久久久久| 色综合av在线| 国产又粗又猛又黄又爽| 精品国产污污免费网站入口| 免费在线观看污视频| 久久精品久久久久久| jizz一区二区三区| 国产精品69精品一区二区三区| 久久综合给合| 麻豆av一区二区三区久久| 欧美国产偷国产精品三区| 日韩精品在线观看av| 久久亚洲美女| 特种兵之深入敌后| 国产视频不卡一区| 麻豆一区二区三区精品视频| 在线观看一区二区精品视频| 国产成人精品亚洲精品色欲| 精品亚洲永久免费精品| 粗大黑人巨茎大战欧美成人| 欧美在线免费视频| 久久99成人| 青娱乐一区二区| 好看的亚洲午夜视频在线| 9久久婷婷国产综合精品性色 | 3d动漫精品啪啪1区2区免费 | 97精品国产露脸对白| 国产麻豆a毛片| 日韩欧美在线视频| 精品久久久久久亚洲综合网站| 亚洲欧美在线x视频| 四季久久免费一区二区三区四区| 国产精品久久久久久久午夜| 国内精品偷拍| 99re8这里只有精品| 久久九九精品| 亚洲男女在线观看| 一区二区成人在线| 中文字幕一区二区三区人妻四季| 精品国产髙清在线看国产毛片| 黄色av免费在线| 国产精品视频播放| 免费看成人哺乳视频网站| 国产色一区二区三区| 国产精品一二三| 欧洲性xxxx| 欧美综合一区二区三区| 日本在线视频1区| 国内精品久久久久伊人av| 国产一精品一av一免费爽爽| 亚洲mv在线看| 秋霞午夜av一区二区三区| 香蕉视频黄色在线观看| 亚洲成人动漫一区| 国产91免费看| 久久久久久综合网天天| 欧美专区一区| 国产香蕉一区二区三区| 精品一区二区三区视频在线观看| 熟女少妇内射日韩亚洲| 色天天综合久久久久综合片| 内衣办公室在线| 日本电影亚洲天堂| 免费一区二区三区视频导航| 国产乱子夫妻xx黑人xyx真爽| av一区二区三区黑人| 国产精品suv一区二区三区| 亚洲成av人乱码色午夜| av今日在线| 精品乱码一区二区三区| 性色一区二区| 69视频在线观看免费| 欧美在线视频全部完| 国产精品四虎| 国产啪精品视频| 91精品婷婷色在线观看| 欧美高清精品一区二区| 亚洲男人的天堂在线aⅴ视频| 国产特级黄色片| 欧美激情精品久久久久久黑人| 91在线一区| 无码人妻丰满熟妇区五十路百度| 国产性色一区二区| 亚洲影院一区二区三区| 超碰精品一区二区三区乱码| 国产精品美女久久久久人| 97久久国产亚洲精品超碰热| 不卡的av网站| 波多野结衣黄色网址| 俺去亚洲欧洲欧美日韩| 亚洲精品aⅴ| 欧洲av无码放荡人妇网站| 欧美国产日产图区| 国产jzjzjz丝袜老师水多| 4438全国成人免费| 日产精品一区二区| 精人妻一区二区三区| 欧美日韩国产在线看| 国产午夜精品一区理论片| 成人午夜一级二级三级| 亚洲激情影院| 刘亦菲国产毛片bd| 精品久久国产97色综合| 韩国精品主播一区二区在线观看| 一区二区三区我不卡| 成人免费毛片片v| 黄色av网站免费观看| 久久综合网hezyo| 欧美黄色录像| 国内国产精品天干天干| 亚洲成人动漫一区| 91精品专区| 国产主播一区二区三区四区| 日本欧美韩国一区三区| 精品午夜福利在线观看| 伊人男人综合视频网| 91夜夜蜜桃臀一区二区三区| 五月天激情视频在线观看| 亚洲国产美国国产综合一区二区| 国产黄色在线播放| 国产精品亚洲综合|