精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破視頻多模態(tài)大模型瓶頸!「合成數據」立大功,項目已開源

人工智能 新聞
本研究介紹了高質量的專為視頻語言指令任務設計的 LLaVA-Video-178K 數據集。

本文作者來自字節(jié)跳動,南洋理工大學 S-Lab 和北京郵電大學。其中第一作者為南洋理工大學 S-Lab 的博士生 Yuanhan Zhang (https://zhangyuanhan-ai.github.io/),主要研究領域為將基礎模型適配于開放世界。本文的指導老師為 Ziwei Liu 教授 ((https://liuziwei7.github.io/) 和 Chunyuan Li 博士 (https://chunyuan.li/), 其中 Chunyuan Li 領導了這個項目。本文其他作者包括北京郵電大學 Jinming Wu,南洋理工大學 S-Lab 的博士生 Bo Li, 字節(jié)跳動研究員 Wei Li, Zejun Ma.

視頻多模態(tài)大模型(LMMs)的發(fā)展受限于從網絡獲取大量高質量視頻數據。為解決這一問題,我們提出了一種替代方法,創(chuàng)建一個專為視頻指令跟隨任務設計的高質量合成數據集,名為 LLaVA-Video-178K。

該數據集包含詳細的視頻的描述、開放式問答(QA)、和多項選擇題。通過在該數據集和現有的視覺指令微調數據上訓練模型,我們推出了新的視頻 LMM——LLaVA-Video。實驗表明,LLaVA-Video 在多個視頻基準上表現出色,展示了該數據集的有效性。

圖片

  • 論文標題:VIDEO INSTRUCTION TUNING WITH SYNTHETIC DATA
  • 論文鏈接:https://arxiv.org/pdf/2410.02713
  • 項目主頁:https://llava-vl.github.io/blog/2024-09-30-llava-video/

先來看一組交互性演示,了解 LLaVA-Video 在真實世界中與人交互:

1.LLaVA-Video 教我下載 "TikTok":

2.LLaVA-Video 描述我的客廳,并指導我找健康飲料:

視頻指令跟隨數據合成

一個高質量的視頻指令跟隨數據集對于開發(fā)有效的視頻語言模型至關重要。我們確定了構建此類數據集的關鍵因素:確保視頻內容和語言注釋的豐富性和多樣性。我們對現有的視頻基準進行了全面調查,涵蓋了各種公共視頻描述和問答數據集,然后確定了十個獨特的視頻來源,這些來源為超過 40 個視頻語言基準提供了數據。從每個來源中,我們選擇具有顯著時間動態(tài)的視頻。為了保持注釋的多樣性,我們建立了一條能夠生成任何長度視頻的詳細描述的流水線。此外,我們定義了 16 種問題類型,指導 GPT-4o 生成問答對,以訓練視頻語言模型的感知和推理能力。

視頻來源

我們注意到,盡管不同的視頻語言數據集側重于各種視頻理解任務,但大多數都來源于十個主要視頻來源,這些來源提供了廣泛的來自不同網站、拍攝視角和題材的視頻。下圖展示了這十個我們選擇的視頻數據集與其他現有視頻語言數據集之間的關系。進一步,我們從這些來源中選擇了動態(tài)視頻,詳細的選擇邏輯在論文中描述。

圖片

我們使用的 10 個視頻來源與其他現有視頻語言數據集的關系。

自動生成視頻詳細描述

對于選定的視頻,我們使用 GPT-4o 系統(tǒng)地描述其內容。我們從每秒一幀的頻率開始采樣視頻。然而,由于 GPT-4o 的輸入大小限制,我們無法一次性使用視頻中所有采樣的幀。因此,我們按順序描述視頻,如下圖所示。我們在三個不同級別上創(chuàng)建描述,詳細如下,簡單來說,第一個層級(leve-1)指的是針對 10s 區(qū)間的視頻描述,第二個層級(level-2)指的是針對 30s 區(qū)間的視頻描述,第三個層級(level-3)指的是針對整個視頻的描述。

圖片

視頻描述的生成流程:通過遞歸方法對三個不同的視頻描述層級(leve-1,level-2,level-3)進行描述。`t` 是時間區(qū)間在其自身層級的索引,`T` 是最后一個時間區(qū)間的索引。(a) 我們根據 level-1 的 `t` 內收集的幀、level-1 的 `t-1` 的描述,以及最近的一次 level-2 描述(如果有的話),來生成 level-1 時間區(qū)間 `t` 的視頻描述。(b) 我們使用 level-2 的 `t-1` 的描述,以及最近的三個 level-1 描述,生成 level-2 的時間區(qū)間 `t` 的描述, (c) 我們基于最近一次 level-2 的描述和最近的一次 level-1 的描述,生成 level-3 的 `T` 的描述。

自動生成視頻問答

除了詳細的視頻描述,我們的數據集中還包含設計用于復雜交互的各種問答對。這種設置提高了視頻理解模型處理現實問題的能力。我們參考公共視頻問答基準,將這些問題組織為 16 種特定類別,如圖 3 所示。給定詳細的視頻描述,我們使用 GPT-4o 為每種問題類型最多生成一個問答對。有關問題類型和生成過程的更多細節(jié),請參閱論文。

圖片

數據創(chuàng)建中用于生成視頻問答對的問題類型。對于每種類型,我們提供其名稱和示例問題。

數據集統(tǒng)計

我們從收集到的數據源中精心挑選,以形成一個平衡且全面的集合,最終得到總共 178K 個視頻和 1.3M 個指令跟隨樣本。這包括 178K 個視頻描述、960K 個開放式問答和 196K 個多項選擇問答。

圖片

不同數據集和問題類型(描述、開放式 Q&A、多項選擇 Q&A)中的數據分布。

圖片

一個用于說明 LLaVA-Video-178K 中視頻指令跟隨數據的示例。

數據集比較

圖片

LLaVA-Video-178K 和其他視頻語言數據集的比較。平均 FPS 代表用于提示 GPT-4o/GPT-4V 進行注釋的每秒幀數。★:VIDAL, WebVid, ActivityNet。?:Panda-70M, Pexels, Pixabay, Mixkit, BDD100K, Ego4d。?:HD-VILA-100M, Kinetics-700M, Ego4D, VidOR, InternVid, YouCook2, ActivityNet, Sth-sthv2, VIDAL, Charades。

我們提供了和其他高質量指令跟隨視頻語言數據集的比較,LLaVA-Video-178K 展現了如下優(yōu)勢

1. 廣泛的動態(tài)視頻集合:在視頻來源方面,雖然 LLaVA-Hound 包含最多的視頻,但其 44% 的視頻數據來自 [WebVid](https://ak.picdn.net/shutterstock/videos/21179416/preview/stock-footage-aerial-shot-winter-forest.mp4),其中大多數視頻是靜態(tài)的。ShareGPT4Video 的 30% 視頻來自 [Pexels](https://www.pexels.com/video/a-bird-is-standing-on-the-beach-27916646/)、[Pixabay](https://pixabay.com/videos/plane-modelling-miniature-lockheed-134519/) 和 [Mixkit](https://mixkit.co/free-stock-video/a-young-woman-clad-in-snugly-black-sportswear-doing-lunges-52112/)。這些視頻美學效果很好,但是同時存在視頻本身較為靜態(tài)的弊病。此外,其大部分視頻來自 Panda-70M,這些是從較長視頻中剪輯的短片,其情節(jié)較為簡單。相比之下,我們精心選擇了動態(tài),情節(jié)復雜的視頻,這對于開發(fā)強大的視頻理解模型至關重要。

2. 高幀率:關于采樣的幀的頻率,LLaVA-Video-178K 考慮了 1 FPS,而其他數據集考慮的 FPS 較低。LLaVA-Hound 從任意長度的視頻中均勻采樣 10 幀。平均 FPS 為 0.008,這樣會錯過一些細節(jié)。ShareGPT4Video 使用 CLIP 基于幀的獨特性選擇關鍵幀。此方法可能也會錯過視頻中的細微變化,因為 CLIP 的特征無法很好地捕捉細粒度動態(tài)。我們的方法以 FPS=1 進行采樣,不使用關鍵幀選擇算法,確保詳細的時間信息能夠在注釋中得到高覆蓋率的表達。

3. 多樣化的任務:所提出的數據集考慮了三種常見的任務類型,包括描述、自由形式和封閉形式問答,而現有的數據集僅考慮了其中的一部分。同時,我們數據集的樣本質量和數量更高。

該數據集聚焦動態(tài)視頻, 高幀率, 和多樣化的任務, 讓視頻多模態(tài)大模型洞察每一瞬精彩。

視頻表示

基于經典的 SlowFast 視頻表示方法,我們開發(fā)了 LLaVA-Video_SlowFast,以在視頻表示中,平衡幀數和視覺 token 的數量,同時考慮 LLM 的上下文窗口限制和 GPU 內存的限制。

具體來說,我們根據擊中率 s 將幀分為兩組,每隔 s 幀均勻選出形成 * 慢 * 幀組,剩下的幀被認為是 * 快 * 幀組。需要注意的是,當 s=1 時,只有一組幀,這種情況下 SlowFast 表示就簡化為原始的簡單表示。對于每組幀,我們使用 PyTorch 函數 avg_pool2d}() 應用不同的池化率。我們對慢幀使用 pXp 池化,對快幀使用 2pX2p 池化。

基準性能

圖片

LLaVA-Video 的表現。對于 VideoDC 和 VideoChatGPT 的,我們使用 5 分制度打分,其他評測集結果以準確率打分。所有結果均為 0-shot 準確率。* 表示該評測集的訓練集已在我們的訓練集中使用。

我們在視頻和圖像數據的聯合數據集上微調了 LLaVA-OneVision (SI)。具體而言,我們添加了來自 LLaVA-Video-178K 數據集和四個公共數據集的視頻數據:ActivityNet-QA、NExT-QA、PerceptionTest 和 LLaVA-Hound-255K,此外,我們還使用了來自 LLaVA-OneVision 模型的 110 萬個圖像語言對。如表格所示,LLaVA-Video 展現了出色的性能。

結論

本研究介紹了高質量的專為視頻語言指令任務設計的 LLaVA-Video-178K 數據集。它的特點是在較長的未修剪視頻中進行密集的幀采樣,覆蓋了包括字幕制作、開放式和多項選擇問答等多種任務。通過將 LLaVA-Video-178K 數據集與現有的視覺指令數據結合起來,我們開發(fā)了一系列新的模型,LLaVA-Video。這些模型改進了視頻表現,更有效地利用了 GPU 資源,使我們能夠在訓練過程中處理更多幀。實驗結果證明了所提出的合成數據集的有效性,LLaVA-Video 模型在各種視頻基準測試中都表現出色。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-25 14:30:00

模型AI

2025-01-08 08:21:16

2025-07-24 08:40:00

2024-12-18 18:57:58

2024-08-08 13:04:28

2024-12-25 14:30:00

大語言模型AI計算

2024-01-22 13:59:00

模型訓練

2024-03-06 09:00:00

大語言模型人工智能

2023-02-23 07:46:48

學習模型數據倉庫

2025-05-28 03:30:00

AI人工智能大數據

2025-09-16 09:35:52

2025-03-06 00:15:00

3D場景數據

2024-11-13 09:39:13

2024-06-20 10:49:15

2024-01-16 14:23:32

大數據人工智能AI

2023-05-15 12:14:02

ChatGPT語音模型

2024-10-30 15:00:00

AI視頻模型

2025-01-26 09:07:46

2025-03-19 09:30:00

點贊
收藏

51CTO技術棧公眾號

色呦呦久久久| 国产毛片毛片毛片毛片| 免费看日本一区二区| 欧美色视频日本版| 欧美日韩一区二区三区在线视频| 亚洲欧美日韩三级| 四虎影院观看视频在线观看 | 欧美日韩大片一区二区三区| 日韩成人在线免费视频| 尤物tv在线精品| 4hu四虎永久在线影院成人| 一卡二卡三卡视频| av基地在线| 成人一区二区三区视频在线观看 | 天天干天天舔天天操| 亚洲男女网站| 欧美日韩国产色| 亚洲国产精品久久久久婷婷老年 | 777午夜精品免费视频| 老汉色影院首页| 日本不卡视频一区二区| 国产在线一区二区| 2019中文字幕在线观看| 欧美性x x x| 国产精品亚洲人成在99www| 日韩欧美电影在线| 三上悠亚av一区二区三区| gogo久久| 亚洲人成网站精品片在线观看 | 欧美aⅴ在线观看| 在线视频婷婷| 国产亚洲一二三区| 久久综合九色99| 97精品久久人人爽人人爽| 久久成人在线| 97成人在线视频| 久久久久人妻一区精品色欧美| 国产精选久久| 欧美性欧美巨大黑白大战| 久久久久久av无码免费网站下载| 精品人妻少妇嫩草av无码专区| 99精品美女| 亚洲精品日韩欧美| 精品1卡二卡三卡四卡老狼| 日韩黄色在线| 欧美日韩中文字幕一区| 久久国产色av免费观看| 看黄在线观看| 性感美女久久精品| 天堂8在线天堂资源bt| 成人看av片| 亚洲免费av观看| 中文字幕一区二区三区最新| 日本视频在线| 成人欧美一区二区三区1314| 亚洲mv在线看| √新版天堂资源在线资源| 国产日韩精品一区二区三区在线| 国产精品高潮呻吟久久av黑人| 摸摸摸bbb毛毛毛片| 最近国产精品视频| 一本色道久久88精品综合| 色婷婷免费视频| 国产成人tv| 亚洲精品久久久久久久久| 欧产日产国产精品98| 精品视频自拍| 日韩精品免费一线在线观看| 欧美无人区码suv| 日韩欧美四区| 尤物精品国产第一福利三区 | 国产aⅴ综合色| 99理论电影网| 黄色av一区二区三区| 白白色亚洲国产精品| 精品网站在线看| 都市激情一区| 亚洲免费视频中文字幕| 国产肉体ⅹxxx137大胆| 18在线观看的| 亚洲国产裸拍裸体视频在线观看乱了 | 最近中文字幕在线观看| 日本一不卡视频| 91久久夜色精品国产网站| a毛片在线免费观看| 成人av中文字幕| 日韩久久久久久久| av色综合久久天堂av色综合在| 日本一区二区三区久久久久久久久不| 成人av播放| 欧美女优在线观看| 亚洲欧美在线高清| 国产白丝袜美女久久久久| av有声小说一区二区三区| 91精品国产aⅴ一区二区| 在线观看免费视频黄| 国产精品欧美在线观看| 欧美老少配视频| 国产精品500部| 欧美a级理论片| 国产日韩精品推荐| 欧洲日本在线| 亚洲国产精品一区二区久久 | 欧美精品一区二区成人| 亚洲一卡久久| 亚洲影视中文字幕| 国产在线你懂得| 亚洲一二三四久久| 亚洲成人天堂网| 韩国女主播一区二区三区| 日韩在线观看免费| 人妻丰满熟妇av无码区| 国产久卡久卡久卡久卡视频精品| 成人黄色在线播放| 免费在线黄色影片| 亚洲成年人影院| 日本国产一级片| 妖精一区二区三区精品视频 | 久久精品亚洲| y111111国产精品久久婷婷| shkd中文字幕久久在线观看| 婷婷久久综合九色综合伊人色| 奇米影视亚洲色图| 麻豆一二三区精品蜜桃| 中文字幕在线观看亚洲| 三级视频在线观看| 成人18视频在线播放| 日韩最新中文字幕| 国产a亚洲精品| 亚洲欧美在线一区二区| 中日韩黄色大片| 国产成人亚洲精品狼色在线| 国产又黄又爽免费视频| 国产精品无码久久久久| 在线成人一区二区| 一级黄色av片| 国产亚洲精品福利| 999精品网站| 免费看av成人| 国产精品h片在线播放| 免费a在线观看| 欧美日韩在线影院| 毛茸茸多毛bbb毛多视频| 狠狠久久婷婷| 岛国视频一区| 黑人另类精品××××性爽| 日韩丝袜美女视频| 91视频综合网| 国产精品12区| 日本黄色片一级片| 成人h动漫免费观看网站| 欧美大片免费看| 亚洲第一色视频| 亚洲国产婷婷综合在线精品| 亚洲成人精品在线播放| 影音先锋久久资源网| 极品日韩久久| 免费福利视频一区二区三区| 亚洲偷欧美偷国内偷| 超碰在线免费97| 欧美国产精品一区二区三区| 不卡的av中文字幕| 一区二区三区在线电影| 99se婷婷在线视频观看| 福利小视频在线| 亚洲黄色在线看| 无码人妻精品一区二区三区9厂| 国产麻豆成人精品| 久久久久久久久久久久久国产| 亚洲精品一级二级| 色视频www在线播放国产成人 | 在线观看视频一区| 色撸撸在线视频| 国产精品伊人色| r级无码视频在线观看| 日韩av黄色在线| 国产精品久久久久久亚洲影视| 日本精品999| 色噜噜狠狠色综合欧洲selulu| 免费观看一区二区三区| 国产精品嫩草99av在线| 欧美最大成人综合网| 欧美黑粗硬大| 国内精品视频一区| a中文在线播放| 精品伦理精品一区| 无码人妻丰满熟妇区bbbbxxxx| 91丨九色porny丨蝌蚪| 乱子伦视频在线看| 欧美一区二区三区另类| 免费久久99精品国产自| 成人av在线播放| 91av在线看| 免费在线观看av| 亚洲国产天堂久久综合| 中文字幕在线播出| 亚洲午夜日本在线观看| 中文字幕伦理片| 成人精品视频网站| 色一情一区二区| 国产日韩一区二区三区在线| 综合视频在线观看| 亚洲动漫精品| 国产高清一区视频| 99久久久国产精品免费调教网站| 伊人久久久久久久久久久| www.国产三级| 欧美日韩三级一区二区| 亚洲激情视频一区| 成人欧美一区二区三区小说| 三上悠亚影音先锋| 成人三级在线视频| 一级淫片在线观看| 日韩电影一区二区三区| 欧美久久久久久久久久久久久| 国产精品毛片久久久| 国产日韩欧美在线| 美脚恋feet久草欧美| 高清在线视频日韩欧美| 免费av在线播放| 亚洲午夜小视频| 天堂91在线| 精品国产乱码久久久久久老虎 | a级毛片免费观看在线| 亚洲欧美日韩爽爽影院| 人妻少妇一区二区三区| 欧美一区二区日韩一区二区| 中文字幕欧美色图| 欧美日韩国产精品一区二区不卡中文| 波多野结衣av在线观看| 99re热这里只有精品免费视频| 女人扒开屁股爽桶30分钟| 红桃视频欧美| 天天想你在线观看完整版电影免费| 色播一区二区| 91精品综合久久久久久五月天| 欧洲在线视频| 九九久久精品一区| 成人video亚洲精品| 久久精品国产久精国产一老狼| 亚洲精品一级片| 欧美一区日韩一区| 国产人妻精品一区二区三区| 6080亚洲精品一区二区| 一区二区三区日| 91精品国产综合久久精品app | 91精品国产综合久久国产大片| 玖玖爱这里只有精品| 中文字幕中文乱码欧美一区二区| 中国xxxx性xxxx产国| 成人在线视频一区| av在线播放网址| 99国产精品视频免费观看| 国产老熟女伦老熟妇露脸| 91久色porny| 97人妻人人揉人人躁人人| 亚洲国产精品成人综合色在线婷婷| 91精品又粗又猛又爽| 成人爱爱电影网址| 不卡一区二区在线观看| 国产亚洲欧美在线| 自拍偷拍第9页| 亚洲人成网站色在线观看| 九九精品在线观看视频| 亚洲小说欧美激情另类| 国产香蕉在线视频| 欧美性xxxx极品高清hd直播| 少妇无套内谢久久久久| 欧美另类变人与禽xxxxx| 亚洲av无码乱码国产精品| 亚洲电影免费观看高清完整版在线观看 | 欧美做受高潮6| 久久久久99精品一区| 亚洲天堂精品一区| 亚洲精品菠萝久久久久久久| 日韩激情在线播放| 91久久精品一区二区| 国产精品视频一二区| 精品国产91洋老外米糕| 青青青草网站免费视频在线观看| 亚洲成色www8888| 黄色小视频在线免费观看| 色999日韩欧美国产| 国产区美女在线| 国产v综合v亚洲欧美久久| 99久久99九九99九九九| 精品国产91亚洲一区二区三区www| 国产精品xnxxcom| 国产精品免费一区二区三区四区| 视频免费一区二区| 久久综合九色99| 99久久久久久中文字幕一区| 国产精品www在线观看| 日韩黄色免费网站| 佐佐木明希电影| 欧美韩国日本不卡| www.99re7.com| 欧美午夜精品一区二区三区| 风流少妇一区二区三区91| 中文字幕少妇一区二区三区| 97超碰免费在线| 成人亚洲欧美一区二区三区| 偷拍亚洲色图| 中文字幕色呦呦| 免费在线看一区| av鲁丝一区鲁丝二区鲁丝三区| 97久久超碰国产精品| 国产美女久久久久久| 精品久久久久久久久久久| 91中文字幕在线视频| 亚洲天堂av女优| 超碰高清在线| 91影院未满十八岁禁止入内| 日韩精品诱惑一区?区三区| 亚洲熟妇国产熟妇肥婆| 国产精品1区2区3区| 美女网站视频色| 色综合咪咪久久| 熟妇人妻一区二区三区四区| 成人444kkkk在线观看| 国产一区二区三区朝在线观看| 国产日韩中文在线| 久久99国产精品视频| 青青青青在线视频| 精品一区二区国语对白| 阿v天堂2014| 91极品视觉盛宴| 色av男人的天堂免费在线| 久久久久久久久久久免费精品| 少妇视频一区| 国产精品一级久久久| 欧美日一区二区三区在线观看国产免| 国内少妇毛片视频| 国产精品一区在线观看你懂的| 亚洲天堂2024| 亚洲精品免费视频| 国产精品一级二级| 久久精品国产亚洲| 欧美男男gaygay1069| 色狠狠久久av五月综合|| 先锋影音久久久| 少妇光屁股影院| 欧美网站在线观看| 日本福利片在线| 国产精品福利网站| 日韩综合在线| 亚洲第一色av| 一区二区成人在线| 欧美一区,二区| 51久久精品夜色国产麻豆| 日韩中文av| 欧美 国产 小说 另类| 国产亚洲成年网址在线观看| 中文字幕手机在线视频| 一区二区三区 在线观看视| se69色成人网wwwsex| 亚洲欧洲精品一区二区| 精品一区二区免费视频| 国产免费一区二区三区四区| 欧美一级黄色大片| 国产91足控脚交在线观看| 国产日本一区二区三区| 久久久蜜桃一区二区人| 亚洲最大成人综合网| 欧美日本在线观看| 最爽无遮挡行房视频在线| 国产99视频精品免费视频36| 日韩视频一区| 亚洲国产天堂av| 88在线观看91蜜桃国自产| 秋霞在线视频| 乱色588欧美| 蜜乳av一区二区| 久久一区二区三| 亚洲欧美综合v| 一区二区三区无毛| 日韩 欧美 视频| 久久久国产一区二区三区四区小说| 精品无码人妻一区二区三| 亚洲久久久久久久久久久| 亚洲mmav| 美女av免费观看| 久久精品欧美日韩精品| 999免费视频| 国内精品小视频在线观看| 欧美久久综合网| 国产精品亚洲一区二区无码| 一本色道亚洲精品aⅴ| 精品国产白色丝袜高跟鞋| 国产在线一区二区三区四区| 蜜桃视频在线观看一区二区| 欧美国产日韩综合| 在线a欧美视频| 精品视频自拍| 色婷婷激情视频| 日韩欧美在线视频| 在线中文免费视频| 亚洲v欧美v另类v综合v日韩v| 青椒成人免费视频| 久久免费在线观看视频|