精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

沒有等來OpenAI開源GPT-4o,等來了開源版VITA

人工智能 新聞
本文 ,來自騰訊優圖實驗室等機構的研究者提出了 VITA,這是第一個開源的多模態大語言模型 (MLLM),它能夠同時處理和分析視頻、圖像、文本和音頻模態,同時具有先進的多模態交互體驗。

大語言模型 (LLM) 經歷了重大的演變,最近,我們也目睹了多模態大語言模型 (MLLM) 的蓬勃發展,它們表現出令人驚訝的多模態能力。

特別是,GPT-4o 的出現顯著推動了 MLLM 領域的發展。然而,與這些模型相對應的開源模型卻明顯不足。開源社區迫切需要進一步促進該領域的發展,這一點怎么強調也不為過。

本文 ,來自騰訊優圖實驗室等機構的研究者提出了 VITA,這是第一個開源的多模態大語言模型 (MLLM),它能夠同時處理和分析視頻、圖像、文本和音頻模態,同時具有先進的多模態交互體驗。

研究者以 Mixtral 8×7B 為語言基礎,然后擴大其漢語詞匯量,并進行雙語指令微調。除此以外,研究者進一步通過多模態對齊和指令微調的兩階段多任務學習賦予語言模型視覺和音頻能力。

VITA 展示了強大的多語言、視覺和音頻理解能力,其在單模態和多模態基準測試中的出色表現證明了這一點。

除了基礎能力,該研究在提升自然多模態人機交互體驗方面也取得了長足進步。據了解,這是第一個在 MLLM 中利用非喚醒交互和音頻中斷的研究。研究者還設計了額外的狀態 token 以及相應的訓練數據和策略來感知各種交互場景。

VITA 的部署采用復式方案,其中一個模型負責生成對用戶查詢的響應,另一個模型持續跟蹤環境輸入。這使得 VITA 具有令人印象深刻的人機交互功能。

VITA 是開源社區探索多模態理解和交互無縫集成的第一步。雖然在 VITA 上還有很多工作要做才能接近閉源同行,但該研究希望 VITA 作為先驅者的角色可以成為后續研究的基石。

圖片

  • 論文地址:https://arxiv.org/pdf/2408.05211
  • 論文主頁:https://vita-home.github.io/
  • 論文標題:VITA: Towards Open-Source Interactive Omni Multimodal LLM

在上述視頻中,用戶可以和 VITA 進行無障礙的溝通,看到用戶穿的白色 T 恤后,會給出搭配什么顏色的褲子;在被問到數學題時,能夠實時查看題目類型,進行推理,然后給出準確的答案;當你和別人講話時,VITA 也不會插嘴,因為知道用戶不是和它交流;出去旅游,VITA 也會給出一些建議;在 VITA 輸出的過程中,你也可以實時打斷對話,并展開另一個話題。

在這個視頻中,用戶拿著一個餅干,詢問 VITA 自己在吃什么,VITA 給出在吃餅干,并給出餅干搭配牛奶或者茶口感會更好的建議。

健身時,充當你的聊天搭子:

注:上述視頻都是實時 1 倍速播放,沒有經過加速處理。

根據用戶提供的流程圖,VITA 就能編寫代碼:

圖片

提供一張圖片,VITA 也能根據圖片內容回答問題:

圖片

還能觀看視頻回答問題,當用戶拋出問題「詳細描述狗的動作」,VITA 也能準確給出答案:

圖片

方法介紹

如圖 3 所示,VITA 的整體訓練流程包括三個階段:LLM 指令微調、多模態對齊和多模態指令微調。

圖片

LLM 指令微調

Mixtral 8x7B 的性能屬于頂級開源 LLM 中一員,因此該研究將其作為基礎。然而研究者觀察到官方的 Mixtral 模型在理解中文方面的能力有限。為了注入雙語(中文和英文)理解能力,該研究將中文詞匯量擴展到基礎模型,將詞匯量從 32,000 個增加到 51,747 個。在擴展詞匯量后,研究者使用 500 萬個合成的雙語語料庫進行純文本指令微調。

多模態對齊

為了彌合文本和其他模態之間的表征差距,從而為多模態理解奠定基礎。僅在視覺對齊階段訓練視覺連接器。表 1 總結了所使用的訓練數據,除了純文本部分。

圖片

視覺模態

首先是視覺編碼器。研究者使用 InternViT-300M-448px 作為視覺編碼器,它以分辨率 448×448 的圖像作為輸入,并在使用一個作為簡單兩層 MLP 的視覺連接器后生成了 256 個 token。對于高分辨率圖像輸入,研究者利用動態 patching 策略來捕捉局部細節。

視頻被視作圖像的特殊用例。如果視頻長度短于 4 秒,則統一每秒采樣 4 幀。如果視頻長度在 4 秒到 16 秒之間,則每秒采樣一幀。對于時長超過 16 秒的視頻,統一采樣 16 幀。

其次是視覺對齊。研究者僅在視覺對齊階段訓練視覺連接器,并且在該階段沒有使用音頻問題。

最后是數據級聯。對于純文本數據和圖像數據,該研究旨在將上下文長度級聯到 6K token,如圖 4 所示。值得注意的是,視頻數據不進行級聯。

圖片

級聯不同的數據有兩個好處:

  • 它支持更長的上下文長度,允許從單個圖像問題交互擴展到多個圖像問題交互,從而產生更靈活的輸入形式,并擴展上下文長度。
  • 它提高了計算效率,因為視頻幀通常包含大量視覺 token。通過級聯圖像 - 問題對,該研究可以在訓練批中保持平衡的 token 數量,從而提高計算效率。

此外,該研究發現使用級聯數據訓練的模型與使用原始數據訓練的模型性能相當。

音頻模態

一方面是音頻編碼器。輸入音頻在最開始通過一個 Mel 濾波器組塊進行處理,該塊將音頻信號分解為 mel 頻率范圍內的各個頻帶,模仿人類對聲音的非線性感知。隨后,研究者先后利用了一個 4×CNN 的下采樣層和一個 24 層的 transformer,總共 3.41 億參數,用來處理輸入特征。同時他們使用一個簡單的兩層 MLP 作為音頻 - 文本模態連接器。最后,每 2 秒的音頻輸入被編碼為 25 個 tokens。

另一方面是音頻對齊。對于對齊任務,研究者利用了自動語言識別(ASR)。數據集包括 Wenetspeech(擁有超過 1 萬小時的多領域語音識別數據,主要側重于中文任務)和 Gigaspeech(擁有 1 萬小時的高質量音頻數據,大部分數據面向英文語音識別任務)。對于音頻字幕任務,研究者使用了 Wavcaps 的 AudioSet SL 子集,包含了 400k 個具有相應音頻字幕的音頻片段。在對齊過程中,音頻編碼器和連接器都經過了訓練。

多模態指令微調

該研究對模型進行了指令調整,以增強其指令遵循能力,無論是文本還是音頻。

數據構建。指令調優階段的數據源與表 1 中對齊階段的數據源相同,但該研究做了以下改進:

問題被隨機(大約一半)替換為其音頻版本(使用 TTS 技術,例如 GPT-SoVITS6),旨在增強模型對音頻查詢的理解及其指令遵循能力。

設置不同的系統 prompt,避免不同類型數據之間的沖突,如表 2 所示。例如,有些問題可以根據視覺信息來回答或者基于模型自己的知識,導致沖突。此外,圖像數據已被 patch,類似于多幀視頻數據,這可能會混淆模型。系統 prompt 顯式區分不同數據類型,有助于更直觀地理解。

圖片

為了實現兩種交互功能,即非喚醒交互和音頻中斷交互,該研究提出了復式部署框架,即同時部署了兩個 VITA 模型,如圖 1 所示。

圖片

在典型情況下,生成模型(Generation model)會回答用戶查詢。同時,監控模型(Monitoring model)在生成過程中檢測環境聲音。它忽略非查詢用戶聲音,但在識別到查詢音頻時停止生成模型的進度。監控模型隨后會整合歷史上下文并響應最新的用戶查詢,生成模型和監控模型的身份發生了轉換。

圖片

實驗評估

語言性能。為了驗證語言模型訓練過程的有效性,研究者使用了四個數據集,分別是 C-EVAL、AGIEVAL、MMLU 和 GSM8K。這些數據集涵蓋了各種場景,包括一般選擇題、多學科問答題以及數學和邏輯推理任務,同時覆蓋了中英文上下文。

下表 3 的結果表明,本文的訓練顯著增強了語言模型在中文評估集(C-EVAL 和 AGIEVAL)上的能力,同時保持了在英文相關基準(MMLU)上的原始性能水平,并在數學推理任務(GSM8K)上實現顯著提升。

圖片

音頻性能。為了驗證模型學得的語音表示的穩健性,研究者在 Wenetspeech 和 Librispeech 兩個數據集上進行了測試。

其中 Wenetspeech 有兩個評估指標,分別是 test_net 和 test_meeting,前者數據源與訓練數據更加一致,因而更容易;后者提出了更大的挑戰。作為模型的 held-out 數據集,Librispeech 評估了模型在未見過數據集上的泛化能力,它有四個評估集,以「dev」開頭的是驗證集,以「test」開頭的是測試集,「Clean」代表挑戰性較低的集,「other」代表挑戰性更高的集。

從下表 4 的結果可以看到,VITA 在 ASR 基準測試上取得了非常不錯的結果。

圖片

多模態性能。為了評估多模態能力,該研究在四個基準上評估了 VITA,包括 MME 、OCRBench、HallusionBench 和 Video-MME。結果如圖 5 所示。

在圖像理解方面,VITA 優于圖像專用開源模型 LLaVA-Next,并且接近閉源模型 Gemini 1.5 Pro。

在視頻理解方面,VITA 超過了視頻開源模型 Video-CCAM。盡管 VITA 和視頻專用的 LLaVA-Next-Video 之間存在差距,但考慮到 VITA 支持更廣泛的模態并優先考慮可交互性,因而這是可以接受的。

最后,值得注意的是,目前開源模型與專有模型在視頻理解能力方面仍存在較大差距。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-18 08:02:26

2025-08-07 14:05:40

OpenAI大模型開源

2024-09-24 11:13:14

2025-04-16 09:15:00

AI模型數據

2025-04-08 02:26:00

2024-07-04 15:26:56

2025-05-26 09:05:00

2024-05-14 11:29:15

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2024-05-15 09:13:37

GPT-4oAI

2024-10-17 13:30:00

2024-09-23 15:10:00

2025-08-11 08:42:00

GPT-5AI模型

2025-08-05 09:15:15

2024-05-15 17:34:15

2024-08-08 14:27:29

2024-07-31 13:20:14

2025-03-31 08:50:00

AI生成模型

2024-05-21 12:23:17

2024-07-08 08:25:00

點贊
收藏

51CTO技術棧公眾號

亚洲三级在线视频| 伊人狠狠色丁香综合尤物| 国产精品500部| 小说区图片区色综合区| 欧美人伦禁忌dvd放荡欲情| av动漫在线播放| 日本啊v在线| 国内精品自线一区二区三区视频| 亚洲91精品在线| 丰满的亚洲女人毛茸茸| 91大神精品| 欧美日韩一级片网站| 丁香六月激情婷婷| 免费观看成人高潮| 久久精品一区二区三区四区| 亚洲伊人一本大道中文字幕| 国产午夜麻豆影院在线观看| 天天综合网网欲色| 亚洲天堂免费视频| 亚洲免费观看在线| 视频欧美精品| 色就色 综合激情| 免费在线看黄色片| 麻豆传媒在线观看| 国产区在线观看成人精品| 成人综合电影| av网站在线免费看| 日本大胆欧美人术艺术动态| 亚洲亚洲精品在线观看| 日本高清不卡一区二区三| 日韩精品手机在线| 亚洲成av人片乱码色午夜| 亚洲欧美视频在线| xfplay5566色资源网站| av日韩一区| 欧美性生活一区| 无码人妻丰满熟妇区毛片| 电影k8一区二区三区久久| 亚洲欧美在线aaa| 国产主播欧美精品| 日本一本在线观看| 欧美亚洲自偷自偷| 97在线免费观看| 国产在线视频你懂的| 综合国产在线| 久久伊人色综合| 国产精品夜夜夜爽阿娇| 成人激情在线| 中文字幕久精品免费视频| 国产激情在线免费观看| 亚洲自拍电影| 亚洲男人的天堂在线| 在线免费观看黄色小视频| 美国一区二区| 日韩精品视频观看| 黄色片视频免费观看| 精品丝袜久久| 日韩精品在线播放| 少妇毛片一区二区三区| 亚洲丝袜美腿一区| 亚洲欧美日韩网| 性猛交ⅹxxx富婆video| av一区二区高清| 色99之美女主播在线视频| 免费看的黄色录像| 国产二区精品| 欧美国产极速在线| 亚洲激情视频一区| 香蕉亚洲视频| 国产精品看片资源| 97人妻精品一区二区三区视频| 精彩视频一区二区| 超碰97人人在线| 搡老岳熟女国产熟妇| 91视频91自| 亚洲高清视频一区| 国产理论在线观看| 亚洲一区二区中文在线| 每日在线更新av| 亚洲第一会所| 欧美一区二区三区四区在线观看 | 欧美精品日韩在线| 国产精品福利在线观看播放| 欧美精品999| 六月丁香激情综合| 麻豆国产精品一区二区三区| 91网站在线免费观看| 午夜精品久久久久久久99热黄桃| 99久久精品免费看国产| 欧美亚洲爱爱另类综合| 国产一二区在线观看| 亚洲mv在线观看| 北条麻妃av高潮尖叫在线观看| 欧美风情在线视频| 精品国产百合女同互慰| 日韩视频在线观看免费视频| 欧美午夜电影在线观看| 国产第一区电影| 不卡视频在线播放| 国产丝袜欧美中文另类| 超级碰在线观看| 成人午夜视屏| 日韩欧美的一区| 五月天综合视频| 欧美ab在线视频| 国产精品∨欧美精品v日韩精品| 国产婷婷一区二区三区久久| 久久综合狠狠综合久久激情 | 欧美色视频一区| 国产国语老龄妇女a片| 欧美日韩一二三四| 97国产精品免费视频| 国产精品国产三级国产aⅴ| 91色乱码一区二区三区| 法国空姐在线观看免费| 国产综合色区在线观看| 欧美精品一区二区在线观看| 乱老熟女一区二区三区| 亚洲尤物在线| 国产精品一区二区免费| 国产区在线观看| 欧美综合天天夜夜久久| 精品人妻一区二区三区香蕉| 欧美影视一区| 91久久久精品| 91精品专区| 视频在线观看入口黄最新永久免费国产| 亲子伦视频一区二区三区| 日韩一二三在线视频播| 无码人妻av免费一区二区三区| 成人综合婷婷国产精品久久免费| 亚洲一区二区三区精品在线观看| 最新欧美色图| 亚洲高清色综合| 欧美三级 欧美一级| 精彩视频一区二区| 亚洲资源视频| 久久天天久久| 中文字幕精品av| 激情网站在线观看| 久久久久免费观看| 无码精品国产一区二区三区免费| 亚洲精品一区二区三区中文字幕| 中文字幕国产精品久久| 中文字幕欧美色图| 久久久久国产精品麻豆| 鲁一鲁一鲁一鲁一澡| 奇米777国产一区国产二区| 国内精品一区二区三区四区| 成人精品在线播放| 亚洲成人一区二区| 国产a级黄色片| 日韩香蕉视频| 欧美国产一区二区在线| 成人爱爱网址| 亚洲天堂男人天堂| 怡春院在线视频| 国产精品另类一区| 欧美国产日韩另类 | 成人黄色片免费| 伊人久久影院| 午夜精品久久久久久久白皮肤 | 亚洲美女喷白浆| 亚洲精品男人的天堂| 国产欧美视频一区二区| 国产福利在线免费| 午夜久久久久| 九九99久久| 国产精品亚洲一区二区三区在线观看| 亚洲欧美中文日韩在线v日本| 日韩黄色片网站| 综合久久久久久久| 五月天丁香社区| 蜜桃久久av| 亚洲午夜精品久久| 视频二区欧美| 欧日韩不卡在线视频| av大片在线看| 日韩欧美一级特黄在线播放| 你懂的国产视频| 国产精品久久毛片av大全日韩| 欧美精品色视频| 国产一区二区高清| 亚洲人成网站在线观看播放| 色播一区二区| 国产成人在线一区二区| gogo在线高清视频| 国产偷国产偷亚洲清高网站| 在线免费看91| 午夜精品福利久久久| 国产综合精品久久久久成人av| 国产在线播放一区| 18禁男女爽爽爽午夜网站免费| 日韩久久电影| 黑人巨大精品欧美一区二区小视频| 秋霞国产精品| 欧美精品www| 国产免费视频在线| 日韩精品一区在线观看| 自拍偷拍校园春色| 亚洲不卡av一区二区三区| 国产精品理论在线| zzijzzij亚洲日本少妇熟睡| 免费看涩涩视频| 亚洲黄色免费| 黄色网址在线免费看| 亚洲精品国产setv| 97se亚洲综合在线| 欧美成人xxxx| 国产成人一区二区| 久草在线资源福利站| 久久国产精品久久久久久久久久| 国产小视频在线观看| 精品国产成人在线影院| 97在线公开视频| 欧美系列日韩一区| 日本中文字幕在线| 午夜影视日本亚洲欧洲精品| 国产日产精品一区二区三区的介绍| 26uuu亚洲| 日本人添下边视频免费| 久久国产人妖系列| 久久精品免费网站| 久久三级视频| 丝袜老师办公室里做好紧好爽| 欧美视频四区| 强开小嫩苞一区二区三区网站| 久久综合色占| 久久精品国产第一区二区三区最新章节| 欧洲一区在线| 成人在线播放av| 日韩国产大片| 国产日韩欧美成人| 人人玩人人添人人澡欧美| 国产精品91久久久久久| 在线成人av观看| 国产91精品久久久久久久| 变态调教一区二区三区| 欧美精品video| 91豆花视频在线播放| 色综合男人天堂| 牛牛精品在线视频| 欧美福利小视频| h片在线观看| 午夜精品久久久久久久99热浪潮 | 国产女主播在线播放| 国产精品一区在线观看乱码 | 亚洲成a天堂v人片| 久久久久无码精品国产| 亚洲尤物在线视频观看| 久久久久久久久久久97| 亚洲曰韩产成在线| 国产一级做a爱片久久毛片a| 精品人伦一区二区三区蜜桃网站| 国产真人真事毛片| 无码av中文一区二区三区桃花岛| 国产乱码久久久久久| 天涯成人国产亚洲精品一区av| 国产 欧美 日韩 在线| 狠狠久久五月精品中文字幕| 麻豆成人免费视频| 欧美午夜影院一区| 国产乱淫片视频| 欧美不卡123| 天堂成人在线| 日韩电影大全免费观看2023年上| 三级在线播放| 中文字幕亚洲综合久久筱田步美| 色网站免费在线观看| 欧美不卡视频一区发布| 1024在线看片你懂得| 日韩免费在线播放| 国产高清日韩| 欧美一级淫片aaaaaaa视频| 九色porny丨国产首页在线| 日韩av高清不卡| 欧洲亚洲精品| 国产精品嫩草在线观看| 亚洲a级精品| 中文字幕日韩一区二区三区不卡| 欧美国产精品| 久久久久狠狠高潮亚洲精品| 久久9热精品视频| 国产精品手机在线观看| 久久久国产一区二区三区四区小说 | 国产成人免费观看视频| 欧美视频在线播放| 亚洲av无码乱码在线观看性色| 日韩激情视频在线播放| 在线观看av黄网站永久| 国内成人精品视频| jizzjizz少妇亚洲水多| 国产精品初高中精品久久| 国产精品一区二区av交换| 亚洲av首页在线| 久久最新视频| 精人妻一区二区三区| 日本一区二区三区四区| 久久精品欧美一区二区| 欧美三级韩国三级日本一级| 国产免费黄色大片| 国产视频丨精品|在线观看| wwwav在线| 国产精品国语对白| 精品按摩偷拍| 只有这里有精品| 日韩高清一区二区| 毛茸茸free性熟hd| 亚洲视频一区二区在线| 在线观看你懂的网站| 亚洲激情成人网| 福利视频在线| 国产精品综合久久久| 色婷婷狠狠五月综合天色拍 | 黄色小说在线播放| 国产情人节一区| 精品一区毛片| 天天夜碰日日摸日日澡性色av| 精品一区二区在线播放| www色com| 色欧美片视频在线观看在线视频| 丰满人妻一区二区三区免费视频 | 91杏吧porn蝌蚪| 欧美在线色视频| 日本国产在线| 992tv成人免费影院| 99香蕉久久| 国产又粗又爽又黄的视频| 日本中文字幕一区二区有限公司| 国产精品伦子伦| 亚洲成av人片在www色猫咪| 成人av无码一区二区三区| 另类图片亚洲另类| 亚洲精品伊人| 在线视频一区观看| 黑人巨大精品欧美一区| av资源在线免费观看| 欧美日韩一区 二区 三区 久久精品 | 中文在线8资源库| 精品久久久久久一区| 亚洲精品社区| 亚洲av成人片色在线观看高潮| 亚洲一区二区不卡免费| 亚洲国产精品二区| 欧美国产极速在线| 成人台湾亚洲精品一区二区 | 久久精品国产亚洲aⅴ| 91导航在线观看| 欧美日韩国产一级二级| 午夜不卡视频| 国产日韩在线看片| 欧美一区二区三区另类| 超碰人人cao| 亚洲一区二区免费视频| 秋霞av鲁丝片一区二区| 2018中文字幕一区二区三区| 免费视频一区三区| 欧美在线观看视频网站| 国产精品区一区二区三| 国产毛片久久久久| 欧美国产日韩精品| 另类ts人妖一区二区三区| 97av视频在线观看| 国产精品无人区| 国产色片在线观看| 欧美激情一区二区三区在线视频观看 | 久久99久久99精品免视看婷婷| 中文字幕美女视频| 日韩欧美国产综合在线一区二区三区| 丰乳肥臀在线| 欧美伦理一区二区| 韩国三级在线一区| 国产精品16p| 亚洲欧美www| 亚洲精品一区av| 久久久久免费看黄a片app| 久久精品人人做| ,一级淫片a看免费| 97视频人免费观看| 欧美日韩一二| 欧美午夜精品一区二区| 欧美视频在线观看免费| 在线观看免费高清完整| 动漫3d精品一区二区三区| 久久精品123| 亚洲成人生活片| 国产视频丨精品|在线观看| 亚洲成a人片777777久久| 亚洲人成无码网站久久99热国产| 久久精品一区二区三区不卡牛牛| 国产精品一级视频| 热久久99这里有精品| 在线成人超碰| 黄瓜视频污在线观看| 日韩午夜电影在线观看| 欧美magnet| 久久国产精品网| 亚洲丝袜制服诱惑| 免费福利在线观看| 国产精品初高中精品久久|