精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小紅書&上交多模態大模型新基準,Gemini 1.5 Pro準確率僅48%

人工智能 新聞
通過對視覺信息、音頻信息以及視頻幀采樣密度的研究,為提升MLLMs在真實世界場景中的理解能力提供了重要的參考方向。

多模態大模型理解真實世界的水平到底如何?

有新基準來衡量了。

就在最近,小紅書和上海交通大學聯合提出WorldSense,一個全新的基準測試,用來評估多模態大模型(MLLMs)的多模態真實場景理解能力。

基于WorldSense,團隊對各種先進的MLLMs進行了廣泛評估,結果發現:

開源的視頻-音頻模型在該基準上的準確率僅約25%,幾乎等同于隨機猜測;即使是表現最好的專有模型 Gemini 1.5 Pro,準確率也只有48%,遠不能滿足可靠的真實世界應用需求。

下面具體來看。

WorldSense介紹

想象一下,當你開車時,不僅要依靠眼睛觀察道路標志、交通信號燈和障礙物,還要用耳朵聽其他車輛的喇叭聲、后方傳來的警笛聲,甚至通過手對方向盤的觸感、車輛行駛時的震動來做出實時決策,確保安全駕駛。

這就是人類在真實場景中自然的多模態信息整合能力。

而現在的多模態大模型,在處理這些復雜的真實世界場景時,表現究竟如何呢?

WorldSense的誕生,正是為了填補現有評估體系的關鍵空白。

與以往那些存在諸多局限性的基準測試不同,它具備三大核心亮點,為多模態大模型的評估開辟了新的道路。

全模態協同,深度融合感知

在WorldSense的設計中,音頻和視頻緊密耦合,每個問題都需要模型充分挖掘音頻和視頻中的線索,將兩者信息有機結合,才能找到正確答案。

比如,在上圖第一個例子中,有個人手里拿著水果。如果僅依靠視覺信息,我們可能只能看到他拿著東西這個動作,但很難確定他具體在做什么,是展示水果的顏色、大小,還是在進行其他操作;而僅憑借音頻,我們甚至都難以判斷他手中拿的是什么水果。

只有將視覺與音頻信息協同起來,模型才能準確理解場景,給出正確答案。這種設計嚴格考驗模型同時處理多種感官輸入、進行精準理解的能力。

最新的開源視頻音頻多模態大模型僅僅獲得了25%左右的準確率,而表現最好的Gemini 1.5 Pro也只有48%的準確率,并且在缺失一個模態的情況下性能下降約15%左右。

這進一步說明了全模態協同在真實世界感知的重要性和WorldSense中多模態信息的強耦合,也揭示了現有多模態大模型的局限性。

視頻與任務多樣性,全方位場景覆蓋

據介紹,WorldSense涵蓋了1662個視聽同步視頻,系統地分為8個主要領域和67個細粒度子類別,覆蓋了豐富的真實世界場景。

同時,它還包含3172個多選問答對,橫跨26種不同的認知任務,從基礎的物體識別、聲音辨別,到復雜的因果推理、抽象概念理解,全方位評估MLLMs的多模態理解能力。

高質量標注,可靠性的基石

為了保證評估的可靠性,所有的問答對都是由80位專家手動標注

而且,標注過程并非一蹴而就,而是經過多輪嚴格的人工審核,從語言表達的清晰度、邏輯的連貫性,到答案的準確性和唯一性,都進行了反復考量。

不僅如此,還借助自動MLLM驗證技術,進一步確保標注質量。

經過這樣雙重保障的標注過程,確保問題和答案的準確性和高質量。

實驗

如前所述,研究團隊基于WorldSense對各種先進的MLLMs進行了廣泛評估,結果令人深思。

開源的視頻 - 音頻模型在該基準上的準確率僅約25%,幾乎等同于隨機猜測;即使是表現最好的專有模型Gemini 1.5 Pro,準確率也只有48%,遠不能滿足可靠的真實世界應用需求。

這表明當前的模型在理解真實世界場景方面還面臨巨大挑戰,同時也凸顯了全模態協同理解的重要性。

為進一步深入剖析這些模型的性能短板,研究人員開展了細粒度分析,從不同音頻類型和任務類別兩個關鍵維度入手,挖掘模型在實際應用中的具體問題。

這一分析為我們深入洞察現有模型的局限性提供了關鍵視角。

最終結果如下:

1、音頻相關任務表現欠佳:模型在音頻識別、計數等任務上表現差,顯著落后于其他任務類型。這是由于音頻信號復雜,現有模型架構和訓練方法難以有效解析利用其中的頻率、音色等信息。

2、情感相關任務挑戰巨大:這類任務需整合面部表情、語氣語調、語音內容等多模態線索,模型表現較差,暗示其訓練數據缺乏情感樣本,且架構算法難以融合多模態信息進行判斷。

3、不同音頻類型下表現各異:以Gemini 1.5 Pro為例,其處理事件相關問題的準確率低于語音或音樂任務,其他模型也存在類似情況。這凸顯現有模型缺乏對各種音頻類型通用、穩定的理解能力。

鑒于上述評估中揭示的多模態大模型(MLLMs)在性能上的巨大差距,研究團隊深入探究了提升MLLMs性能的潛在方法,具體涵蓋視覺信息、音頻信息以及視頻幀等方面的研究。

視覺信息的影響

研究人員通過設置不同的輸入配置,探究視覺信息對模型性能的影響,這些配置包括僅音頻輸入、音頻結合視頻字幕輸入以及音頻結合視頻幀輸入。

從實驗結果來看,視覺信息通常能提升模型性能。以Gemini 1.5 Pro為例,其僅音頻輸入時準確率為34.6%,而添加視頻幀輸入后,準確率提升至48.0%。

然而,不同模型受視覺信息的影響存在差異。像UnifiedIO2系列模型,在結合視頻字幕輸入時,性能提升效果并不穩定,甚至出現了性能下降的情況。

這一現象表明,一方面,視覺信息若能被模型恰當整合,對增強多模態理解至關重要;另一方面,當前模型在有效利用視覺信息方面的能力仍然有限,可能是因為模型在處理視覺特征與其他模態信息融合時存在困難,或者是在提取視覺關鍵信息上還不夠高效。

音頻信息的作用

在音頻信息的研究上,團隊設置了三種輸入配置進行實驗,分別是僅視頻輸入、視頻結合字幕輸入以及視頻結合原始音頻輸入。

實驗結果呈現出有趣的規律

對于Gemini 1.5 Pro和OneLLM等模型,添加字幕能提高準確率,而添加原始音頻后,準確率提升更為顯著,這充分說明字幕和原始音頻中的聲學特征(如語氣、情感、環境聲音等)都為多模態理解提供了有價值的信息,且原始音頻包含了字幕無法捕捉的重要線索,對多模態理解意義重大。

但不同模型對音頻信息的處理能力也有所不同。UnifiedIO2 在整合字幕或音頻時,性能出現了下降,尤其是字幕輸入導致準確率明顯降低,這反映出該模型在多模態處理方面存在困難,可能無法有效融合音頻和視覺等多模態信息。

而Video - LLaMA2雖然在添加兩種模態信息時性能都有所提升,但對字幕的依賴更強,在處理原始音頻時表現相對較弱,這表明它更擅長處理文本形式的音頻信息,而在解析復雜聲學信息上能力不足。

此外,研究人員還對僅視頻輸入的 MLLMs 提供轉錄字幕進行評估,發現幾乎所有模型在添加字幕后性能都顯著提升,不過在音樂相關問題上,由于字幕無法有效捕捉旋律、節奏和和聲等固有聲學特征,性能提升并不明顯。

這進一步證明了原始音頻在多模態理解中的獨特價值,同時也表明當前模型在整合聲學和文本信息以實現全面場景理解方面存在較大的提升空間。

視頻幀采樣密度的效果

研究團隊還研究了視頻幀的時間采樣密度對模型性能的影響,通過改變僅視頻輸入的 MLLMs 的輸入幀數來進行實驗。

結果顯示,大多數模型在增加幀密度后,性能有顯著提升

這是因為更高的幀密度能夠讓模型更好地捕捉視頻中細粒度的時間動態變化和微妙的視覺改變,從而提升對視頻內容的理解。

例如,在一些包含快速動作或微小細節變化的視頻中,增加幀密度能讓模型獲取更多關鍵信息,進而做出更準確的判斷。但也有例外,如 LLaMA - 3.2 在增加幀密度時,性能并未提升。

這可能與該模型自身的架構特點或訓練方式有關,導致它無法有效利用增加的幀信息,這也為后續研究如何優化模型以更好地利用視頻幀信息提供了思考方向。

小結一下,通過對視覺信息、音頻信息以及視頻幀采樣密度的研究,為提升MLLMs在真實世界場景中的理解能力提供了重要的參考方向。

未來的研究可以基于這些發現,進一步優化模型架構和訓練方法,以增強模型對多模態信息的處理能力,縮小與人類真實世界理解能力之間的差距。

論文鏈接:
https://arxiv.org/abs/2502.04326
項目主頁:
https://jaaackhongggg.github.io/WorldSense/

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-03 08:22:00

模型評估視頻

2024-06-12 11:50:23

2025-05-26 08:33:00

2023-10-23 10:02:00

模型技術

2024-01-05 08:44:52

2025-08-07 16:24:19

小紅書開源dots.vlm1

2025-05-07 10:09:08

2023-10-26 08:40:15

模型隱私推理

2024-12-13 07:30:40

2023-11-08 08:38:43

2025-08-07 02:00:00

2025-01-08 08:21:16

2025-05-21 08:47:00

2025-05-06 15:32:23

模型AI測試

2025-05-21 13:56:37

模型圖像AI

2025-07-07 13:50:56

AI編程算法

2025-11-05 08:51:33

2024-09-25 16:08:52

2025-04-15 12:14:10

點贊
收藏

51CTO技術棧公眾號

在线男人天堂| 天天综合天天综合| 欧美日韩天堂| 精品伊人久久97| 亚洲少妇久久久| 天天色天天射天天综合网| av成人老司机| 国产精品专区一| 久久久久久久蜜桃| 国产精品自拍区| 日韩欧美久久久| 久久久久免费精品| 在线你懂的视频| 久久久久久久久久久久久久久99| 国产在线视频2019最新视频| 日本少妇性高潮| 婷婷激情综合| 亚洲精品视频播放| 一级做a爱视频| 欧美最新精品| 亚州成人在线电影| 一区二区三区一级片| 亚洲欧洲精品视频| 国产精品12区| 成人精品在线观看| 中文字幕日产av| 亚洲一区亚洲| 国外成人在线视频| 欧美成欧美va| 国产精品99久久久久久动医院| 日韩理论片久久| 国产chinesehd精品露脸| 日本另类视频| 日韩欧美高清在线视频| 国产在线播放观看| 俄罗斯一级**毛片在线播放| 国产精品超碰97尤物18| 日本电影一区二区三区| 亚洲 欧美 激情 另类| 国产精品91一区二区| 国产综合香蕉五月婷在线| 天天操天天干天天摸| 国产精品日本| 51视频国产精品一区二区| 国产在线成人精品午夜| 欧美.www| 久久91亚洲精品中文字幕奶水| 综合 欧美 亚洲日本| 深爱激情综合| 亚洲天堂av高清| 波多野结衣 在线| 亚欧洲精品视频在线观看| 精品1区2区在线观看| 中文字幕在线观看91| 欧美日韩中出| 欧美xxxxxxxxx| 精品少妇人妻av一区二区三区| 亚洲一区二区三区在线免费| 日韩欧美一级特黄在线播放| 潘金莲一级淫片aaaaa| 亚洲欧洲国产精品一区| 欧美成人国产一区二区| 成人啪啪18免费游戏链接| 91亚洲精品视频在线观看| 亚洲成年网站在线观看| 91玉足脚交白嫩脚丫| 天天操综合520| 一区二区三区动漫| 中文字幕求饶的少妇| 无码一区二区三区视频| 欧美乱妇高清无乱码| 18精品爽视频在线观看| 国产日韩欧美在线播放不卡| 欧美亚洲伦理www| 成人毛片一区二区三区| 理论电影国产精品| 97超碰最新| 五月激情六月婷婷| 国产日韩成人精品| 综合一区中文字幕| 成全电影大全在线观看| 色又黄又爽网站www久久| 国产又黄又猛又粗| 久久免费精品| 日韩av在线电影网| 内射毛片内射国产夫妻| 国产精品九九| 日本韩国欧美精品大片卡二| 在线免费观看日韩视频| 国产成人精品影视| 日本高清视频一区二区三区| 高清全集视频免费在线| 婷婷六月综合网| 免费涩涩18网站入口| 亚洲国产视频二区| 亚洲欧美综合v| 青青青在线免费观看| 国产精品久久久亚洲一区| 国产精品无av码在线观看| 国产后入清纯学生妹| 久久新电视剧免费观看| 国产av第一区| 日韩免费小视频| 精品99一区二区三区| 久久精品色妇熟妇丰满人妻| 国内精品福利| 国产欧美日韩丝袜精品一区| 粉嫩小泬无遮挡久久久久久| 国产人妖乱国产精品人妖| www.日本三级| 日韩第二十一页| 亚洲免费视频在线观看| 免费无遮挡无码永久在线观看视频| 老司机一区二区三区| 亚洲自拍偷拍视频| 成黄免费在线| 黄色成人在线播放| 中文字幕一二三区| 国产精品videosex性欧美| 日韩av电影在线播放| 成人午夜视频一区二区播放| 中文字幕亚洲精品在线观看| 国产精品wwwww| 另类ts人妖一区二区三区| 久久国产一区二区三区| 久操视频在线免费观看| 99久久精品国产一区二区三区 | 黄色免费视频大全| 国产精品1区在线| 国产一区二区三区在线观看视频| 国产一级性生活| 国产呦萝稀缺另类资源| 午夜精品视频在线观看一区二区| av电影免费在线看| 日韩一区二区三区在线观看| 国产精品视频在| 日韩av一区二区三区| 欧美18视频| 特黄毛片在线观看| 亚洲精品乱码久久久久久金桔影视| 特级片在线观看| 国产另类ts人妖一区二区| 中文字幕中文字幕99| 国产综合色激情| 尤物99国产成人精品视频| 亚洲 欧美 日韩 在线| 久久婷婷色综合| 六月丁香婷婷在线| 中文字幕伦av一区二区邻居| 欧美亚洲午夜视频在线观看| 午夜成人鲁丝片午夜精品| 欧美日韩国产综合视频在线观看中文| 国产不卡一二三| 国产一区二区你懂的| 久久精品国产美女| 欧美日韩免费观看视频| 最近中文字幕日韩精品| 一级片一区二区三区| 亚洲丝袜自拍清纯另类| 无码国产精品一区二区高潮| 欧美日韩亚洲一区三区| 国产在线一区二| 粉嫩一区二区| 综合av色偷偷网| 国产精品羞羞答答在线| 综合在线观看色| 韩国三级在线看| 国产视频亚洲| 日韩精品极品视频在线观看免费| 久久天天久久| 欧美另类在线播放| 日韩av成人| 欧美日韩国产影片| 久久亚洲精品大全| 久久精品一区二区三区不卡牛牛 | 日本一区二区欧美| 91免费国产视频网站| 丁香婷婷激情网| 在线精品国产| 久久综合色一本| 亚瑟国产精品| 97婷婷涩涩精品一区| 极品美乳网红视频免费在线观看 | 热久久99这里有精品| www免费网站在线观看| 91精品在线免费| 中文字幕日韩一级| 国产精品欧美精品| 91九色蝌蚪porny| 男人操女人的视频在线观看欧美| 精品国产三级a∨在线| 任你躁在线精品免费| 国产日韩欧美日韩大片| www在线观看黄色| 日韩在线观看免费全| 色综合视频在线| 制服.丝袜.亚洲.中文.综合| 国产成人在线观看网站| 中文字幕亚洲在| 噜噜噜在线视频| 国内精品国产三级国产a久久| 国产v片免费观看| 婷婷综合视频| 日韩精品久久一区二区三区| 在线视频亚洲欧美中文| 国产精品永久免费| 亚洲性色av| 欧美激情免费看| 日韩免费啪啪| 亚洲区中文字幕| 黄色片一区二区三区| 69久久夜色精品国产69蝌蚪网| 亚洲精品男人的天堂| 一区二区国产盗摄色噜噜| 欧美色图17p| 国产亚洲1区2区3区| 国产午夜在线一区二区三区| 激情深爱一区二区| 香蕉视频禁止18| 日韩国产一区二| 无码人妻丰满熟妇区96| 欧美三级在线| 97精品国产97久久久久久粉红| 国产精品一国产精品| 久久久综合香蕉尹人综合网| 91蜜桃臀久久一区二区| 亚洲一区亚洲二区亚洲三区| 成人看片毛片免费播放器| 青青草原成人在线视频| 波多野结衣在线播放| 久久99国产综合精品女同| 男人天堂手机在线| 中文字幕一区电影| 国产69精品久久app免费版| 国产午夜精品麻豆| 三级无遮挡在线观看| 亚洲精品720p| 欧美自拍偷拍第一页| 精品成人一区二区三区| 丰满人妻熟女aⅴ一区| 日韩欧美不卡在线观看视频| 99精品免费观看| 91精品国产色综合久久久蜜香臀| 亚洲午夜激情视频| 欧美精品久久99久久在免费线| 中文字幕你懂的| 欧洲一区二区三区免费视频| 伊人成年综合网| 欧美亚洲一区三区| 亚洲天堂网在线观看视频| 欧美三级电影网站| 国产精品乱码久久久| 欧美一区三区二区| 性生交生活影碟片| 欧美xxxxxxxxx| 五月婷婷狠狠干| 亚洲跨种族黑人xxx| 韩国精品视频| 中文字幕日韩在线播放| 老司机午夜在线视频| 欧美老女人性视频| 999av小视频在线| 日韩av电影在线免费播放| 成人在线免费av| 亚洲专区中文字幕| 青青一区二区| 水蜜桃亚洲一二三四在线| 久久综合88| 国产 欧美 日韩 一区| 亚洲每日在线| 999精品视频在线| 国内精品久久久久影院薰衣草| 精品伦一区二区三区| 91欧美一区二区| 久久精品国产亚洲AV成人婷婷| 亚洲欧洲成人精品av97| 免费在线观看国产精品| 欧美日韩亚洲精品内裤| 中文字幕乱伦视频| 日韩欧美激情一区| 欧美女v视频| 久久久久www| 久久影院午夜精品| 91精品久久久久久久久不口人| 亚洲午夜精品| 神马影院我不卡午夜| 欧美一区亚洲| 97公开免费视频| 成人网页在线观看| 久久久久亚洲av无码a片| 亚洲乱码精品一二三四区日韩在线| 日本中文字幕网| 欧美色综合久久| 成人午夜视频一区二区播放| 在线看国产精品| h片视频在线观看| 国产精品亚洲自拍| 精品成人自拍视频| www.-级毛片线天内射视视| 亚洲欧美日韩国产一区二区| 手机精品视频在线| 国产三级欧美三级日产三级99| 欧美丰满熟妇bbbbbb| 91久久精品国产91性色tv| 国内精品偷拍视频| 中文字幕久热精品在线视频| 超碰中文在线| 91久热免费在线视频| 欧美猛男同性videos| 久久久久久久9| 麻豆免费精品视频| 三级电影在线看| 亚洲精品日韩综合观看成人91| 日本中文字幕在线观看视频| 精品对白一区国产伦| 欧美jizzhd69巨大| 日本视频久久久| 加勒比视频一区| 国产片侵犯亲女视频播放| 久久福利资源站| 国产一级久久久久毛片精品| 岛国av午夜精品| 天堂中文资源在线观看| 色综合男人天堂| 国产剧情一区二区在线观看| 亚洲激情电影在线| 日本视频免费一区| 欧美特级黄色录像| 色综合视频在线观看| 手机看片国产1024| 欧美激情手机在线视频 | 欧美日韩经典丝袜| 7777精品久久久大香线蕉小说| 欧美超碰在线| 久热精品在线观看视频| 国产欧美一区二区三区在线老狼| 六月丁香在线视频| 亚洲精品国产美女| 亚洲优女在线| 久久久久久久久四区三区| 亚洲精品婷婷| 国产福利在线观看视频| 欧美日韩国产影院| 欧美成人综合在线| 日韩av快播网址| 红桃成人av在线播放| 九热视频在线观看| 国产精品你懂的在线欣赏| 中文字幕+乱码+中文乱码www| 亚洲网在线观看| 国产一区二区主播在线| 亚洲精品一区国产精品| 日本女人一区二区三区| 国产白丝一区二区三区| 欧美军同video69gay| √天堂8在线网| 粉嫩av免费一区二区三区| 亚洲精品社区| 少妇人妻好深好紧精品无码| 欧美无乱码久久久免费午夜一区 | 成人欧美一区二区三区黑人麻豆 | 亚洲欧洲中文天堂| yiren22亚洲综合| av动漫免费观看| 国产精品一卡二卡在线观看| 精品无码久久久久久久久| 亚洲精品www久久久久久广东| 345成人影院| 午夜精品美女久久久久av福利| 激情另类小说区图片区视频区| 精品国产欧美日韩不卡在线观看| 欧美成人三级电影在线| 在线看片福利| 中文字幕乱码一区二区三区| 国产.精品.日韩.另类.中文.在线.播放| 中文字幕一区二区三区手机版| 亚洲免费视频观看| 疯狂欧洲av久久成人av电影| 日韩小视频网站| 国产欧美精品一区| 国产黄色美女视频| 青草青草久热精品视频在线网站 | 欧美国产视频一区二区| 外国成人在线视频| 红桃视频 国产| 午夜电影一区二区三区| 福利在线午夜| 国产精品国产三级国产专区53| 久久一二三区| 妺妺窝人体色www婷婷| 亚洲情综合五月天| 亚洲国产欧美在线观看| 日本熟妇人妻中出| 亚洲一区二区成人在线观看| 欧美成人免费| 波多野结衣成人在线| 日本色综合中文字幕| 国产成人在线免费观看视频| 久久在线视频在线| 国产一区二区三区不卡视频网站|