精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

全球首個「視頻教學」基準!南洋理工、CMU發布Video-MMMU

人工智能 新聞
人類通過課堂學習知識,并在實踐中不斷應用與創新。那么,多模態大模型(LMMs)能通過觀看視頻實現「課堂學習」嗎?新加坡南洋理工大學S-Lab團隊推出了Video-MMMU——全球首個評測視頻知識獲取能力的數據集,為AI邁向更高效的知識獲取與應用開辟了新路徑。

想象一下,你正在觀看吳恩達老師的機器學習課程,視頻講解清晰、動畫直觀,你很快掌握了核心概念,并能在考試中靈活應用,人類對這個過程再熟悉不過。

那么,如果AI也能這樣學習呢?

圖片

圖1 Video-MMMU提出知識獲取的3大認知階段

這正是Video-MMMU試圖回答的核心問題:AI能否通過觀看視頻獲取并應用知識?

對于多模態大模型(LMMs)來說,視頻不僅是它們感知世界的窗口,更是獲取知識的重要途徑。南洋理工大學S-Lab團隊推出Video-MMMU數據集是首個評測LMMs從多學科專業視頻中提取、理解并運用知識能力的創新基準。

通過Video-MMMU,我們不再滿足于模型「看懂」視頻,而是探索它能否真正「學會」視頻中的新知識,并運用這些知識解決實際問題。

圖片

論文地址:https://arxiv.org/abs/2501.13826

開源代碼:https://github.com/EvolvingLMMs-Lab/VideoMMMU

項目主頁:https://videommmu.github.io/

數據集:https://huggingface.co/datasets/lmms-lab/VideoMMMU

三大認知階段:從感知到應用

教育學認為,學習是一個漸進的認知過程 [1],而Video-MMMU正是圍繞這個過程設計的,將學習新知識拆解為三個認知階段:感知(Perception)、理解(Comprehension)和運用(Adaptation),系統評估模型在知識獲取不同層次的能力。

感知(Perception)——信息獲取的起點,模型需要從視頻中提取關鍵信息,這是獲取知識的基礎。

圖片

理解(Comprehension)——從感知到掌握,模型不僅需要「看清」,還要理解知識的深層次含義。

圖片

運用(Adaptation)——真正的學以致用,模型需要將從視頻中學到的知識運用到全新的場景中。這是測試學習能力的最終環節。

圖片

知識增益(?knowledge):衡量模型的能力提升

Video-MMMU 的另一大亮點在于設計了「知識增益」(?knowledge)指標。這一創新不僅關注模型的「絕對能力」,更評估其在觀看視頻前后的在應用階段的表現提升。

圖片

圖2 模型通過觀看視頻,將原本無法解決的問題做對。「解題」的能力不是唯一的檢驗標準,能獲取知識,并把原本做錯的問題做對,也是一種重要的能力。

與傳統評測不同,Video-MMMU更關注模型是否能通過觀看視頻解決原本無法解答的問題。從Video-MMMU的角度,智能不僅僅是「解題」的能力,更是快速學習和應用新技能的能力。

對于多模態大模型來說,視頻就是它們的課堂。通過視頻「上課」,模型可以獲取新知識,并靈活應用于實際生活中的未知挑戰,不僅是對「智能」概念的重新思考,更是邁向通用智能(AGI)的一次有趣探索。

Video-MMMU 的發布,為評估和改進LMMs的知識獲取能力提供了全新視角。如果人類的課堂是學習的起點,那么 Video-MMMU 就是LMMs走向課堂的一扇大門。

數據集的獨特性

Video-MMMU的獨特之處在于首次將視頻作為知識傳播的核心渠道,從傳統的視頻場景理解轉向視頻內容的知識學習。數據集專注于高質量教育視頻,平均時長506.2秒,覆蓋多個學科領域。其問題平均長度達75.7字,遠超其他基準,體現出高度專業性和挑戰性。

圖片

數據集設計

Video-MMMU覆蓋6大專業領域(藝術、商業、醫學、科學、人文、工程)中的30個學科。數據集包含精心篩選的300個大學水平的教育視頻和900個高質量的問答對。

圖片

圖片

問題設計

圖片

感知階段的問題類型

  • ASR(自動語音識別):要求模型準確轉錄視頻中的口述內容。示例:如上圖中Art(左上)的例子。
  • OCR(光學字符識別):從公式、圖表或手寫筆記中提取關鍵細節。示例:如上圖中Business(左下)的例子。

理解階段的問題類型

  • 概念理解(Concept Comprehension):通過不定項選擇題評估模型對視頻中概念的理解。示例:如上圖中Humanities(中上)的例子。
  • 解題方法理解(Problem-solving Strategy Comprehension):在視頻中演示的解決問題基礎上,通過改變輸入值測試模型是否掌握了解題方法。示例:如上圖中Science(中下)的例子。

運用階段的問題類型

  • 案例分析(Case Study Analysis):將視頻中講解的知識應用于新的實際情境。示例:如上圖Medicine(右上)的例子。
  • 解題方法運用(Problem-solving Strategy Adaptation):將視頻中演示的解決方法應用于實際的問題。示例:如上圖中Engineering(右下)的例子。

實驗結果分析

圖片

各認知階段的表現

  1. 人類 vs. AI:人類專家在所有階段的表現都優于模型,盡管Claude-3.5-Sonnet在模型中得分最高,但仍明顯落后于人類。

  2. 難度逐級遞增:無論是人類還是AI,從感知到理解再到運用,準確率逐步下降,說明越深層次的認知任務對能力要求越高。

  3. 知識運用的挑戰:運用階段(Adaptation Track) 是知識獲取的最大瓶頸,模型得分普遍低于50%。這表明,盡管模型在可能表面理解了視頻知識,但在實際應用時仍存在明顯短板,難以靈活遷移和運用所學內容。

音頻文本的影響

作者使用 OpenAI Whisper 生成音頻轉錄文本,以測試其對模型表現的影響。

圖片

結果顯示:

  • 感知與理解階段:音頻文本有助于模型更精準地理解視頻內容,提高表現。
  • 運用階段的挑戰:模型表現反而下降,可能因為音頻中存在冗余信息,干擾了模型對關鍵知識的提取和遷移能力。這說明,盡管音頻文本能幫助AI“聽懂”視頻,但真正的知識應用依然是重大挑戰。

知識增益的定量分析

Video-MMMU 的核心創新之一是引入「知識增益」指標(?knowledge)用于評估模型通過觀看視頻學習新知識的能力。與傳統評測不同,該指標關注模型是否能通過視頻學習,解決原本不會的問題,而不僅僅是靜態的解題能力。(?knowledge)定義為:

圖片

人類 vs. AI:學習能力差距

人類在觀看視頻后,知識增益達33.1%,而表現最好的模型(GPT-4o)僅為15.6%,多數模型低于10%。更令人意外的是,一些模型在觀看視頻后反而表現下降,表明它們在知識學習和應用方面仍遠不及人類。

圖片

模型的知識獲取兩面性

僅憑知識增益(?knowledge)并不能全面衡量模型的真實學習能力。因此,作者進一步引入兩個關鍵指標:

  • 錯誤轉正確率(Wrong-to-Right Rate):模型能否通過視頻學習,把原本錯誤的答案修正?定義為:

圖片

  • 正確轉錯誤率(Right-to-Wrong Rate):模型是否看視頻之后,把原本做對的題做錯了?

圖片

實驗發現,大多數模型取得較為不錯的錯誤轉正確率,顯示出一定的學習能力。但是,大多數模型的正確轉錯誤率遠高于人類,表明它們在吸收視頻知識時仍存在明顯不足。

人類的認知優勢

人類在這兩個指標上的表現更加平衡:

  • 錯誤轉正確率:40.4% → 說明人類能更有效地學習新知識。
  • 正確轉錯誤率:10.7% → 這表明,人類能夠自然整合新舊知識,而模型在處理視頻信息時,往往會修改原本正確的答案,這成為其學習能力的核心短板之一。

結論:模型的瓶頸

實驗結果揭示了當前多模態大模型(LMMs)在視頻學習中的兩大挑戰:

  1. 學習能力有限:難以高效獲取并應用新知識。
  2. 模型回答的不穩定性:原本會做的題,看完視頻后反而不會了。

如何提升LMMs的學習效率和穩定性,將是提升視頻知識獲取能力的關鍵。

錯誤分析

作者對Claude-3.5-Sonnet在運用階段的100個錯誤進行了分類,分析模型做錯的根本原因。

圖片

  • 方法選擇錯誤(8%):模型選擇了錯誤的解題方法,也就是說,它未能理解視頻中講解的正確策略。簡單來說,模型看了視頻,但沒有選對路。
  • 方法運用錯誤(64%):這是最常見的錯誤。模型記住了視頻中的方法,但在新情境下無法靈活應用。比如,它理解了視頻中的解題方法,但無法正確運用到另一個場景中。
  • 問題誤讀錯誤(15%):模型沒讀懂題目,比如錯看了數值或條件。這些錯誤和知識獲取無關,更像是「粗心大意」。

作者詳細分析了模型方法運用錯誤的例子:

圖片

總結

Video-MMMU首次系統性評測了LMMs從視頻中學習、理解和應用知識的能力,揭示了當前多模態大模型在學習效率和知識遷移上的顯著不足。提升模型從視頻中獲取知識的能力,將是邁向AGI的重要一步。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-04 08:40:00

AI教育生成

2009-07-16 16:29:46

LTE商用版本華為

2023-04-10 16:34:46

模型文本

2023-05-11 11:53:35

模型評測

2011-11-25 14:57:01

Radware應用交付

2016-10-31 09:33:08

2025-10-20 09:01:00

2025-09-10 18:03:16

AI智能體開源

2011-11-10 10:36:29

全球信息技術主管宣言

2010-06-19 16:28:16

WiMAX

2023-03-13 16:05:03

強化學習開源

2021-04-08 20:45:09

自動駕駛AI人工智能

2025-09-25 14:15:51

2025-05-14 09:17:00

2020-07-01 15:53:40

GSMA5G5G網絡新指南

2024-06-17 18:06:17

2022-09-04 19:22:46

開發科技

2018-03-21 13:34:15

混合云SD-WAN

2014-04-24 16:48:18

大數據引擎百度大腦百度
點贊
收藏

51CTO技術棧公眾號

亚洲欧美一区二区不卡| 亚洲视屏一区| 宅男噜噜噜66一区二区66| 中文字幕剧情在线观看一区| www.亚洲天堂.com| 国产欧美日韩亚洲一区二区三区| 在线播放国产精品| 激情小说欧美色图| 色8久久影院午夜场| 1区2区3区精品视频| 国产精品一区二区a| 极品国产91在线网站| 91超碰成人| 日韩精品在线观看一区| 国产成人美女视频| 国产中文在线播放| 国产精品九色蝌蚪自拍| 国产精品国产亚洲精品看不卡15| 久久久久久久久久一级| 国语精品一区| 在线观看欧美日韩国产| 玖玖爱在线精品视频| 欧洲美女精品免费观看视频 | 4444kk亚洲人成电影在线| 日本va欧美va国产激情| 久久久久久久久国产一区| 亚洲男人的天堂在线播放| 手机av在线网站| 欧美成人黑人| 亚洲成人av中文| ijzzijzzij亚洲大全| 国际av在线| 成人avav影音| 91中文字精品一区二区| 一区二区国产欧美| 男人的j进女人的j一区| 欧美与黑人午夜性猛交久久久| 欧美交换国产一区内射| 久久美女视频| 亚洲视频一区二区| 黄色正能量网站| xxxx日韩| 精品久久久久久综合日本欧美| 亚洲图色中文字幕| 欧美性理论片在线观看片免费| 亚洲v日本v欧美v久久精品| 国产四区在线观看| 在线观看麻豆| 国产精品日韩精品欧美在线| 少妇精品久久久久久久久久| 久久电影中文字幕| 久久亚洲精华国产精华液 | 精品中文一区| 日韩电影中文 亚洲精品乱码| 国产亚洲精品成人a| 深夜福利一区| 日韩欧美激情一区| 国产精品无码自拍| 红杏成人性视频免费看| 亚洲精品在线三区| 国产人成视频在线观看| 国产伦精品一区二区三区在线播放 | 亚洲精品视频免费| 中文幕无线码中文字蜜桃| 亚洲尤物av| 亚洲欧洲xxxx| 欧美人与性囗牲恔配| 国产欧美日韩在线一区二区| 亚洲天堂久久av| 中文字幕欧美激情极品| 久久中文字幕av| 久久精品成人欧美大片| 精国产品一区二区三区a片| 黄色亚洲在线| 欧美一级淫片丝袜脚交| 日本欧美www| 久久99精品久久久久婷婷| 亚洲xxx自由成熟| 日韩一卡二卡在线| 久久婷婷综合激情| 亚洲欧美日韩国产yyy| 麻豆电影在线播放| 亚洲国产综合色| 免费无码av片在线观看| 午夜欧美巨大性欧美巨大 | a天堂在线观看视频| 国产成人午夜精品5599| 久久精品99| h视频在线免费| 亚洲精品乱码久久久久久| 欧美在线一区视频| 日韩精品三区| 欧美一区二区三区色| 中文字幕人妻一区二区三区| 国产精品最新| 欧美激情视频网站| 波多野结衣理论片| 国产一区二区久久| 久久久久久欧美精品色一二三四| 999国产在线视频| 亚洲最大成人综合| 欧美xxxxx在线视频| 999精品视频在线观看| 亚洲国语精品自产拍在线观看| 真实乱视频国产免费观看| 一区二区三区四区电影| 欧美在线视频免费观看| av中文字幕免费在线观看| 久久女同互慰一区二区三区| 久久久久久久免费视频| 筱崎爱全乳无删减在线观看| 欧美一区二区三区日韩视频| 久久精品视频18| 亚洲天堂偷拍| 91精品国产综合久久男男| 日韩一级免费毛片| 日韩理论片中文av| 成人一区二区三| 精品欧美午夜寂寞影院| 久久香蕉国产线看观看av| 亚洲影院在线播放| 成人午夜激情片| 中文字幕av导航| 欧美一区 二区 三区| 精品国产乱码久久久久久久久 | 久久日文中文字幕乱码| 4444欧美成人kkkk| 国产黄色片免费| ㊣最新国产の精品bt伙计久久| 亚洲色精品三区二区一区| 日韩欧美四区| 欧美精品video| 国产日韩欧美视频在线观看| 欧美激情在线一区二区三区| 欧美 日韩 国产在线观看| 在这里有精品| 欧美成人免费全部| 91精品国产乱码久久| 国产欧美日韩三级| 99福利在线观看| 青青久久av| 97香蕉久久夜色精品国产| 亚洲精品福利网站| 亚洲免费电影在线| 色网站在线视频| 91影院成人| 国产美女91呻吟求| 婷婷免费在线视频| 欧美日韩一区二区不卡| 一级特黄曰皮片视频| 日韩福利电影在线观看| 日韩国产伦理| 高清av一区二区三区| 亚洲欧美在线免费观看| 成人一级免费视频| 欧美高清在线精品一区| 亚洲色图 在线视频| 欧美顶级大胆免费视频| 成人美女av在线直播| 黄a在线观看| 日韩一区二区免费高清| 麻豆视频在线观看| 成人高清免费观看| 欧美 日本 亚洲| 香蕉久久夜色精品国产更新时间| 日本道色综合久久影院| 好男人免费精品视频| 欧美体内she精视频| fc2ppv在线播放| 国产精品一区在线观看你懂的| 中国女人做爰视频| 久久99精品久久久久久欧洲站| 78色国产精品| 国产精品免费播放| 欧美精品第1页| 九九热只有精品| 99国内精品久久| 在线观看av日韩| 亚洲一区欧美| 精品蜜桃传媒| 99久久久国产精品免费调教网站| 精品国产欧美一区二区五十路| www.久久成人| 五月天精品一区二区三区| av网在线播放| 国产麻豆成人传媒免费观看| 日本福利视频在线| 欧美伦理在线视频| 91久久久久久久久久久| 成年人国产在线观看| 亚洲天堂av在线免费| 国产黄色片av| 91国偷自产一区二区三区观看| 人妻人人澡人人添人人爽| 99国产精品视频免费观看| 中文字幕第80页| 欧美激情视频一区二区三区在线播放 | 99九九99九九九视频精品| 激情婷婷综合网| 欧美三级网页| 视频一区在线免费观看| av成人app永久免费| 国产精品精品久久久久久| 污污的网站在线看| 国产午夜精品一区二区三区 | 国产二区国产一区在线观看| 欧美黄色免费影院| 欧美精品一卡| 亚洲精品8mav| 天堂网av成人| 99在线免费观看视频| 韩日精品一区| 91po在线观看91精品国产性色| 国产黄色小视频在线| 亚洲日韩第一页| 高清一区二区三区四区| 欧美福利视频一区| 一级做a爰片久久毛片| 夜夜精品浪潮av一区二区三区| 亚洲ⅴ国产v天堂a无码二区| 99麻豆久久久国产精品免费| 香蕉视频xxxx| 美女诱惑一区二区| 哪个网站能看毛片| 影音先锋亚洲精品| 女人床在线观看| 欧美freesextv| 日韩欧美亚洲区| 中国av一区| 精品一区二区视频| 国产厕拍一区| 国产精品久久久对白| 欧美一区在线观看视频| 国产日韩专区在线| 精品成人av| 国产成人精品在线播放| xxxxx性欧美特大| 7777免费精品视频| 美女高潮在线观看| 国内精品久久久久| 欧美hdxxx| 欧美高清不卡在线| 中文字幕在线观看播放| 久久精品亚洲热| 黄色网在线免费看| 毛片精品免费在线观看| 成人黄色网址| 欧美成人亚洲成人| 成人在线直播| 欧美精品一本久久男人的天堂| 高清全集视频免费在线| 久久色在线播放| 国产精品刘玥久久一区| 久久99国产精品自在自在app| 3d玉蒲团在线观看| 欧美激情a∨在线视频播放| 欧美videos另类精品| 性视频1819p久久| 日韩脚交footjobhd| 国产成人精品最新| www.成人在线视频| 91老司机在线| 日韩欧美高清一区二区三区| 国产chinese精品一区二区| 麻豆一区一区三区四区| 欧美精品七区| 成人亚洲一区| 成人在线观看www| 狠狠干成人综合网| 日本网站免费在线观看| 日韩国产高清在线| 九九久久久久久| www.色综合.com| 久久只有这里有精品| 国产精品久久久久四虎| 欧美三级小视频| 黑人巨大精品欧美一区免费视频| 欧美日韩a v| 日韩一区二区免费在线观看| 午夜视频www| 在线性视频日韩欧美| caoporm免费视频在线| 国内精品一区二区三区| 秋霞国产精品| 亚洲一区亚洲二区| 日韩精品免费一区二区夜夜嗨| 日韩精品不卡| 欧美日韩亚洲一区| 国产精品免费成人| 国产一区二区毛片| 日本黄色网址大全| 亚洲欧洲日产国产综合网| 日本视频www| 欧美色综合久久| 六月婷婷综合网| 中文字幕一区二区三区电影| 超碰97国产精品人人cao| 国产成人黄色av| 网站一区二区| 日韩激情久久| 一区二区自拍| 亚洲欧美偷拍另类| 91麻豆免费视频| 黄色一级视频免费| 在线观看国产精品网站| 欧洲av在线播放| 日韩中文字幕免费| 香蕉伊大人中文在线观看| 91久久精品国产91久久性色| 欧美猛男同性videos| www.日本三级| 久久99久久99| 中文字幕在线观看免费高清| 亚洲一区二区三区激情| 亚洲天堂777| 亚洲欧美国产高清va在线播| 高h视频在线播放| 91免费看片在线| 日韩精品久久久久久久电影99爱| 精品久久久久久久久久中文字幕| 国产原创一区二区三区| 人妻一区二区视频| 午夜精品福利久久久| 精品人妻少妇AV无码专区 | 国产在线精品日韩| 久久久久久久久国产一区| 手机在线看福利| 久久久91精品国产一区二区精品| 伊人国产在线观看| 欧美一区二区私人影院日本| 992tv免费直播在线观看| 国产精品成人va在线观看| 国产一区丝袜| 欧日韩免费视频| 国产99久久久国产精品免费看| 欧美成人777| 911精品国产一区二区在线| 1pondo在线播放免费| 国产精品美女999| 国产一区三区在线播放| 欧美激情精品久久久久久小说| 久久视频一区二区| aaa人片在线| 日韩精品免费在线播放| 中文字幕在线视频网站| 久久草.com| 国产亚洲福利| 午夜一区二区三区免费| 日韩欧美一区二区三区| 外国精品视频在线观看 | 国产一区二区三区在线看麻豆| 国产wwwwxxxx| 欧美日本一道本| 好操啊在线观看免费视频| 51成人做爰www免费看网站| 欧美精品日韩| 欧美夫妇交换xxx| 亚洲成人av在线电影| 五月婷婷六月丁香综合| 欧美亚洲国产成人精品| 久久综合欧美| 奇米视频7777| 亚洲男人天堂av网| 丰满人妻一区二区三区免费| 欧美激情小视频| 欧美爱爱网站| 久久婷婷国产91天堂综合精品| 国产精品毛片无遮挡高清| 国产手机精品视频| 久久久久久成人精品| 久久99偷拍| 三级在线视频观看| 亚洲麻豆国产自偷在线| 欧美 日韩 国产 精品| 97精品在线观看| 欧美午夜精彩| 亚洲成人手机在线观看| 亚洲二区在线视频| 九色视频在线播放| 成人激情在线播放| 伊人成人在线| 亚洲自拍偷拍图| 欧美一级片在线看| 韩国精品一区| 亚洲一区二区精品在线观看| 国产精品一区在线| 手机在线看片1024| 久久精品国产成人精品| 精品国产午夜肉伦伦影院| 国产a级片免费观看| 亚洲欧洲日产国码二区| 四虎永久在线观看| 国产精品日本精品| 激情视频一区二区三区| 免费看黄色av| 精品免费视频.| 成人全视频免费观看在线看| 久久精品国产sm调教网站演员| 国产欧美日韩另类视频免费观看 | 亚洲国语精品自产拍在线观看|