精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4o再暴露「弱智」缺陷,大模型無一幸免!港中文等發(fā)布「視覺聽覺」基準(zhǔn)AV-Odyssey:26個任務(wù)直指死角問題

人工智能 新聞
多模態(tài)大模型在聽覺上,居然也出現(xiàn)了「9.11>9.8」的現(xiàn)象,音量大小這種簡單問題都識別不了!港中文、斯坦福等大學(xué)聯(lián)合發(fā)布的AV-Odyssey基準(zhǔn)測試,包含26個視聽任務(wù),覆蓋了7種聲音屬性,跨越了10個不同領(lǐng)域,確保測試的深度和廣度。

在人工智能領(lǐng)域,我們一直以為頂尖的多模態(tài)大模型已經(jīng)無所不能,GPT-4o在ASR(音頻轉(zhuǎn)文字)任務(wù)上已經(jīng)達到了97%的正確率,更是凸顯了強大的音頻理解能力。

然而,最近一項來自香港中文大學(xué)、斯坦福大學(xué)、伯克利大學(xué)和耶魯大學(xué)的研究成果卻徹底顛覆了這一認(rèn)知——GPT-4o、Gemini 1.5 Pro、Reka Core等最先進的多模態(tài)大模型居然無法正確分辨明顯不同的聲音大?。?/span>

下面是一個例子:

圖片

結(jié)果讓人難以置信:這些頂尖的AI模型都未能準(zhǔn)確判斷出音量的差異!對于人類來說,這種問題簡直是「傻瓜級」任務(wù),然而這些大模型卻紛紛失手,暴露出其在基本聽覺能力上的嚴(yán)重缺陷。

這一發(fā)現(xiàn)激發(fā)了研究團隊的思考:為什么如此先進的模型在聽覺辨識方面如此薄弱?為了填補這一空白,研究團隊首度提出了一個全新的測試工具——DeafTest,它專門用來測試多模態(tài)大模型的基礎(chǔ)聽覺能力。

不僅如此,研究團隊還提出了首個全面的多模態(tài)大模型視聽能力評估基準(zhǔn)——AV-Odyssey。這一基準(zhǔn)旨在推動未來AI模型在聽覺、視覺的理解整合能力上邁向新高度。

圖片

論文鏈接:https://arxiv.org/pdf/2412.02611

項目地址:https://av-odyssey.github.io/

代碼地址:https://github.com/AV-Odyssey/AV-Odyssey

DeafTest:多模態(tài)大模型的「聽力盲點」

為了測試多模態(tài)大模型最基礎(chǔ)的聽覺能力,研究團隊首先提出DeafTest,該測試包括四項基礎(chǔ)任務(wù):數(shù)音頻中的聲音次數(shù)、比較兩個音頻的響度、比較兩個音頻的音高、比較兩個音頻的時長。

這些任務(wù)都被設(shè)計為對人類來說極其簡單的判斷題,差異明顯,例如:

在響度比較任務(wù)中,一個音頻的響度在70-100分貝之間,而另一個音頻則在30-60分貝之間。

圖片

然而,測試結(jié)果卻令人震驚——這些頂尖的AI模型在大多數(shù)任務(wù)中的表現(xiàn),幾乎與隨機猜測無異,準(zhǔn)確率和隨機選擇的50%差不多,無疑暴露了多模態(tài)大模型在音頻感知上的巨大短板。

AV-Odyssey Bench:全面評估多模態(tài)大模型的視聽能力

為了更全面地評估AI在視聽能力上的表現(xiàn),研究團隊還推出了一個全新的評估基準(zhǔn)——AV-Odyssey。

AV-Odyssey包含26個任務(wù),覆蓋了7種聲音屬性——音色、語調(diào)、旋律、空間感知、時序、幻覺、綜合感知,并且跨越了10個不同領(lǐng)域,確保測試的深度和廣度。

圖片

為了確保評估的穩(wěn)健性和公正性,所有任務(wù)均采用四選一的多項選擇題形式,每個問題都融合了視覺、聽覺等多模態(tài)信息,全面考察模型的綜合處理能力。

此外,為了避免因輸入順序或格式導(dǎo)致的偏差,所有輸入(包括文本、圖片/視頻和音頻片段)都會以交錯的方式輸入到多模態(tài)大模型中。問題的形式如下圖所示:

圖片

AV-Odyssey中包含了由人類專家全新標(biāo)注的4555個問題,確保題目沒有在其他任何數(shù)據(jù)集中出現(xiàn)過,任務(wù)分布以及統(tǒng)計信息如下面圖表所示:

圖片

同時,為了進一步控制質(zhì)量,研究團隊利用5個視覺語言模型和4個音頻大語言模型,過濾出包含冗余圖像或音頻片段的問題。

在這個過程中,2.54%的問題同時被所有視覺語言模型或所有音頻大語言模型解決,研究團隊去除了這些問題。

圖片

AV-Odyssey 實驗結(jié)果

圖片

從實驗結(jié)果中,可以發(fā)現(xiàn):

AV-Odyssey的挑戰(zhàn)性:

大多數(shù)現(xiàn)有的多模態(tài)大語言模型平均表現(xiàn)僅略高于25%,這與四選一問題的隨機猜測準(zhǔn)確率相當(dāng)。值得注意的是,即使是AV-Odyssey中的表現(xiàn)最佳的模型——GPT-4o,也僅取得了34.5%的準(zhǔn)確率。

這一結(jié)果凸顯了AV-Odyssey所帶來的高挑戰(zhàn)性,遠遠超出了當(dāng)前模型訓(xùn)練數(shù)據(jù)的分布范圍。

通過設(shè)定嚴(yán)格的標(biāo)準(zhǔn),AV-Odyssey基準(zhǔn)測試為評估多模態(tài)大模型在音頻視覺任務(wù)中的能力提供了一個重要工具,突顯了現(xiàn)有模型的局限性,并為未來的改進指明了方向。

開源多模態(tài)大模型訓(xùn)練的局限性:

同時,即便OneLLM、Unified-IO-2、VideoLLaMA2和NExT-GPT 通過引入Audiocaps等音頻-文本匹配數(shù)據(jù)集,嘗試增強音頻理解能力,并結(jié)合圖像-文本配對數(shù)據(jù)訓(xùn)練視覺理解,這些模型在AV-Odyssey的測試中仍然表現(xiàn)不佳。

這表明,目前的訓(xùn)練流程并不足以真正彌合音頻與視覺模態(tài)之間的鴻溝,也未能有效地學(xué)習(xí)音視頻信息的整合與深度理解。

AV-Odyssey 錯誤分析:音頻感知仍是瓶頸

研究團隊對Gemini 1.5 Pro在AV-Odyssey中的錯誤進行深入分析,對每個任務(wù)隨機抽取了4個錯誤案例進行人工標(biāo)注,最終得到104個錯誤案例,并對其進行統(tǒng)計。錯誤的分布如下圖所示:

圖片

這一分析結(jié)果揭示了一個重要趨勢:63%的錯誤都集中在音頻理解上!

例如,在某些任務(wù)中,雖然模型正確理解了視覺信息,但是音頻片段的內(nèi)容識別錯誤,導(dǎo)致了錯誤答案的生成。一個例子如下圖所示:

圖片

這一發(fā)現(xiàn)再次印證了DeafTest的初步結(jié)論:當(dāng)前多模態(tài)大模型在基礎(chǔ)的聽力能力上存在明顯短板,音頻感知依然是多模態(tài)任務(wù)中的最大瓶頸。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-05-15 14:37:17

AI生成模型

2023-10-24 19:06:44

數(shù)據(jù)模型

2023-11-07 07:00:37

2025-05-15 09:10:00

2025-08-28 06:30:00

2023-09-23 12:34:11

AI模型

2024-06-28 18:13:05

2025-08-07 14:05:40

OpenAI大模型開源

2024-04-03 12:13:58

2024-05-07 13:40:41

2024-12-18 13:24:30

谷歌AI大語言模型

2023-07-07 12:30:00

模型技術(shù)

2025-05-26 08:33:00

2024-06-27 12:45:30

2009-06-10 15:08:31

2025-06-09 08:40:00

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2018-12-28 10:15:15

云宕機事故云計算

2024-12-26 07:10:00

2024-05-21 12:23:17

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲欧美日韩精品久久奇米色影视 | 精品国产免费人成电影在线观看四季 | 亲爱的老师9免费观看全集电视剧| 日韩一级av毛片| 一区二区三区无毛| 亚洲二区视频在线| 婷婷久久五月天| 成人爽a毛片一区二区| 蜜乳av另类精品一区二区| 日韩中文字幕在线视频播放| 国产白袜脚足j棉袜在线观看| 国产精品高清乱码在线观看| 一区二区三区四区精品在线视频 | 久久久久亚洲av无码专区首jn| 日韩电影免费看| 亚洲视频免费观看| 免费亚洲精品视频| 精品黑人一区二区三区国语馆| 久久不射网站| 国自在线精品视频| 波多野结衣家庭教师| 最新国产一区| 精品久久国产字幕高潮| 天天干天天av| 综合在线影院| 亚洲成av人影院| 四虎永久免费网站| av在线之家电影网站| 99久久99久久精品免费观看| 91福利视频导航| 中文字幕一区二区三区四区视频 | 国产精品国产福利国产秒拍| 久久精品这里有| 中文字幕日韩一区二区不卡| 亚洲最新av在线网站| 亚洲色图14p| 福利在线一区| 欧美videossexotv100| 午夜啪啪小视频| 九七影院97影院理论片久久| 欧美日韩中文字幕综合视频 | 熟女少妇a性色生活片毛片| 天堂av一区二区三区在线播放 | 色哟哟国产精品免费观看| 国产欧美日韩小视频| 91三级在线| 亚洲欧洲日韩在线| 亚洲一二三区精品| 在线免费av电影| 欧美激情中文不卡| 少妇特黄a一区二区三区 | 久久精品亚洲精品国产欧美kt∨| 韩国成人动漫在线观看| 日本激情视频网站| 成人18视频在线播放| 国产经典一区二区三区| 国产 日韩 欧美 综合| 国产iv一区二区三区| 国产成人av一区二区三区| 精品毛片在线观看| 丁香激情综合国产| 狠狠色伊人亚洲综合网站色 | 精品国产一区二区三区久久狼5月| 亚洲色成人网站www永久四虎| 国产成人精品免费视| 亚洲欧美色婷婷| 精品成人无码一区二区三区| 成人在线免费视频观看| 久久久黄色av| 中文字幕一区二区三区手机版 | jizz欧美性11| 亚洲成人高清| 日韩视频在线观看一区二区| 男人网站在线观看| 最新精品国偷自产在线| 中文字幕日韩高清| 久久久精品视频免费观看| 亚洲性图久久| 国产精品av在线| 夜夜躁狠狠躁日日躁av| 国产精品1024| 美女一区视频| 麻豆免费在线视频| 亚洲a一区二区| 黄色一级二级三级| 免费欧美网站| 亚洲区一区二区| 粉嫩av性色av蜜臀av网站| 亚洲成人原创| 国产精品色婷婷视频| www.com欧美| 久久影院视频免费| 日韩video| 精品91久久| 3d动漫精品啪啪| aa片在线观看视频在线播放| 成人免费av| 久久久久久久久久久网站| 国产熟妇一区二区三区四区| 国产麻豆视频一区二区| 99久热re在线精品996热视频| 视频国产在线观看| 亚洲男人的天堂一区二区| 免费黄色日本网站| 欧美一级片网址| 亚洲一品av免费观看| 欧美日韩精品一区二区三区视频播放| 国产毛片久久| 91精品国产99久久久久久红楼| 欧美巨乳在线| 亚洲午夜久久久久久久久电影网 | 国产精品视频一二三| 大陆av在线播放| 久久伊人国产| 亚洲欧洲国产伦综合| 久久免费看少妇高潮v片特黄| 石原莉奈在线亚洲二区| 成人影片在线播放| 免费大片在线观看www| 色综合天天在线| 香港三日本8a三级少妇三级99| 天天做综合网| 国产精品亚洲网站| 国产三级视频在线看| 亚洲电影一区二区| 最好看的中文字幕| 亚洲午夜精品一区 二区 三区| 国产精品jizz在线观看麻豆| 色噜噜在线播放| 亚洲一二三区在线观看| 色姑娘综合天天| 91不卡在线观看| 成人国产精品一区二区| av免费在线一区二区三区| 欧美视频在线观看免费| 黄色免费视频网站| 在线成人欧美| 精品久久久久久一区| 免费男女羞羞的视频网站在线观看| 欧美日韩不卡一区二区| 自拍偷拍你懂的| 青娱乐精品视频| 水蜜桃一区二区三区| 91精品影视| 亚洲午夜精品久久久久久性色| 国产中文字幕视频| 久久色.com| 成人在线看视频| www.日日夜夜| 中文字幕视频一区| 天天干天天玩天天操| 日韩国产专区| 国产九九精品视频| 麻豆av在线导航| 欧美疯狂做受xxxx富婆| 日本裸体美女视频| 国产又黄又大久久| 六月婷婷激情综合| 福利在线一区| 日本精品一区二区三区在线播放视频 | 素人一区二区三区| 色妞在线综合亚洲欧美| 国产精品久久久久久久免费看| 亚洲人午夜精品天堂一二香蕉| 日本高清免费观看| 亚洲婷婷在线| 久久久久久九九九九| 日本免费一区二区三区四区| 伊人久久免费视频| 91中文字幕在线视频| 亚洲黄色小视频| 免费a v网站| 日韩成人精品在线观看| 中文字幕不卡每日更新1区2区| 日本精品一区二区三区在线观看视频| 欧美激情一级精品国产| 天天av综合网| 欧美日韩免费一区二区三区| 欧美精品一级片| 91年精品国产| 日本在线播放一区二区| 欧美日韩亚洲一区三区| 黄色99视频| 少妇高潮一区二区三区99| 久久久久久久久久久91| www亚洲人| 欧美一级高清片| 精品人妻一区二区三区潮喷在线| 亚洲色欲色欲www| 国产精品第七页| 毛片av一区二区三区| 欧美久久久久久久久久久久久久| 免费av一区| 91九色蝌蚪国产| 久草在线中文最新视频| 久久久精品国产网站| 日韩国产福利| 日韩视频在线一区二区| 97人妻精品视频一区| 亚洲韩国一区二区三区| 天天操天天舔天天射| 不卡视频一二三| 99九九99九九九99九他书对| 亚洲欧美日韩国产一区| 天天干天天色天天爽| 亚洲宅男一区| 北条麻妃高清一区| 国产伊人久久| 51ⅴ精品国产91久久久久久| 国产在线1区| 永久免费毛片在线播放不卡| 天堂在线资源库| 日韩一区二区不卡| 国产成人精品一区二区色戒| 精品国产1区2区| 免费在线观看黄视频| 国产精品乱码一区二三区小蝌蚪| 国产精品一级黄片| 成人亚洲一区二区一| 精品国产乱码久久久久久1区二区 91网址在线观看精品 | a级精品国产片在线观看| 亚洲天堂一区二区在线观看| 免费成人性网站| chinese少妇国语对白| 亚洲最黄网站| 国产美女在线一区| 亚洲欧美一级二级三级| 中文字幕日韩精品久久| 凹凸成人精品亚洲精品密奴| 久久手机视频| 欧美男人操女人视频| 国产伦精品一区二区三区| 日本免费一区二区视频| 91夜夜未满十八勿入爽爽影院| 欧美性www| 国产精品久久久久秋霞鲁丝| 户外露出一区二区三区| 欧美一级电影在线| 亚洲精品中文字幕| 欧美最顶级丰满的aⅴ艳星| 成人免费观看在线观看| 国内精品在线一区| 超碰在线公开| 2024亚洲男人天堂| 樱桃视频成人在线观看| 日本乱人伦a精品| 色8久久影院午夜场| 国产成人精品日本亚洲专区61| 91看片一区| 国产精品都在这里| 国产亚洲精彩久久| 成人在线精品视频| 国产免费av国片精品草莓男男| 91免费欧美精品| 中文字幕亚洲在线观看| 国产综合动作在线观看| 人体久久天天| 日日夜夜精品网站| 国内精品久久久久久99蜜桃| 亚洲图片在线观看| 66久久国产| 精品人妻少妇一区二区| 9久re热视频在线精品| 一本大道熟女人妻中文字幕在线| 日韩中文字幕麻豆| 国产aⅴ爽av久久久久| 国产黄色精品网站| 中文字幕 亚洲一区| 亚洲国产精品成人综合色在线婷婷 | 久久男人av| 日本精品免费| 欧美成人一品| 波多野结衣家庭教师视频| 蜜臀久久久久久久| 欧美日韩一区二区区别是什么 | 日韩精品福利在线| 不卡在线视频| 美女性感视频久久久| 麻豆mv在线看| 成人国产亚洲精品a区天堂华泰| 一区二区在线视频观看| 久久精品五月婷婷| 99久久99久久精品国产片果冰| 91黄色在线看| 免费高清不卡av| 日本少妇xxxx| 中文字幕综合网| 天堂网视频在线| 91精品在线观看入口| xxxx国产精品| 亚洲人成在线一二| 菠萝蜜视频国产在线播放| 97超级碰碰碰| 日本免费一区二区视频| 日韩aⅴ视频一区二区三区| 很黄很黄激情成人| 欧美午夜aaaaaa免费视频| 成人自拍视频在线| 国产黄色片在线| 欧美性猛交xxxx久久久| 国产高清免费观看| 永久免费精品影视网站| 国产精品一二三产区| 91久久国产精品91久久性色| 色橹橹欧美在线观看视频高清| 日韩人妻精品一区二区三区| 久久婷婷av| 少妇一级淫片免费放播放| 亚洲色图在线看| 中文字幕有码视频| 亚洲欧美国产精品久久久久久久| 亚洲男同gay网站| 国产欧美精品久久久| 希岛爱理av免费一区二区| 免费观看亚洲视频| 久久99精品网久久| 亚洲成人黄色av| 色综合久久中文综合久久97| 欧美一级淫片aaaaaa| 欧美精品亚州精品| 四虎精品一区二区免费| 欧美一区二区在线| 宅男噜噜噜66一区二区| 人妻互换一二三区激情视频| 亚洲视频在线观看三级| 中文字幕一区二区三区波野结| 亚洲人成电影在线播放| 自拍视频在线看| 久久久久资源| 国产日韩欧美| 水蜜桃av无码| 精品久久久一区二区| 欧美自拍第一页| 国内揄拍国内精品少妇国语| caoporn成人| 91亚洲精品国产| 成人国产在线观看| 国产午夜激情视频| 亚洲福利在线播放| 黄在线观看免费网站ktv| 精品国产乱码久久久久久久软件| 亚洲大胆av| 日本一卡二卡在线| 激情懂色av一区av二区av| 天天躁日日躁狠狠躁伊人| 国内精品久久久久久久| 精品淫伦v久久水蜜桃| 尤物av无码色av无码| 99久久99久久综合| www.com亚洲| 色综合伊人色综合网| 日韩久久一区| 伊人再见免费在线观看高清版| 国产风韵犹存在线视精品| 免费麻豆国产一区二区三区四区| 精品国产成人在线影院| 成人ssswww在线播放| 日本一区二区在线视频| 免费在线成人网| 国产老头老太做爰视频| 欧美一级黄色片| 悠悠资源网亚洲青| 视频一区二区三| 国产一区二区三区蝌蚪| 国产在线观看免费av| 国产午夜精品麻豆| 精品国产欧美日韩一区二区三区| 好吊色这里只有精品| 成人精品一区二区三区中文字幕| 国产专区第一页| 日韩视频免费在线| 久久免费福利| 色综合久久久久无码专区| 国产女同性恋一区二区| 国产精品无码一区二区桃花视频| 欧美精品video| 精品99久久| 美女被艹视频网站| 岛国视频午夜一区免费在线观看| av电影在线观看一区二区三区| 成人黄色免费在线观看| 亚洲国产清纯| 99自拍偷拍视频| 亚洲精品成人av| 国产精品传媒麻豆hd| 国产av熟女一区二区三区| 久久美女艺术照精彩视频福利播放| 在线观看免费中文字幕| 久久久久久国产精品久久| 欧美日韩激情| 国产乱淫av麻豆国产免费| 色94色欧美sute亚洲线路二| av网址在线免费观看| 欧美日产一区二区三区在线观看| 国内一区二区在线| 日本一区二区免费电影| 欧美成人激情视频免费观看| 久久av综合| 波多野结衣三级视频| 欧美日韩一二三区|