精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

CVPR2025視頻生成統(tǒng)一評估架構(gòu),上交x斯坦福聯(lián)合提出讓MLLM像人類一樣打分

人工智能 新聞
Video-Bench視頻評估框架,能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內(nèi)容的智能評估體系。

視頻生成技術(shù)正以前所未有的速度革新著當前的視覺內(nèi)容創(chuàng)作方式,從電影制作到廣告設(shè)計,從虛擬現(xiàn)實到社交媒體,高質(zhì)量且符合人類期望的視頻生成模型正變得越來越重要。

那么,要如何評估AI生成的視頻是否符合人類的審美和需求呢?

Video-Bench視頻評估框架,能夠通過模擬人類的認知過程,建立起連接文本指令與視覺內(nèi)容的智能評估體系。

簡單地說,能夠讓多模態(tài)大模型(MLLM)“像人一樣評估視頻”。

實驗結(jié)果表明,Video-Bench不僅能精準識別生成視頻在物體一致性(0.735相關(guān)性)、動作合理性等維度的缺陷,還能穩(wěn)定評估美學(xué)質(zhì)量等傳統(tǒng)難題,顯著優(yōu)于現(xiàn)有的評估方法。

圖片

Video-Bench的研究團隊來自上海交通大學(xué)、斯坦福大學(xué)、卡內(nèi)基梅隆大學(xué)等機構(gòu)。

Video-Bench:基于MLLM的自動化視頻評估框架

Video-Bench團隊在面對已有的視頻評估方法時,發(fā)現(xiàn)了兩個問題:

1.簡單的評分規(guī)則往往無法捕捉視頻流暢度、美學(xué)表現(xiàn)等復(fù)雜維度——

那么,當評判“視頻質(zhì)量”時,如何將人類出于“直覺”的模糊感受轉(zhuǎn)化為可量化的評估指標?

2.現(xiàn)有基于大語言模型(Large Language Model,LLM)的基準雖能更好模擬人類評估邏輯,但在視頻-條件對齊評估中存在跨模態(tài)比較困難,在視頻質(zhì)量評估中則面臨文本評價標準模糊化的局限——

那么,評估”視頻是否符合文字描述”時,評估系統(tǒng)如何實現(xiàn)跨模態(tài)對比?

針對上述的兩個問題,Video-Bench作出了兩點核心創(chuàng)新:

圖片

(1)系統(tǒng)性地構(gòu)建了覆蓋視頻-條件對齊(Video-Condition Alignment)視頻質(zhì)量(Video quality)的雙維度評估框架。

(2)引入了鏈式查詢(Chain-of-Query)少樣本評分(Few-shot scoring)兩項核心技術(shù)。

鏈式查詢通過多輪迭代的”描述-提問-驗證”流程,有效解決了文本與視頻跨模態(tài)對齊的評估難題;少樣本評分則通過多視頻對比建立相對質(zhì)量標尺,將主觀的美學(xué)評判轉(zhuǎn)化為可量化的客觀標準。

這樣的功能設(shè)計使Video-Bench突破了現(xiàn)有視頻質(zhì)量評估方法的限制,能夠更全面、更智能地對視頻進行評分。

更全面、更智能

一方面,Video-Bench將視頻生成質(zhì)量解構(gòu)為“視頻-條件對齊”和“視頻質(zhì)量”兩個正交維度,分別評估生成內(nèi)容與文本指令的符合度以及視頻本身的觀感質(zhì)量。

視頻-條件一致性關(guān)注評估生成的視頻是否準確地反映了文本提示中的內(nèi)容,包括以下幾個關(guān)鍵維度對象類別一致性、動作一致性、顏色一致性、場景一致性、視頻-文本一致性;

視頻質(zhì)量的評估則側(cè)重于視頻本身的視覺保真度和美學(xué)價值。包括成像質(zhì)量、美學(xué)質(zhì)量、時間一致性、運動質(zhì)量。

這種雙維度的評估框架能使Video-Bench全面覆蓋視頻生成的各個要素,在評估視頻是否“保真”的同時,關(guān)注到視頻的美觀程度。

另一方面,Video-Bench的評估框架利用多模態(tài)大語言模型(Multimodal Large Language Model,MLLM)的強大能力,通過鏈式查詢技術(shù)和少樣本評分技術(shù),實現(xiàn)對視頻生成質(zhì)量的高效評估:

圖片

(1)鏈式查詢技術(shù):通過多輪問答的方式,逐步深入地評估視頻與文本提示之間的一致性。

這種方法避免了直接的跨模態(tài)比較,而是先將視頻內(nèi)容轉(zhuǎn)換為文本描述,然后通過一系列精心設(shè)計的問題,逐步檢查視頻內(nèi)容是否與文本提示完全一致,有效解決了跨模態(tài)對比的語義鴻溝問題。

圖片

(2)少樣本評分技術(shù):模仿人類橫向比較的本能,通過同時對比多個同主題視頻,使抽象的美學(xué)評價變得可量化。

例如在評估”電影感”時,Video-Bench會橫向比較不同生成結(jié)果的運鏡流暢度、光影層次感,而非孤立打分。

“像人一樣評估視頻”

圖片

將Video-Bench與當前主流評估方法進行系統(tǒng)性對比,可以看到,在視頻-條件對齊維度,Video-Bench以平均0.733的Spearman相關(guān)系數(shù)顯著優(yōu)于傳統(tǒng)方法CompBench;在視頻質(zhì)量維度,其0.620的平均相關(guān)性同樣領(lǐng)先EvalCrafter。

此外,在對象類別一致性這一關(guān)鍵指標上,Video-Bench達到0.735的相關(guān)性,較基于GRiT的方法提升56.3%。

圖片

為驗證評估結(jié)果的可靠性,Video-Bench還組織了10人專家小組對35,196個視頻樣本進行標注。

對齊結(jié)果顯示,評估者間一致性(Krippendorff’s α)達0.52,與人類自評水平相當。

圖片

通過組件設(shè)計的消融實驗,可以看到,鏈式查詢使視頻-條件對齊評估提升了9.3%,少樣本評分將成像質(zhì)量評估相關(guān)性從46.1%(單樣本)提升至62.4%(7樣本)。

組合使用兩項技術(shù)時,評估穩(wěn)定性(TARA@3)達67%,Krippendorff’s α達0.867,驗證了這些組件設(shè)計的有效性。

圖片

魯棒性測試結(jié)果發(fā)現(xiàn),添加高斯噪聲后,Video-Bench的視頻-文本一致性評估誤差<5%,且三次重復(fù)實驗的評分一致性達87%,對不同復(fù)雜度提示的評估穩(wěn)定性優(yōu)于基線方法32%

現(xiàn)有視頻生成模型的測評結(jié)果

圖片

使用Vedio-Bench對7個主流視頻生成模型進行測評,結(jié)果發(fā)現(xiàn),商業(yè)模型整體優(yōu)于開源模型(Gen3綜合得分4.38v.s.VideoCrafter2綜合得分3.87),不同模型存在顯著特長差異(如CogVideoX在視頻-文本一致性領(lǐng)先,而Gen3在成像質(zhì)量最優(yōu))。

總體來看,當前的模型在動作合理性(平均2.53/3)和動態(tài)模糊(3.11/5)等動態(tài)維度表現(xiàn)較弱。

圖片

對不同基礎(chǔ)模型進行比較,結(jié)果發(fā)現(xiàn),與Gemini1.5pro和Qwen2vl-72b相比,GPT-4o通常在視頻質(zhì)量和一致性評分上表現(xiàn)更優(yōu),特別是在成像質(zhì)量(0.807)和視頻-文本一致性(0.750)方面,GPT-4o-0806表現(xiàn)尤為突出。

然而,性能并不總是隨著GPT-4o版本的更新而持續(xù)提升。例如,GPT-4o-1120在運動效果方面相較于GPT-4o-0806有所下降(0.309vs.0.469),這表明在更新過程中,時間運動檢測可能存在潛在退化。

作者簡介

共同第一作者

韓慧,上海交通大學(xué)碩士生,研究方向為多模態(tài)語言模型

李思遠,上海交通大學(xué)碩士生,研究方向為多模態(tài)語言模型

陳家棋,復(fù)旦大學(xué)碩士,斯坦福訪問學(xué)者,F(xiàn)ellou 研究員,研究方向為 LLM agent

袁怡雯,CMU 本科,xAI 研究員,研究方向為多模態(tài)語言模型和 RAG

通訊作者為倪泳鑫,波士頓大學(xué)博士

代碼鏈接:https://github.com/Video-Bench/Video-Bench.git論文地址:https://arxiv.org/html/2504.04907v1

責任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-06-13 08:46:00

2024-10-21 12:40:00

視頻生成模型

2024-10-28 10:30:00

AI開源模型

2023-05-30 13:29:25

2023-12-14 12:51:28

LLM3D場景

2022-07-28 14:46:01

人工智能機器人計算機科學(xué)

2020-09-30 17:12:09

人工智能技術(shù)數(shù)據(jù)

2020-01-09 17:03:29

人工智能技術(shù)算法

2023-11-29 14:53:00

AI數(shù)據(jù)

2025-11-11 08:43:00

AI模型視覺

2023-11-13 07:51:58

ChatGPT研究

2022-07-14 15:08:23

AI模型

2023-04-05 14:19:07

FlinkRedisNoSQL

2025-10-13 07:58:56

2024-06-21 09:24:03

2025-03-20 09:20:00

2023-12-26 14:56:59

模型訓(xùn)練

2023-09-22 11:56:57

模型駕駛

2018-10-25 22:34:34

機器人人工智能系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號

隔壁老王国产在线精品| 一本大道久久精品懂色aⅴ| 亚洲aⅴ男人的天堂在线观看| 成人三级视频在线观看| 日韩三级不卡| 亚洲成av人综合在线观看| 久久一区二区精品| 91精品国产乱码久久久久| 欧美高清日韩| 亚洲男人天堂手机在线| 国产又黄又猛的视频| 国产乱码精品一区二三赶尸艳谈| 欧美—级在线免费片| 99超碰麻豆| 老熟妇一区二区三区啪啪| 一级欧洲+日本+国产| 亚洲精品久久久久| 欧美国产日韩另类 | 亚洲精品自拍偷拍| 奇米视频888| 这里有精品可以观看| 亚洲视频小说图片| 蜜桃视频成人| 亚洲精品无码久久久| 日韩成人免费在线| 欧美激情a在线| 国产又粗又猛又爽又黄的视频小说| 国产成人av毛片| 欧美福利视频导航| 欧美牲交a欧美牲交aⅴ免费真 | 久久久久久午夜| 国产精品麻豆免费版现看视频| 国产精品午夜av| 欧美一区二区视频免费观看| 欧美成人黑人猛交| а√天堂8资源中文在线| 亚洲激情成人在线| 永久域名在线精品| yiren22综合网成人| 99久久99久久综合| 高清一区二区三区视频| 国产精品一区二区av白丝下载| 日韩av一二三| 国产成人黄色av| 国产成人无码精品| 亚洲精品1区| 欧美富婆性猛交| 无码人妻精品一区二区三区夜夜嗨| 日韩久久视频| 在线观看日韩专区| 美女网站视频色| 久久中文字幕二区| 日韩中文字幕第一页| 人成免费在线视频| 日韩一区自拍| 北条麻妃一区二区三区中文字幕| 调教驯服丰满美艳麻麻在线视频| 欧美裸体在线版观看完整版| 亚洲天堂网在线观看| 少妇久久久久久久久久| 欧美极品在线观看| 亚洲日本aⅴ片在线观看香蕉| 国产男女猛烈无遮挡a片漫画| 欧美绝顶高潮抽搐喷水合集| 亚洲精品国产精品国产自| 朝桐光av一区二区三区| 日韩欧美四区| 亚洲人在线观看| 国产主播av在线| 国产精品成人a在线观看| 久久伊人色综合| 精品视频久久久久| 妖精视频成人观看www| 欧美一区二区.| 狠狠狠狠狠狠狠| 免费看欧美美女黄的网站| 成人免费福利在线| 亚洲精品一区二区口爆| 99精品欧美一区| 日韩国产精品一区二区| 欧美激情办公室videoshd| 亚洲精品国产第一综合99久久| 国产精品videossex国产高清| sm性调教片在线观看 | 天天摸天天碰天天添| 免费成人直播| 3atv一区二区三区| 国产女主播在线播放| 人人网欧美视频| 中文字幕精品久久久久| 国产一级片免费看| 视频一区视频二区中文字幕| 91亚洲国产成人精品性色| 人妻少妇精品无码专区久久| 久久久久国产精品免费免费搜索| 日韩中文一区| 在线不卡日本v二区707| 一道本成人在线| 国产人妻精品久久久久野外| 台湾色综合娱乐中文网| 色噜噜狠狠色综合网图区| 亚洲国产精品成人无久久精品| 久久国产日韩| 亚洲综合自拍一区| 久久天堂电影| 亚洲综合色在线| xx欧美撒尿嘘撒尿xx| 中文字幕亚洲在线观看| 中文字幕在线日韩| 久久午夜免费视频| 国产麻豆午夜三级精品| 日韩高清三级| 日韩伦理在线| 欧美一级专区免费大片| 丁香花五月婷婷| 亚洲一级黄色| 国产精品无av码在线观看| 无码国产伦一区二区三区视频| 国产精品久久久久桃色tv| 97成人在线免费视频| 2020国产精品小视频| 亚洲欧洲日本专区| 日本三级网站在线观看| 国产乱子轮精品视频| 日韩国产欧美一区| 国产无遮挡裸体视频在线观看| 51精品视频一区二区三区| 怡红院一区二区三区| 亚洲精选成人| 国产精品美女黄网| 一区二区三区伦理| 在线成人免费视频| 性少妇xx生活| 日本亚洲三级在线| 蜜桃臀一区二区三区| 草美女在线观看| 日韩一区二区三区观看| 欧美日韩午夜视频| 久99久精品视频免费观看| 日韩在线导航| 四虎4545www国产精品| 亚洲欧美制服第一页| 欧美另类一区二区| 91小视频免费看| 国自产拍偷拍精品啪啪一区二区 | 亚洲影视在线| 久久青青草原| 一二三四视频在线中文| 日韩高清中文字幕| 日韩特级黄色片| 99精品一区二区| 久久国产亚洲精品无码| 日本在线中文字幕一区| 91精品国产91久久久久久吃药| 免费观看毛片网站| 亚洲福利国产精品| 亚洲图片综合网| 国产精品亚洲综合久久| 欧美不卡在线一区二区三区| 三级成人黄色影院| 国产亚洲精品一区二555| 亚洲av无码精品一区二区| 国产性天天综合网| 污视频网站观看| 婷婷精品进入| 国产精品jizz视频| 久久人体大尺度| www.欧美精品| 亚洲黄色片视频| 五月激情六月综合| 黄色在线观看av| 日韩avvvv在线播放| 伊人久久大香线蕉成人综合网| 在线免费成人| 欧美激情欧美激情在线五月| 神马午夜精品95| 日本丶国产丶欧美色综合| 天堂网av2018| 国产精品一区二区三区乱码 | 亚洲一区 欧美| 狠狠色狠狠色合久久伊人| 一本大道东京热无码aⅴ| 欧美挤奶吃奶水xxxxx| 国产精品极品美女在线观看免费| 老司机av在线免费看| 亚洲精品一区在线观看| 国产亚洲欧美在线精品| ...xxx性欧美| 中文字幕人妻一区二区三区| 久久国产毛片| 男女裸体影院高潮| 蜜臀av免费一区二区三区| 国产主播精品在线| √天堂8资源中文在线| 亚洲天堂av网| 亚洲成人久久精品| 欧洲另类一二三四区| 强行糟蹋人妻hd中文| 久久久久99精品国产片| 亚洲综合20p| 国产日产高清欧美一区二区三区| 亚洲成人18| 国产精品极品在线观看| 国产精品中文久久久久久久| 女同视频在线观看| 日日狠狠久久偷偷四色综合免费| 少妇一区二区三区四区| 91精品国产色综合久久不卡电影 | 欧美日本乱大交xxxxx| 中日韩精品视频在线观看| 国产精品乱子久久久久| 久久人人妻人人人人妻性色av| 老司机午夜精品| 啊啊啊一区二区| 国内精品福利| 五月天av影院| 经典一区二区| 国精产品一区二区| 欧美经典一区| 国产日韩av在线播放| 日日av拍夜夜添久久免费| 国产综合在线看| 免费在线毛片网站| 一本色道久久88综合日韩精品| 日本美女一级视频| 日韩免费成人网| 国产农村妇女毛片精品久久| 欧美在线视频不卡| 69视频免费看| 欧美日韩一区二区免费在线观看| 久久久久久久久久久久久久久久久| 国产精品传媒在线| 最新中文字幕av| 国产亚洲一区二区三区四区| 一区二区免费在线观看视频| 国产宾馆实践打屁股91| 一本之道在线视频| 国产伦精品一区二区三区免费迷 | 一区二区成人av| 日韩电影在线观看完整版| 亚洲精品v天堂中文字幕| 国产综合在线播放| 精品卡一卡二卡三卡四在线| 国内精品久久久久久久久久久| 在线播放亚洲一区| 在线免费观看日韩视频| 欧美性做爰猛烈叫床潮| 日韩中文字幕高清| 欧美性欧美巨大黑白大战| 国产suv精品一区二区33| 色婷婷综合五月| 337p粉嫩色噜噜噜大肥臀| 91福利社在线观看| 波多野结衣视频网址| 在线亚洲免费视频| 亚洲熟女乱色一区二区三区久久久| 欧美系列一区二区| 亚洲视频在线观看一区二区 | **欧美日韩vr在线| 日韩电影免费看| 国产成人涩涩涩视频在线观看 | 狠狠爱www人成狠狠爱综合网| 9191国产视频| 亚洲人成高清| 美女福利视频在线| 免费看欧美美女黄的网站| 看看黄色一级片| 丁香一区二区三区| 中文字幕在线免费看线人| 国产亚洲va综合人人澡精品| 国产午夜精品福利视频| 亚洲人一二三区| 国产性一乱一性一伧一色| 激情亚洲一区二区三区四区| 极品国产91在线网站| 欧美日韩一二三区| 精品国产18久久久久久| 亚洲第一精品久久忘忧草社区| 视频在线不卡| 色哟哟入口国产精品| 中文字幕中文字幕在线中高清免费版| 久久久久在线观看| 欧美在线va视频| 91在线免费观看网站| 麻豆一区一区三区四区| 少妇免费毛片久久久久久久久| 亚洲h色精品| 无码专区aaaaaa免费视频| 奇米精品一区二区三区四区| 少妇熟女视频一区二区三区| 久久人人爽爽爽人久久久| 欧美特黄一级片| 欧美视频免费在线观看| 国产又大又黄的视频| 亚洲精品www久久久| 午夜小视频在线| 性欧美xxxx交| 欧美成人三级| 蜜桃av色综合| 欧美ab在线视频| 亚洲一区二区三区四区五区xx| 国产成人免费视频| 手机看片福利视频| 亚洲成人午夜影院| 亚洲一级在线播放| 亚洲欧美日韩国产成人| av中文字幕在线播放| 国产成人一区二区三区小说| 视频一区视频二区欧美| 亚洲日本欧美在线| 妖精视频成人观看www| 污视频在线观看免费网站| 国产日韩一级二级三级| 九九视频免费看| 欧美人与z0zoxxxx视频| 黄色在线小视频| 97视频在线观看免费| 久久视频免费| 一本一生久久a久久精品综合蜜| 亚洲综合三区| 午夜av免费看| 一区二区三区视频在线看| 一级黄色小视频| 亚洲人成毛片在线播放| 超碰资源在线| 国产精品区一区二区三在线播放| 97精品国产一区二区三区| 国产精品69页| 久久亚洲综合色一区二区三区 | jizz日韩| 国产精品白嫩初高中害羞小美女| 黄色成人美女网站| www.在线观看av| 国产精品综合av一区二区国产馆| 欧美另类69xxxx| 欧美亚洲免费在线一区| 国产98在线| 国产成人精品久久二区二区91 | 亚洲精品美女久久久久| 欧美videossex| 成人av免费在线看| 欧美日本不卡高清| 绯色av蜜臀vs少妇| 一区二区高清视频在线观看| 国产夫绿帽单男3p精品视频| 久久影视电视剧免费网站| 精品久久亚洲| 日本丰满大乳奶| 国产精品一区二区久激情瑜伽| 欧美偷拍第一页| 欧美成人精品二区三区99精品| 在线网址91| 国产经品一区二区| 亚洲看片一区| 丰腴饱满的极品熟妇| 在线视频你懂得一区| 成人不用播放器| 成人欧美一区二区三区黑人| 欧美~级网站不卡| 欧洲成人午夜精品无码区久久| 亚洲夂夂婷婷色拍ww47| 视频一区二区免费| 欧美在线亚洲在线| 郴州新闻综合频道在线直播| 久久国产激情视频| 亚洲人成小说网站色在线| www香蕉视频| 91精品国产色综合| 国产最新精品| 老司机久久精品| 一区二区三区不卡在线观看| 日本激情一区二区| 欧美专区在线播放| 97久久夜色精品国产| 欧美午夜精品一区二区| 欧美视频在线免费看| 无遮挡的视频在线观看| 99久热re在线精品视频| 国产视频欧美| 黑人と日本人の交わりビデオ| 欧美一区二区成人6969| 女人高潮被爽到呻吟在线观看| 日本在线成人一区二区| 狠狠色狠狠色综合日日91app| 国产无码精品在线播放| 在线观看久久久久久| 中文字幕久久精品一区二区 | 精品在线免费观看视频| 精品视频久久久久久| 亚洲福利影视| 777精品久无码人妻蜜桃| 国产精品午夜久久| 高h调教冰块play男男双性文| 国产成人亚洲综合91| 亚洲欧美一级二级三级| 人人人妻人人澡人人爽欧美一区| 91精品中文字幕一区二区三区| 天堂√中文最新版在线| 国产又粗又大又爽的视频| 久久精品这里都是精品|