精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假? 精華

發(fā)布于 2025-11-13 09:05
瀏覽
0收藏

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

論文鏈接:https://arxiv.org/pdf/2510.26802v1
項(xiàng)目主頁(yè):https://video-cof.github.io/

引言

近年來(lái),以 Veo、Sora 等為代表的視頻生成模型展現(xiàn)出驚人的生成能力,能夠合成高度逼真、時(shí)間連續(xù)的動(dòng)態(tài)畫(huà)面。這些進(jìn)展暗示,模型在視覺(jué)內(nèi)容生成之外,或許已開(kāi)始具備對(duì)物理世界結(jié)構(gòu)與規(guī)律的潛在理解。

值得注意的是,Google 最新研究指出,諸如 Veo-3 等模型正在顯現(xiàn)出超越純粹生成的“涌現(xiàn)能力”,例如感知建模、動(dòng)態(tài)預(yù)測(cè)以及推理能力。

由此催生出一個(gè)與語(yǔ)言模型“思維鏈”(Chain-of-Thought, CoT)相對(duì)應(yīng)的新概念——幀鏈推理(Chain-of-Frame, CoF)。

其核心思想在于:視頻模型通過(guò)逐幀生成過(guò)程,構(gòu)建連貫的視覺(jué)演化,從而體現(xiàn)思維與推理的過(guò)程。然而,一個(gè)關(guān)鍵問(wèn)題仍懸而未決——這些模型是否真的具備零樣本推理(Zero-Shot Reasoning)能力?還是僅僅在模仿訓(xùn)練數(shù)據(jù)中的表層模式?

為驗(yàn)證這一點(diǎn),來(lái)自香港中文大學(xué)、北京大學(xué)、東北大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)開(kāi)展了系統(tǒng)研究,對(duì) Veo-3 等模型的零樣本推理潛能進(jìn)行全面評(píng)估,并提出了涵蓋空間、幾何、物理、時(shí)間等 12 個(gè)維度的綜合基準(zhǔn)——MME-CoF。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

什么是 Chain-of-Frame(CoF)?

“幀鏈推理(CoF)”可以視作語(yǔ)言中“思維鏈”(CoT)的視覺(jué)化形式:

  • CoT:通過(guò)逐步生成文本展示思考與推理路徑。
  • CoF:通過(guò)逐幀生成畫(huà)面,以動(dòng)態(tài)演化的方式呈現(xiàn)推理與決策過(guò)程。

這種方式使模型不僅輸出結(jié)果,更在生成的時(shí)間維度上“展示”其思考軌跡。

12 項(xiàng)推理挑戰(zhàn)概覽

研究團(tuán)隊(duì)圍繞 12 個(gè)推理維度構(gòu)建了系統(tǒng)測(cè)試,對(duì) Veo-3 模型進(jìn)行了實(shí)證評(píng)估。以下為部分典型任務(wù)摘要。

視覺(jué)細(xì)節(jié)推理(Visual Detail Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):檢測(cè)模型保持細(xì)粒度視覺(jué)屬性(顏色、紋理)與空間關(guān)系的能力。
  • 表現(xiàn):對(duì)顯著、易識(shí)別物體表現(xiàn)較好。
  • 局限:當(dāng)目標(biāo)較小、被遮擋或背景復(fù)雜時(shí),模型易偏離任務(wù)目標(biāo)或生成風(fēng)格化偏差。

視覺(jué)追蹤推理(Visual Trace Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):評(píng)估模型在動(dòng)作序列中維持因果連續(xù)性的能力。
  • 表現(xiàn):在簡(jiǎn)單任務(wù)中能生成連貫的短時(shí)序路徑。
  • 局限:長(zhǎng)時(shí)序或高邏輯依賴任務(wù)中,模型難以保持連貫因果關(guān)系。

物理推理(Physics-based Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo):測(cè)試模型是否理解重力、碰撞、摩擦等物理規(guī)律。
  • 表現(xiàn):能生成短期合理的動(dòng)態(tài)畫(huà)面。
  • 局限:經(jīng)常違反物理約束(如能量守恒),僅在“模仿”物理而非真正推理。

真實(shí)世界空間推理(Real-World Spatial Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 測(cè)試模型在視角變化下保持空間一致性的能力。
  • 表現(xiàn): 簡(jiǎn)單場(chǎng)景中能維持基本的方向與空間結(jié)構(gòu)。
  • 局限: 在復(fù)雜多視角任務(wù)中常出現(xiàn)空間錯(cuò)位或漂移。

3D 幾何推理(3D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 評(píng)估模型在立體折疊、旋轉(zhuǎn)與重構(gòu)任務(wù)中的結(jié)構(gòu)理解。
  • 表現(xiàn): 在單步操作中具備一定三維感知。
  • 局限: 復(fù)雜組合變換時(shí)易崩壞,缺乏穩(wěn)定幾何一致性。

2D 幾何推理(2D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

  • 目標(biāo): 檢驗(yàn)?zāi)P驮谄矫鏄?gòu)圖與形狀關(guān)系中的精確度。
  • 表現(xiàn): 能識(shí)別并繪制基礎(chǔ)幾何關(guān)系。
  • 局限: 更傾向生成“好看”的圖形而非“正確”的幾何,易出現(xiàn)邏輯順序錯(cuò)誤。

其他六個(gè)推理維度概覽

除上述6項(xiàng)外,其余6個(gè)維度同樣揭示了 Veo-3 的限制:

  • 旋轉(zhuǎn)推理(Rotation Reasoning):小角度旋轉(zhuǎn)可近似實(shí)現(xiàn),大角度下結(jié)構(gòu)崩壞。
  • 圖表推理(Table & Chart Reasoning):可模仿局部視覺(jué)模式,但缺乏對(duì)數(shù)值關(guān)系的真實(shí)理解。
  • 物體計(jì)數(shù)(Object Counting Reasoning):在靜態(tài)場(chǎng)景下表現(xiàn)良好,但動(dòng)態(tài)環(huán)境中常出現(xiàn)漏數(shù)或重復(fù)。
  • GUI 推理(GUI Reasoning):能生成點(diǎn)擊或拖動(dòng)動(dòng)作,但對(duì)操作目的與邏輯缺乏認(rèn)知。
  • 具身推理(Embodied Reasoning):能識(shí)別物體位置與動(dòng)作,但不遵守環(huán)境規(guī)則,偶有“作弊式”生成。
  • 醫(yī)學(xué)推理(Medical Reasoning):在放大或觀察局部細(xì)節(jié)時(shí)具備表面能力,但無(wú)法保持影像邏輯一致,易出現(xiàn)結(jié)構(gòu)性錯(cuò)誤。

MME-CoF:首個(gè)視頻推理基準(zhǔn)

研究團(tuán)隊(duì)據(jù)此提出 MME-CoF,這是首個(gè)專門(mén)用于量化視頻模型推理能力的標(biāo)準(zhǔn)化評(píng)測(cè)體系。其主要特征包括:

  • 首個(gè)系統(tǒng)化視頻推理評(píng)估框架;
  • 覆蓋 12 個(gè)維度;
  • 將抽象的推理過(guò)程轉(zhuǎn)化為視頻生成挑戰(zhàn),以迫使模型在視覺(jué)上展示“幀鏈思考”。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

基于 MME-CoF 基準(zhǔn),研究團(tuán)隊(duì)對(duì)多個(gè)主流模型進(jìn)行了量化評(píng)測(cè)(由 Gemini-2.5-Pro 評(píng)分,滿分 4 分)。結(jié)果顯示:

  • 整體表現(xiàn)較低:多數(shù)模型平均得分不足 2 分,推理能力仍有限。
  • 優(yōu)勢(shì)差異顯著:

a.Sora-2 在物理、具身與醫(yī)學(xué)推理中表現(xiàn)相對(duì)突出;

b.Veo-3 在真實(shí)空間推理上具優(yōu)勢(shì);

c.Seedance-1.0-Pro 在旋轉(zhuǎn)與三維幾何任務(wù)中略勝一籌。

  • 總體趨勢(shì):各模型均在特定方向具備偏好性,但仍停留在“模式重現(xiàn)”層面,尚未形成真正的邏輯推理能力。

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?-AI.x社區(qū)

結(jié)論:推理,還是表演?

通過(guò)對(duì) Veo-3 等模型的實(shí)證分析,研究團(tuán)隊(duì)得出如下結(jié)論:

  • 缺乏真正的零樣本推理:當(dāng)前視頻模型更多依賴數(shù)據(jù)模式,而非自主邏輯推演。
  • 生成強(qiáng) ≠ 推理強(qiáng):高質(zhì)量的畫(huà)面并不代表深層理解。
  • 注重表象,忽視因果:生成結(jié)果“看似合理”,但常違背邏輯或物理規(guī)律。
  • 視頻模型可作為視覺(jué)推理系統(tǒng)的重要模塊,與語(yǔ)言或邏輯模型結(jié)合,推動(dòng)多模態(tài)智能邁向真正的“通用理解”。

總體來(lái)看,本研究為學(xué)術(shù)界構(gòu)建了一個(gè)系統(tǒng)且可驗(yàn)證的實(shí)證評(píng)估框架,清晰揭示了視頻生成模型在從“內(nèi)容生成”邁向“邏輯推理”,并邁向真正“通用視覺(jué)智能”過(guò)程中仍需跨越的核心瓶頸。


本文轉(zhuǎn)自AI生成未來(lái) ,作者:AI生成未來(lái)


原文鏈接:??https://mp.weixin.qq.com/s/TshekyfXktEp3Eqm6TVtlg??

標(biāo)簽
已于2025-11-13 10:18:19修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲一区二区观看| 美日韩精品免费| 欧美黑人性猛交xxx| 国产乱码精品一区二区三区亚洲人 | 在线日韩中文| 亚洲国内精品在线| 各处沟厕大尺度偷拍女厕嘘嘘| 欧美精品久久久久久久久久丰满| 母乳一区在线观看| 亚洲老司机av| 日本黄色的视频| 成人免费一区二区三区牛牛| 久久久精品免费网站| 亚洲va码欧洲m码| 好吊色在线视频| 极品av少妇一区二区| 中文字幕亚洲二区| 老熟妇精品一区二区三区| 日韩福利影视| 一本高清dvd不卡在线观看| 超碰成人在线免费观看| 黄色美女网站在线观看| 成人中文字幕合集| 成人免费大片黄在线播放| 亚洲综合久久网| 亚洲小说区图片区| 日韩一中文字幕| 久久成人激情视频| 久久午夜影院| 日韩美一区二区三区| 网站一区二区三区| 中文在线аv在线| 亚洲午夜影视影院在线观看| 天堂精品视频| 男人的天堂在线免费视频| 成人小视频在线| 91久久久久久久| 中文字幕 欧美激情| 国产美女一区| 欧美一级电影久久| 精品成人免费视频| 国产一区激情| 欧美黑人xxxx| 国产va在线播放| 国产精品麻豆久久| 综合久久五月天| 日韩精品无码一区二区三区久久久 | 色偷偷88欧美精品久久久| 免费超爽大片黄| 在线观看午夜av| 亚洲精品视频一区| 日本一二三区视频在线| 高h视频在线观看| 亚洲日本在线视频观看| 在线看无码的免费网站| 欧美激情二区| 国产精品免费网站在线观看| 视频一区二区三| 生活片a∨在线观看| 国产精品久久久久影视| 日本91福利区| 日韩一区二区高清| 日韩av福利在线观看| 成人动漫视频在线观看| 678五月天丁香亚洲综合网| 欧美美女一级片| 精品一区二区三区免费看| 欧美一级生活片| 性生活在线视频| 成人另类视频| 亚洲激情免费观看| 69视频在线观看免费| 清纯唯美综合亚洲| 俺去亚洲欧洲欧美日韩| 欧美丰满熟妇bbbbbb| 国产精品chinese| 97精品伊人久久久大香线蕉| 中文字幕在线播| 美国三级日本三级久久99| 91精品啪aⅴ在线观看国产| 亚洲av无码国产综合专区| 91亚洲资源网| 日韩精品一区二区三区丰满| 巨大荫蒂视频欧美大片| 亚洲一区自拍偷拍| 国产又黄又大又粗视频| 懂色aⅴ精品一区二区三区| 欧美高清视频一二三区| 久久久久亚洲AV成人网人人小说| 亚州av日韩av| 精品久久国产精品| 国产精品第二十页| 青娱乐精品视频在线| av一区二区三区免费| 五月婷婷在线播放| 国产精品―色哟哟| 和岳每晚弄的高潮嗷嗷叫视频| 亚洲美女炮图| 91精品久久久久久久91蜜桃 | 成人国产精品免费| 欧美午夜视频在线| 26uuu亚洲电影在线观看| 激情懂色av一区av二区av| 午夜在线观看av| julia中文字幕一区二区99在线| 一色桃子一区二区| 国产亚洲精品女人久久久久久| 三级在线观看一区二区| 成人网在线观看| 国产专区在线播放| 亚洲已满18点击进入久久| 天堂中文视频在线| 久久大胆人体视频| 久久av在线播放| 久久精品无码av| 岛国一区二区三区| a级黄色片网站| 麻豆精品蜜桃| 亚洲精品福利资源站| 无码人妻精品一区二区三区夜夜嗨| 久久福利影视| 精品一区二区三区免费毛片| 成人在线免费看片| 欧美中文字幕一二三区视频| 在线免费观看污视频| 亚洲电影在线一区二区三区| 国产精品人成电影在线观看| 五月婷婷丁香花| 樱花影视一区二区| 一级淫片在线观看| 欧美第一精品| 国产精品免费在线免费| 免费在线观看一级毛片| 亚洲最大色网站| 亚洲天堂小视频| 天天精品视频| 成人妇女淫片aaaa视频| a黄色在线观看| 色婷婷国产精品久久包臀| 韩国三级与黑人| 91av精品| 亚洲va欧美va在线观看| 毛片在线播放a| 欧美日韩国产首页| 一级免费黄色录像| 久久狠狠亚洲综合| 亚洲在线视频一区二区| 国产精品亲子伦av一区二区三区| 亚洲欧美在线免费| 四虎影院在线免费播放| 国产午夜精品一区二区| 激情婷婷综合网| 国内精品久久久久久久影视简单| 国产精品成人一区二区三区吃奶| 毛片网站在线| 欧美视频中文字幕| 欧美福利在线视频| 国产在线精品免费| 国产精品三级一区二区| av成人男女| 97国产成人精品视频| av女名字大全列表| 日本二三区不卡| 国产一区二区三区视频播放| 久久99蜜桃精品| 最新av网址在线观看| 一区中文字幕电影| 97国产一区二区精品久久呦| 免费一级毛片在线观看| 欧美午夜精品免费| 一起操在线播放| 成人免费视频免费观看| 精品久久一二三| 亚洲成人一品| 成人春色激情网| 99热99re6国产在线播放| 亚洲日韩中文字幕在线播放| 五月天中文字幕| 亚洲免费三区一区二区| 国产激情第一页| 日本美女视频一区二区| 欧美一级爱爱视频| 婷婷亚洲精品| 成人高清视频观看www| 蜜臀av在线| 亚洲图片欧洲图片av| 99久久精品无免国产免费| 性做久久久久久免费观看| 欧美做受xxxxxⅹ性视频| 国产真实乱子伦精品视频| 亚洲熟妇无码一区二区三区导航| 亚洲自拍电影| 97视频中文字幕| 日韩毛片免费观看| 九九精品在线视频| 国产在线小视频| 日韩精品一区二区三区四区| 69xxxx国产| 亚洲午夜一区二区| 性少妇xx生活| 91麻豆免费看| 亚洲国产欧美日韩在线| 久久综合九色| 大西瓜av在线| 国产精品国内免费一区二区三区| 久久国产精品 国产精品| 亚洲欧美在线人成swag| 4438全国亚洲精品在线观看视频| 黄视频网站在线看| 国产亚洲一区二区在线| 亚洲欧美黄色片| 欧美美女黄视频| 国产精品久久久久久久久久久久久久久久久 | 久久久久高清| 久久wwww| 国产精品视频色| 热色播在线视频| 美日韩丰满少妇在线观看| 成黄免费在线| 日韩电视剧在线观看免费网站| 99精品免费观看| 欧美日韩亚洲高清一区二区| 91玉足脚交嫩脚丫在线播放| 亚洲综合丝袜美腿| 99鲁鲁精品一区二区三区| 91麻豆精品在线观看| 一级黄色免费视频| 精品影院一区二区久久久| 邪恶网站在线观看| 噜噜爱69成人精品| 六月丁香婷婷激情| 国产精品免费看| 日本男女交配视频| 91不卡在线观看| 国产又黄又爽免费视频| 久久国产精品成人免费观看的软件| 欧美不卡在线一区二区三区| 欧美1区2区3区4区| 国产伦精品一区二区三区照片| 午夜视频一区二区在线观看| 成人做爰www免费看视频网站| 日韩欧乱色一区二区三区在线| 国产精品久久久久久av下载红粉| 伊人色综合一区二区三区影院视频| 久久久伊人欧美| a级片在线免费| 午夜精品三级视频福利| 成人三级高清视频在线看| 久久久久中文字幕2018| 国产桃色电影在线播放| 久久久久国产精品www| 四虎av在线| 欧美精品激情blacked18| tube8在线hd| 亚洲3p在线观看| 新版的欧美在线视频| 国产精彩精品视频| 国产亚洲欧美日韩精品一区二区三区| 日本sm极度另类视频| 国产成人免费9x9x人网站视频| 国产精品情侣自拍| 精品国产第一国产综合精品| αv一区二区三区| 黄色美女久久久| 欧美激情第一页在线观看| 国产伦精品一区二区三区千人斩| 色999五月色| 91精品国产成人观看| 国产亚洲精品久久久久久久| 国产一区日韩一区| 国产又大又硬又粗| 麻豆成人91精品二区三区| 日本高清免费在线视频| 粉嫩av亚洲一区二区图片| 久久国产精品影院| 国产精品久久久爽爽爽麻豆色哟哟| 小泽玛利亚一区| 亚洲一区二区三区视频在线播放 | 成人福利网站| 国内精品小视频在线观看| 天堂av在线网| 成人夜晚看av| 全球av集中精品导航福利| 水蜜桃亚洲一二三四在线| 久久精品亚洲人成影院| 欧美深夜福利视频| 日本sm残虐另类| 91人妻一区二区| 国产色综合一区| 久久久久久久久久久久国产| 日韩欧美综合在线视频| 一女二男一黄一片| 亚洲精品久久久久久下一站| 亚洲成a人v欧美综合天堂麻豆| 欧美精品少妇videofree| 暖暖成人免费视频| 99中文视频在线| 精品久久中文| 青青草成人免费在线视频| 久久99国内精品| 国产高清自拍视频| 亚洲女人小视频在线观看| 日本视频网站在线观看| 日韩亚洲欧美成人一区| 超碰在线国产| 68精品久久久久久欧美| 99久久99九九99九九九| 免费国产一区二区| 国产精品v日韩精品v欧美精品网站 | 国产欧美丝袜| 天天天综合网| 精品久久久久久中文字幕2017| 懂色中文一区二区在线播放| 精品少妇一区二区三区密爱| 欧美性色视频在线| 黄色一级大片在线免费看国产一| 中文字幕国产日韩| 台湾佬中文娱乐网欧美电影| 97在线电影| 国产精品7m凸凹视频分类| 久久久久久久少妇| 99精品在线观看视频| 久久久99精品| 欧美另类变人与禽xxxxx| www免费网站在线观看| 日本亚洲欧美三级| 欧美日韩直播| 五十路熟女丰满大屁股| 国产大陆精品国产| 国产盗摄一区二区三区在线| 欧美视频日韩视频| 国产精品四虎| 国产成人一区二区在线| 日本欧美高清| 9久久9毛片又大又硬又粗| 成人av电影在线网| 日韩 国产 在线| 精品国产凹凸成av人网站| 性欧美video高清bbw| 99久re热视频这里只有精品6| 久久久久久久久国产一区| 超碰成人在线播放| 国产精品久久久久久久久久久免费看| 国产精品尤物视频| 在线成人激情视频| 免费一级欧美在线观看视频| 亚洲精品乱码久久久久久蜜桃91| 巨乳诱惑日韩免费av| 人人人妻人人澡人人爽欧美一区| 91黄色免费观看| 亚洲搞黄视频| 亚洲free嫩bbb| 欧美日本中文| 国产69视频在线观看| 午夜精品123| 色视频精品视频在线观看| 青青精品视频播放| 国产在视频线精品视频www666| 亚洲三级视频网站| 亚洲图片激情小说| 亚洲黄色在线播放| 91精品国产乱码久久久久久久久| 亚洲电影男人天堂| 波多野结衣天堂| 亚洲人成在线观看一区二区| 超碰在线人人干| 91av免费观看91av精品在线| 少妇精品久久久一区二区| www.99av.com| 亚洲欧美一区二区三区久本道91| 午夜精品久久久久久久91蜜桃| 91国自产精品中文字幕亚洲| 国产欧美日韩精品一区二区三区 | 久久久久国产免费免费 | 亚洲精华液一区二区三区| 日韩国产伦理| 国产乱人伦偷精品视频免下载| 国产对白videos麻豆高潮| 亚洲日本aⅴ片在线观看香蕉| 99久久久国产| 色综合久久久久无码专区| 中文在线一区二区| 成人午夜精品福利免费| 日韩av理论片| 综合一区av| www.日本高清| 51精品秘密在线观看| 国产在线88av| 中文字幕久精品免| www.性欧美| 一级黄色片在线| 国模视频一区二区三区| 日韩成人激情| 波多野结衣一二三区| 欧美中文字幕亚洲一区二区va在线| 日皮视频在线观看| 亚洲高清视频一区二区| 成人h动漫精品一区二区| 中文天堂在线资源| 欧美亚洲成人网|