精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI能看懂圖像卻算不好距離,上交時間-空間智能基準難倒9大頂尖多模態(tài)模型

人工智能 新聞
上海交通大學聯(lián)合中國地質(zhì)大學、南洋理工大學、智源研究院以及斯坦福大學的研究團隊推出首個多模態(tài)大模型(MLLM)時空智能評測基準STI-Bench(Spatial-Temporal Intelligence Benchmark),向當前最先進的多模態(tài)大語言模型發(fā)起了關于精確空間時間理解的嚴峻挑戰(zhàn)。

多模態(tài)大語言模型(MLLM)在具身智能和自動駕駛“端到端”方案中的應用日益增多,但它們真的準備好理解復雜的物理世界了嗎?

上海交通大學聯(lián)合中國地質(zhì)大學、南洋理工大學、智源研究院以及斯坦福大學的研究團隊推出首個多模態(tài)大模型(MLLM)時空智能評測基準STI-Bench(Spatial-Temporal Intelligence Benchmark),向當前最先進的多模態(tài)大語言模型發(fā)起了關于精確空間時間理解的嚴峻挑戰(zhàn)。

結(jié)果顯示,即便是Gemini-2.5-Pro、GPT-4o、Claude-3.7-Sonnet、Qwen 2.5 VL等當前最強的多模態(tài)大模型,在需要定量分析真實世界空間關系和動態(tài)變化的任務上,表現(xiàn)并不盡人意。

圖片

從語義理解到時空智能

MLLM在視覺語言理解上成就斐然,并被寄望于成為具身智能和自動駕駛的“端到端”解決方案。但這要求模型超越傳統(tǒng)的語義理解,具備精準的時空智能。

試想AI應用場景中的需求:

  • 自動駕駛: 需知曉與前車的精確距離(米)、行人過馬路的速度(米/秒)、安全過彎的車速限制等。
  • 機器人操作:需判斷目標物體的尺寸位置(毫米級)、物體間的空間布局、高效的抓取路徑與速度。

這些任務的核心是定量化的空間-時間理解能力,而這恰恰可能是當前大模型能力的薄弱環(huán)節(jié)。STI-Bench正是為了系統(tǒng)評估這一關鍵能力而生。

STI-Bench:”時空智能”的全面基準測試

與現(xiàn)有側(cè)重語義的評測不同,STI-Bench直接采用真實世界視頻作為輸入,聚焦于精確、量化的時空理解,旨在評估模型在真實應用場景中的潛力。

圖片

基準構(gòu)建

數(shù)據(jù)來源包括300多個真實世界視頻,覆蓋三類典型場景:桌面操作(毫米級)、室內(nèi)環(huán)境(厘米級)、戶外場景(分米級)。

評測任務共八項,分屬兩個維度。第一類是靜態(tài)空間理解,包括:(1)尺度度量,評估物體大小和物體之間的距離;(2)空間關系,理解物體的相對位置關系;(3)3D視頻定位,預測物體在三維空間中的位置框。第二類是動態(tài)時序理解,包括:(4)位移與路徑長度,判斷物體運動距離;(5)速度與加速度,分析物體運動的快慢及其變化趨勢;(6)自我中心方向,估計相機的旋轉(zhuǎn)角度;(7)軌跡描述,概括物體運動路徑;(8)姿態(tài)估計,識別相機或物體在運動過程中的姿態(tài)變化。

圖片

此外,該數(shù)據(jù)集還包含2000多對高質(zhì)量問答(QA),所有問答基于精確標注計算真值,采用GPT-4o生成多樣化問題與答案,并經(jīng)過多輪人工審核與校準,確保問答內(nèi)容準確、語言合理、且與對應場景的精度需求高度匹配。

圖片

實驗結(jié)果

研究團隊對當前最先進的多模態(tài)模型進行了全面評測,包括最強的專有模型(GPT-4o、Gemini-2.0-Flash、Gemini-2.5-Pro、Claude-3.7-Sonnet)和知名開源模型(Qwen2.5-VL-72B、InternVL2.5-78B、VideoLLaMA 3等)。

圖片

評測結(jié)果令人感到擔憂:

整體表現(xiàn)不佳:表現(xiàn)最好的Qwen2.5-VL-72B和Gemini-2.5-Pro也僅不到42%的準確率,僅比隨機猜測(20%)高一些,距離實際應用所需的可靠性還有天壤之別。

定量空間任務成”重災區(qū)”:

  • 尺度度量:最高僅34.2%(Gemini-2.5-Pro)
  • 位移路徑長度:最佳成績不到33%
  • 速度與加速度:最高僅36.9%

場景差異明顯:

  • 所有模型在戶外場景表現(xiàn)相對較好(最高約50%)
  • 在對精度要求更高的室內(nèi)場景和桌面環(huán)境中普遍下降(均低于40%)

開源模型嶄露頭角:

Qwen2.5-VL-72B不僅贏過所有開源對手,甚至擊敗了所有專有模型,為開源社區(qū)帶來振奮。

圖片

錯誤原因分析

為了揭示大模型在空間-時間理解上失敗的根本原因,研究者對Gemini-2.5-Pro在各個場景下各類任務的思考過程進行了詳細錯誤分析,發(fā)現(xiàn)了三大核心瓶頸:

1. 定量空間屬性不準確模型往往難以通過單目視頻準確估計視覺輸入中物體的空間屬性,如尺寸、距離,以及無法從視頻中推斷3D信息,影響了所有需要精確空間測量的任務。

2. 時間動態(tài)理解缺陷模型在理解隨時間變化的跨幀信息方面表現(xiàn)不佳,難以準確計算和描述運動特征如位移、速度和軌跡。尤其難以區(qū)分物體運動與相機運動,這些問題源于跨幀信息整合困難和物理先驗的缺失。

3. 跨模態(tài)整合能力薄弱模型無法有效結(jié)合理解文本指令與視覺內(nèi)容,整合非視覺數(shù)據(jù)與視覺信息。這導致對時間約束的誤解、給定初始條件等使用不當,以及結(jié)構(gòu)化數(shù)據(jù),如坐標、姿態(tài)等與視覺元素的正確關聯(lián),影響所有依賴多模態(tài)信息的任務。

這些問題直指當前MLLM在精準的空間-時間理解上的能力缺陷,也為未來研究指明了方向。

圖片

總結(jié)

STI-Bench的結(jié)果清晰地揭示了當前多模態(tài)大模型在精確空間-時間理解方面的嚴重不足。只有當MLLM掌握了可靠、精確的空間-時間理解能力,它們才能在具身智能和自動駕駛等領域發(fā)揮真正的價值,邁出從虛擬世界到物理世界的關鍵一步。

STI-Bench的發(fā)布,為評估和改進MLLM的空間-時間理解能力提供了一個新的基準和“試金石”,有望引導研究人員更深入地探索解決方案。

目前,該項目的論文、代碼、數(shù)據(jù)等已經(jīng)開源。

論文鏈接: https://arxiv.org/pdf/2503.23765
論文主頁: https://mira-sjtu.github.io/STI-Bench.io/
Github: https://github.com/MIRA-SJTU/STI-Bench
Huggingface: https://huggingface.co/datasets/MIRA-SJTU/STI-Bench

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-13 09:40:00

2023-12-10 15:05:47

AI模型

2025-10-15 14:02:29

AI模型自動駕駛

2025-02-17 13:00:00

ChatGPT大模型AI

2025-02-17 10:09:54

2024-01-22 13:59:00

模型訓練

2024-09-12 14:19:59

2025-07-04 16:50:07

工具AI模型

2017-02-22 15:04:52

2025-01-08 08:21:16

2020-11-16 16:38:30

人工智能AI

2025-05-21 08:47:00

2018-03-06 10:38:23

云計算大數(shù)據(jù)人工智能

2023-10-19 13:44:00

數(shù)據(jù)訓練

2025-11-05 08:51:33

2025-10-20 09:02:00

2024-07-23 10:34:57

2022-07-04 08:31:42

GitOpsGit基礎設施

2018-12-24 08:46:52

Kubernetes對象模型

2019-12-27 09:47:05

大數(shù)據(jù)TomcatWeb
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲在线一区| 超碰成人在线免费| 综合分类小说区另类春色亚洲小说欧美| 国产精品一区二区三区久久久| 中文字幕欧美激情极品| 亚洲男人在线| 激情成人中文字幕| 水蜜桃一区二区| 337p粉嫩色噜噜噜大肥臀| 国产精品久久久久无码av| 亚洲成av人片在线观看香蕉| 黑鬼大战白妞高潮喷白浆| 日本成人网址| 91亚洲永久精品| 91精品国产综合久久久久久蜜臀 | 成人av网站在线播放| 久久一区二区三区电影| 亚洲第一中文字幕| 日韩肉感妇bbwbbwbbw| 女同一区二区免费aⅴ| 国产亚洲综合色| 97视频热人人精品| 中文字幕一区二区三区四区免费看 | 先锋影音久久久| 久久视频在线视频| 亚洲a v网站| 最新精品在线| 欧美久久久久中文字幕| 欧美黄色免费影院| 欧美6一10sex性hd| 国产精品福利电影一区二区三区四区| 国产精品区免费视频| 一区二区自拍偷拍| 久久人人超碰| 7777免费精品视频| 久久国产免费观看| 亚洲激情久久| 日韩在线视频免费观看| 在线观看成人动漫| 国产日韩欧美中文在线| 欧美日韩精品高清| 国产理论在线播放| 神马电影网我不卡| 欧美日韩亚洲精品内裤| 18禁裸男晨勃露j毛免费观看| 欧美r级在线| 国产精品美女www爽爽爽| 久久久久久国产精品mv| 人妻一区二区三区四区| 国产激情视频一区二区在线观看| 成人h猎奇视频网站| 国产美女www| 丝袜亚洲另类丝袜在线| 91成人天堂久久成人| 久久久久久久蜜桃| 韩日精品视频| 久久久久久一区二区三区 | 国产高清一区二区| 中文国产亚洲喷潮| 伊人影院综合网| 欧美日韩国产一区二区三区不卡| 亚洲欧美日韩国产中文| 爱爱免费小视频| 国产欧美一区二区三区精品观看| 日韩精品中文字幕有码专区| 一本加勒比波多野结衣| 亚洲精品动态| 亚洲图片在线综合| 蜜桃传媒一区二区亚洲| 欧美日韩在线网站| 深夜福利国产精品| 国产色无码精品视频国产| 91精品啪在线观看国产18| 欧美成人免费大片| 精品无码人妻一区二区三区品| 色网站免费观看| 视频一区在线观看| 少妇激情综合网| 全程偷拍露脸中年夫妇| 国产一区视频在线观看免费| 久久久久久久国产精品| 久久久精品免费看| 青青草伊人久久| 91九色视频在线| 亚洲精品一区二区口爆| 99久久免费国产| 神马影院午夜我不卡| 免费网站成人| 亚洲电影中文字幕在线观看| 男人揉女人奶房视频60分 | 国产精品美女在线| aaa一区二区| 91美女福利视频| 一区二区三区在线视频111| 日韩电影免费观看| 色欧美乱欧美15图片| 天堂av2020| 国产欧美自拍一区| 一区二区三区国产视频| 精品人妻伦九区久久aaa片| 亚洲第一区色| 国产精品视频色| 日韩在线视频免费| 国产精品美女久久久久高潮| 成年人看的毛片| 成人在线高清| 亚洲国产欧美在线成人app | 天天干天天综合| 中文字幕亚洲在线观看| 中文字幕亚洲情99在线| 国产精品第一页在线观看| 喷白浆一区二区| 国产自产在线视频一区| 黄色av电影在线观看| 欧美午夜精品久久久久久人妖| 999久久久精品视频| 亚洲免费专区| 欧美极品美女电影一区| 在线免费观看av片| 久久综合五月天婷婷伊人| 亚洲精品天堂成人片av在线播放| 色婷婷综合久久久中字幕精品久久| 这里只有精品电影| 一本色道久久综合狠狠躁篇怎么玩| 日本中文字幕精品| 成人羞羞动漫| 欧亚精品中文字幕| 国精产品一品二品国精品69xx | 日韩精品亚洲一区二区三区免费| 97人人模人人爽人人少妇 | 久久99久久亚洲国产| 无码人妻丰满熟妇区五十路| 成人国产亚洲欧美成人综合网| 一级做a爰片久久| 丝袜美腿一区| 亚洲乱亚洲乱妇无码| 国产精品18p| 国产成人精品一区二区三区网站观看| 亚洲一区二区三区精品视频| 国产高清不卡| 日韩激情视频在线播放| 欧美日韩在线视频免费| 国产一区高清在线| 亚洲乱码一区二区三区 | 欧美日韩综合| 91传媒在线免费观看| 色的视频在线免费看| 欧美中文字幕一区二区三区| 好吊视频在线观看| 男人的天堂亚洲在线| 狠狠色综合欧美激情| av日韩国产| 亚洲国产成人精品电影| 日韩xxx高潮hd| 北条麻妃一区二区三区| 欧美国产视频一区| 国产精东传媒成人av电影| 欧美黑人性生活视频| 精品人妻无码一区二区| 亚洲综合色视频| 亚洲一区二区三区四区av| 日韩视频一区| 精品日本一区二区| 高潮一区二区| 搡老女人一区二区三区视频tv| 中文字幕在线观看视频一区| 亚洲欧洲色图综合| 超碰中文字幕在线观看| 你懂的国产精品永久在线| av成人在线电影| 岛国在线视频网站| 国产亚洲精品久久| 国产精品久久久久久久成人午夜| 亚洲免费资源在线播放| 亚洲av综合色区无码另类小说| 欧美午夜不卡影院在线观看完整版免费| 91成人在线看| 亚洲永久av| 中文字幕亚洲欧美在线| 国产xxxx在线观看| 婷婷久久综合九色综合伊人色| 午夜理伦三级做爰电影| 久久精品免费观看| 97中文字幕在线| 视频精品在线观看| 亚洲综合在线做性| 性孕妇free特大另类| 在线观看欧美日韩国产| 国产成人精品免费看视频| 午夜精品一区在线观看| 美国黑人一级大黄| 国产成人小视频| 久久无码高潮喷水| 亚洲成av人电影| 精品免费视频123区| 欧美videos粗暴| 777国产偷窥盗摄精品视频| 在线免费av电影| 亚洲国产精品久久精品怡红院| 人人妻人人爽人人澡人人精品| 亚洲三级在线观看| 色婷婷在线影院| 国产一二三精品| 久草精品在线播放| 国产精品黄色| 亚洲国产成人不卡| 欧美人体视频| 97人人模人人爽人人少妇 | 99精彩视频在线观看免费| 伊人成综合网站| 欧美精品在线观看| 成人在线播放视频| 亚洲精品av在线播放| 国产精品亚洲欧美在线播放| 欧美视频在线免费| 久久午夜无码鲁丝片| 亚洲国产精华液网站w| 国模无码视频一区| 国产一区二区在线观看免费| 日韩一级在线免费观看| 亚洲高清不卡| 警花观音坐莲激情销魂小说| 成人激情电影在线| 美女视频久久| 国产毛片久久久| 97se国产在线视频| 综合久草视频| 国产精品久久久久久久天堂 | 午夜欧美大尺度福利影院在线看| 日韩av片在线免费观看| 91蝌蚪porny成人天涯| 精品人妻一区二区免费| 国产成人在线视频免费播放| 日本中文字幕观看| 美女视频黄a大片欧美| 成人性视频欧美一区二区三区| 亚洲精品乱码久久久久久蜜桃麻豆| 欧洲精品视频在线| 99热国内精品| 一区二区三区四区视频在线观看| 蜜桃精品噜噜噜成人av| 久久99精品久久久久久秒播放器 | 日韩丝袜美女视频| 91九色蝌蚪91por成人| 在线视频国内一区二区| 免费的毛片视频| 色系网站成人免费| 久青草免费视频| 亚洲国产综合色| 91精品国产高潮对白| 亚洲成人7777| 精品美女久久久久| 欧美日韩精品在线| 中文字幕欧美人妻精品一区| 免费av不卡| 亚洲色图13p| 国产视频在线看| 国产一区二区三区在线观看网站 | 欧美一区一区| 2022国产精品| 亚洲国产中文在线| 国产精品一区二区三区观看| 大香伊人久久精品一区二区| 国产一区福利视频| 午夜欧洲一区| 日本一区二区精品视频| 日韩欧美网站| 九九久久九九久久| 影音先锋中文字幕一区| 国产精品秘入口18禁麻豆免会员| 天堂蜜桃一区二区三区 | 成人精品高清在线视频| 国产在线拍偷自揄拍精品| 麻豆精品久久| 精品一区二区久久久久久久网站| 亚洲成a人片77777在线播放| 天天综合色天天综合色hd| 99热国内精品| 国产午夜福利100集发布| 久久精品一本| 亚洲色图欧美自拍| av不卡在线播放| 精品日韩在线视频| 亚洲美女免费视频| 九九热精品视频在线| 欧美亚洲综合一区| 精品久久久久久亚洲综合网站 | 你懂的在线视频| www.亚洲男人天堂| 24小时免费看片在线观看| 日韩av成人在线观看| 亚洲午夜剧场| 久久综合九色欧美狠狠| 五月天久久久| 男女高潮又爽又黄又无遮挡| 久久99久国产精品黄毛片色诱| 95视频在线观看| 日本不卡免费一区| 亚洲欧美一区二区三区在线| 99久久99久久久精品棕色圆| 日韩av影视在线| 国产原创在线观看| 日本韩国在线不卡| 日韩中文字幕在线一区| 欧美一区免费视频| 国产在线欧美| 色一情一区二区三区| 91麻豆精品秘密| 久久久久久久国产视频| 欧美又粗又大又爽| 午夜福利一区二区三区| 久久人人爽人人爽人人片亚洲| 中文字幕在线视频久| 亚洲综合中文字幕在线| 欧美呦呦网站| 中文字幕乱码人妻综合二区三区 | 成人自拍性视频| 免费电影一区二区三区| 男女啪啪免费观看| 老司机午夜精品| 久久精品人人爽| 国产午夜在线视频| 性视频1819p久久| 成人影院网站ww555久久精品| 欧美激情专区| 亚洲欧洲一区| 在线观看一区二区三区视频| 国产精品毛片高清在线完整版| www亚洲视频| 亚洲精品不卡在线| 美洲精品一卡2卡三卡4卡四卡| 国产欧美精品一区二区三区介绍| 真实原创一区二区影院| 日本中文字幕网址| 成人午夜精品一区二区三区| 久久精品一区二区三区四区五区| 在线观看一区日韩| 久草福利在线视频| 欧美在线播放视频| 婷婷综合电影| 日韩av片在线看| 不卡欧美aaaaa| 日本三级中文字幕| 精品成人佐山爱一区二区| 日韩免费影院| 99久久久精品免费观看国产| 中文字幕亚洲综合久久五月天色无吗'' | 国产精品熟女一区二区不卡| 亚洲国产精品精华液ab| 精品成人无码久久久久久| 亚洲跨种族黑人xxx| 中日韩脚交footjobhd| 九九九久久久| 国产欧美午夜| 久久久亚洲av波多野结衣| 精品久久久视频| 欧美视频综合| 国产精品电影在线观看| 成人av动漫在线观看| 亚洲不卡视频在线| 国产精品剧情在线亚洲| 亚洲一卡二卡在线| 精品激情国产视频| 精品国产一区二区三区性色av | 日本黄色特级片| 色综合天天综合在线视频| 国内精品在线视频| 国产精品自拍偷拍| 91精品久久久久久久蜜月| 天堂va欧美va亚洲va老司机| av福利在线导航| 国产精品一香蕉国产线看观看| 久久视频国产| 中文字幕无人区二| 懂色aⅴ精品一区二区三区蜜月| 桃花色综合影院| 国产精品成人国产乱一区| 久久久影院免费| 久久久久亚洲av无码专区首jn| 亚洲成人免费av| 国产对白叫床清晰在线播放| 国产日本欧美一区二区三区| 欧美激情aⅴ一区二区三区| 亚洲色偷偷色噜噜狠狠99网| 一本久久综合亚洲鲁鲁五月天| 幼a在线观看| 国产精品国产一区二区| 久久一区国产| 日本中文字幕免费在线观看 | 免费看男男www网站入口在线| 国产精品日韩欧美综合| 国产精品v亚洲精品v日韩精品| 醉酒壮男gay强迫野外xx| 欧美色综合网站| 欧美xxxx免费虐| 亚洲草草视频| av一本久道久久综合久久鬼色| 在线视频你懂得| 2020久久国产精品| 欧美三级韩国三级日本三斤在线观看|