精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

李飛飛謝賽寧新作「空間推理」:多模態大模型性能突破關鍵所在

人工智能
即使是最先進的多模態大模型,在空間認知方面與人類相比仍有顯著差距,測試中約71%的錯誤都源于空間推理方面的缺陷,即空間推理能力是當前主要瓶頸。

李飛飛謝賽寧再發新成果:

直接把o1式思考拉至下一個level——多模態大語言模型的空間思維

這項研究系統評估了多模態大模型的視覺空間智能,結果發現:

當前,即使是最先進的多模態大模型,在空間認知方面與人類相比仍有顯著差距,測試中約71%的錯誤都源于空間推理方面的缺陷,即空間推理能力是當前主要瓶頸

圖片圖片

更為有趣的是,在這種情況下,思維鏈、思維樹等常用的語言提示技術直接失靈了——

不僅沒有提升模型在空間任務上的表現,反而會使性能下降。

而在問答過程中明確生成認知地圖則會增強多模態大模型的空間距離能力。

圖片圖片

這項工作陣容非常豪華,合著作者中不僅有李飛飛,還有紐約大學計算機科學助理教授、CV大牛謝賽寧。

而剩下的四位作者,全部共同一作。

圖片圖片

這項研究吸引了不少網友的關注,大伙兒一邊看論文,一邊已迫不及待搓搓手期待2025年的新進展。

圖片圖片

多模態大模型的空間思維

雖然當前多模態大語言模型在語言理解和一般視覺任務上取得了顯著進展,但在空間認知和理解方面的能力仍未得到充分研究。

反觀人類,面對心理旋轉測試、挑選家具這些任務時,會同時依賴于空間和視覺思考。

圖片圖片

多模態大語言模型能否“進行空間思考”?能否構建一個準確的、隱式的“認知地圖”來幫助它們回答有關空間的問題?使用多模態大語言模型來增強空間智能的優勢和局限性是什么?

為了探索這些問題,團隊研究了視覺空間智能

作者解釋,之所以在“空間智能”前加上“視覺”一詞,是因為空間智能不受感官模式限制,比如盲人也可以通過別的感官感知空間,而該研究專注于視頻輸入,所以討論視覺空間智能。

圖片圖片

VSI-Bench視覺空間智能基準測試集

首先團隊提出了一個名為VSI-Bench的基準測試集。

基于之前的計算機視覺工作,團隊重新利用現有的空間掃描視頻(最初用于3D重建)及其真實標注來自動生成視覺問答(VQA)問題。

具體來說,這個測試集基于ScanNet、ScanNet++和ARKitScenes等數據集中的288個真實室內場景視頻,包括住宅、辦公室、實驗室等各種環境。

團隊設計了超5000個問答對,將評測任務分為三大類:

  • 配置型任務:物體計數、相對距離、相對方向、路線規劃
  • 測量估計:物體尺寸、房間大小、絕對距離
  • 時空任務:物體出現順序等

并采用人工審核確保數據質量,消除歧義和錯誤標注。

圖片圖片

隨后,他們全面評估了15種支持視頻的多模態大語言模型,開源、閉源的都有。

圖片圖片

結果,人類在VSI-Bench上的平均準確率達到79%,在配置型和時空任務上準確率更高,處于94%-100%之間。

相比之下,表現最好的閉源模型是Gemini-1.5 Pro,平均準確率為48.8%,開源模型LLaVA-NeXT-Video-72B和LLaVA-OneVision-72B與之相近。

在需要精確估計絕對距離/大小的三個測量任務上,大模型和人類表現差距相對較小。

團隊還進一步證實了視頻輸入對模型性能的重要性,盲測實驗中,在絕對距離估計等特定任務上,即使是最先進的模型也難以超越隨機基線的表現。

語言視覺兩個層面分析模型思維過程

為了深入理解模型的認知機制,團隊又從語言和視覺兩個層面分析了模型的思維過程。

圖片圖片

圖片圖片

在語言層面,通過讓模型進行自我解釋,發現它們確實具備不錯的視頻理解和語言推理能力。

但詳細的錯誤分析顯示,超70%的錯誤源于其空間推理能力的不足

圖片圖片

圖片圖片

接著,團隊用常用的語言提示技術改進,包括思維鏈、思維樹、自洽性。

結果不僅沒有提升模型在空間任務上的表現,反而導致了性能下降,也就是說純粹的語言推理技術難以解決空間認知問題。

在視覺層面,他們又使用認知地圖來分析模型的空間記憶能力。

結果顯示,模型在理解局部空間關系時表現較好,相鄰物體位置關系的準確率達到64%。但隨著物體之間距離的增加,模型的空間關系理解能力顯著下降。

這說明模型傾向于建立局部空間模型,而不是形成完整的全局空間理解

圖片圖片

圖片圖片

不過,他們研究了一種新思路:

使用認知地圖輔助空間推理。

圖片圖片

加入這種機制,模型在相對距離任務上的準確率提升了10個百分點,這為提升模型空間智能提供了一個潛在的解決方向。

李飛飛謝賽寧領銜,四位共同一作

論文一經公布,幾位作者就激情當起了自個兒的首批自來水(doge)。

謝賽寧表示:

視頻理解是下一個前沿領域,但并非所有視頻都是相同的。

這項研究探索了多模態大語言模型如何觀察、記憶和回憶空間。

圖片圖片

“AI教母”李飛飛也轉發開麥:

這是人類智能中極為重要的一個方面,2025年還有更多值得期待,推動空間智能的邊界!

圖片圖片

這項研究共同一作有四位,正如李飛飛教授透露,多位都是謝賽寧的學生。

Jihan Yang

圖片圖片

Jihan Yang是紐約大學Courant研究所博士后研究員,導師是謝賽寧。在此之前,Jihan Yang于香港大學獲得了博士學位,中山大學獲得了學士學位。

他的研究興趣集中在機器學習和計算機視覺領域,特別關注多模態和具身智能。

Shusheng Yang

圖片圖片

Shusheng Yang目前是紐約大學博士生。

領英顯示,他是華中科技大學校友,曾經在阿里和騰訊有過工作經歷。

圖片圖片

Anjali Gupta

圖片圖片

Anjali Gupta是紐約大學Courant研究所博士生,導師是謝賽寧教授。

她的研究領域是機器學習和計算機視覺,特別是以視覺為中心的多模態大語言模型。

Rilyn Han

圖片圖片

Rilyn Han來自耶魯大學,主修計算機科學和經濟學,研究主要關注探索多模態大語言模型的能力。

論文鏈接:https://arxiv.org/pdf/2412.14171
項目主頁:https://vision-x-nyu.github.io/thinking-in-space.github.io/
參考鏈接:
[1]https://x.com/sainingxie/status/1870877202595958791
[2]https://x.com/drfeifei/status/1870881981703291097
[3]https://vision-x-nyu.github.io/thinking-in-space.github.io/

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-12-23 13:50:00

數據訓練模型

2025-04-08 09:10:00

模型訓練AI

2025-11-10 17:11:13

AI李飛飛模型

2025-11-11 12:16:25

2025-04-14 09:38:00

2023-12-25 09:23:07

模型技術

2023-09-28 08:23:18

AI模型

2024-08-07 13:00:00

2024-06-27 13:10:21

2025-07-04 08:52:00

3D圖像生成AI

2009-10-12 14:00:24

布線測試

2021-06-23 10:26:19

自動化DevSecOps安全防護

2011-04-14 13:26:10

2025-01-08 08:21:16

2025-05-21 08:47:00

2020-06-10 14:00:28

生物識別智慧城市網絡

2016-11-14 16:47:11

Nutanix

2024-10-25 14:30:00

模型AI

2023-12-28 17:31:44

PixelLM性能模型

2025-06-10 03:30:00

點贊
收藏

51CTO技術棧公眾號

亚洲成人最新网站| 欧美暴力调教| 99久久夜色精品国产网站| 91国产精品电影| 五月天精品在线| 9999精品| 欧美视频中文在线看| 亚洲一区二区在线观| 亚洲精品成人区在线观看| 亚洲男女自偷自拍| 美女性感视频久久久| 日本少妇毛茸茸| 日韩伦理一区二区| 欧美性高潮在线| 国产大尺度在线观看| 香蕉视频国产在线| 精品一区二区免费视频| 亚州欧美日韩中文视频| 手机看片国产日韩| 欧美变态挠脚心| 91精品国产欧美日韩| 国产视频九色蝌蚪| a级网站在线播放| 久久亚洲精品小早川怜子| 亚洲最大福利视频网站| 亚洲精品中文字幕乱码三区91| 亚洲h色精品| 国产亚洲精品美女久久久| 国产成人精品一区二区在线小狼 | 九色精品国产蝌蚪| 欧美一区二区黄色| 日韩肉感妇bbwbbwbbw| 女人让男人操自己视频在线观看 | 日本午夜小视频| 午夜精品一区二区三区国产| 亚洲人成电影网站色| 国产伦精品一区二区三区88av| 97久久网站| 欧美丝袜一区二区三区| 国产乱子伦精品无码专区| 久久亚洲天堂| 中文乱码免费一区二区| 裸模一区二区三区免费| 日批免费在线观看| 国产成人av福利| 亚洲自拍av在线| 国产三级第一页| 美女视频黄 久久| 国产精品高清在线| 日韩黄色片网站| 视频一区欧美精品| 国产精品成人va在线观看| 欧美h在线观看| 欧美亚洲三区| 91福利视频在线观看| 国产小视频在线观看免费| 午夜国产精品视频| 精品中文字幕在线| 青青草在线观看视频| 一区二区三区毛片免费| 久久成人在线视频| 1024手机在线视频| 欧美日韩一区二区国产| 欧美精品18videos性欧美| 劲爆欧美第一页| 亚洲天堂激情| 77777亚洲午夜久久多人| 日韩欧美激情视频| 先锋a资源在线看亚洲| 午夜伦理精品一区| 久热精品视频在线观看一区| 国产又粗又猛又爽又黄的网站| 超碰公开在线| 夜夜操天天操亚洲| 亚洲美免无码中文字幕在线| 日韩精品美女| 91国偷自产一区二区开放时间 | 国产高清一区二区三区四区| 精品美女视频| 精品国产一区av| 玖玖爱免费视频| 欧美一级专区| 国产日本欧美在线观看| wwwav在线播放| 波多野洁衣一区| 日本高清不卡三区| 黄网址在线观看| 亚洲成人综合网站| 一本大道熟女人妻中文字幕在线 | 91久久精品www人人做人人爽| 国产成人久久精品77777综合| 成人激情小说乱人伦| 欧美大香线蕉线伊人久久国产精品| 国产福利在线| 亚洲美女视频在线| 久久国产色av免费观看| 亚洲日本中文| 日韩成人av在线| 国产麻豆a毛片| 一本色道久久| 成人精品久久av网站| 神马午夜一区二区| 国产精品福利一区| avav在线看| 国产亚洲观看| 亚洲人成在线播放| 久久久精品99| 免费成人在线观看视频| 国模一区二区三区私拍视频| 999在线视频| 午夜不卡av在线| 午夜av中文字幕| 免费看av成人| 久久久久久综合网天天| 中文永久免费观看| 99九九99九九九视频精品| 一区二区三区欧美在线| 激情都市亚洲| 亚洲成人激情在线| 免费在线观看黄色小视频| 亚洲免费在线| 国产免费一区二区| 在线xxxx| 欧美日韩激情一区二区| 蜜桃精品成人影片| 红桃视频亚洲| 亚洲在线视频观看| 黄色动漫在线观看| 欧美在线999| 国产精品亚洲无码| 在线欧美视频| 91黄色精品| 免费黄色在线| 欧美调教femdomvk| 无码一区二区三区在线| 亚洲每日更新| 国产精品视频在线免费观看 | 日韩理论片在线| 天天操天天爽天天射| 欧美顶级毛片在线播放| 欧美激情视频免费观看| 国产日本精品视频| 亚洲日韩欧美一区二区在线| 亚洲综合av在线播放| 成人久久久久| 国产精品久久久久久久9999| 精品视频一二三| 色综合久久综合中文综合网| 色天使在线视频| 亚洲精品乱码| 国产日韩二区| 亚洲欧美韩国| 亚洲三级黄色在线观看| 波多野结衣绝顶大高潮| 国产亚洲一区二区三区在线观看| 国产熟女高潮视频| 国产剧情在线观看一区| 国产精品入口日韩视频大尺度| 韩国免费在线视频| 欧美午夜精品电影| 91视频免费看片| 精品在线免费观看| 黄色一级片网址| 午夜视频在线观看精品中文| 久久69精品久久久久久久电影好 | 国产极品久久久久久久久波多结野| 亚洲精品在线视频| 中文字幕一区二区久久人妻| 国产精品福利电影一区二区三区四区 | 国产肉体xxxx裸体784大胆| 99精品视频免费全部在线| 久久久久免费网| 欧美色网在线| 久久伊人91精品综合网站| 国内精品国产成人国产三级| 亚洲国产cao| 欧美bbbbb性bbbbb视频| 日韩成人伦理电影在线观看| 一区二区三区四区视频在线| 国产午夜久久av| 欧美亚洲国产视频| av资源网在线观看| 日韩一区二区三区电影| 国产微拍精品一区| 国产精品视频在线看| 日本中文字幕精品| 免费在线亚洲欧美| 亚洲成年人专区| 美女一区2区| 国产精品一二三在线| 在线网址91| 国产偷亚洲偷欧美偷精品| 伊人久久国产精品| 亚洲国产一区二区三区| 欧美黄色高清视频| 国产91高潮流白浆在线麻豆 | 亚洲精品视频一区二区三区| 韩国三级大全久久网站| 欧美伊久线香蕉线新在线| 日本视频在线播放| 日韩精品在线私人| jizz国产视频| 在线看日本不卡| 国产亚洲精品女人久久久久久| 国产亚洲精品免费| 国内精品免费视频| 久久超级碰视频| 欧美性大战久久久久xxx| 在线一区免费| 亚洲精品在线观看免费| 欧美丝袜足交| 91在线国产电影| av亚洲一区二区三区| 久久久中文字幕| 欧美性天天影视| 亚洲色图综合久久| 欧美一区二区三区成人片在线| 欧美视频一区二区| 中文在线第一页| 亚洲成人第一页| 在线免费观看亚洲视频| 国产精品亲子伦对白| 极品粉嫩小仙女高潮喷水久久| 国产自产2019最新不卡| 亚洲精品一二三四五区| 在线一区视频| 国产精品久久..4399| 中文字幕午夜精品一区二区三区| 亚洲v国产v在线观看| 欧美做受69| 国产激情一区二区三区在线观看| 91精品国产色综合久久不卡粉嫩| 国产99久久精品一区二区| 1区2区3区在线| 久久久久久九九九| 日本电影在线观看| 插插插亚洲综合网| 成人福利片网站| 日韩在线中文字| 日本www在线| 啊v视频在线一区二区三区 | 99草草国产熟女视频在线| 激情国产一区| 欧美日韩不卡在线视频| 黄页网站一区| 国产免费裸体视频| 红桃视频亚洲| 免费看又黄又无码的网站| 91久久久久| 国模无码视频一区二区三区| 99精品国产在热久久下载| 亚洲国产精品无码av| 伊人成人在线视频| 成人中文字幕在线播放| 夜夜嗨一区二区| 成年人免费在线播放| 久久一日本道色综合久久| 九色91popny| 精品在线视频一区| 国产成人av片| 91亚洲国产成人精品一区二三| 国产成人无码一区二区在线观看| 97久久超碰国产精品| 国产三级国产精品| 欧美国产成人精品| 18岁成人毛片| 亚洲成人动漫精品| 黄色网址中文字幕| 在线综合视频播放| 欧美视频在线观看一区二区三区| 亚洲级视频在线观看免费1级| 性xxxxbbbb| 夜夜嗨av一区二区三区免费区| 日本在线播放| 久久久免费av| 欧美色999| 91免费福利视频| 久久99精品国产自在现线| 欧美日韩大片一区二区三区| 日本一本不卡| www.亚洲成人网| 久久精品道一区二区三区| 五月婷婷丁香色| 国产99精品在线观看| 国产精品1000部啪视频| 国产精品无遮挡| 久久久夜色精品| 色婷婷久久一区二区三区麻豆| 国产又大又长又粗| 精品国产91九色蝌蚪| 成人三级黄色免费网站| 九九视频这里只有精品| 小黄鸭精品aⅴ导航网站入口| 91青草视频久久| 香蕉久久夜色精品国产更新时间| 亚洲 日韩 国产第一区| 欧美久久综合| 污污视频网站免费观看| 极品销魂美女一区二区三区| 丰满大乳奶做爰ⅹxx视频| 国产精品灌醉下药二区| 毛片视频网站在线观看| 欧洲激情一区二区| 欧性猛交ⅹxxx乱大交| 在线播放日韩精品| 国产理论在线| 亚洲一区二区中文字幕| 久久不见久久见免费视频7| 男人的天堂avav| 日本成人在线视频网站| 午夜男人的天堂| 亚洲三级小视频| 成人毛片一区二区三区| 亚洲国产一区二区三区四区| 国内精品久久久久久野外| 日本亚洲欧洲色α| 国产suv精品一区| 超碰超碰超碰超碰超碰| 免费欧美在线视频| 大又大又粗又硬又爽少妇毛片| 一区二区三区中文字幕电影| 又污又黄的网站| 精品视频久久久久久久| 俺来也官网欧美久久精品| 91亚洲精品一区二区| 日韩电影免费在线观看| 成人在线看视频| 26uuu精品一区二区三区四区在线| 久久久久久久中文字幕| 欧美大片免费久久精品三p| 日本最新在线视频| 国产精品国产自产拍高清av水多| 天堂综合网久久| 成年人午夜视频在线观看| 国产超碰在线一区| 欧美日韩亚洲国产另类| 91精品国产综合久久福利| 欧美尤物美女在线| 国产精品永久在线| 精品国产美女| 国产自偷自偷免费一区| 国产丝袜在线精品| 久久久蜜桃一区二区| 亚洲图片欧美日产| 粉嫩一区二区三区| 日韩久久久久久久| 美女性感视频久久| 北条麻妃在线观看视频| 欧美精品乱码久久久久久| 欧美成人精品一区二区男人看| 国产精品综合不卡av| 日韩激情图片| www.色欧美| 一区二区三区.www| 狠狠躁日日躁夜夜躁av| 国外成人免费在线播放| 欧美一级全黄| 人妻内射一区二区在线视频 | а√天堂中文资源在线bt| 国产精品二区三区四区| 伊人天天综合| 一区二区三区免费在线观看视频| 色综合久久88色综合天天6 | 久久夜精品va视频免费观看| 国产高清视频一区二区| 国产一二三区在线播放| av不卡在线播放| 国产性生活视频| 日韩在线视频导航| 日韩不卡在线视频| 毛片在线视频播放| 久久久精品国产免费观看同学| 在线亚洲欧美日韩| 欧美成人第一页| 女同另类激情重口| 婷婷丁香激情网| 亚洲免费av观看| 亚洲精品久久久久久久久久久久久久 | 一级黄色录像毛片| 在线91免费看| av伦理在线| 婷婷四月色综合| 国产一区二区在线观看免费| 国产在线综合网| 亚洲丝袜在线视频| 免费看日产一区二区三区 | 国模冰冰炮一区二区| 伊人久久大香线蕉av一区| 成人av影院在线| 亚洲精品一区二区二区| 欧美精品videos另类日本| 国产成人短视频在线观看| 久久精品一卡二卡| 色综合天天综合网天天看片| 好了av在线| 欧美日韩精品不卡| 国产一二精品视频| 香蕉影院在线观看| 欧美极品少妇全裸体| 日韩夫妻性生活xx|