精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI能否「圣地巡禮」?多模態大模型全新評估基準VIR-Bench來了

人工智能 新聞
VIR-Bench 不僅是一個新的評測基準,更是為未來諸多應用打開了一扇窗口。通過在旅行視頻中重建行程順序,它逼迫模型同時理解 “地理位置 + 時間順序”,這與機器人如何理解世界、規劃路徑,以及自動駕駛系統如何在動態環境中進行決策高度契合。

大家或許都有過這樣的體驗:

看完一部喜歡的動漫,總會心血來潮地想去 “圣地巡禮”;刷到別人剪輯精美的旅行 vlog,也會忍不住收藏起來,想著哪天親自走一遍同樣的路線。旅行與影像的結合,總是能勾起人們的探索欲望。那么,如果 AI 能自動看懂這些旅行視頻,幫你解析出 “去了哪些地方”“順序是怎樣的”,甚至還能一鍵生成屬于你的旅行計劃,會不會很有趣?這不僅僅是阿宅的想象,更是多模態大模型在真實世界應用中的一個重要場景。

正是在這樣的啟發下,來自日本早稻田大學,CyberAgent 和奈良先端科學技術大學院大學的團隊提出了一個全新的多模態大模型評估基準 VIR-Bench ,旨在評測 AI 是否真的能理解旅行視頻中的地理位置與時間順序,從而支撐更復雜、更實用的應用。用一句話來概括,這項研究就是在追問:“我從哪里來?我要到哪里去?”

  • 論文地址:https://www.arxiv.org/abs/2509.19002
  • GitHub:https://github.com/nlp-waseda/VIR-Bench

VIR-Bench 是什么?任務設計與數據集構建

任務目標:行程還原(Itinerary Reconstruction)

在 VIR-Bench 中,給定一個旅行 vlog(在日本拍攝),模型要輸出訪問順序圖(visiting order graph),也就是 “我去了哪些地點、按什么順序、地點之間有哪些包含關系” 的結構化表示。

更具體地,這個訪問順序圖是一個有向圖,其中:

  • 節點表示被訪問的地點,按層次分為 Prefecture,City,和 POI(Point of Interest)三層級。
  • 包含邊(Inclusion edge) 表示層次上的 “大地理單元包含小地理單元” 關系(例如某 POI 在某個 City 里,某個 City 在某個 Prefecture 里)。
  • 轉移邊(Transition edge) 表示時間順序上的移動:從一個節點移動到下一個節點(同層級)表示旅行順序。

這意味著模型不僅要識別出 “我去過的地點”,還要判斷這些地點之間的時間順序,地理空間關系,進而構建出整個旅行路徑的結構。此外,由于旅行視頻往往是自拍視角 / 行進視角 / 風光視角等交錯出現,模型需要在多樣視角、非連續畫面中 “拼圖式” 理解,這進一步提升了任務難度。

為便于模型訓練與評測,作者將這一復雜任務拆解為兩個子任務:

1. 節點預測:給定視頻,模型列出所有被訪問的 Prefecture、City、POI。

2. 邊緣預測:給定視頻 + 節點集合(節點標簽順序被打亂),模型要判斷哪些節點之間存在包含邊,哪些節點之間存在轉移邊。即預測邊的集合。

通過這種分解方式,我們可以分別評估模型的地理識別能力與時序推理能力,以及它們在實際組合時的協同性。

數據集構建:200 個旅行視頻 + 訪問順序圖

為了支撐上述任務,作者構建了一個規模適中的專用數據集:

  • 視頻數量:200 個旅行 vlog(都在日本拍攝) 。
  • 地點覆蓋:共標注出 3,689 個 POI,分布在日本 43 個都道府縣(幾乎覆蓋全日本) 。
  • 標注方式:每個視頻由人工注釋者識別每個 POI 的起止時間、Google Maps 鏈接,并通過雙人校驗后自動構建最終的訪問順序圖。 

作者在論文中還附上了詳細注釋指南、數據分布統計等信息(可見 Appendix 部分)。

實驗結果與洞察:當前模型面臨的挑戰

在實驗中,作者發現開源模型整體上仍然落后于商用模型,尤其是在 POI 節點識別 和 轉移邊預測 這兩個子任務上差距尤為明顯。進一步的分析顯示,轉移邊預測幾乎是所有模型的 “最難關”:不少模型要么直接誤解了任務要求,要么忽視了層級結構的約束(只有同層級節點之間可以有轉移邊),結果往往接近隨機水平。

另一方面,模型規模的擴展對性能提升具有顯著作用,尤其體現在邊緣預測上;而是否具備地理相關的預訓練,則成為 POI 節點預測精度差異的關鍵因素。值得注意的是,思維鏈推理(Chain-of-Thought) 的效果在不同子任務中差別很大:在節點預測中提升有限,但在邊緣預測中卻能帶來顯著的改善。如果再進一步結合音頻信息(例如 Gemini-2.5-Pro 的多模態輸入),效果提升尤為突出。

Ablation 實驗也為我們揭示了模型性能提升的幾個關鍵方向:增加輸入幀數可以讓模型捕捉更完整的旅行線索,更長的推理過程能幫助模型逐步還原旅行順序,而音頻的利用則能提供額外的語義提示。三者結合,共同推動了模型在復雜時空理解任務上的進步。

然而,即便有這些改進,整體性能仍遠未達到可用水平。即使是當前得分最高的 Gemini-2.5-Pro,在預測結果中依然存在大量錯誤,這進一步凸顯了多模態大模型在長程地理與時間理解上的巨大挑戰。

表1: 節點預測的評估結果

表2: 邊緣預測的評估結果

總而言之,VIR-Bench 不僅是一個新的評測基準,更是為未來諸多應用打開了一扇窗口。通過在旅行視頻中重建行程順序,它逼迫模型同時理解 “地理位置 + 時間順序”,這與機器人如何理解世界、規劃路徑,以及自動駕駛系統如何在動態環境中進行決策高度契合。

這一研究讓我們看清:當前的大模型在長程推理和時空理解上仍有明顯不足,但也指明了進化的方向 —— 更強的地理空間感知、更可靠的時間推理,以及多模態信息的深度融合。當這些能力逐漸成熟,AI 將不再只是 “看視頻”,而是真正具備 “在世界中行動” 的潛力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-06-16 14:39:56

模型開源框架

2025-01-08 08:21:16

2025-05-21 08:47:00

2023-11-05 15:09:35

模型AI

2024-03-25 12:40:19

訓練模型

2025-04-28 14:04:03

Gemini模型AI

2025-11-05 08:51:33

2024-06-17 18:06:17

2023-08-03 10:59:49

人工智能

2025-07-10 08:52:00

2025-07-04 16:50:07

工具AI模型

2025-09-16 09:35:52

2025-11-11 08:45:00

2024-11-15 15:38:00

模型測評

2024-12-18 18:57:58

2024-11-13 09:39:13

2024-12-30 00:01:00

多模態大模型Python

2024-10-22 14:20:00

AI模型

2024-07-15 07:52:00

點贊
收藏

51CTO技術棧公眾號

尤物yw午夜国产精品视频明星| 亚洲精品国产无天堂网2021| 国产成人中文字幕| 在线日韩国产网站| 久久91在线| 欧美视频在线一区二区三区| 黄黄视频在线观看| 精品无人乱码| 丁香婷婷深情五月亚洲| 国产精品扒开腿做| 国产极品在线播放| 成人国产精品一级毛片视频| 精品国产sm最大网站免费看| 在线观看免费成人av| 韩国日本一区| 国产精品国产三级国产aⅴ原创 | 欧美三级在线观看视频| 91短视频版在线观看www免费| 国产成人精品1024| 国产欧美va欧美va香蕉在| 国产精品18p| 香蕉久久网站| 在线观看国产欧美| 中文字幕人妻一区二区| 超碰成人97| 3atv一区二区三区| 狠狠躁狠狠躁视频专区| 色一区二区三区| 一区二区三区波多野结衣在线观看| 日韩黄色影视| 天天干天天爱天天操| 国产一区二区在线电影| 国产成人精品免高潮在线观看| 欧美日韩人妻精品一区二区三区 | 中文日韩电影网站| 亚洲精品成人无码熟妇在线| 在线视频亚洲欧美中文| 在线不卡a资源高清| 国产免费视频传媒| 大桥未久在线播放| 亚洲乱码国产乱码精品精98午夜| 亚洲国产精品久久久久婷婷老年| 日本aaa在线观看| 97se亚洲国产综合自在线| av免费观看久久| 国产三级三级在线观看| 久88久久88久久久| 国产在线观看精品| 亚洲视频一区二区三区四区| 日韩精彩视频在线观看| 国产精品福利观看| 人人妻人人爽人人澡人人精品| 亚洲一区视频| 日韩免费av一区二区| 亚洲欧美偷拍一区| 久久狠狠婷婷| 国产精品白丝jk喷水视频一区| 中文字幕在线观看视频网站| 国产精品美女久久久| 98精品在线视频| 亚洲熟女综合色一区二区三区| 欧美亚洲三级| 国产精品精品久久久| 一区二区乱子伦在线播放| 日韩成人免费电影| 成人免费自拍视频| 超碰在线观看av| av不卡免费在线观看| 久久国产精品高清| 高清中文字幕一区二区三区| 中文子幕无线码一区tr| 日韩最新中文字幕| 24小时免费看片在线观看| 无码av中文一区二区三区桃花岛| 欧美激情国产精品日韩| www.精品国产| 日韩欧美国产一区二区三区| 欧产日产国产精品98| 精品国产一区二区三区久久久樱花| 亚洲老头老太hd| 乱老熟女一区二区三区| 国产精品豆花视频| 国产成人午夜视频网址| 911美女片黄在线观看游戏| 国产精品羞羞答答xxdd| 好吊色欧美一区二区三区| 成人h小游戏| 亚洲精品国产无天堂网2021| 黑人糟蹋人妻hd中文字幕| 成人黄色免费网站| 欧美变态凌虐bdsm| 无码少妇精品一区二区免费动态| 天天综合一区| 2019最新中文字幕| 国产精品久久久久久免费免熟 | 在线观看国产精品一区| 伊人成综合网| 国产99久久精品一区二区永久免费| 91麻豆国产视频| 91亚洲资源网| 久久免费视频2| 三级中文字幕在线观看| 91超碰这里只有精品国产| 熟女人妻在线视频| 在线看片不卡| 国产精品旅馆在线| 亚洲日本在线播放| 亚洲美女免费视频| 亚洲xxxx2d动漫1| 红杏成人性视频免费看| 日韩中文字幕不卡视频| 国产做受高潮漫动| 精品一区二区在线看| 另类小说综合网| 调教一区二区| 欧美日产国产精品| 国产精久久一区二区三区| 亚洲特色特黄| 91免费高清视频| eeuss影院www在线观看| 精品国产精品三级精品av网址| 国产一区二区在线观看免费视频| 蜜桃精品噜噜噜成人av| 久久久久久国产精品久久| 一本色道久久综合亚洲| 久久久777精品电影网影网 | av最新在线观看| 石原莉奈在线亚洲三区| 久久精品第九区免费观看| 五月天激情在线| 欧美一区在线视频| 久久成人小视频| 麻豆精品视频在线| 亚洲a∨一区二区三区| jk漫画禁漫成人入口| 亚洲国产精品中文| 国产亚洲自拍av| 国产成人亚洲综合a∨婷婷图片| 一区二区欧美日韩| 欧美黄页免费| 色99之美女主播在线视频| 国产成人av免费| 欧美国产国产综合| 91人人澡人人爽人人精品| 国产精品嫩草影院在线看| 欧美在线观看视频| 久草在线青青草| 91国产免费观看| 欧美一区二区三区粗大| 免费av成人在线| 亚洲一区二区三区午夜| 欧美爱爱视频| 久久久精品视频成人| 国产日韩欧美一区二区东京热| 亚洲另类色综合网站| 亚洲热在线视频| 亚洲国产日本| 久久狠狠久久综合桃花| 国产一区一一区高清不卡| 在线一区二区日韩| 99热在线只有精品| 亚洲成av人影院| 97超碰在线资源| 日韩在线a电影| 亚洲一区二区免费视频软件合集| 日日夜夜亚洲精品| 欧美激情国产高清| 三级黄视频在线观看| 在线欧美日韩精品| 亚洲精品卡一卡二| 国产suv精品一区二区三区| 久久99久久99精品| 久久不卡国产精品一区二区 | 国产精品xxx在线观看| 7m精品福利视频导航| 美国一级片在线免费观看视频| 欧美性生活一区| 国产这里有精品| 91在线视频在线| 美女少妇一区二区| 欧美日韩一视频区二区| 久久久福利视频| 日韩毛片免费视频一级特黄| 欧美日韩福利视频| 国产中文字幕在线视频| 69久久99精品久久久久婷婷| 久久久久久久久久影院| 国产精品久久久久影院| 亚洲精品久久一区二区三区777| 午夜在线精品| 久久国产精品免费观看| 日韩有码一区| 成人精品视频99在线观看免费| 2019中文字幕在线电影免费| 一区二区三区国产视频| 成人午夜福利视频| 欧美日韩一区不卡| 国产成人精品一区二三区| 国产精品久久久久久久久免费相片 | 欧美在线观看视频免费| 国产精品三级| av一区二区三区在线观看| 性感美女一区二区在线观看| 欧美猛交免费看| 二区在线视频| 亚洲精品久久久久久下一站 | 国产一区二区三区免费看| 成 年 人 黄 色 大 片大 全| 99精品网站| 欧美资源一区| 网红女主播少妇精品视频| 99国产精品久久久久老师| 成人国产精品| 青草成人免费视频| 成年男女免费视频网站不卡| 久久精品久久久久久国产 免费| 深夜福利在线看| 精品精品欲导航| 国产免费高清视频| 欧美日韩一区二区三区四区| 亚洲精品男人的天堂| 午夜欧美在线一二页| 精品99在线观看| 日韩一区中文字幕| 欧美日韩生活片| 久久免费美女视频| 日本一区二区三区网站| 成人午夜在线视频| 欧美xxxx日本和非洲| 国产一区二区网址| 天天av天天操| 久久爱www久久做| 91激情视频在线| 日日夜夜一区二区| 虎白女粉嫩尤物福利视频| 国产偷自视频区视频一区二区| 野外做受又硬又粗又大视频√| 欧美激情成人在线| 日韩精品福利片午夜免费观看| 国产国产精品| 黑人巨大国产9丨视频| 999国产精品视频| 国产91av视频在线观看| 色喇叭免费久久综合网| 日韩在线第一区| 国产精品欧美日韩一区| 亚洲春色在线| 国产精品国产三级国产在线观看 | 99在线精品视频在线观看| 欧美午夜性视频| 最新亚洲激情| 国产淫片免费看| 欧美一级二区| 日韩中文字幕二区| 奇米777欧美一区二区| 15—17女人毛片| 国产综合色视频| 伊人av在线播放| 成人av在线影院| 亚洲av无码一区二区二三区| 国产亚洲一区二区三区四区| 天堂av网手机版| 91成人精品观看| 欧美日韩1080p| 要久久爱电视剧全集完整观看| 精品国产乱码91久久久久久网站| 精品国产av鲁一鲁一区| 日韩欧美一区二区不卡| 亚洲精品字幕在线| 亚洲天堂2016| 精品国产乱码久久久久久1区二区| 久久国产精品露脸对白| 黑人性生活视频| 97精品久久久午夜一区二区三区| 色无极影院亚洲| 自拍偷拍亚洲综合| 国产精品999久久久| 欧美性猛交xxxx免费看久久久| 亚洲视屏在线观看| 日韩精品自拍偷拍| 青青色在线视频| www日韩欧美| 91黄页在线观看| 国产精品免费小视频| 午夜久久av| 日本在线一区| 中文字幕亚洲精品乱码| 91视频最新入口| 国内欧美视频一区二区| 亚洲精品乱码久久| 成人免费一区二区三区视频 | 国模私拍视频在线| 永久免费看mv网站入口亚洲| 欧美人体视频xxxxx| 国产精品激情自拍| 久久久伦理片| 黄色免费高清视频| 免费一级欧美片在线播放| 亚洲欧美日韩三级| 2014亚洲片线观看视频免费| 黄色免费一级视频| 精品欧美一区二区三区| 亚洲中文无码av在线| 亚洲精品videossex少妇| 黄色网页网址在线免费| 日韩女优人人人人射在线视频| 欧美一级大片在线视频| 日本一区二区三区视频在线观看 | 日本不卡二三区| 国产午夜伦鲁鲁| 国产精品白丝jk黑袜喷水| 五月激情四射婷婷| 日韩欧美有码在线| 精品国产乱码一区二区三| 国产一区二区三区高清在线观看| 国产后进白嫩翘臀在线观看视频| 国产专区欧美专区| 国产不卡一区| 91九色在线观看视频| 国产电影精品久久禁18| 久久久久麻豆v国产| 欧美中文字幕久久| 青青青草原在线| 91精品国产乱码久久久久久久久| 久久视频社区| 国产精品久久成人免费观看| 日本网站在线观看一区二区三区 | 性欧美videossex精品| 久久综合九色综合欧美亚洲| 亚洲国产综合久久| 亚洲精品一区二区三区影院| www视频在线免费观看| 国产欧美一区二区三区在线| 精品国产精品国产偷麻豆| 国产l精品国产亚洲区久久| 99久久伊人精品| 日韩av无码中文字幕| 精品99久久久久久| 岛国毛片av在线| 精品国产一区二区三区久久久久久| 国模一区二区三区| 扒开伸进免费视频| 午夜精品在线视频一区| 欧性猛交ⅹxxx乱大交| 韩国三级电影久久久久久| 国产精品宾馆| 九色在线视频观看| 久久久久久99精品| 中文字幕日本视频| 中文字幕不卡av| 日韩在线电影| 久久人妻无码一区二区| 大白屁股一区二区视频| 香蕉视频一区二区| 亚洲男女性事视频| av在线不卡精品| 在线观看欧美激情| 国产米奇在线777精品观看| 欧美成人一二三区| 亚洲国产精彩中文乱码av在线播放| av毛片午夜不卡高**水| 久久影视中文粉嫩av| 日产国产欧美视频一区精品| 91视频免费看片| 日韩欧美视频在线| 原纱央莉成人av片| 亚洲精品中文字幕乱码三区不卡| 九九热在线视频观看这里只有精品| 性色av无码久久一区二区三区| 日韩欧美电影在线| 国产美女高潮在线观看| 日本一区二区在线| 国产河南妇女毛片精品久久久| 国产成人啪精品午夜在线观看| 亚洲国产精品大全| 91p九色成人| 老司机午夜免费福利视频| 99麻豆久久久国产精品免费| 久久国产乱子伦精品| 成年无码av片在线| 日本一区福利在线| 四季av一区二区三区| 亚洲福利电影网| av在线免费一区| 国产经品一区二区| 日韩国产欧美一区二区三区| 青花影视在线观看免费高清| 精品国产乱码久久久久久老虎| 大胆人体一区二区| 日本一道在线观看| 久久免费美女视频| 亚洲AV午夜精品| 国产精品免费一区豆花| 最新日韩欧美| 日本中文在线视频| 亚洲欧洲午夜一线一品| 亚洲精品国产九九九| 日本在线观看免费视频| 亚洲va欧美va国产va天堂影院| av网站在线播放|