精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4V都搞不明白的未來推理有解法了!來自華科大&上科大

人工智能 新聞
華科大和上科大團隊提出了一個賦予多模態大語言模型前瞻性思維的學習范式,并基于這一范式構建了多模態大語言模型Merlin(梅林)。

多模態大語言模型展現了強大的圖像理解和推理能力。

但要讓它們基于當前觀測來對未來事件進行預測推理仍然非常困難。

即便是當前最強大的GPT-4V(如下圖所示),也無法很好地解決這一問題。

圖片

△ GPT-4V的錯誤案例

現在,華科大和上科大團隊提出了一個賦予多模態大語言模型前瞻性思維的學習范式,并基于這一范式構建了多模態大語言模型Merlin(梅林)

Merlin(梅林)是亞瑟王傳說中的一個傳奇人物,以其強大的魔法和智慧而聞名于亞瑟王傳說。傳說中梅林擁有預見未來的能力,并對命運有著深刻的理解。

圖片

來看看它具體是如何做的?

注:人類可以根據當前觀測狀態來推理出即將或者接下來一段時間可能會發生的事件,我們將這一能力稱為前瞻性思維。

一個簡單的例子:

當你在電視上觀看NBA球賽時,你可以根據場上不同球員的狀態來判斷接下來可能會出現的場景。

比如當一名進攻球員在持球突破防守人之后,我們有理由判斷這名球員即將沖到籃下進行上籃或者灌籃。

再比如當持球人在三分線停下并面向籃筐時,我們則有理由預測這名球員即將進行三分射籃(當然也有可能是假動作為了晃開防守人進行突破)。

Merlin大模型就可以進行此類預測。

方法介紹

為了探究如何賦予激發多模態大語言模型的前瞻性思維。

我們首先深入分析了人類是如何進行未來事件的預測的。

我們將人類進行未來事件的推理預測視為一個兩階段的系統。

首先一階段我們會對當前場景進行觀測,觀測過程當中重點捕捉相關主體的動態線索,第二階段我們的大腦會根據這個獲取的動態線索來分析主體的行為模式(比如奔行走或者奔跑等)及行為意圖,進而推理出即將可能發生的事件。

對標多模態大語言模型,我們認為第二階段是可以較好地完成的,這得益于大語言模型強大的邏輯推理能力。

所以問題出在了第一階段,也就是當前的多模態大語言模型難以成功捕獲相關主體的動態信息,進而限制了其對于未來事件推理的能力。

得到這一結論之后,接下來我們要做就是探究如何讓多模態大語言模型學會從當前觀測中捕捉相關主體的動態線索信息

為了實現這一目標,一個直接的方案就是讓多模態大語言模型學習預測下一幀的全部信息(也就是以重建下一幀為優化目標)

不過這么做一方面學習難度較大,另一方面圖像或者視頻序列存在大量的冗余視覺信息,這并不利于模型學會捕獲對應主體的動態信息。

基于上述分析,本文提出了一個以“軌跡”這一結構化表示作為優化目標來建立過去與未來之間的動態關聯。我們認為以軌跡作為優化目標有以下幾點好處:

(1)軌跡作為一種高度結構化的表征具有較強的信息凝練性,能夠幫助模型有效地提取出主體在連續動作中的關鍵動態信息,從而減少了對冗余視覺信息的學習需求,計算成本更低。

(2)軌跡可以很自然地將過去和未來關聯在一起,通過學習預測主體的軌跡,多模態大語言模型必須學會精確地關注對應的主體在不同幀中的對應位置,可以極大地增強模型多圖多身份 (Id)的對齊能力。

基于這些優點,我們設計了一個新型的學習框架,它專注于從多模態輸入(如圖像、視頻和文本)中提取和理解主體的運動軌跡并進行預測。此框架具體如下:

圖片

受到當前主流LLM學習范式的啟發,我們也構建了一個兩階段的學習范式,分別為前瞻思維預訓練(Foresight Pre-Training, FPT)以及前瞻思維指令微調(Foresight Instruction-Tuning, FIT)

在FPT中,我們首先會輸入包含數幀圖片的視覺上下文tokens給模型,然后我們會給予相關主體的第一幀的初始觀測(初始位置,表觀描述或者是動作描述),接著我們要求模型需要根據初始觀測來預測出對應主體的整條軌跡。

通過學習預測整條軌跡,模型必須學會正確關注多圖中的對應主體并捕捉其動態信息。

而在FIT中,則會加入一些相關的user prompt來進行關于相關主體的對話。

值得注意的是,為了在這一階段激發模型的前瞻性思維,我們也設計了一種以“軌跡”為核心的指令交互形式,我們將其稱之為軌跡思維鏈技術(Trajectory Chain-of-Thought,T-CoT)

具體來說,當和模型進行對話時,我們會要求模型將提及的相關主體的軌跡一并輸出(如上圖所示)

通過輸出整條軌跡,強制要求模型關注多圖中的對應主體,為后續的未來事件推理提供足夠的動態信息。更多方法細節,請閱讀論文。

數據構造

設計好了我們的學習范式之后,接下來更重要的是構建合適的數據來讓模型進行學習,我們基于現在市面上開源的數據精心構建了一整套多任務學習數據,數據分布具體如下:

主要包括Caption,Referring,Detection,Tracking,Reasoning以及Dialogue數據 *表示數據只用于指令微調階段(FIT)

圖片

這里梅林首次使用了由tracking數據構造的FPT數據來賦予模型軌跡感知及預測能力。

另一方面,我們也提出了精確任務及輸出形式提示(Precise Definition of Task Prompt and Answer Format)技術:

通過告訴大模型具體的任務以及輸出形式來避免多任務學習之間的沖突以及對通用多模態能力的損害。

我們后續的實驗也表明采用這一技術可以讓大模型兼顧學習多任務專有能力以及通用多模態能力。

能力展示

結合上述兩個學習過程以及構建的高質量數據,我們搭建了一個全新的通用多模態大語言模型,梅林(Merlin)。

Merlin可以支持單圖或多幀圖像序列的輸入,可以完成包括檢測,跟蹤,REC,REG等一系列任務。

同時得益于我們提出的FPT以及FIT,Merlin展現了強大基于軌跡的未來推理能力,這里我們挑一些cases來展示Merlin的能力,更多的測試結果請閱讀我們的論文以及后續開放的demo。

實驗分析

為了全面評測Merlin的各方面能力,我們設計了一系列性能比較試驗以及性質探究實驗,這里我們著重挑選幾個有啟發性的實驗來進行分享,更多實驗細節,請閱讀我們的論文。

1、未來推理(Future Reasoning)評測

由于當前領域內并沒有成熟的可以對多模態大語言模型進行評測的benchmark,所以本工作基于MMBench搭建了一套新的Future Reasoning Benchmark。

在這一benchmark上,Merlin顯著超越了現有的主流多模態大模型,展現了強大的未來推理能力。

圖片

    2、軌跡關聯及預測評測

由于Merlin將基于初始觀測進行相關主體軌跡預測作為預訓練中的一項核心學習目標,為了更全面的評測這一學習情況,我們重點選擇了tracking這一下游任務來進行評測。

這是由于軌跡關聯是tracking任務中的一個核心子任務,tracking的評測指標可以一定程度上反應大模型的多圖多id的對齊能力。

圖片

從結果可以看到Merlin作為一個通用多模態大語言模型,在tarcking任務上甚至超越了一些專家模型,同時值得注意的是這也是多模態大語言模型首次可以執行tracking相關的任務。

   3、幻覺評測

幻覺問題是大模型領域的一個重要研究課題,由于多模態大語言模型引入了視覺模態,由主體描述和對應的視覺信息無法準確對齊而導致的bias也進一步帶來了更加嚴重的幻覺。

本文中我們在POPE上對Merlin進行了幻覺評測來評估模型的圖文之間的對齊能力。如下表所示:

圖片

可以看到,Merlin展現了強大的抗幻覺能力,顯著領先當前的主流多模態大語言模型,這證明了我們提出的前瞻性思維訓練范式可以增強模型的“識圖”能力,讓模型減少對圖片內容的誤識別以及圖文之間的不一致問題。

   4、多模態綜合性能評測

Merlin同樣在當前的主流多模態大語言模型綜合能力(包括MMBench以及MMVet)以及視覺問答能力(包括GQA以及VisWiz)評測Benchmark上進行了評測。

評測結果表明Merlin都取得了非常有競爭力的結果,展現了Merlin強大的通用綜合能力。

圖片

    5、可視化分析

為了更直觀的展現Merlin對于動態信息線索的捕捉情況,本文也進行了一個有趣的可視化實驗,對于一個具體的對話問答,我們將模型輸出的軌跡坐標的word embedding與多幀圖片的視覺tokens之間的注意力圖進行了可視化,如下圖所示:

圖片

我們可以看到,模型輸出的估計坐標的word embedding可以準確的關注到對應幀中的對應目標主體。

這個可視化結果也進一步證明了“軌跡”是一個非常好的中間表示來幫助多模態大語言模型建立起語言描述和多幀圖像對應主體之間的動態關聯。

這也從另一個角度解釋了為什么Merlin具有強大的多模態綜合能力以及抗幻覺能力。

思考和總結

Merlin這一工作向我們展示了“軌跡”這一結構化表示在幫助多模態大語言模型具備前瞻性思維中的重要作用。

從這一點出發我們可以進一步思考回歸框(bounding box)以及軌跡(trajectory)究竟在多模態大語言模型的學習中究竟起到了什么樣的作用——

是作為一種中間形式還是可以作為一種單獨的學習優化目標?

另一方面現有的坐標編碼是否合理,有沒有什么更加適配自然語言的表示形式呢?

我想這些目前都還沒有標準答案,需要各位研究者們進一步深入的探索。最后希望Merlin這個工作能給多模態大模型社區帶來一些新的思考和認知,也歡迎大家持續關注我們的工作,多多交流。

論文:https://arxiv.org/pdf/2312.00589.pdf 

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-11-13 07:48:08

AI檢測

2021-03-01 07:59:24

架構系統Zachman

2024-06-11 14:30:18

2025-03-25 08:50:00

2025-03-24 00:00:15

2025-09-15 00:00:01

2024-02-02 21:53:58

AI訓練

2024-02-06 09:00:00

GPT-4VLLaVA大型語言

2018-05-14 17:36:59

2018-05-14 11:31:02

2024-03-04 13:36:00

模型訓練

2021-12-17 07:30:42

排序算法效率

2015-12-23 11:32:50

2023-11-13 18:19:35

AI訓練

2023-12-01 12:32:04

數據訓練

2023-10-19 09:32:45

自動駕駛技術

2009-04-23 08:31:23

微軟鮑爾默收購

2023-11-07 12:56:35

Redis主從復制

2025-06-10 09:07:00

2024-04-14 19:53:44

點贊
收藏

51CTO技術棧公眾號

欧美性猛片xxxxx免费中国 | 一区二区在线看| 亚洲自拍av在线| 91porny在线| 成人动漫免费在线观看| 日韩一区二区三区电影| 91九色在线观看视频| 在线观看黄色av| 成人av在线看| 成人两性免费视频| 日本在线视频免费| 91精品国产福利在线观看麻豆| 亚洲韩国青草视频| 国产性生活一级片| xx欧美xxx| 亚洲一区免费在线观看| 亚洲一卡二卡| 欧洲一区av| 粉嫩绯色av一区二区在线观看| 国产精品激情自拍| 久草视频手机在线观看| 欧美大人香蕉在线| 亚洲男人天堂手机在线| 亚洲成a人无码| 96视频在线观看欧美| 色婷婷精品大视频在线蜜桃视频| 9色porny| 国产日产一区二区| 中文字幕免费不卡在线| 欧美日韩成人一区二区三区| 好吊视频一区二区三区| 激情欧美一区二区| 日本精品久久久久久久| 可以在线观看av的网站| 国产在线成人| 日韩亚洲精品电影| 国产一区二区三区精品在线| 香蕉精品久久| 亚洲国产精久久久久久久| 无码国产精品一区二区高潮| 日韩第二十一页| 在线免费一区三区| 任你操这里只有精品| 日本不卡一二三| 欧美视频中文在线看| 毛片在线视频播放| 蜜桃av.网站在线观看| 亚洲丰满少妇videoshd| 大陆av在线播放| 国产后进白嫩翘臀在线观看视频| 亚洲免费观看高清完整| 亚洲成年人专区| 免费a级毛片在线播放| 亚洲欧美综合网| 一区二区三区四区五区精品 | 久国内精品在线| 欧洲第一无人区观看| 一区二区在线影院| 粗暴蹂躏中文一区二区三区| 国产黄色小视频网站| 久久久久久美女精品| 美日韩精品免费观看视频| 欧美成欧美va| 亚洲精品视频啊美女在线直播| 欧美激情免费视频| 久久久午夜影院| 久久久精品网| 成人国产在线激情| 99热这里是精品| thepron国产精品| 久久精品日产第一区二区三区| 欧美黄色小说| 国产精品久久久久久久久久久免费看 | 欧美亚洲午夜视频在线观看| 在线观看日本网站| 看片的网站亚洲| 亚洲xxxx在线| 午夜在线视频免费| 欧美激情在线一区二区三区| 综合视频在线观看| av小说在线播放| 色噜噜狠狠色综合中国| 一道本在线免费视频| 日韩精品一区二区三区中文在线 | 69精品无码成人久久久久久| 97精品国产一区二区三区 | 韩国美女久久| 678五月天丁香亚洲综合网| 91精品人妻一区二区三区蜜桃2| 欧美黑人做爰爽爽爽| 国产一区二区三区在线播放免费观看 | 欧美1区2区3区4区| 日韩在线视频播放| 国产第一页第二页| 久久精品国产一区二区三区免费看 | 7777精品| 国产亚洲日本欧美韩国| 久久久久久久蜜桃| 日本中文字幕一区二区视频| 翡翠波斯猫1977年美国| 激情在线视频| 亚洲午夜国产一区99re久久| 另类小说第一页| 红杏视频成人| 插插插亚洲综合网| 一级片在线观看免费| 懂色一区二区三区免费观看| 日韩亚洲视频在线| 草莓视频丝瓜在线观看丝瓜18| 欧美色欧美亚洲另类二区| 中文字幕第九页| 香蕉视频国产精品 | 精品视频在线观看一区| 在线视频成人| 亚洲日本成人网| 国产精品 欧美 日韩| 久草中文综合在线| 日韩av一区二区三区在线观看| 手机av在线播放| 欧美日韩国产高清一区二区| 久久久亚洲av波多野结衣| 欧美一区视频| 成人在线播放av| h视频网站在线观看| 黑人巨大精品欧美一区二区三区 | 午夜在线观看av| 无码少妇一区二区三区| 久久久亚洲福利精品午夜| 国产美女精品视频国产| 国产精品色哟哟网站| 国产性生交xxxxx免费| 亚洲电影一级片| 国产做受69高潮| 亚洲第一大网站| 一区二区三区日韩| 亚洲色图欧美自拍| 99精品在线观看| 成人亲热视频网站| 八戒八戒神马在线电影| 欧美高清视频在线高清观看mv色露露十八| 先锋影音av在线| 日韩va欧美va亚洲va久久| 欧美午夜精品久久久久免费视| 色偷偷偷在线视频播放| 日韩电影中文 亚洲精品乱码| 国产乡下妇女做爰| 成人黄页在线观看| 国产 日韩 亚洲 欧美| 国产亚洲精品美女久久| 97人人做人人爱| 亚州视频一区二区三区| 狠狠做深爱婷婷久久综合一区 | 清纯唯美亚洲激情| 日本免费不卡| 在线观看免费视频综合| 1024手机在线观看你懂的| 青青青伊人色综合久久| 一区二区在线中文字幕电影视频| 欧美特黄色片| 欧美另类极品videosbestfree| 性欧美videos另类hd| 亚洲高清中文字幕| 一级特黄a大片免费| 亚洲欧美日韩在线观看a三区| 六月婷婷久久| 丁香久久综合| 欧美国产在线视频| 色资源在线观看| 欧美性猛交一区二区三区精品| 日韩一卡二卡在线观看| 国产一区二区精品在线观看| 精品成在人线av无码免费看| 四虎影视精品| 国产精品美女免费看| av片在线观看网站| 亚洲国产精品成人一区二区| 91午夜精品亚洲一区二区三区| 国产精品久久久久三级| 人妻av一区二区三区| 国产精品综合| 亚洲一区二三| 狼人精品一区二区三区在线 | 日本一区二区综合亚洲| 亚洲精品20p| 在线精品一区| 天天爽天天狠久久久| 国产精品一区二区美女视频免费看| 久久久久一本一区二区青青蜜月| 九色视频网站在线观看| 91精品国产美女浴室洗澡无遮挡| 日韩免费不卡视频| 国产精品伦一区二区三级视频| 91超薄肉色丝袜交足高跟凉鞋| 日韩中文字幕区一区有砖一区| 中文字幕乱码一区二区三区| 欧美人妖在线观看| 91久久精品国产91久久性色| av中文在线资源库| 日韩在线视频观看正片免费网站| 成人无码一区二区三区| 欧美日韩精品一区二区三区四区 | 色综合一区二区日本韩国亚洲 | av一区二区三| 91激情在线视频| 国产小视频在线看| 国产精品三级电影| 国产激情视频网站| 国产裸体歌舞团一区二区| 99精品免费在线观看| 国产精品s色| 在线免费观看成人网| 欧美亚洲大陆| 不卡视频一区| 亚洲视频自拍| 国产精品爽黄69天堂a| 一二三四视频在线中文| 欧美激情精品久久久久久大尺度| 日本高清视频在线播放| 亚洲性猛交xxxxwww| 五十路在线观看| 精品99999| 国产激情无套内精对白视频| 欧美日韩一区二区电影| 无码人妻精品一区二区三区9厂| 亚洲综合丁香婷婷六月香| 少妇被躁爽到高潮无码文| 国产精品高清亚洲| 女人黄色一级片| 国产色产综合产在线视频| 欧美无人区码suv| 成人黄色av网站在线| 中文字幕 欧美 日韩| 国产一区二区免费在线| 精品综合久久久久| 美女www一区二区| 成年人在线观看视频免费| 久久国产精品久久久久久电车| 成人免费观看cn| 亚洲中字黄色| 97超碰青青草| 久久精品亚洲| 成人一区二区三| 日韩高清一级片| 一区二区三区 日韩| 日韩激情中文字幕| av在线无限看| 久久99精品国产.久久久久| av免费一区二区| 精品一区二区三区的国产在线播放| 午夜在线观看av| 久久99精品国产.久久久久久| 91免费视频污| 国产高清不卡一区二区| 日本中文字幕精品| 成年人午夜久久久| 手机在线看片日韩| 久久精品夜色噜噜亚洲aⅴ| 成人在线一级片| 国产精品丝袜久久久久久app| 欧美自拍偷拍网| 日韩美女视频19| 久久99久久98精品免观看软件| 亚洲成va人在线观看| 日本中文在线播放| 在线亚洲一区二区| 国产又爽又黄免费软件| 日韩欧美亚洲国产精品字幕久久久| 北条麻妃一二三区| 日韩成人网免费视频| 国产黄在线看| 欧美理论电影在线观看| 日韩av影片| 国产精品香蕉在线观看| 欧美第一在线视频| 精品久久久久久中文字幕动漫 | 51精品国产| 日本不卡一区| 欧美一区二区三区另类| 日韩精品视频久久| 黄页视频在线91| 亚洲精品乱码久久| 国产精品成人网| 日本五十路女优| 欧美在线观看视频一区二区三区| 国产强被迫伦姧在线观看无码| 亚洲国产成人爱av在线播放| 成人欧美亚洲| 久久久免费电影| 成人av集中营| 国产精品伊人日日| 日本a级不卡| 霍思燕三级露全乳照| 另类专区欧美蜜桃臀第一页| 艳妇乳肉豪妇荡乳xxx| 亚洲欧美在线aaa| 在线能看的av| 日韩欧美国产三级| 成人午夜影视| 7m第一福利500精品视频| 成人av在线播放| 日韩啊v在线| 99热在线精品观看| 在线免费观看av网| 国产丝袜欧美中文另类| 日本一级黄色录像| 欧美一区2区视频在线观看| 国产在线观看免费| 欧美亚洲成人精品| 清纯唯美激情亚洲| 亚洲欧美精品| 美女尤物久久精品| 国模无码视频一区| 亚洲另类中文字| 一二三四区视频| 亚洲人在线观看| 亚洲天堂资源| 国精产品一区二区| 午夜日韩福利| 99视频在线观看视频| 亚洲国产电影在线观看| 国产无套丰满白嫩对白| 精品电影一区二区| 3d玉蒲团在线观看| 成人在线小视频| 欧美aaaaaaaaaaaa| 成人午夜激情av| 国产日韩欧美制服另类| 国产性猛交╳xxx乱大交| 亚洲国产精品久久久| 成人影音在线| 国产精品久久精品国产 | wwwxxx黄色片| 99久久国产免费看| 可以在线观看av的网站| 亚洲第一福利网站| www在线观看黄色| 国产伦精品一区二区三区高清版 | 高清视频欧美一级| 成人看片黄a免费看视频| 欧美黄色免费网址| 丁香婷婷综合网| 精品午夜福利视频| 亚洲国产欧美一区二区三区久久| 麻豆av在线免费观看| 国产精品免费看一区二区三区| 在线观看视频免费一区二区三区| 日韩高清一二三区| 亚洲444eee在线观看| 免费成人在线看| 欧美在线影院在线视频| 免费观看久久av| 天堂av在线网站| 国产精品不卡视频| 99在线无码精品入口| 欧美日韩国产第一页| 国产精品任我爽爆在线播放| 久久久久久久午夜| 久久精品免费在线观看| 中文字幕丰满人伦在线| 久久精品中文字幕电影| 日本精品在线播放| xxxx18hd亚洲hd捆绑| 久久色成人在线| 中文字幕第315页| 久久国产精品影片| 欧美jizz19性欧美| 无码日韩人妻精品久久蜜桃| 亚洲人成人一区二区在线观看| 性少妇videosexfreexxx片| 7777免费精品视频| 日韩精品诱惑一区?区三区| 中文字幕avav| 欧美日韩美女在线| 毛片在线看片| 精品久久久久久一区| 美女一区二区视频| 国产精品18p| 日韩在线观看你懂的| av综合网站| 丝袜制服一区二区三区| 亚洲伦在线观看| 欧美日韩国产中文字幕在线| 91精品视频大全| 国产一区白浆| 成人做爰视频网站| 日韩av在线播放资源| 亚洲成人高清| 男人日女人下面视频| 中文字幕一区二区三区不卡在线| 风流老熟女一区二区三区| 国产精品久久久91| 黄色免费成人| 亚洲女同二女同志奶水| 亚洲第一精品自拍| 日韩午夜电影免费看| 欧美日韩在线视频一区二区三区| 成人免费在线视频| 国产人成在线视频| 国语精品免费视频| 国产一区在线视频|