精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

超越CoT!微軟劍橋中科院提出MVoT,直接可視化多模態推理過程

人工智能 新聞
近日,微軟和劍橋大學公布推理新方法:多模態思維可視化MVoT。新方法可以邊推理,邊「想象」,同時利用文本和圖像信息學習,在實驗中比CoT擁有更好的可解釋性和穩健性,復雜情況下甚至比CoT強20%。還可以與CoT組合,進一步提升模型性能。

大模型也學會了「空間想象力」?還可以自己解釋自己?

在大語言模型(LLMs)和多模態大語言模型(MLLMs)中,思維鏈(CoT)在復雜推理方面非常有效。

然而,對于復雜的空間推理,CoT表現不佳。

但人類的認知能力不僅限于語言,還能夠同時用詞語和圖像推理。

受這一機制的啟發,來自微軟研究院、劍橋大學和中科院的研究人員,在思維鏈提示的基礎上,提出了空間推理(spatial reasoning)新范式:多模態思維可視化(MVoT)。


論文地址:https://arxiv.org/pdf/2501.07542

將思維鏈(CoT)擴展到多模態模型,已有的方法盡管能夠處理文本和圖像,但或者嚴重依賴于獨立的視覺模塊或外部工具,難以適應更復雜的空間推理任務;或者可視化太過簡化,推理過程難以理解。

論文作者Chengzu Li在X上解釋MVoT的核心設計理念:「MVoT超越了思維鏈(CoT),可以讓AI利用生成的視覺圖像去想象它的思考。通過融合語言和視覺推理,MVoT使復雜問題的解決變得更加直觀、可更具解釋性、更加強大。」

具體而言,MVoT要微調自回歸多模態大語言模型(MLLM)。為了提升推理過程的可視化質量,引入了token差異損失,彌補了分別訓練的分詞器(tokenizer)的差距。

文章亮點:

  • 多模態思維可視化(MVoT)將文本與視覺統一在推理過程中,將自然生成視覺思維作為推理過程的一部分。
  • 在Chameleon-7B中實現了MVoT,并在自回歸多模態大語言模型(MLLM)中引入了token差異損失(token discrepancy loss),以彌補分別訓練的文本分詞器和圖像分詞器之間的差距。
  • 實驗結果表明,MVoT在復雜場景中比思維鏈(CoT)更優的適應性和穩健性。
  • MVoT和CoT組合可以進一步提高性能上限。

架構

給定一個多模態輸入序列,模型需要生成交織的多模態思維,作為推理過程的組成部分,并最終生成最終答案。

表示一個預訓練的多模態大語言模型(MLLM),其參數為θ,x表示多模態輸入序列,z和v分別表示語言思維序列和圖像思維序列。

在多跳(multi-hop)空間推理任務中,給定輸入x,思維鏈(CoT)提示生成中間步驟 其中每個樣本基于輸入和之前生成的步驟順序采樣。最終的輸出基于所有先前的步驟得出。

MVoT通過為每個中間步驟添加圖像v^i可視化來增強這一過程,然后根據先前的步驟和可視化采樣后續步驟,如圖1所示。

圖1:多模態思維可視化(MVoT)推理過程與其他方法的對比

多模態思維可視化(MVoT)讓多模態大語言模型(MLLMs)能在不同模態之間生成交織的推理軌跡。

傳統的CoT僅依賴于語言思維,而MVoT則通過促進視覺思維來可視化推理軌跡。

這個推理范式類似于人類的認知方式,能夠無縫地在文字和圖像之間進行思維。

訓練

多模態序列建模如圖3所示,使用Chameleon的架構,利用統一的Transformer來處理圖像和文本token。

該架構集成了兩個tokenizer:圖像tokenizer使用離散的碼本(codebook)將輸入圖像編碼為一系列圖像token;文本tokenizer則將文本數據映射為相應的token序列。

這些token序列被連接在一起并由因果Transformer模型處理。

損失函數

因果Transformer模型利用下一個token預測目標進行微調,同時兩個tokenizer在整個過程中保持凍結狀態。

訓練的損失函數要同時考慮圖像token差異損失,以及文本token和圖像token的交叉熵損失,定義如下。

其中token差異損失要對與真實標簽顯著偏離的token施加懲罰,彌合了語言建模與視覺嵌入空間之間的差距,同時確保梯度的連續性。

實驗結果

有效性實驗

作者在三個動態空間推理任務中進行大量實驗,驗證了MVoT的有效性。

MAZE和MINIBEHAVIOR聚焦于與空間布局的交互,而FROZENLAKE強調在動態環境中的細粒度模式識別。

實驗結果表明,MVoT在任務中的表現具有競爭力,在高難度的FROZENLAKE場景中,MVoT的表現比傳統的思維鏈(CoT)高出了20%多

不同系統變體在任務中的實驗結果。

三個模擬任務的實驗結果表明,Direct存在過擬合問題,準確率約為70%。GPT-4o的表現更差。相比之下,MVoT展現出不斷的改進。

在MAZE和MINIBEHAVIOR上,MVoT的準確率超過90%,可與CoT相媲美。

而在FROZENLAKE上,MVoT的準確率為85.60%,優于Direct和CoT。

這表明MVoT比CoT擁有更好的穩定性和穩健性。

此外,MVoT還提供了語言和視覺形式的中間推理狀態,可以更清晰、更直觀地理解推理過程

定性分析

圖4展示了FROZENLAKE中生成圖像的正確與錯誤示例。

可視化生成的錯誤分類如下:

(1)錯誤可視化(Wrong Visualization):生成的可視化內容不準確。

(2)多余圖形(Redundant Patterns):在預期修改區域外可視化了不必要或無關的圖形。

圖4:定性分析示意圖。

此外,與MAZE和MINIBEHAVIOR相比,在FROZENLAKE任務中,觀察到隨著模式復雜度的增加,生成圖像的細節經常會變得模糊。

在重建的圖像與原始圖像之間也觀察到類似的差異。

這種變異性經常導致細粒度細節的丟失或擾動,反映了MLLM在表達能力上的局限性。

定量分析

為了評估生成的視覺推理的質量,基于已識別的錯誤類型定義了自動化評估指標:

  • 可視化準確率(V-Acc.):衡量在網格中對應于下一步操作的預期修改是否被準確可視化。
  • 可視化模式冗余度(V-Red.):評估目標修改區域之外是否存在非預期的視覺模式。
  • 可視化正確步驟(V-Steps):操作序列中前k個連續正確可視化的平均長度。
  • 可視化正確比率(V-Ratio):操作序列中前k個連續正確可視化的平均比例。

作者報告了MAZE和MINIBEHAVIOR中可視化位置的定量結果,如下所示。

表3:token差異損失對MVoT視覺思維定量指標的影響

上圖中,最佳結果以加粗形式標出。帶有↑的指標表示值越高性能越好,反之亦然。

Token差異損失函數分析

Token差異損失提高了可視化的準確性并減少了冗余。

如表3所示,token差異損失增強的MVoT能夠生成高度準確且模式冗余最小的可視化內容。

即使在遞歸生成場景中,在推理過程中依然實現了95%的平均正確和連續可視化。

相比之下,缺少token差異損失會顯著降低生成質量:沒有的MVoT經常會生成多余圖形,且未能準確捕捉狀態轉換。

這些結果與圖像編輯場景中的發現一致,如圖5所示,圖中展示了MAZE在不同訓練周期的定量指標。

圖5:MAZE在不同訓練周期的定量指標

MVoT和CoT的組合

MVoT在推理中與CoT的能力可以互相補充

正如作者Chengzu Li所言:「MVoT不會取代CoT,而是提升了CoT。通過組合MVoT和CoT,多模態推理和語言推理的協同作用解鎖了性能上限,證明兩種推理范式可能比一種更好!」

在兩種方法的組合中,如果MVoT或CoT中的任一方法生成了正確的預測,則認為該數據點正確。

如表4所示,在MAZE和MINIBEHAVIOR上,上限性能達到了接近100%的準確率;在FROZENLAKE上,達到了92%的準確率。

表4:通過組合CoT和MVoT在三個任務中的預測所達到的性能上限。

文中也討論了消融實驗,并在附錄中給出了更多的實驗細節。

當然,這項研究也有局限性,作者建議借鑒擴散模型中的圖像生成技術,作為未來改進的方向。

此外,在推理過程中,顯式生成可視化會引入計算開銷。

為了解決這一問題,作者倡導進一步研究使用更少token的緊湊的圖像表示,以降低可視化生成的計算成本。

作者介紹

共一作者Chengzu Li在微軟研究院實習時參與了全程工作。目前,他是劍橋大學語言技術實驗室的計算、認知與語言學博士生。在攻讀博士學位之前,他在劍橋大學計算機科學系獲得了高級計算機科學碩士學位。他本科就讀于西安交通大學自動化專業。

共一作者Wenshan Wu, 目前是微軟亞洲研究院(MSRA)的高級研究軟件開發工程師。之前,曾在騰訊擔任軟件工程師。她從中國科學院獲得了碩士學位。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-07-21 08:51:00

2025-05-09 08:40:00

2025-10-29 09:09:46

2023-05-15 12:14:02

ChatGPT語音模型

2024-08-08 13:04:28

2023-04-18 10:12:06

模型解碼

2025-03-11 13:49:20

2024-06-05 09:22:43

2025-11-20 12:51:07

2025-10-11 09:20:13

2018-02-28 16:20:57

中科睿芯

2025-03-31 09:22:00

強化學習模型AI

2017-05-15 15:07:36

納米材料農藥

2024-12-31 09:10:00

2019-01-16 15:21:12

中科院大數據數據庫

2022-10-31 09:36:47

深度學習數據集

2025-02-26 13:00:00

2023-05-30 10:23:45

模型研究

2024-09-14 09:29:37

2022-03-28 13:14:50

機器學習語言訓練AI
點贊
收藏

51CTO技術棧公眾號

欧美精品在线免费观看| 制服丝袜国产精品| 免费中文日韩| 亚洲熟女乱色一区二区三区久久久| 日韩一区三区| 日韩免费性生活视频播放| 欧美色图色综合| 麻豆91在线| 97se亚洲国产综合自在线不卡| 欧洲日韩成人av| 加勒比婷婷色综合久久| 亚洲深夜福利在线观看| 欧美一区二区三区播放老司机| 六月婷婷在线视频| 亚洲视频tv| 99久久精品国产一区| 国产剧情久久久久久| 日本少妇久久久| 99久久99热这里只有精品| 亚洲第一页自拍| 在线一区二区不卡| 欧美黑人疯狂性受xxxxx野外| 亚洲天堂av老司机| 欧美一级日本a级v片| 亚洲成人777777| 蜜桃久久久久久| 55夜色66夜色国产精品视频| 五月天婷婷色综合| 精品免费一区二区| 亚洲精品mp4| 少妇极品熟妇人妻无码| 国产91亚洲精品久久久| 欧美日韩激情美女| 91免费国产精品| 黄色网址在线免费| 国产女同互慰高潮91漫画| 国产不卡一区二区在线观看| 一级黄色片在线看| 欧美a一区二区| 欧美亚洲国产视频小说| 久久精品视频国产| 久久久久久久久丰满| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 亚洲va韩国va欧美va精品| 亚洲欧洲三级| 成人影院免费观看| 久久精品网站免费观看| 开心色怡人综合网站| 好吊视频一区二区三区| 国产成人综合亚洲网站| 亚洲精品日产aⅴ| 国产精品一区二区人人爽| 蜜臀av在线播放一区二区三区| 青青草精品毛片| 波多野结衣家庭主妇| 久久精品30| 国产精品va在线播放| 日本a级c片免费看三区| 蜜乳av另类精品一区二区| 1769国产精品| 日韩精品一区不卡| 日本不卡一二三区黄网| 国产欧美精品日韩精品| 国产精品高潮呻吟AV无码| 精品一区二区免费在线观看| 成人免费xxxxx在线观看| 国产精品无码在线播放| 激情成人综合网| 99一区二区三区| 成人久久久精品国产乱码一区二区| 成人免费精品视频| 九色综合婷婷综合| 成人高清在线| ●精品国产综合乱码久久久久| 日本丰满大乳奶| 国产蜜臀一区二区打屁股调教| 婷婷一区二区三区| 日本成人黄色网| 四虎地址8848精品| 欧美mv日韩mv国产网站app| 国产性生活毛片| 国产成人精品免费视| 日韩视频在线免费观看| 国产人妻精品一区二区三区不卡| 亚洲网站啪啪| 日韩女优在线播放| 国产精品一二三四五区| 国产**成人网毛片九色| 欧美国产一区二区在线| 欧美猛烈性xbxbxbxb| 亚洲中国最大av网站| 成年人免费大片| 欧洲精品99毛片免费高清观看 | 国产精品人成电影| 国产露脸91国语对白| av亚洲精华国产精华精| 亚洲欧洲国产日韩精品| 波多野在线观看| 在线观看精品一区| 亚洲成人精品在线播放| 久久不卡国产精品一区二区| 欧美成人精品影院| 无码日韩精品一区二区| 国产成人免费高清| 欧洲精品码一区二区三区免费看| 91小视频xxxx网站在线| 日本韩国欧美一区| 男人的天堂免费| jlzzjlzz亚洲女人| 97免费视频在线| 91在线视频国产| 久久久久久免费网| 妞干网在线播放| 亚洲精品乱码日韩| 亚洲精品自在久久| 久久这里只有精品免费| 精品亚洲欧美一区| 欧美一区二区三区精美影视| 黄色的视频在线观看| 欧美日韩在线播放一区| a视频免费观看| 影音先锋中文字幕一区| 亚洲free性xxxx护士白浆| 国产青青草在线| 欧美日韩激情美女| 国产午夜在线一区二区三区| 亚洲国产一成人久久精品| 国产精品日韩专区| 欧美日本网站| 精品久久久国产| 国产乱国产乱老熟300部视频| 国产精品国产一区| 国产精品视频一区国模私拍| 免费在线稳定资源站| 婷婷久久综合九色综合绿巨人 | 啪啪小视频网站| 91亚洲午夜精品久久久久久| 欧美激情亚洲天堂| 久久国产精品美女| 欧美巨猛xxxx猛交黑人97人| 中文字幕精品一区二| 国产日韩一级二级三级| 免费在线激情视频| 亚洲精品无吗| 日韩免费高清在线观看| 欧美婷婷久久五月精品三区| 无码av免费一区二区三区试看| 日本精品一二三区| 亚洲第一精品影视| 精品伦精品一区二区三区视频 | 亚洲国产欧美另类丝袜| 好吊操视频这里只有精品| 国产一区日韩欧美| 99免费在线观看视频| 欧美四级在线| 欧美成人bangbros| 日本免费观看视| 91丝袜美腿高跟国产极品老师 | 美女毛片在线观看| 成人免费不卡视频| 欧美韩国日本在线| 精品一区二区三| 国产精品亚洲综合天堂夜夜| 免费网站看v片在线a| 欧美一级片在线看| 精品在线免费观看视频| 久久综合狠狠综合久久激情| 91av在线免费播放| 小处雏高清一区二区三区| 444亚洲人体| av影院在线免费观看| 日韩精品黄色网| 男操女视频网站| 中文字幕欧美一区| 极品白嫩的小少妇| 久久这里有精品15一区二区三区| 亚洲.欧美.日本.国产综合在线| 综合久久av| 午夜精品一区二区三区av| 毛片免费在线观看| 欧美精品v国产精品v日韩精品| 精品99在线观看| 久久久国产午夜精品| 黄色小视频免费网站| 亚洲日韩成人| 亚洲高清资源综合久久精品| 亚洲一区二区三区日本久久九| **欧美日韩vr在线| 九色porny丨首页在线| 亚洲精品理论电影| 亚洲自拍第二页| 亚洲一卡二卡三卡四卡| www色com| 成人一区二区三区| 国产喷水theporn| 黑人一区二区| 亚洲v国产v| 老牛影视av一区二区在线观看| 国产精品女主播| 24小时免费看片在线观看 | 天堂8中文在线| 亚洲欧美激情四射在线日| 国产99久久九九精品无码免费| 精品国产电影一区| 青青草精品在线视频| 国产日韩欧美亚洲| 日本一区二区在线观看视频| 免费精品99久久国产综合精品| 国产精品自拍片| 综合一区在线| 四虎影视永久免费在线观看一区二区三区| 欧洲大片精品免费永久看nba| 国产精品久久久久久久久借妻| av中文资源在线资源免费观看| 精品国产自在精品国产浪潮| 你懂的视频在线观看| 精品美女在线观看| 国产乱淫片视频| 在线一区二区三区做爰视频网站| 日本三级网站在线观看| 亚洲免费在线看| 欧美a在线播放| 久久亚洲综合色一区二区三区| 丰满饥渴老女人hd| 国内外成人在线| 天天干天天操天天做| 天堂一区二区在线| 无码精品国产一区二区三区免费| 欧美视频亚洲视频| 2025韩国大尺度电影| 波多野结衣在线播放一区| 久久波多野结衣| 欧美变态挠脚心| 国产精品视频免费一区| 久久国际精品| 91久久国产综合久久91精品网站| 国产精品传媒麻豆hd| 国产成人久久久精品一区| 欧美a级在线观看| 91精品国产高清自在线| 国产调教在线| 97免费视频在线| 交100部在线观看| 97婷婷大伊香蕉精品视频| 暧暧视频在线免费观看| 欧美国产日本高清在线| 少女频道在线观看免费播放电视剧| 久久久久999| 超碰免费在线播放| 蜜月aⅴ免费一区二区三区| 超碰在线无需免费| 欧美巨乳美女视频| 波多野一区二区| 浅井舞香一区二区| 成人精品高清在线视频| 国产欧美日韩专区发布| www.久久热| 99re视频在线观看| 国产suv精品一区| 精品国产乱码久久久久软件| 一区三区在线欧| 日韩区国产区| 久久综合成人| 女人床在线观看| 国产综合欧美| 欧美亚洲一二三区| 日韩电影免费在线观看网站| 亚洲综合av在线播放| 国产一区二区三区免费| 制服丝袜在线第一页| 久久综合狠狠综合| 手机看片国产日韩| 一区二区三区免费看视频| 国产真实的和子乱拍在线观看| 五月天欧美精品| 在线观看你懂的网站| 9191成人精品久久| 色婷婷在线视频| 尤物九九久久国产精品的特点| 国产三区在线观看| 97久久精品人人澡人人爽缅北| 超碰aⅴ人人做人人爽欧美| 国产伦精品免费视频| 凹凸成人在线| 日韩精品无码一区二区三区| 在线国产一区| 99re在线视频免费观看| 国产一区二区三区免费看| 在线观看日韩精品视频| 国产精品私人自拍| 日韩毛片在线播放| 欧美三级电影网站| 涩涩视频免费看| 色偷偷亚洲男人天堂| 51漫画成人app入口| 91精品国产综合久久香蕉的用户体验 | 婷婷综合伊人| 国内性生活视频| 国产一区二区0| 中文字幕一二三四区| 成人欧美一区二区三区1314| 日韩网红少妇无码视频香港| 欧美人牲a欧美精品| 色网站在线免费观看| 久久电影一区二区| 电影亚洲一区| 国产在线一区二区三区欧美| 婷婷伊人综合| 91蝌蚪视频在线观看| 不卡的av在线| 日本在线一级片| 在线观看日韩精品| 天天操天天爱天天干| 免费91在线视频| 成人一级视频| 欧美中日韩一区二区三区| 99在线精品免费视频九九视 | 免费看黄色a级片| 秋霞午夜鲁丝一区二区老狼| 波多野结衣福利| 亚洲国产精品一区二区尤物区| 国产精品综合在线| 中文字幕亚洲欧美在线| 日韩免费小视频| 欧美日韩国产综合在线| 亚洲精品偷拍| 手机免费看av片| 亚洲精品亚洲人成人网在线播放| 亚洲天堂777| 日韩在线视频免费观看高清中文| 欧美大胆成人| 茄子视频成人在线观看| 国产精品日本| 成人在线视频免费播放| 亚洲高清免费一级二级三级| 国产a级免费视频| 久久国产精彩视频| 日韩一级淫片| av影院在线播放| 国产高清久久久| 欧美精品一级片| 精品日本一线二线三线不卡| 性直播体位视频在线观看| 亚洲一区二区三区sesese| 中文字幕一区二区三区久久网站| 色一情一区二区三区| 日韩美女啊v在线免费观看| 一级黄色片在线看| 操人视频在线观看欧美| 日韩精品久久久久久久软件91| 国产又粗又长又爽视频| 风流少妇一区二区| 黄色一级片免费看| 亚洲欧洲午夜一线一品| 欧美性理论片在线观看片免费| 天堂精品视频| 精品中文字幕一区二区小辣椒 | 婷婷成人综合网| 日韩二区三区| 国产精品av电影| 97精品视频| 一卡二卡三卡四卡五卡| 亚洲一区电影777| 日韩精品视频在线观看一区二区三区| 欧洲午夜精品久久久| 日韩欧美一区二区三区在线视频| 在线观看国产福利| 一区2区3区在线看| 午夜视频福利在线| 国产精品视频久| 欧美在线视屏| 免费在线观看你懂的| 欧美日韩aaaaa| 日韩三级免费| 欧美激情导航| 麻豆国产精品777777在线| 青娱乐91视频| 日韩精品视频在线| 精品久久福利| 99在线免费视频观看| 国产亚洲va综合人人澡精品| 国产美女www爽爽爽视频| 久久久久久91| av在线不卡顿| 中文字幕永久免费| 91成人免费电影| 视频在线这里都是精品| 日韩欧美视频一区二区| 国产精品羞羞答答xxdd| youjizz在线视频| 免费不卡欧美自拍视频| 国产探花在线精品一区二区| www.欧美激情.com| 欧美视频在线免费看| 精品美女在线观看视频在线观看| 久久av一区二区三区亚洲| 久久99精品国产.久久久久| 久久午夜免费视频| 久久精品电影网| 国产成人精品免费视|