精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD

發(fā)布于 2024-4-7 14:04
瀏覽
0收藏

GPT-4V 的推出引爆了多模態(tài)大模型的研究。GPT-4V 在包括多模態(tài)問答、推理、交互在內(nèi)的多個領(lǐng)域都展現(xiàn)了出色的能力,成為如今最領(lǐng)先的多模態(tài)大模型。


然而,近期很多工作發(fā)現(xiàn) GPT-4V 在很多基本能力上卻意外的出現(xiàn)短板。例如,在微軟一篇長達(dá) 166 頁的技術(shù)報告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中,作者發(fā)現(xiàn),對于一個不太復(fù)雜的圖像中的蘋果數(shù)量,GPT-4V 竟然怎么數(shù)也數(shù)不對。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


然而,學(xué)術(shù)界和工業(yè)界尚不清楚導(dǎo)致這些問題的底層原因。


這個問題在清華大學(xué)、新加坡國立大學(xué)和中國科學(xué)院大學(xué)的一篇題為《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的論文中得到了解釋。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


  • 論文鏈接:https://arxiv.org/pdf/2403.11703.pdf
  • 項目鏈接:github.com/thunlp/LLaVA-UHD


其原因在于 GPT-4V 很可能存在:視覺編碼漏洞。


該工作對當(dāng)前最強(qiáng)的商業(yè)大模型 GPT-4V 和最受歡迎的開源模型 LLaVA-1.5 進(jìn)行了實(shí)驗,揭示了目前多模態(tài)大模型中的視覺編碼漏洞。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


漏洞 1:GPT-4V 將圖像進(jìn)行有重疊的切片后再編碼


作者首先設(shè)計了一個實(shí)驗來觀察:圖像中的位置如何影響 GPT-4V 的計數(shù)回答。


具體來說,作者合成了如圖 1 (a) 所示的圖像,并向 GPT-4V 提問題:“圖像中有多少個圓圈?” 同時,通過改變圓圈的位置而保持提問不變,進(jìn)一步生成了一系列圖像變體。


圖 1 (b) 中以熱圖的形式顯示了 GPT-4V 對圖像中每個位置平均回答的數(shù)量,作者發(fā)現(xiàn)了一個與圖像中目標(biāo)位置高度相關(guān)的有趣模式如圖 1(b)所示,具體表現(xiàn)為被 256×256 的正方形網(wǎng)格分割的三種不同模式:


(1) 中央正方形區(qū)域展示了最高的響應(yīng)數(shù)量,

(2) 中間邊緣區(qū)域的響應(yīng)數(shù)量較低,

(3) 角落區(qū)域的響應(yīng)數(shù)量最接近于真實(shí)值。


在對 GPT-4V 的響應(yīng)進(jìn)行數(shù)值區(qū)分后,作者發(fā)現(xiàn)除了正確答案和接近正確答案的情況,還有兩種異常答案(8 個圓和 16 個圓),這些異常答案呈現(xiàn)了答案數(shù)量翻倍或四倍的錯誤模式。結(jié)合 OpenAI 公開的信息,這一現(xiàn)象的最可能原因是,當(dāng)圖像分辨率無法被 512 整除時,GPT-4V 處理圖像的切片之間會出現(xiàn)重疊。如圖 1 (e) 所示,兩個切片之間的重疊區(qū)域?qū)е聰?shù)量翻倍,而四個切片的交叉重疊區(qū)域會使得識別出的數(shù)量增加至四倍。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


作者設(shè)計了另一個實(shí)驗來觀察:圖像分辨率如何影響 GPT-4V 的計數(shù)回答。


具體來說,作者將圖 2 (a) 中的圖像按比例縮放至連續(xù)遞增的分辨率,并詢問 GPT-4V 其中圓圈的個數(shù)。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


圖 2 (b) 中展示了 GPT-4V 的回答結(jié)果。隨著圖像分辨率的變化,GPT-4V 的回答顯示出顯著的相位變化:(1)在第 1 階段,由于沒有圖像切片,大多數(shù)答案是正確的;(2)在第 2 階段,答案 12 在響應(yīng)中占主導(dǎo)地位,可能是由于每個切片中的圓不完整;(3)第 3 階段顯示了 9、12 和 16 的混合答案。請注意,16 可以很好地解釋圖 1 (e) 中的錯誤模式。


以上兩個實(shí)驗結(jié)果揭示了 GPT-4V 在處理高分辨率圖像時存在重疊切片,導(dǎo)致錯誤響應(yīng),啟發(fā)作者需要進(jìn)一步研究更合理的圖像預(yù)處理和編碼方式。


漏洞 2:LLaVA-1.5 進(jìn)行大范圍的圖像填充(Padding)


LLaVA-1.5 作為出色的開源多模態(tài)大模型被學(xué)術(shù)界廣泛關(guān)注。


為了處理具有不同長寬比的圖像,LLaVA-1.5 在將圖像輸入視覺編碼器之前將其填充為正方形。這種編碼方法導(dǎo)致非正方形圖像的計算浪費(fèi)。例如,將 1:4 圖像填充為正方形后,有效計算量僅為 25%。


更重要的是,LLaVA-1.5 實(shí)際上無法確定填充像素是來自圖像預(yù)處理還是原始輸入圖像的實(shí)際部分。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


為了演示這個問題,作者合成了一系列輸入圖像,如圖 3(右)所示,其中不同長寬比的綠色矩形被灰色(即填充對應(yīng)的 RGB 值)所包圍。給定輸入圖像,作者提示:“最左 / 最右 / 最上 / 最下區(qū)域的顏色是什么?” 從圖 3(左)的結(jié)果中,作者觀察到 LLaVA-1.5 忽略了灰色輸入?yún)^(qū)域(將其視為填充),并置信地回答了中心矩形的顏色。


綜合以上 2 個明顯的視覺編碼漏洞可以知道,多模態(tài)模型中的視覺策略必須謹(jǐn)慎設(shè)計。常見做法,如填充、形狀扭曲調(diào)整和重復(fù)切片,可能導(dǎo)致計算資源的浪費(fèi)、模型能力的喪失,甚至容易受到對抗性攻擊。


于是,作者提出 LLaVA-UHD,該模型可以對 180 萬像素任意長寬比圖像進(jìn)行編碼,相比于 LLaVA-1.5 在 9 個主流評測基準(zhǔn)實(shí)現(xiàn)提升,訓(xùn)練和推理計算開銷相比于 LLaVA-1.5 均有顯著下降。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)



LaVA-UHD 包括三個關(guān)鍵部分:一種圖像模塊化策略,將原始分辨率的圖像分成更小的可變大小的切片,以便進(jìn)行高效和可擴(kuò)展的編碼;一個壓縮模塊,進(jìn)一步壓縮來自視覺編碼器的圖像 tokens,一個空間裝飾模式,用于為 LLMs 組織片段 tokens。


圖像模塊化策略中主要包含兩個部分:


1. 高分辨率圖像劃分策略(如圖 4 左側(cè))。目標(biāo)是確定高分辨率圖像的劃分方式,使每個切片的分辨率變化最小。給定圖像分辨率和和在固定分辨率上預(yù)訓(xùn)練的 ViT,首先確定處理圖像所需的切片數(shù)。然后將切片數(shù)因式分解為和幾種劃分方式。為了選擇最合適的劃分,作者定義一個評分函數(shù)來衡量與 ViT 標(biāo)準(zhǔn)預(yù)訓(xùn)練設(shè)置的偏差,進(jìn)而選擇最佳的劃分方法。


2. 任意寬高比切片編碼(如圖 4 右側(cè))。目的是等比例調(diào)整圖像以適應(yīng)預(yù)訓(xùn)練模型的位置嵌入數(shù)量。首先將 ViT 的 1D 位置嵌入轉(zhuǎn)換為 2D 格式,并進(jìn)行插值以匹配動態(tài)切片分辨率,從而獲得自適應(yīng)圖像尺寸的視覺編碼。實(shí)驗表明,此方法在保持 ViT 和位置嵌入?yún)?shù)不變的情況下,通過后期微調(diào)即可提升性能。此外,還編碼一張低分辨率概覽圖像,有助于提供全局語義信息,增強(qiáng)模型對圖像的整體理解。


LLaVA-UHD 利用壓縮模塊(Resampler)壓縮每張切片的 tokens,實(shí)現(xiàn)比 LLaVA-1.5 在 336×336 分辨率圖像中更低的計算成本來編碼 672×1008 分辨率的圖像。由于圖像切片在不同圖像之間是動態(tài)的,因此有必要通過位置修飾符來告知 LLM 圖像切片的相對位置。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


表 1 報告了主要的實(shí)驗結(jié)果。在性能表現(xiàn)上,LLaVA-UHD 相對于 LLaVA-1.5 取得了顯著的改進(jìn)。通過簡單地感知原生高分辨率圖像,LLaVA-UHD 在 TextVQA 上實(shí)現(xiàn)了 6.4 的準(zhǔn)確率提升,在 POPE 上實(shí)現(xiàn)了 3.2 的準(zhǔn)確率提升。原因在于低分辨率圖像中的模糊內(nèi)容可能會阻止 LMMs 準(zhǔn)確識別具有挑戰(zhàn)性的細(xì)粒度目標(biāo)和 OCR 字符。在計算效率和可拓展性上,LLaVA-UHD 僅使用 94% 的推理計算即支持任意寬高比的 672×1088 分辨率圖像,能夠適應(yīng)更大分辨率的拓展。


揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯(lián)合NUS提出LLaVA-UHD-AI.x社區(qū)


為了更直觀地展示 LMM 在處理高分辨率圖像方面的能力,在圖 5 中提供了 LLaVA-UHD 和 LLaVA-1.5 的定性結(jié)果。可以看到,LLaVA-UHD 可以正確識別課表上的密集內(nèi)容,小海報上的文字以及手機(jī)上的圖標(biāo)和文字,實(shí)現(xiàn)了細(xì)粒度的識別和推理。


未來展望


LLaVA-UHD 將圖像分辨率限制在最大 672×1008。但是在未來,考慮到其具有潛力的效率和可擴(kuò)展性,將探索更高分辨率的圖像以及更具挑戰(zhàn)性的任務(wù),如小目標(biāo)檢測和分割。此外,目前圖像片段是獨(dú)立編碼的,只在 LLMs 中進(jìn)行交互。計劃通過改進(jìn)的視覺編碼策略,在圖像片段之間建立高效的連接,實(shí)現(xiàn)細(xì)粒度全局信息交互。


本文轉(zhuǎn)自 機(jī)器之心 ,作者:機(jī)器之心


原文鏈接:??https://mp.weixin.qq.com/s/5CKBR_KA-YNIqkz1ZcC79A??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
国产精品久久午夜| 久久五月激情| 亚洲精品在线免费观看视频| 国产极品尤物在线| 国内精品在线视频| 久久99精品网久久| 欧美激情国内偷拍| mm131美女视频| 亚洲欧美久久精品| 亚洲成av人在线观看| 青青草成人网| 亚洲大尺度网站| 老司机精品导航| 九九热这里只有精品免费看| 强伦人妻一区二区三区| 亚洲天堂网站| 欧美日韩久久久久| 天天综合五月天| 天天av天天翘| 国产自产v一区二区三区c| 97欧美精品一区二区三区| 免费黄色在线网址| 精品国产午夜肉伦伦影院| 欧美日韩在线播放| 97超碰青青草| 黄视频在线免费看| 亚洲色欲色欲www| 欧美一区二区三区精美影视| 人妻精品一区一区三区蜜桃91| 久久国产精品99久久久久久老狼 | av色综合网| 影音先锋黄色网址| 亚洲麻豆视频| 欧美黑人xxxⅹ高潮交| av资源在线免费观看| 亚洲综合福利| 欧美精品一区二区三区久久久| 色综合五月婷婷| jizz免费一区二区三区| 欧美日韩亚洲成人| www插插插无码视频网站| а√天堂资源地址在线下载| 国产精品三级久久久久三级| 欧美日本韩国在线| 亚州av在线播放| 成人福利视频网站| 国产精品日韩高清| www.日日夜夜| 国产成人在线视频免费播放| 国产精品久久久av久久久| 中文字幕视频网站| 久久婷婷亚洲| 天天精品视频| 亚洲精品欧美专区| 日韩中文一区| 大胆av不用播放器在线播放| 97精品国产露脸对白| 国产精品一区视频| 亚洲精品国产精品国| 激情久久五月天| 91精品久久久久久久| 一级特黄aaa大片在线观看| 三级欧美韩日大片在线看| 欧美专区国产专区| av网站中文字幕| 久久精品人人做人人爽电影蜜月| 欧美一区二区三区精品电影| 婷婷激情五月网| 日韩午夜高潮| 日韩av电影免费观看高清| 欧美激情黑白配| 天堂蜜桃一区二区三区| 国产精品成人av在线| 久久久久精彩视频| 精品制服美女丁香| 91精品黄色| 黄色www视频| 91在线视频在线| 欧美日本韩国一区二区三区| 一级毛片视频在线| 亚洲欧美日韩国产一区二区三区| 国产成人一区三区| 日本在线播放一区二区| 亚洲欧洲二区| 日韩免费成人网| 五月天丁香社区| 亚洲精品**不卡在线播he| 亚洲色在线视频| 国产又黄又粗又猛又爽的| 91精品国产91久久久久久密臀 | 极品白嫩少妇无套内谢| 高潮按摩久久久久久av免费| 亚洲精品小视频| 成人欧美一区二区三区黑人一| 一区二区日韩欧美| 97久久国产精品| 亚洲婷婷久久综合| 国产美女视频91| 久久精品丝袜高跟鞋| 成年人视频在线免费观看| 亚洲免费高清视频在线| 欧美激情视频免费看| 日韩欧美一区二区三区免费观看| 日韩欧美一区中文| 久久精品无码一区| 欧美国产日本| 国产精品久久久久久久久久ktv | 91美女片黄在线| 中文字幕制服丝袜在线| 麻豆免费在线| 欧美一区二区国产| 国产精久久一区二区三区| 亚洲欧美综合国产精品一区| 国产精品27p| 免费观看黄一级视频| 中文字幕乱码一区二区免费| 欧美成人免费在线观看视频| 91精品国产色综合久久不卡粉嫩| 精品调教chinesegay| 日本午夜在线观看| 欧美一级网站| 国产精品久久精品视| 看黄网站在线| 欧美性猛交xxxxxxxx| 波多野结衣有码| 国产精品久久| 91久久久久久久久久久久久| 国产精品视频一区二区久久| 午夜精品久久久久久久99水蜜桃 | 国产亚洲精aa在线看| 伊人久久精品视频| 99久久精品国产亚洲| 成人免费视频一区| av中文字幕av| 不卡一区视频| 日韩一区二区欧美| 亚洲中文无码av在线| www国产亚洲精品久久麻豆| 日韩精品在线中文字幕| 亚洲乱码一区| 欧美国产日韩xxxxx| 国产农村老头老太视频| 中文字幕视频一区| 成年人三级黄色片| 99久久99久久精品国产片桃花 | 88久久精品| 精品中文字幕在线2019| 国产欧美第一页| 亚洲天堂网中文字| 久久精品国产露脸对白| 99久久影视| 91精品国产自产在线观看永久| 1769视频在线播放免费观看| 欧美日韩在线免费视频| 老司机精品免费视频| 麻豆91在线看| 国产麻豆电影在线观看| 日本亚洲视频| 欧美黑人巨大精品一区二区| 亚洲国产精品成人久久蜜臀| 亚洲一区国产视频| 少妇被狂c下部羞羞漫画| 亚洲精品1区| 狼狼综合久久久久综合网| 黑人巨大亚洲一区二区久 | www.综合网.com| 亚洲精品999| 天堂а√在线中文在线新版| 国产日韩欧美高清在线| 久热精品在线播放| 91av精品| 国产在线欧美日韩| 欧美大胆性生话| 中文字幕在线精品| 国产成人三级在线播放| 亚洲高清免费一级二级三级| 成年人网站免费在线观看| 视频在线观看一区| 亚洲最新免费视频| 一区二区在线免费播放| 欧美亚洲国产成人精品| gogogo高清在线观看免费完整版| 欧美一区二区三区在线观看视频| 久久免费视频精品| 2023国产精品视频| 在线免费视频一区| 国产一区日韩一区| 免费国产一区二区| 欧美一区=区三区| 久久久久久中文| 成人在线观看黄色| 欧美成人官网二区| 国产免费a视频| 亚洲一区二区三区四区在线 | 亚洲三级视频在线观看| 国产黑丝在线观看| 激情综合色综合久久综合| 国产一二三在线视频| 日韩国产在线| 精品久久中出| 精品国产18久久久久久二百| 欧美亚洲日本黄色| 成人影院在线看| 亚洲人成在线观看网站高清| 精品国产亚洲av麻豆| 色婷婷精品大在线视频| 麻豆changesxxx国产| 国产日韩欧美精品电影三级在线| 无码人妻精品一区二区三| 欧美aⅴ一区二区三区视频| av在线播放天堂| 91一区在线| 麻豆传媒一区二区| 97久久综合区小说区图片区| 国产精品吴梦梦| 亚洲十八**毛片| 欧美黑人xxxx| 麻豆视频在线观看免费| 亚洲久久久久久久久久久| av一级黄色片| 欧美日韩日日摸| 亚洲第一网站在线观看| 亚洲国产综合人成综合网站| 久草手机视频在线观看| 国产日韩一级二级三级| 呦呦视频在线观看| 国产91综合网| 精品国产午夜福利在线观看| 久久av中文字幕片| 性欧美极品xxxx欧美一区二区| 激情久久久久久| 黄黄视频在线观看| 亚洲精品一二三区区别| 亚洲欧洲一区二区福利| 少妇精品久久久一区二区三区 | 精品国产91乱码一区二区三区四区 | 日韩中文字幕欧美| 国产精品二线| 亚洲午夜未满十八勿入免费观看全集| 日韩资源在线| 日韩精品在线私人| 婷婷五月综合久久中文字幕| 精品国产凹凸成av人网站| 99免费在线视频| 欧美一区二区久久| 精品乱子伦一区二区| 宅男噜噜噜66一区二区66| 一个人看的www日本高清视频| 欧美日韩另类一区| 中文字幕一区二区三区人妻四季| 在线看国产日韩| 在线视频欧美亚洲| 7878成人国产在线观看| 国产精品玖玖玖| 欧美一级在线视频| 性一交一乱一透一a级| 日韩精品一区二区三区四区| 亚洲精品国产一区二| 亚洲成人在线网| 五月婷婷丁香网| 亚洲精品一区中文| jizz在线观看视频| 久久久国产一区| 午夜伦理大片视频在线观看| 欧美—级高清免费播放| 高潮在线视频| 日本成人在线视频网址| 成人毛片免费| 亚洲综合社区网| 国产成人高清精品免费5388| 麻豆91蜜桃| 色喇叭免费久久综合| 国产精品无码乱伦| 亚洲国产一区二区精品专区| 无码人妻h动漫| 久久99热狠狠色一区二区| 久久精品一二三四| 92国产精品观看| 国产中文字幕久久| 亚洲伊人伊色伊影伊综合网| 久久精品一二区| 欧美区视频在线观看| 亚洲国产精品视频在线| 国产视频综合在线| 国产乱色在线观看| 97国产suv精品一区二区62| 精品三区视频| 99re视频在线播放| 国产91久久精品一区二区| 亚洲欧洲在线一区| 亚洲精品色图| 手机免费看av网站| 91丨九色丨蝌蚪丨老版| 国产大屁股喷水视频在线观看| 亚洲国产精品久久人人爱| 亚洲av人无码激艳猛片服务器| 日韩三级视频中文字幕| 黄色免费在线播放| 欧美夫妻性生活视频| 欧美精品高清| 国产一区二区不卡视频| 久久中文字幕二区| 亚洲欧洲日产国码无码久久99 | 少妇被狂c下部羞羞漫画| 国产精品美女久久久久av爽李琼| 国产乡下妇女做爰| 欧美日韩一区 二区 三区 久久精品| 亚洲欧美另类视频| 少妇高潮久久久久久潘金莲| 成人美女大片| www.久久久| 91精品国产调教在线观看| 1024精品视频| 粉嫩13p一区二区三区| 2014亚洲天堂| 在线亚洲一区二区| 五月婷婷在线播放| 久久99久久亚洲国产| 只有精品亚洲| 午夜欧美一区二区三区免费观看| 亚洲清纯自拍| 佐佐木明希电影| 亚洲另类中文字| 亚洲熟妇av乱码在线观看| 亚洲欧美中文日韩在线| 色在线免费观看| 国产一区二区精品免费| 亚洲一区二区三区无吗| 亚洲这里只有精品| 久久精品一二三| 国产美女激情视频| 亚洲国产日韩欧美综合久久| 欧美性爽视频| 97se亚洲综合| 欧美激情偷拍| 色哟哟免费视频| 亚洲欧洲制服丝袜| 在线观看免费中文字幕| 亚洲午夜精品久久久久久性色 | 色综合久久综合| 蜜桃视频在线观看网站| 欧洲日本亚洲国产区| 日本午夜精品久久久| www.av中文字幕| 99在线精品免费| 午夜毛片在线观看| 精品无人国产偷自产在线| 少妇在线看www| 蜜桃成人在线| 日韩精品国产精品| 先锋影音av在线| 欧美视频第二页| 老司机午夜在线视频| 国产女人高潮时对白| 欧美图片一区二区三区| 可以在线观看的黄色| 国产精品mp4| 精品视频亚洲| 色综合色综合色综合色综合| 国产精品美女一区二区在线观看| 伊人网视频在线| 久久综合免费视频| 午夜免费欧美电影| av网站大全免费| 97久久超碰国产精品电影| 一本一道无码中文字幕精品热| 亚洲欧美一区二区三区情侣bbw| 欧美色999| 美女国产一区二区三区| 亚洲精品性视频| 亚洲人成在线观看一区二区| 国产人妻精品一区二区三区| 欧美夫妻性生活xx| 日本在线中文字幕一区| 人妻丰满熟妇av无码区app| 中文字幕免费不卡| www.av导航| 热99精品只有里视频精品| 欧美一区三区| 色婷婷成人网| 先锋影音亚洲资源| 极品少妇一区二区| 欧美日韩国产精品综合| 亚洲激情免费观看| 日本高清不卡一区二区三区视频| 亚洲欧美日韩精品久久久| 国产精品系列在线播放| 亚洲天堂视频网站| 久久九九国产精品怡红院| 国产欧美自拍一区| 一区二区在线播放视频| 一区二区三区在线视频观看| 可以免费看污视频的网站在线| 亚洲一区二区中文字幕| 国产精品久久久久久久免费软件| 久久久久国色av免费看影院| 日本不卡一区视频| 日韩视频免费直播| 欧美成人性网| 国产日韩亚洲欧美在线|