精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只需將感知推理能力拆分,2B大模型就能戰(zhàn)勝20B!國產(chǎn)新框架高效處理視覺任務

人工智能
通過有效解耦感知和推理,Prism不僅能夠用于模型的分析和視覺語言任務的解決,還為未來的研究提供了新的方向。我們期待Prism在更多視覺語言任務中的應用,進一步推動這一領域的發(fā)展。

只要把推理和感知能力拆分,2B大模型就能戰(zhàn)勝20B?!

上海AI Lab聯(lián)合南京大學、香港中文大學等機構,共同推出了一套兩階段框架——Prism

這一框架不僅顯式地解耦了視覺語言模型(VLM) 的感知和推理,還提供了一種更高效的處理視覺語言任務的方案。

圖片

最終讓2B VLM和ChatGPT的組合表現(xiàn)出相當于10倍參數(shù)量VLM的性能。

圖片

Prism框架架構及功能

在解決復雜的視覺語言任務時,模型的感知和推理能力至關重要。當模型在基準測試中表現(xiàn)不佳時,我們?nèi)绾螀^(qū)分問題源自感知能力還是推理能力?

針對這一問題,Prism框架將視覺語言任務處理拆分為兩個獨立階段:

  • 感知階段: VLM作為感知模塊遵循指令提取輸入圖片的視覺信息,并以文本形式輸出
  • 推理階段: LLM作為推理模塊根據(jù)提取得到的文本信息,結合輸入文本生成回復

框架架構如下圖所示:

圖片

Prism框架中用于引導VLM生成圖片描述的指令可以是問題相關的,也可以是問題無關的。

VLM在框架中只用于視覺感知,而推理任務則由LLM解決。通過固定框架中的LLM,可以測試不同VLM的感知能力;相對應地,通過固定VLM并使用不同LLM,可以觀察VLM的性能是否被推理能力限制。

除此以外,通過選定VLM和LLM,Prism具有解決視覺語言任務的能力。

利用Prism,團隊對現(xiàn)有VLMs的感知和推理能力進行了解耦分析,揭示了若干有趣的發(fā)現(xiàn)。從這些發(fā)現(xiàn)中汲取靈感,團隊在Prism框架內(nèi)整合了專注于感知的輕量級VLM和一個專注于推理的強大LLM。

定量結果表明,這種組合在各種視覺語言任務中表現(xiàn)出卓越的性能和效率

視覺語言模型感知推理解耦分析

固定Prism中的LLM為ChatGPT-3.5可以進行不同VLM感知性能的對比。考慮到對視覺輸入依賴數(shù)據(jù)泄露以及復雜性等問題的考慮,團隊選擇MMStar作為實驗的基準。

實驗使用了兩類不同的指令。一是問題無關的通用指令,提前設定并固定;二是問題相關指令,其由問題需要關注的內(nèi)容與通用指令拼接得到。問題需要關注的內(nèi)容由推理模塊LLM根據(jù)輸入問題通過few shot輸出。評估過程中最大輸出長度設置為512,并采用貪心解碼策略。

不同VLM在兩類指令上overall的性能表現(xiàn)為:

圖片

在兩類指令中,GPT-4o 表現(xiàn)出了最強的感知能力。

在開源模型領域,InternVL-Chat-v1.5 表現(xiàn)最佳。在問題相關指令的結果中,InternVL-Chat-v1.5 不僅在開源模型中表現(xiàn)最好,還微弱領先于 GPT-4v。

細粒度分析

閉源商用模型與開源模型的感知能力比較

GPT-4o作為閉源商用模型,在感知能力方面明顯超過其他模型,并且可以熟練地處理各種感知任務。一些開源模型,例如 InternVL-Chat-v1.5 和 LLaVA-NeXT (Yi-34B),已經(jīng)取得了顯著的性能,接近 GPT-4v 和 GeminiPro-V 等閉源VLM的能力。其他開源模型由于感知能力有限,通常表現(xiàn)稍差。值得注意的是,MiniCPM-V-2 作為一款具有約3B參數(shù)的輕量級VLM,相比某些7B VLM表現(xiàn)出更好的感知性能。

感知能力的表現(xiàn)與端到端的性能表現(xiàn)的差異

除了以端到端的方式解決視覺問題外,Prism 還提供了一個替代管道,其中 VLM 僅用于感知。這兩種方法之間的區(qū)別在于推理過程:前者在VLM內(nèi)部進行推理,而后者基于使用外部LLM(ChatGPT)進行推理。這兩種方法在MMStar上的比較如下圖所示:

圖片

對于最先進的大規(guī)模VLM,如 GPT-4o 和 InternVL-Chat-v1.5,它們具有出色的推理能力,使用外部ChatGPT進行推理可能會降低整體性能。相反,對于大多數(shù)小規(guī)模的VLM,使用ChatGPT進行推理可以顯著提高它們的性能,特別是在推理相關的VQA中,如下圖所示。這一現(xiàn)象表明,小規(guī)模VLM的整體性能可能會受到語言模型的大小的嚴重限制

圖片

ChatGPT 的推理能力是否限制了最先進的VLM呢?答案為是的。

將GPT-4o分別用作感知和推理模塊進行解耦得到總體準確率為61%,與端到端GPT-4o性能61.6%幾乎相同。

語言模型對感知能力的影響

評估過程中觀察到當使用更大的語言模型時,LLaVA-v1.5 系列沒有顯示出顯著的改進。這表明當使用相對低分辨率的視覺主干時,感知性能可能與語言模型的大小無關

同時,LLaVA-NeXT 系列的定量結果表明,擴大語言模型會略微增強模型感知,特別是在使用問題相關指令時。其主要原因為:更精細的表達以及更適應于指令,如下圖例子所示:

圖片

消融實驗

團隊針對Prism中的通用指令,推理模塊LLM以及VLM視覺編碼器對感知能力的影響做了消融實驗,結果如下:

  • 通用指令:對人工手寫、GPT生成、思維鏈以及任務分解等不同類型指令的實驗結果表明,即使差距并不明顯,評估分析中所采用的指令是其中最有效的。
  • 推理模塊:比較不同的LLM推理模塊的結果顯示,ChatGPT在推理性能上表現(xiàn)良好,而GPT4則進一步提高了性能。開源模型 Llama3-70B-Instruct 表現(xiàn)出與GPT4相當?shù)哪芰Γ砻?strong>開源模型在視覺信息推理中的潛力。
  • 視覺編碼器:關于VLM中視覺編碼器對感知性能影響的實驗表明,SigLip-SO400M 相比于 CLIP ViT-L/14 和 InternViT-6B 在實驗基準上表現(xiàn)更好。

專注感知的輕量級視覺語言模型

團隊從分析的結果中得到啟發(fā),使用ALLaVA數(shù)據(jù)訓練了專注感知的輕量級VLM--PrismCaptioners ,并在Prism框架中與強大的LLM進行整合。

數(shù)據(jù)與架構

數(shù)據(jù)集

PrismCaptioners使用ALLaVA中的 ALLaVA-Caption-4V 和 Evol-Intruct-GPT4-Turbo-143K 作為指令調(diào)優(yōu)數(shù)據(jù)。與QA格式的指令調(diào)優(yōu)數(shù)據(jù)相比,利用描述性數(shù)據(jù)進行指令調(diào)優(yōu)可以更好地訓練VLM提取和表達視覺信息的能力。

模型架構

使用 SigLip-SO400M 作為視覺編碼器,InternLM2-[1.8B/7B] 作為語言編碼器,訓練了兩個不同尺度的視覺captioner,稱為 PrismCaptioner-[2B/7B]。

模型性能

團隊在MMStar, MMMU, MathVista,AI2D以及后三者的子集上進行了實驗。子集選取的策略類似于MMStar。將PrismCaptioner作為Prism感知模塊并接入ChatGPT或Llama3的性能表現(xiàn)如下表所示。公平起見,模型均使用單個圖像作為輸入,并將最大輸出長度限制為512。

圖片

通過Prism整合VLM與LLM的方式相比于基于LLaVA數(shù)據(jù)訓練的端到端baseline有顯著的性能提高。同時,PrismCaptioner相比于另一開源caption生成模型ShareCaptioner也有更好的效果。

圖片

對于7B版本,Llama3 的接入帶來大幅性能提升,使組合PrismCaptioner-7B的方案成為極具競爭力的視覺語言模型,特別是在 MMStar 和 MMMU 上。對于2B版本,接入Prism后,它實現(xiàn)了與其十倍以上大小 VLM 相當?shù)男阅芩健_@表明 Prism 能夠提供一個強大而高效的解決方案,例如帶有 ChatGPT 的 PrismCaptioner-2B,并展現(xiàn)了令人印象深刻的結果。

圖片

當最大輸出長度設置為2048,并允許多張圖像輸入時(為每張生成描述并拼接),接入Llama3的方案在MMMU上取得了更高的性能,在開源領域優(yōu)勢明顯,如下表所示:

圖片

此外,Prism允許靈活地結合多個VLM以增強感知。例如,簡單地將GPT-4v和GeminiPro-V的輸出拼接起來,即可在MMStar基準測試中的大多數(shù)指標上顯示出了顯著的改進,如下圖所示:

圖片

此外,他們還跟GPT-4o進行了一個對比,發(fā)現(xiàn)仍有一定的進步空間。GPT-4o在空間感知推理方面能力更強,描述的更為詳細和準確。

圖片

Prism框架的引入為視覺語言模型的研究和應用開辟了新途徑。

通過有效解耦感知和推理,Prism不僅能夠用于模型的分析和視覺語言任務的解決,還為未來的研究提供了新的方向。我們期待Prism在更多視覺語言任務中的應用,進一步推動這一領域的發(fā)展。

論文鏈接:
https://arxiv.org/abs/2406.14544

Github鏈接:
https://github.com/SparksJoe/Prism

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-09-22 09:06:00

模型開源

2025-04-11 12:10:33

2023-10-17 19:43:03

RACE排序數(shù)據(jù)

2024-01-17 13:59:00

AI開源

2025-06-05 11:49:21

AI模型數(shù)據(jù)

2017-03-27 15:07:15

云計算2BApp Store

2025-10-20 08:49:00

AI數(shù)據(jù)模型

2016-08-03 11:47:00

云計算

2025-06-09 09:32:35

2025-05-19 09:07:00

2023-01-05 09:33:37

視覺模型訓練

2023-09-23 12:50:39

AI訓練

2025-04-11 09:10:00

模型開源AI

2025-03-11 13:07:58

2025-05-16 09:10:00

2024-10-25 10:57:11

2020-07-15 09:29:23

Python開發(fā)工具

2021-12-31 09:34:22

PyTorchtransformer模型

2024-06-03 10:43:34

2024-03-04 13:36:00

模型訓練
點贊
收藏

51CTO技術棧公眾號

久久99国产精品久久99大师| av在线播放免费| 99视频精品免费观看| 亚洲天堂视频在线观看| 日本一区二区三区在线免费观看| 国产美女高潮在线| 国产精品毛片久久久久久| 成人亚洲激情网| 国产成人在线视频观看| 国产精品久久观看| 亚洲老头老太hd| 一级网站在线观看| 日本综合字幕| 亚洲成国产人片在线观看| 五月天久久狠狠| 色一情一乱一区二区三区| 卡一卡二国产精品| 欧美在线xxx| 麻豆视频在线观看| 精品久久久久久久| 精品不卡在线视频| 在线免费看污网站| 日本免费久久| 精品久久中文字幕| 欧美一级中文字幕| 午夜激情在线观看| 国产女主播在线一区二区| 精品无人区一区二区三区| 国产白浆在线观看| 久久国产人妖系列| 国产精品电影网站| 羞羞影院体验区| 国内揄拍国内精品久久| 久久久91精品国产| 成人黄色短视频| 欧美三级伦理在线| 亚洲美女性视频| 日本xxx在线播放| 超碰cao国产精品一区二区| 6080国产精品一区二区| www.久久久久久久久久久| 人人鲁人人莫人人爱精品| 午夜视频久久久久久| 成人国产一区二区三区| 麻豆电影在线播放| 中文字幕日韩av资源站| 亚洲视频精品一区| 888av在线| 国产精品乱码人人做人人爱| 日本一区二区三区四区在线观看| 人成免费电影一二三区在线观看| 91麻豆免费视频| 国内一区二区在线视频观看| 欧洲av在线播放| jlzzjlzz亚洲日本少妇| 久久www免费人成精品| 无码精品人妻一区二区| 91麻豆精品视频| 免费试看一区| av天在线观看| 中文字幕中文字幕一区二区| 在线观看欧美亚洲| 97超碰资源站在线观看| 亚洲综合视频在线观看| 亚洲精品久久久久久久蜜桃臀| av电影在线免费| 欧美性jizz18性欧美| 国产91在线视频观看| 午夜欧美巨大性欧美巨大 | 日韩影片中文字幕| 色综合久久中文综合久久97| 一区二区三区 日韩| 欧美综合社区国产| 日韩三级高清在线| 在线观看国产免费视频 | 中文字幕欧美人与畜| 青青青青在线| 亚洲一卡二卡三卡四卡五卡| jizzjizzxxxx| 久久天堂av| 欧美精品久久久久久久多人混战| 一级日本黄色片| 久久男人av| 亚洲一二在线观看| 小泽玛利亚一区二区免费| 好吊一区二区三区| 秋霞av国产精品一区| 中文字幕乱码人妻无码久久| 国产一区不卡在线| 美日韩免费视频| 在线激情小视频| 亚洲国产精品一区二区www| 粉嫩虎白女毛片人体| 成人激情久久| 亚洲欧美成人精品| 男女性高潮免费网站| 亚洲午夜极品| 国产精品久久国产精品99gif| av中文在线观看| 久久久久久久综合色一本| 在线精品亚洲一区二区| 国产直播在线| 在线不卡中文字幕播放| 性欧美丰满熟妇xxxx性久久久| 亚洲午夜久久| 色综合久综合久久综合久鬼88| 三级黄色在线视频| 老司机免费视频一区二区三区| 国产精品裸体一区二区三区| av大片在线看| 五月天一区二区| 91pony九色| 欧美极品中文字幕| 欧美第一黄网免费网站| 日韩乱码一区二区三区| 成人免费视频一区| 黄色免费高清视频| 日韩一区二区三区免费| 亚洲第一天堂av| 91免费公开视频| 日韩精品欧美成人高清一区二区| 国产精品一区二区av| 国产精品久久麻豆| 欧美午夜视频网站| 日本高清www| 91久久综合| 亚洲一区二区三区乱码aⅴ蜜桃女| 你懂的在线看| 精品久久久久久国产| 伊人成人免费视频| 99精品视频在线观看播放| 国产91在线播放精品91| 手机看片1024国产| 亚洲在线视频一区| 日本少妇xxx| 天天做天天爱综合| 国产日韩在线精品av| 在线免费观看黄色av| 色婷婷一区二区三区四区| 性欧美成人播放77777| 在线看片欧美| 国产精品一区二区不卡视频| 欧美性video| 精品美女在线观看| 九九九在线视频| 豆国产96在线|亚洲| 91传媒免费视频| 日韩精品成人在线观看| 久久久999精品| 91成人在线免费| 中文字幕在线观看一区| 国产精品嫩草影院8vv8| 国产精品久久久久蜜臀| 亚洲专区在线视频| 香蕉成人app免费看片| 欧美成人艳星乳罩| 国产一级视频在线观看| 不卡欧美aaaaa| 777av视频| 亚洲va久久| 国产精品久久久亚洲| 岛国最新视频免费在线观看| 欧美日韩精品一区二区| 天堂av免费在线| 国产一区二区精品久久| 日韩在线视频在线| 国内精品麻豆美女在线播放视频| 538国产精品一区二区免费视频| 日韩黄色影片| 欧美日韩二区三区| 人妻人人澡人人添人人爽| 粉嫩一区二区三区性色av| 日本韩国欧美在线观看| 欧洲福利电影| 91牛牛免费视频| xxx.xxx欧美| 亚洲色图欧美制服丝袜另类第一页| 欧美一区二区三区久久久| 中文字幕在线观看不卡| 韩国av中国字幕| 亚洲一区网站| 亚洲一区影院| 成人三级av在线| 国产成人综合av| 成人午夜在线影视| 亚洲精品国产精品乱码不99按摩 | 久久综合给合久久狠狠色| 搜成人激情视频| 不卡中文字幕av| 日本黄在线观看| 91精选在线观看| 欧美三级一区二区三区| 一区在线播放视频| 欧美做受喷浆在线观看| 久久精品国内一区二区三区| 国产91沈先生在线播放| 成人影院天天5g天天爽无毒影院| 97久久人人超碰caoprom欧美| 韩日成人影院| 九九热精品在线| 你懂的在线看| 精品久久久久久最新网址| 日韩在线视频不卡| 亚洲一区二区三区国产| 国产又黄又粗又猛又爽的 | 2019男人天堂| 成人avav影音| 激情文学亚洲色图| 久久一本综合频道| 99在线观看视频免费| 日韩欧美网址| 免费看污久久久| 国产精品x8x8一区二区| 国产欧美va欧美va香蕉在线| 在线成人av观看| 久久久亚洲国产| 成年人网站在线| 一区国产精品视频| 日本一卡二卡四卡精品| 日韩女同互慰一区二区| 91精品中文字幕| 91久久线看在观草草青青| 日韩欧美不卡视频| 一级特黄大欧美久久久| 久久久精品少妇| 国产精品欧美精品| 熟女高潮一区二区三区| 91玉足脚交白嫩脚丫在线播放| 日本一本在线视频| 久久 天天综合| 天堂在线资源视频| 免费在线欧美黄色| 成人性免费视频| 激情一区二区| 777久久精品一区二区三区无码| 91精品国产乱码久久久久久久 | 高清av在线| 亚洲欧美综合精品久久成人| 天堂av2024| 精品99一区二区三区| 亚洲av永久纯肉无码精品动漫| 91精品国产aⅴ一区二区| 亚洲综合精品国产一区二区三区 | av中文字幕观看| 欧美精品粉嫩高潮一区二区| 亚洲最大成人av| 欧美精品电影在线播放| 国产亲伦免费视频播放| 欧美久久久久免费| 国产精品免费无遮挡| 欧美电影一区二区三区| 国产高清免费观看| 欧美成人猛片aaaaaaa| 欧洲成人一区二区三区| 亚洲精品福利在线观看| 久久精品国产亚洲a∨麻豆| 亚洲裸体xxxx| 99中文字幕一区| 日日狠狠久久偷偷四色综合免费| 欧美性猛交xxx乱大交3蜜桃| 俺去了亚洲欧美日韩| 成人av免费| 韩国日本不卡在线| 韩国久久久久久| 国产一区二区香蕉| 国产精品99久久免费| 大波视频国产精品久久| 日本亚洲不卡| 日日骚一区二区网站| 香蕉精品视频在线观看| 国产精品久久久久久久久电影网| 亚洲国产国产亚洲一二三| 免费国产黄色网址| 老司机精品视频网站| 亚洲一区二区三区观看| 国产黄色91视频| 少妇被狂c下部羞羞漫画| 久久久www免费人成精品| 北条麻妃在线观看视频| 亚洲图片欧美视频| 国产精华7777777| 91精品国产日韩91久久久久久| 人妻精品无码一区二区| 亚洲午夜精品久久久久久久久久久久 | 国产真实乱子伦精品视频| 日本泡妞xxxx免费视频软件| 99久久精品免费看国产| 国产美女永久免费无遮挡| 1024成人网| 久久久久久久久久免费视频 | 欧美国产日本韩| 免费在线观看av网址| 欧美日韩一区二区在线| 91丨九色丨蝌蚪丨对白| 亚洲精品成人久久| 麻豆传媒在线完整视频| 欧美中文字幕视频| 精品国模一区二区三区欧美| 欧美福利精品| 欧美午夜在线视频| 我要看一级黄色大片| 成人教育av在线| 又色又爽的视频| 精品久久久久人成| 国产乱淫片视频| 亚洲欧洲黄色网| 亚洲电影视频在线| 国产精品久久久久久久久久久不卡 | 在线观看视频欧美| 色呦呦免费观看| 大胆欧美人体视频| av一区在线| 九9re精品视频在线观看re6 | 日韩免费毛片视频| 丁香婷婷深情五月亚洲| 黄色av免费播放| 日韩欧美在线网址| 女人18毛片水真多18精品| xxx一区二区| 美女色狠狠久久| 欧美日韩成人一区二区三区| 亚洲高清免费| 韩国三级在线播放| ㊣最新国产の精品bt伙计久久| 一级做a爰片久久毛片| 亚洲成人动漫在线播放| 国产网友自拍视频导航网站在线观看| 国产99久久精品一区二区 夜夜躁日日躁 | 欧美日韩国产综合一区二区 | 亚洲天天做日日做天天谢日日欢| 无码人妻精品一区二区| 日韩精品电影网| 国产精品13p| 国产一区二区三区色淫影院| 黄色av一区| 国产成人精品一区二区三区在线观看| 自拍偷拍国产精品| 一区二区三区精彩视频| 日韩在线中文视频| 亚洲狼人在线| 裸体裸乳免费看| 国内精品久久久久影院薰衣草| 国产又黄又粗又猛又爽的| 欧美精品一级二级三级| 成人黄色在线电影| 99re视频在线| 亚洲午夜精品久久久久久app| 伊人久久一区二区三区| 亚洲成av人片www| 少妇高潮一区二区三区99小说| 性色av一区二区三区在线观看| 任你弄精品视频免费观看| 亚洲 欧美 日韩 国产综合 在线 | 国精品人伦一区二区三区蜜桃| 欧美午夜在线一二页| 免费超碰在线| 91国产在线播放| 怡红院精品视频在线观看极品| av无码一区二区三区| 在线观看亚洲一区| 淫片在线观看| 成人在线观看网址| 在线视频亚洲| xxxxx在线观看| 欧美日韩高清不卡| 不卡一本毛片| 欧美日韩高清免费| 久久成人免费日本黄色| 免费一级全黄少妇性色生活片| 精品福利av导航| 91精品韩国| 在线无限看免费粉色视频| 成人午夜免费av| 999视频在线| 欧美成人午夜激情视频| 欧美1区2区3区4区| 无码人妻精品一区二区三区66| 最新国产の精品合集bt伙计| 日韩一级中文字幕| 日韩美女中文字幕| 婷婷综合在线| 精品一区二区视频在线观看| 欧美性大战xxxxx久久久| 最爽无遮挡行房视频在线| 国产精品一区视频网站| 蜜臀av一区二区在线观看 | 欧美日韩精选| 国产熟妇久久777777| 欧美一区永久视频免费观看| 综合日韩av| 欧美日韩一级在线| 26uuu国产一区二区三区 | 日韩国产中文字幕| 人人精品久久| 日本日本19xxxⅹhd乱影响| 国产精品久久久久精k8| 亚洲日本在线播放| 91久久中文字幕| 久久aⅴ乱码一区二区三区| 男人的天堂久久久|