精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容

發(fā)布于 2025-2-27 12:41
瀏覽
0收藏

OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference

2025-02-25|SJTU, Shanghai AI Lab, NJU, FDU, ZJU|??54

???http://arxiv.org/abs/2502.18411v1????
????https://huggingface.co/papers/2502.18411????
????https://github.com/PhoenixZ810/OmniAlign-V???

研究背景與意義

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

隨著多模態(tài)大語言模型(MLLMs)的快速發(fā)展,現(xiàn)有的研究主要集中在提升模型的基礎能力,如物體識別、OCR等,而在與人類偏好對齊方面存在顯著差距。這種對齊的缺失直接影響了多模態(tài)對話交互中的用戶體驗。本文提出的OmniAlign-V數(shù)據(jù)集,旨在通過提供高質(zhì)量、多樣化的訓練樣本,顯著提升MLLMs與人類偏好的對齊能力。此外,本文還引入了MM-AlignBench,一個專門設計用于評估MLLMs與人類價值觀對齊能力的高質(zhì)量基準。

研究方法與創(chuàng)新

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

OmniAlign-V數(shù)據(jù)集的核心創(chuàng)新在于其多樣化的任務設計和高質(zhì)量的數(shù)據(jù)生成流程。首先,數(shù)據(jù)集將圖像分為自然圖像和信息圖表兩大類,并為每類圖像設計了不同的任務類型,如知識問答、推理任務和創(chuàng)造性任務。其次,通過圖像篩選策略,確保所選圖像具有豐富的語義信息,從而生成更具挑戰(zhàn)性和多樣性的問答對。

在數(shù)據(jù)生成過程中,OmniAlign-V采用了多階段的生成和優(yōu)化流程。對于自然圖像,使用GPT-4生成多樣化的問答對,并通過后處理步驟進一步優(yōu)化答案的質(zhì)量。對于信息圖表,設計了專門的提示詞,確保生成的問答對能夠深入挖掘圖像中的信息。此外,OmniAlign-V還引入了指令增強的知識問答,通過將復雜指令融入問題中,進一步提升模型的對齊能力。

實驗設計與結(jié)果分析

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

實驗結(jié)果表明,使用OmniAlign-V進行微調(diào)的MLLMs在多個基準測試中表現(xiàn)顯著提升。特別是在MM-AlignBench和WildVision等人類偏好對齊基準上,模型的性能得到了大幅改善。此外,OmniAlign-V在保持模型基礎能力的同時,進一步提升了其在復雜問答任務中的表現(xiàn)。

通過對比實驗,OmniAlign-V在多個任務類型上的表現(xiàn)均優(yōu)于現(xiàn)有的數(shù)據(jù)集。例如,在知識問答任務中,OmniAlign-V生成的問答對不僅涵蓋了廣泛的主題,還通過指令增強的方式提升了模型的指令遵循能力。在創(chuàng)造性任務中,OmniAlign-V通過多樣化的任務設計,顯著提升了模型在生成創(chuàng)意內(nèi)容方面的表現(xiàn)。

結(jié)論與展望

OmniAlign-V的引入為提升MLLMs與人類偏好的對齊能力提供了新的解決方案。通過多樣化的任務設計和高質(zhì)量的數(shù)據(jù)生成流程,OmniAlign-V顯著提升了模型在復雜問答任務中的表現(xiàn)。未來的研究可以進一步探索如何將OmniAlign-V與其他多模態(tài)數(shù)據(jù)集結(jié)合,以進一步提升模型的泛化能力和對齊效果。

此外,MM-AlignBench的引入為評估MLLMs的對齊能力提供了新的基準。通過精心設計的圖像和問題,MM-AlignBench能夠更全面地評估模型在真實世界場景中的表現(xiàn)。未來的工作可以進一步擴展MM-AlignBench的規(guī)模和多樣性,以覆蓋更多的應用場景和任務類型。

Introducing Visual Perception Token into Multimodal Large Language Model

2025-02-24|NUS|??5

???http://arxiv.org/abs/2502.17425v1????
????https://huggingface.co/papers/2502.17425????
????https://github.com/yu-rp/VisualPerceptionToken???

研究背景與意義

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

在當今的多模態(tài)大語言模型(MLLM)領(lǐng)域,視覺信息的處理能力直接影響模型在空間推理、細粒度理解等任務中的表現(xiàn)。然而,現(xiàn)有的MLLM系統(tǒng)缺乏自主控制其視覺感知過程的能力,例如無法選擇性地審查圖像的特定區(qū)域或聚焦于與特定對象類別相關(guān)的信息。這種局限性導致模型在處理復雜視覺任務時,往往依賴于手動設計的流程,限制了其在實際應用中的靈活性和效率。

本文提出的“視覺感知標記”(Visual Perception Token)概念,旨在賦予MLLM一種機制,使其能夠自主控制視覺感知過程。通過設計兩種類型的視覺感知標記——區(qū)域選擇標記(Region Selection Token)和視覺重編碼標記(Vision Re-Encoding Token),MLLM可以像生成文本一樣生成這些標記,并利用它們觸發(fā)額外的視覺感知動作。這一創(chuàng)新不僅提升了模型在空間推理和細粒度理解任務中的表現(xiàn),還為MLLM在視覺信息處理中的自主性開辟了新的研究方向。

研究方法與創(chuàng)新

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

本文的核心創(chuàng)新在于引入了視覺感知標記,使MLLM能夠自主控制其視覺感知過程。具體來說,區(qū)域選擇標記能夠明確識別圖像中需要進一步感知的特定區(qū)域,而視覺重編碼標記則利用其隱藏狀態(tài)作為控制信號,引導額外的視覺感知過程。這兩種標記的引入,使得MLLM在處理視覺信息時,能夠更加靈活和精準。

區(qū)域選擇標記區(qū)域選擇標記通過將圖像劃分為若干單元格,并使用這些單元格的索引來描述需要進一步感知的區(qū)域。這種方法避免了直接使用像素坐標的復雜性,簡化了模型的訓練過程。具體來說,模型生成一組區(qū)域選擇標記,指示圖像中需要裁剪的區(qū)域,然后將裁剪后的圖像重新輸入模型進行進一步處理。這種方法在處理文檔理解、OCR相關(guān)任務時尤為有效,因為它能夠直接提高圖像的分辨率,從而提升任務表現(xiàn)。

視覺重編碼標記視覺重編碼標記則通過觸發(fā)額外的視覺編碼器(如DINO或SAM模型)來重新編碼原始圖像,并將生成的視覺特征與原始視覺特征結(jié)合,輸入到MLLM中。視覺重編碼標記的隱藏狀態(tài)作為控制信號,能夠精細地控制最終輸入到語言模型的嵌入序列。這種方法在處理需要多次視覺感知的任務時,表現(xiàn)出顯著的優(yōu)勢。

訓練數(shù)據(jù)與模型架構(gòu)為了訓練MLLM使用視覺感知標記,本文構(gòu)建了一個包含829k樣本的訓練數(shù)據(jù)集,涵蓋了通用視覺問答(General VQA)、細粒度視覺問答(Fine-Grained VQA)、空間推理(Spatial Reasoning)和文本/OCR相關(guān)視覺問答(Text/OCR-Related VQA)等任務。模型架構(gòu)方面,本文在標準的MLLM基礎上,增加了額外的視覺編碼器和投影器,使得模型能夠處理視覺重編碼標記生成的額外視覺特征。

實驗設計與結(jié)果分析

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

MLLMs人類偏好增強對齊,自然圖像和數(shù)據(jù)圖表分離;視覺感知標記,模型自主決定感知內(nèi)容-AI.x社區(qū)

本文通過一系列實驗驗證了視覺感知標記的有效性。實驗結(jié)果表明,引入視覺感知標記后,2B參數(shù)的模型在多個任務中的表現(xiàn)顯著提升,甚至超過了7B參數(shù)的基線模型。具體來說,在空間推理和細粒度視覺問答任務中,2B+VPT模型的性能分別提升了34.6%和32.7%。此外,視覺感知標記在零樣本設置下也表現(xiàn)出色,進一步證明了其泛化能力。

實驗結(jié)果在通用視覺問答任務中,2B+VPT模型的表現(xiàn)與7B模型相當,但在空間推理和細粒度視覺問答任務中,2B+VPT模型顯著優(yōu)于7B模型。例如,在CUB-200-2011數(shù)據(jù)集上,2B+VPT模型的性能提升了20.7%。此外,在處理低分辨率圖像時,2B+VPT模型的表現(xiàn)也優(yōu)于7B模型,證明了視覺感知標記在不同分辨率下的有效性。

案例分析通過具體案例的分析,本文展示了視覺感知標記在處理復雜視覺任務時的優(yōu)勢。例如,在處理文檔理解任務時,區(qū)域選擇標記能夠精確定位圖像中的小區(qū)域(如簽名、頁腳等),從而顯著提升OCR任務的準確性。在處理空間推理任務時,視覺重編碼標記能夠通過多次視覺感知,增強模型對空間關(guān)系的理解。

結(jié)論與展望

本文提出的視覺感知標記為MLLM在視覺信息處理中的自主性提供了新的解決方案。通過區(qū)域選擇標記和視覺重編碼標記,MLLM能夠更加靈活和精準地處理視覺信息,顯著提升了其在空間推理、細粒度理解等任務中的表現(xiàn)。未來的研究方向可以進一步探索視覺感知標記在其他多模態(tài)任務中的應用,以及如何通過更復雜的控制機制,進一步提升MLLM的視覺感知能力。

此外,本文的實驗結(jié)果表明,視覺感知標記在處理低分辨率圖像時也表現(xiàn)出色,這為在資源受限環(huán)境下的應用提供了新的可能性。未來的工作可以進一步優(yōu)化視覺感知標記的訓練過程,探索如何在不增加模型參數(shù)的情況下,進一步提升其性能。

總之,視覺感知標記的引入為MLLM在視覺信息處理中的自主性開辟了新的研究方向,具有廣泛的應用前景。

本文轉(zhuǎn)載自 ??AI研究前瞻??,作者: 胡耀淇

收藏
回復
舉報
回復
相關(guān)推薦
欧美—级a级欧美特级ar全黄| 综合电影一区二区三区| 日本人成精品视频在线| 亚洲午夜精品久久久久久高潮| av福利导福航大全在线| 成人三级在线视频| 国产精品网红福利| 国产无码精品一区二区| 日韩成人a**站| 亚洲成av人影院在线观看| 超碰影院在线观看| 你懂的在线观看视频网站| 久久国内精品视频| 91精品国产自产91精品| 日本一级片免费| 日本欧美高清| 日韩欧美国产电影| 天美星空大象mv在线观看视频| 三级av在线| 国产乱子伦视频一区二区三区 | 日本美女高清在线观看免费| 国产高清成人在线| 国产精品久久久久秋霞鲁丝| 色www亚洲国产阿娇yao| 欧美wwwsss9999| 91精品国产色综合久久久蜜香臀| 久久精品国产亚洲7777| xx欧美撒尿嘘撒尿xx| 888av在线| 成人免费毛片片v| 成人久久精品视频| 国产乡下妇女三片| 91精品国产91久久综合| 亚洲天堂影视av| 久久一区二区电影| heyzo欧美激情| 欧美电影精品一区二区| 五月丁香综合缴情六月小说| 国产淫片在线观看| 国产精品毛片大码女人| 日本一区二区三区在线视频| 91影院在线播放| 麻豆成人综合网| 国产精品久久久久久久久久99| 日韩精品一区二区三区在线视频| 国产成人av毛片| 欧美成人综合网站| 欧美精品自拍视频| 国产尤物视频在线| 久久新电视剧免费观看| 精品国产综合久久| 无码h黄肉3d动漫在线观看| 国产jizzjizz一区二区| 成人自拍视频网站| 午夜精品久久久久久久99热黄桃| 亚洲专区免费| 久久成人av网站| √天堂中文官网8在线| 日韩高清三区| 国产婷婷97碰碰久久人人蜜臀| 午夜大片在线观看| 欧美日韩中出| 亚洲电影免费观看高清| 潘金莲激情呻吟欲求不满视频| japanese色国产在线看视频| 亚洲一区免费观看| 国产视频九色蝌蚪| 国产一区二区三区朝在线观看| 亚洲一级二级在线| 天天夜碰日日摸日日澡性色av| 秋霞影院午夜丰满少妇在线视频| 91视频.com| 欧美日韩亚洲综合一区二区三区激情在线 | 欧美在线色图| 日韩在线播放av| 欧美日韩免费一区二区| 欧美3p在线观看| 美女性感视频久久久| 欧美精品成人久久| 亚洲欧美偷拍自拍| 国内精品久久久久久久| 欧美日韩人妻精品一区二区三区| 99久久www免费| 欧美精品在线播放| √天堂中文官网8在线| 日本大胆欧美| 色综合久久久888| 欧美性猛交bbbbb精品| 久热成人在线视频| 成人做爰66片免费看网站| 少妇性bbb搡bbb爽爽爽欧美| 中文字幕+乱码+中文字幕一区| 91成人性视频| 久久久久久无码精品大片| 午夜亚洲性色视频| 国产在线视频2019最新视频| 免费观看成年人视频| 国产人成一区二区三区影院| 日韩av高清在线播放| 中文字幕伦理免费在线视频| 欧美日韩一区二区精品| 激情文学亚洲色图| 久久97视频| 欧美人与性动交a欧美精品| 无码人妻av一区二区三区波多野| 久久婷婷麻豆| http;//www.99re视频| 亚洲第一精品网站| 欧美激情一区二区三区在线| 在线码字幕一区| 成人黄色网址| 亚洲五码中文字幕| 蜜桃福利午夜精品一区| 天美av一区二区三区久久| 亚洲男女性事视频| 色屁屁草草影院ccyy.com| 在线不卡视频| 国产又爽又黄的激情精品视频| 亚洲视屏在线观看| 99视频在线精品| 日韩福利二区| 精品极品在线| 欧美大片一区二区三区| 美国一级片在线观看| 日本视频免费一区| 久久亚洲精品欧美| 成人bbav| 在线一区二区三区四区五区| 欧美在线观看www| 日韩欧美中文字幕在线视频 | 日色在线视频| 国产精品免费久久久久| 99久久激情视频| 欧美黑人巨大videos精品| 欧美黑人极品猛少妇色xxxxx| 国产三级av片| av成人动漫在线观看| 国产小视频免费| 免费看日产一区二区三区| 久久精品免费播放| 国产三级第一页| 亚洲视频一区二区在线| 天堂av8在线| 99久久婷婷| 成人在线小视频| 精品麻豆一区二区三区| 欧美日韩在线视频一区二区| 偷偷色噜狠狠狠狠的777米奇| 欧美亚洲高清| 国产精品影院在线观看| 亚洲免费视频一区二区三区| 欧美日韩国产123区| 美女av免费看| 激情伊人五月天久久综合| 亚洲欧美日产图| 日韩三级一区| 欧美大成色www永久网站婷| 精品人妻一区二区三区浪潮在线| 久久亚洲捆绑美女| 免费看a级黄色片| 日韩dvd碟片| 成人日韩在线电影| 午夜av在线免费观看| 精品久久久久久久久久久久久久久| 日韩一级片在线免费观看| 免费观看30秒视频久久| 91免费网站视频| 日本综合精品一区| 97成人精品区在线播放| 亚洲精品视频网| 午夜激情一区二区| 亚洲久久久久久久| 国产在线精品免费| 蜜臀av无码一区二区三区| 日韩精品欧美大片| 国产剧情日韩欧美| 丁香花在线高清完整版视频| 亚洲欧美色婷婷| 国产成人精品白浆久久69| 亚洲成a人片在线不卡一二三区 | 99久久婷婷国产综合精品电影 | 精品伦精品一区二区三区视频密桃| 久久国产免费| 在线观看一区二区三区三州| 加勒比久久高清| 久久久久久成人精品| av男人天堂av| 欧美午夜无遮挡| 黄色录像二级片| 91老师片黄在线观看| 九九热免费在线观看| 狠狠入ady亚洲精品| 日韩成人在线资源| 激情av综合| 国产日韩欧美一二三区| 都市激情国产精品| 久久视频国产精品免费视频在线| 国产精品久久婷婷| 欧美午夜激情在线| 亚洲午夜精品久久久久久高潮| 日韩成人一级大片| 丝袜人妻一区二区三区| 欧美久久精品| 91久久中文字幕| 亚洲大胆人体大胆做受1| 亚洲免费电影一区| 最近中文在线观看| 亚洲成人av在线电影| www.天天射.com| 欧美天堂亚洲电影院在线观看 | 成人知道污网站| 国产精品欧美一区二区| 日本成a人片在线观看| 日韩精品久久久久久久玫瑰园 | 日韩电影免费在线看| 青草视频在线观看视频| 婷婷综合社区| 亚洲成人午夜在线| 欧美专区视频| 国产精品视频免费在线观看| 中中文字幕av在线| 自拍偷拍亚洲欧美| 精品无吗乱吗av国产爱色| 亚洲国产精品推荐| 中文字幕在线观看视频网站| 91视频免费看| 在线中文字日产幕| 石原莉奈在线亚洲三区| 免费超爽大片黄| 香蕉久久精品| 国产91精品最新在线播放| 麻豆mv在线看| 91国内揄拍国内精品对白| 欧美jizzhd欧美| 在线丨暗呦小u女国产精品| 九九热视频在线观看| 亚洲精品在线视频| 日韩欧美亚洲系列| 亚洲欧美日韩高清| 男女污污视频在线观看| 欧美一区二区三区日韩| 99久久99久久久精品棕色圆| 3atv一区二区三区| 波多野结衣 久久| 欧美日韩中文在线观看| 免费黄色网址在线| 色视频成人在线观看免| 激情综合五月网| 亚洲制服欧美中文字幕中文字幕| 日本xxxxxxxxx18| 国产色产综合色产在线视频 | 国产超碰在线播放| 日韩影院在线观看| 韩国日本美国免费毛片| 日韩高清国产一区在线| www.com黄色片| 国产最新精品免费| 日本成人在线免费| 暴力调教一区二区三区| 99久久国产精| 国产日韩欧美麻豆| 青青草视频播放| 久久蜜桃一区二区| 中文字幕伦理片| 亚洲另类色综合网站| 国产视频三区四区| 亚洲欧洲精品天堂一级| 免费中文字幕视频| 色综合久久88色综合天天6| 亚洲图片在线播放| 在线观看av一区二区| 国产一区二区三区成人| 日韩精品资源二区在线| 亚洲日本在线播放| 中文字幕欧美亚洲| heyzo在线欧美播放| 国产成人精品久久久| 亚洲精品88| xxxxx91麻豆| dy888亚洲精品一区二区三区| 伊人久久久久久久久久久久久| 亚州男人的天堂| 日韩在线观看网址| av免费观看一区二区| 久久精品人人爽| 麻豆视频在线看| 欧美在线视频a| 日日夜夜亚洲| 久久精品丝袜高跟鞋| 我不卡手机影院| 亚洲美免无码中文字幕在线| 六月婷婷色综合| 玖草视频在线观看| 亚洲欧美经典视频| 97人妻一区二区精品视频| 精品成人私密视频| 午夜伦理在线| 日本精品免费观看| youjizz亚洲| 中文字幕综合在线观看| 免费在线亚洲| 久草福利在线观看| 国产精品资源| 日本一二三四区视频| 2023国产精品自拍| 中文字幕另类日韩欧美亚洲嫩草| 亚洲精选免费视频| 久久久久在线视频| 精品国产一二三区| 黄色网页在线免费看| 国产精品18久久久久久首页狼| 亚洲欧美在线人成swag| 免费影院在线观看一区| 欧美午夜影院| 91pony九色| 中文字幕精品三区| 青青草激情视频| 欧美日韩久久一区| 免费av在线电影| 4438全国亚洲精品在线观看视频| 99久久久国产精品免费调教网站| 亚洲v日韩v综合v精品v| 欧美色图一区| 日韩人妻无码精品久久久不卡| 性久久久久久| 玖玖爱在线精品视频| 亚洲一区在线看| 国产一级片av| 国产午夜精品久久久 | 亚洲综合资源| 国产精品视频一区二区三区经| 国产成人影院| 欧美a在线视频| 91一区二区三区在线观看| www.天天色| 亚洲第一网中文字幕| av人人综合网| 精品久久久久亚洲| 99热精品在线| 中文字幕在线免费看线人| 国产欧美日韩精品a在线观看| av女人的天堂| 色就色 综合激情| 国产私拍精品| 国产美女搞久久| 91日韩欧美| 黄色片免费网址| 亚洲精品国产无套在线观| 色黄久久久久久| 色老头在线一区二区三区| 精品国产乱码久久久久久郑州公司 | 在线视频国产区| 99国内精品久久久久久久软件| 精品国产一区二区三区久久久蜜臀| 天天爱天天做天天操| 久久狠狠一本精品综合网| www.17c.com喷水少妇| 天天av天天翘天天综合网色鬼国产| 国产精品玖玖玖| 久久6免费高清热精品| 成午夜精品一区二区三区软件| 一区二区三区在线视频看| 国产一区在线观看麻豆| 劲爆欧美第一页| 91精品国产91久久综合桃花| 91麻豆一二三四在线| 国产伦精品一区二区三区高清版| 亚洲成人av| 一级黄色片毛片| 91国产视频在线观看| 免费观看在线午夜影视| 成人18视频| 久久精品一区二区国产| jizzjizz日本少妇| 精品国产亚洲在线| 中文字幕资源网在线观看| 精品乱子伦一区二区三区| 日韩激情视频在线观看| 日本黄色录像视频| 亚洲国产精品推荐| 国产精品久久久久久久久久齐齐| 欧美一区二区三区在线免费观看| 国产精品综合色区在线观看| 日本欧美一区二区三区不卡视频| 日本黄色一区二区| 精华区一区二区三区| 91亚洲国产精品| 另类av一区二区| 卡通动漫亚洲综合| 国产视频久久久| 日韩黄色av| av污在线观看| 亚洲v精品v日韩v欧美v专区| 成人在线免费视频| 国产高清精品一区二区三区| 日本最新不卡在线| 日韩欧美a级片| 亚洲精品日韩在线| 精品伊人久久| 亚洲欧美另类动漫|