精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態訓練后模型能力雪崩,上海AI Lab全面探索MLLM偏好對齊與模態融合

人工智能 新聞
MLLM的回復質量下降可能是因為經過了多模態數據訓練之后,LLM本身的能力退化。

在實際應用過程中,閉源模型(GPT-4o)等在回復的全面性、完備性、美觀性等方面展示出了不俗的表現。

與之相反的是,在General VQA任務上表現最好的開源模型(如InternVL2-78B)在面對開放式、需要知識儲備的問題時,表現不盡人意:

圖片InternVL2-78B和GPT-4o在回復的完備性和美觀性上有較大差距

上述現象引發了上海交大、上海AI Lab等聯合團隊的思考。

他們首先猜測:MLLM的回復質量下降可能是因為經過了多模態數據訓練之后,LLM本身的能力退化

因此分別測試了多個主流開源模型在主流的純語言對齊Benchmark(AlignBench/AlpacaEval2/ArenaHard)上的性能:

圖片得分由Qwen2.5-72B進行judge

結果顯示,經過多模態訓練的大語言模型在語言主觀基準上的性能簡直可以用雪崩來形容。

既然如此,那是不是說,在多模態數據中加入更多更好的語言數據就可以了呢?團隊又進一步做了如下實驗:

采用LLaVA框架,使用最新的語言模型Internlm2.5-7B作為base,用LLaVANext-780k高質量多模態數據作為Baseline。已知在LLaVANext-780k中,包含40k左右的來自ShareGPT的數據。

由于ShareGPT年代較為久遠,所以選擇了最新的兩個開源語言sft數據集,Magpie-LLaMA3.3以及Condor。將原始的ShareGPT數據分別更換為Magpie以及Condor進行了實驗,并在語言對齊基準、多模態對齊基準(WildVison)、General VQA基準(MMVet/MMBench/AI2D/OCRBench)上進行了全面評測:

圖片為了展示性能差異,此處AlpacaEval2和Arenahard的結果均與GPT3.5進行對比

加入了高質量的語言數據之后,模型在語言基準上的能力確實提升了;但是,無論是多模態主觀對齊還是普通VQA任務,都出現了性能下降的情況。

因此推測:語言數據對多模態對齊能力的影響是十分有限的,在General VQA任務以外,仍然需要帶有開放式問題以及完備回答的多模態訓練數據。

Dataset Construction

基于以上觀察,當前的多模態數據過于看重VQA任務的能力,因此數據面臨答案過于簡短、單一,缺少對預訓練知識的運用與理解的問題。基于以上觀點以及從純語言數據組成中吸取的經驗,團隊提出多模態數據還應包含以下特點:

  1. 開放式,創造性,需要預訓練知識的問題。
  2. 全面,完備,美觀,符合指令跟隨的回答。

基于以上兩點提出了OmniAlign-V數據構建Pipeline:

圖片Pipeline of OmniAlign-V

根據圖片場景,首先將圖片分為自然圖片(Natural)以及信息圖片(Infographic)。鑒于希望得到包含豐富信息的數據,因此首先對自然圖片進行了圖像復雜度以及物體種類數目的兩輪篩選,確保篩選出的圖片具有豐富的語義信息。

其次,將Natural圖片分為Knowledge/Creation/Inferential三類任務,將信息圖片分為Chart/Diagram/Poster/Art四類任務,對不同任務分別應用對應的精心設計的Pipeline以及GPT-4o生成對話數據。而后,對Knowledge/Inferential/Chart分別應用不同的后處理優化,增強了Inferencial和Chart數據的完備性和準確性,在Knowledge基礎上額外添加了Instruction-Following指令,將其作為Instruction-Following任務。最終,OmniAlign-V-SFT包含了205k高質量的多模態數據。

團隊發現OmniAlign-V-SFT中的回復質量較高,很適合作為DPO數據中的positive sample。因此通過對LLaVANext-Internlm2.5-7B模型的輸出應用reject sampling,得到了對應的negative sample,并由此生成了OmniAlign-V-DPO數據集。

此外還發現當前缺少高質量的多模態主觀對齊基準。當前的基準當中面臨圖像質量差,問題模糊/多樣性差等問題。因此構建了MM-AlignBench多模態對齊基準。從經過預篩選的3000+張圖片中人工挑選了252張分布多樣且高質量的圖片,每張圖片以及對應的問題都經過人工審查,確保圖片和任務問題的多樣性以及準確性,合理性。

圖片

實驗結果

在LLaVA/LLaVA-Next上分別采用Internlm2.5-7B/Qwen2.5-32B進行了實驗,并在三個多模態對齊基準以及五個主流VQA基準上進行了評測,結果如下:

圖片SFT多模態評測結果

可以看出,在添加了OmniAlign-V-SFT數據集后,MLLM在三個多模態對齊基準上的表現均有大幅提升;并且在多個General VQA Benchmark上均有不同程度的漲點,尤其是在MMVet和MMMU上漲點十分顯著;LLaVANext-Qwen2.5-32B甚至在MMVet和MMMU上分別增加了+9.2和+5.5。這有力驗證了OmniAlign-V數據集的有效性。

此外還發現,經過OmniAlign-V-SFT訓練后,模型在語言對齊基準上也有一定程度的上漲:

圖片

△SFT語言評測結果

這也驗證了,當添加部分高質量的多模態對齊數據后,能夠有效減少LLM在多模態訓練當中面臨的語言能力退化問題。

此外,采用OmniAlign-V-DPO進行DPO訓練后,模型的對齊能力進一步增強:

圖片DPO實驗結果

實驗結果顯示,當模型完全沒有接受長上下文類似的數據訓練時,在DPO階段應用OmniAlign-V-DPO并不能顯著地提升模型的對齊;而對于經過高質量長上下文訓練的模型而言,OmniAlign-V-DPO可以進一步顯著激發模型的對齊能力。尤其是在經過大規模訓練的開源模型(InternVL2-8B)上,模型的性能提升尤其明顯。

MM-AlignBench已經支持到VLMEvalkit,用于在多個MLLM上進行快捷評測。團隊測試了當前主流MLLM在MM-AlignBench上的結果:

圖片

MM-AlignBench Leaderboard

經過SFT+DPO數據后,LLaVANext-OA-32B-DPO的對齊性能提升明顯,在MMAlignBench上的性能已經超越了QwenVL2-72B。

與此同時也可以看出,即使是QwenVL2-72B和InternVL2-78B,在MMAlignBench上的表現距離閉源模型(GPT/Gemini/Claude Series)也有較大的差距

進一步對MM-AlignBench和其他General VQA Benchmark計算相關度,SRCC score如下所示:

圖片

MM-AlignBench與其他基準的相關性統計

可以發現,MM-AlignBench 與現有的多模態評測基準(如 MMBench、OCRBench 等 VQA Benchmark)之間的相關性極低,但卻與 MMMU 表現出極高的相關性。作為一項涵蓋大量跨學科任務的評測基準,MMMU 對模型的知識先驗深度和廣度提出了極高的要求。盡管 MMMU 采用選擇題形式,答案具有唯一正確解,而 MM-AlignBench 則以開放式問答為主,兩者的題型設計存在顯著差異,但它們所考察的核心能力卻高度相似。這一現象表明,MM-AlignBench 不僅覆蓋了廣泛的任務領域,還深入挖掘了模型在知識先驗上的表現,進一步驗證了其評測維度的全面性與挑戰性。

Future Work

上述研究不僅深入探討了多模態大語言模型的對齊能力,更引發了作者團隊對一個核心問題的全新思考:

究竟什么才是通向真正模態融合的正確路徑?在多模態微調過程中,大語言模型往往會面臨一個棘手的問題——語言能力的“災難性遺忘”。然而,像GPT-4o等閉源模型卻能夠成功實現文本與圖像模態的深度融合,充分釋放其龐大的預訓練語言知識潛能。這背后的技術路線究竟是如何設計的?又是怎樣做到如此高效且精準的模態融合的?

這些問題無疑為我們指明了未來探索的重要方向。

Paper: https://arxiv.org/abs/2502.18411
Github: https://github.com/PhoenixZ810/OmniAlign-V

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-07 00:00:00

多模態大模型

2024-11-04 13:30:00

模型AI

2024-10-25 14:30:00

模型AI

2025-10-20 09:02:00

2025-01-08 08:21:16

2024-11-13 09:39:13

2024-05-21 07:54:30

視頻多模態語義檢索算法

2025-09-16 10:28:57

2025-06-03 08:22:00

模型評估視頻

2025-05-21 08:47:00

2025-09-16 09:35:52

2024-12-09 08:15:43

2024-12-30 00:01:00

多模態大模型Python

2022-09-01 16:58:52

DTW算法鴻蒙

2025-07-29 08:40:00

模型AILLM

2024-05-10 06:59:06

2023-06-08 11:32:00

模型論文

2024-08-30 12:58:43

AI多模態技術

2024-12-12 00:25:09

點贊
收藏

51CTO技術棧公眾號

一区二区三区四区视频| 亚洲国产va精品久久久不卡综合| 日韩美女写真福利在线观看| 国产真实乱人偷精品人妻| 日本免费成人| 亚洲高清三级视频| 亚洲一区二区高清视频| 国精品人妻无码一区二区三区喝尿| 久久久久综合| 欧美国产视频日韩| 国产传媒国产传媒| 国产图片一区| 在线成人午夜影院| 激情综合在线观看| 最新超碰在线| 国产精品丝袜黑色高跟| 国产在线欧美日韩| 国产精品欧美久久久久天天影视 | 国产丝袜一区二区三区| www.成人黄色| 视频在线日韩| 精品国产精品自拍| 日韩中文字幕亚洲精品欧美| 你懂的在线观看| 高清成人免费视频| 91理论片午午论夜理片久久| 亚洲综合久久网| 亚洲午夜av| 久久人人爽人人爽人人片亚洲| www.久久av| 精品国产午夜肉伦伦影院| 91精品国产综合久久香蕉的特点 | 亚洲国产中文字幕久久网| 天堂av.com| 日韩女同强女同hd| 一级日本在线| 成人高清av在线| 成人高清在线观看| 99这里有精品视频| 久久精品国产精品亚洲综合| 国产成人精品一区二区| 欧美精品一二三四区| 国产欧美在线| 2021国产精品视频| 在线观看免费国产视频| 亚洲性图久久| 亚洲2020天天堂在线观看| 欧美又粗又大又长| 女人天堂亚洲aⅴ在线观看| xxxx性欧美| 欧美大片xxxx| 自拍日韩欧美| 欧美激情二区三区| 久久中文字幕无码| 一本不卡影院| 秋霞午夜一区二区| 狠狠狠狠狠狠狠| 日精品一区二区三区| 国产精品91在线| 国产免费www| 蜜臂av日日欢夜夜爽一区| 国产精品你懂得| 一卡二卡三卡在线| 韩日av一区二区| 不卡一区二区三区视频| 日韩一级片免费| 久久亚洲精品国产精品紫薇| 四虎影院一区二区三区| 免费日本一区二区三区视频| 亚洲免费在线播放| 福利在线一区二区| 九九色在线视频| 在线国产亚洲欧美| 99国产精品久久久久久| 亚洲不卡在线| 日韩久久免费电影| 国产精品无码无卡无需播放器| 99久久婷婷| 久久久久久久久久国产| 91porny在线| 中文字幕永久免费视频| 模特精品在线| 91视频国产精品| 欧美性猛交 xxxx| 国产亚洲精品bt天堂精选| 亚洲在线播放电影| 成人福利电影| 欧美视频一区在线观看| wwwxxxx在线观看| 亚洲国产合集| 久久在线免费观看视频| 久久免费激情视频| 激情综合网激情| 蜜桃臀一区二区三区| 在线国产情侣| 天天亚洲美女在线视频| 中文字幕av不卡在线| 911精品国产| 中文字幕自拍vr一区二区三区| 免费在线黄色片| 日韩电影免费在线看| 99精彩视频| 成人免费在线视频网| 亚洲成人一区在线| 一级做a免费视频| 亚洲人成网站77777在线观看| 久久亚洲一区二区三区四区五区高| 中文字幕亚洲精品在线| 国产一区二区中文字幕| 日韩av不卡播放| 成人免费图片免费观看| 日韩一级免费一区| 人人妻人人澡人人爽| 影音先锋一区| 亚洲伊人成综合成人网| av在线二区| 日韩欧美在线免费| 影音先锋资源av| 仙踪林久久久久久久999| 热久久99这里有精品| 蜜臀久久99精品久久久| 亚洲欧美一区二区三区孕妇| 五月婷婷之综合激情| 思热99re视热频这里只精品| 国模精品系列视频| 国产视频一区二区三区四区五区| 国产欧美日韩不卡| 97视频在线免费播放| 丰满人妻一区二区三区53视频| 亚洲一区二区免费在线观看| 久久精品亚洲国产| 在线观看你懂的网站| 91伊人久久大香线蕉| 国产免费裸体视频| 日本亚洲视频| 久久福利视频导航| 国产免费高清av| 中文字幕色av一区二区三区| 91视频免费版污| 精品freesex老太交| 日产精品99久久久久久| 噜噜噜噜噜在线视频| 色婷婷综合久久久中文一区二区 | 欧美在线观看www| av自拍一区| 欧美极品在线播放| 成人无码一区二区三区| 一区二区日韩av| 欧美一级片在线免费观看| 欧美日韩国产免费观看| 99在线影院| 国产乱码在线| 亚洲激情视频在线| 亚洲影院在线播放| 国产欧美一区二区精品久导航| 美女黄色片视频| 三级电影一区| 亚洲aⅴ日韩av电影在线观看| 国产三区视频在线观看| 日韩一级二级三级| 欧美成人aaaaⅴ片在线看| av在线播放成人| 毛片av免费在线观看| 成人激情诱惑| 亚洲aaa激情| 高清在线视频不卡| 日韩国产欧美精品一区二区三区| 黄色片中文字幕| 国产精品毛片久久久久久久| 天天久久综合网| 亚洲黄色天堂| 日韩福利一区二区三区| 亚洲欧洲日韩精品在线| 久久久久日韩精品久久久男男 | 中文字幕9999| 国产乱淫a∨片免费视频| 一区二区三区在线高清| www.xxxx精品| 99热这里是精品| 精品久久久久久久久久久久久久 | 国内精品久久久久久久久久久| 一区av在线播放| 久久亚洲AV成人无码国产野外| 蜜桃91丨九色丨蝌蚪91桃色| 欧美日韩视频免费| 女人丝袜激情亚洲| 亚洲a一级视频| 亚洲v.com| 久久精品国产99国产精品澳门 | 成人性生交大片| 亚洲综合在线网站| 欧美fxxxxxx另类| 久久久久久国产精品一区| 色999久久久精品人人澡69| 欧美第一淫aaasss性| 九九热视频在线观看| 91精品国产91久久久久久最新毛片| 日韩污视频在线观看| 国产精品二三区| 中文字幕一二三四区| 国产精品一区在线| wwwxxx黄色片| 亚洲福利专区| 一区二区三视频| 日韩高清成人在线| 亚洲综合小说区| 成人看片网页| 久久全球大尺度高清视频| 中文日本在线观看| 精品亚洲一区二区三区在线播放| 国产一区二区三区四区视频| 欧美日韩在线影院| 久草免费新视频| 亚洲欧洲三级电影| www.av天天| 91美女福利视频| 美女伦理水蜜桃4| 国产综合色视频| 欧美午夜aaaaaa免费视频| 一区二区三区国产在线| 成人性做爰片免费视频| 日韩中文首页| 午夜精品电影在线观看| 台湾亚洲精品一区二区tv| 成人精品水蜜桃| 成人污版视频| 国产精品青青在线观看爽香蕉| 中文在线最新版地址| 蜜乳av综合| 国产精品视频导航| 日韩成人影音| 欧美怡红院视频一区二区三区| 久久香蕉av| 欧美成aaa人片在线观看蜜臀| 午夜视频在线观看免费视频| 综合久久五月天| 户外极限露出调教在线视频| 精品无码久久久久久国产| 农村少妇久久久久久久| 精品国产在天天线2019| 国产黄频在线观看| 日韩一区二区三区在线视频| 国产精品一级二级| 在线不卡中文字幕播放| 91精品国自产| 在线观看91精品国产麻豆| 亚洲天天综合网| 欧美麻豆精品久久久久久| 一卡二卡三卡在线观看| 67194成人在线观看| 97人妻人人澡人人爽人人精品 | 2019中文字幕在线观看| 麻豆国产在线| 国产成人精品一区二区在线| www.精品国产| 成人免费网视频| 国产不卡精品在线| 97在线资源站| 精品久久对白| 蜜桃在线一区二区三区精品| 欧美精品系列| 伊人久久大香线蕉综合75| 亚洲成av人电影| www.夜夜爱| 亚洲精品日韩久久| 亚洲国产精品毛片av不卡在线| 玖玖玖国产精品| 成人综合久久网| 国产成人av电影在线播放| 日本69式三人交| 国产午夜精品美女毛片视频| 四虎地址8848| 亚洲国产aⅴ成人精品无吗| 免费观看一区二区三区毛片| 在线中文字幕一区| 97在线视频人妻无码| 精品久久久久久综合日本欧美| 天堂在线视频免费观看| 伊人久久大香线蕉av一区二区| 欧美尤物美女在线| 久久免费国产精品1| 黑人巨大精品欧美一区二区桃花岛| 国产精品看片资源| 亚洲天堂中文字幕在线观看| 欧美精品与人动性物交免费看| 日本一区二区高清不卡| 8x8ⅹ国产精品一区二区二区| 成人国产综合| 日韩人在线观看| 久久精品一级片| 色综合久久天天综合网| 国产又粗又猛又爽| 亚洲国产中文字幕在线观看 | 美女精品久久久| 亚洲风情在线资源| 91午夜理伦私人影院| 婷婷五月色综合香五月| 午夜在线视频免费观看| 久久成人亚洲| 91精品人妻一区二区三区蜜桃2| 国产亚洲一区二区三区| 久久久久久久久久久久久久久久久| 色av综合在线| 狠狠人妻久久久久久综合麻豆| 中国人与牲禽动交精品| a级大胆欧美人体大胆666| 成人免费在线视频网站| 亚洲人亚洲人色久| 妞干网视频在线观看| 久久99久久久欧美国产| 毛片网站免费观看| 亚洲国产成人精品视频| 国产又黄又粗又硬| 亚洲色图第一页| 999av小视频在线| 亚洲最大的av网站| 欧美最新另类人妖| 亚洲中文字幕无码专区| 成人精品视频一区二区三区尤物| 美女三级黄色片| 欧美三级三级三级爽爽爽| 欧美一区二区在线观看视频| 爱福利视频一区| 成人在线免费av| 亚洲成色www久久网站| 性高湖久久久久久久久| 国产精品一区二区人妻喷水| 亚洲激情图片小说视频| 国产又粗又猛又色又| 色偷偷偷综合中文字幕;dd| 午夜精品久久久久久久久久蜜桃| 精品国产乱码久久久久久郑州公司| 欧美精品自拍| 麻豆传媒在线看| 亚洲免费观看高清完整版在线 | 亚洲精品一区二| 石原莉奈在线亚洲二区| 欧美成人国产精品一区二区| 色就色 综合激情| 香港一级纯黄大片| 91av视频导航| 中文字幕伦av一区二区邻居| 久久久一本二本三本| 97se亚洲国产综合在线| 天天做天天爱夜夜爽| 日韩麻豆第一页| 日韩漫画puputoon| 一区二区三视频| 国产精品资源站在线| 欧美人与禽zozzo禽性配| 日韩欧美一区在线观看| 伊人影院蕉久影院在线播放| 亚洲成人av电影| 亚洲区自拍偷拍| 日本韩国精品在线| 三区四区电影在线观看| 国产日产久久高清欧美一区| 视频在线不卡免费观看| 色综合五月婷婷| 亚洲激情图片qvod| 欧美综合视频在线| 欧美在线免费视频| av伊人久久| 8x8x成人免费视频| 一区二区三区 在线观看视频| 亚洲风情第一页| 97视频国产在线| 国产永久精品大片wwwapp| 午夜宅男在线视频| 一二三区精品视频| 日韩av地址| 91精品免费看| av不卡免费看| 人成免费在线视频| 日韩一区二区在线看| 国产社区精品视频| 亚州欧美一区三区三区在线| 紧缚奴在线一区二区三区| 国产亚洲第一页| 亚洲人成电影网站色www| 日韩三级一区| 日本韩国欧美在线观看| 国产精品伦一区二区三级视频| 国产成a人亚洲精v品无码| 午夜美女久久久久爽久久| 欧美日韩一二三四| 日韩av福利在线观看| 精品美女国产在线| 人人干在线视频| 久久精品国产99精品国产亚洲性色| 免费人成精品欧美精品| 国产亚洲成人av| 中文字幕日韩电影| 欧美交a欧美精品喷水| 亚洲视频一二三四| 无吗不卡中文字幕| 超碰caoporn久久| 日本视频一区二区不卡| 国产精品69毛片高清亚洲| 中文字幕日韩免费|