精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

高效評估多模態預訓練對齊質量,中科大提出模態融合率MIR

人工智能 新聞
來自中科大等單位的研究團隊共同提出了用來有效評估多模態大模型預訓練質量的評估指標 Modality Integration Rate(MIR),能夠快速準確地評估多模態預訓練的模態對齊程度。

本文作者來自于中國科學技術大學,上海人工智能實驗室以及香港中文大學。其中第一作者黃啟棟為中國科學技術大學三年級博士生,主要研究方向包括多模態大模型(MLLM)和可信 / 高效 AI,師從張衛明教授。

是否還在苦惱如何評估自己預訓練好的多模態 LLM 的性能?是否還在使用并不靠譜的損失 Loss,困惑度 Perplexity(PPL),上下文 In-Context 評估,亦或是一遍遍地通過有監督微調(SFT)之后下游測試基準的分數來判斷自己的預訓練是否有效?

來自中科大等單位的研究團隊共同提出了用來有效評估多模態大模型預訓練質量的評估指標 Modality Integration Rate(MIR),能夠快速準確地評估多模態預訓練的模態對齊程度。

圖片


  • 標題:Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate
  • 論文:https://arxiv.org/abs/2410.07167
  • 代碼:https://github.com/shikiw/Modality-Integration-Rate

研究背景

預訓練(Pre-training)是現有多模態大模型(MLLM)在訓練過程中一個不可或缺的階段。不同于大型語言模型(LLM)的預訓練,多模態預訓練的主要目標聚焦于不同模態之間的對齊。隨著近兩年的發展,多模態預訓練已經從輕量級圖像 - 文本對的對齊,發展為基于廣泛多樣的多模態數據進行深層次模態集成,旨在構建更通用的多模態大模型。

然而,多模態預訓練的評估對于業界仍然是一個未被充分解決的挑戰。現有最常用的評估手段為通過進一步的有監督微調(SFT)來測試在下游基準上的模型能力,但是其伴隨的計算成本和復雜性不容忽視。另外有一些方法通過借用 LLM 的預訓練評估指標,包括損失值 Loss、困惑度 PPL 和上下文 In-Context 評估等方式,在多模態預訓練評估中都被證明是不穩定和不可靠的。

研究者們通過在不同規模的高質量預訓練數據上預訓練 LLaVA-v1.5 的 7B 模型,用上述不同的方法評估其預訓練質量,并與有監督微調之后在下游測試基準上的得分進行對照。如下圖所示,損失值 Loss、困惑度 PPL、以及上下文 In-Context 評估都無法準確的對應 SFT 之后在下游測試基準上的模型性能,而本文提出的模態融合率 MIR 則能完美對應。

圖片

實際上,PPL 等指標的不適用主要由于 LLM 與 MLLM 在預訓練目標上的差異。LLM 預訓練主要學習建模語言的基本模式,而 MLLM 預訓練則側重于縮小不同模態之間的差距。如果用多個不同來源的圖像和文本數據,并在 LLaVA-v1.5 的大模型輸入層去可視化它們的特征分布,會發現盡管圖像或文本內容多樣,但在每種模態內,它們的分布相對均勻,而模態之間則存在明顯的分布差距,如下圖(左)所示。

圖片

如上圖(右)所示,通過進一步計算現有 MLLM 的在大模型不同層中的模態差距,會觀察到淺層的時候仍然有較大差距,但當到越來越深的層,這一差距逐漸縮小,這表明 MLLM 在訓練過程中仍需要學習對齊不同分布,以理解新引入的模態。

技術方案

本文提出模態融合率 MIR,能夠用于評估多模態預訓練的跨模態對齊質量。該指標能準確反映各種預訓練配置(如數據、策略、訓練配方和架構選擇)對模型性能的影響,而無需再進行有監督微調 SFT 并于下游測試基準上評估。

對于一個預訓練的多模態大模型 M = (E, P, D),其中 E 表示視覺編碼器,P 表示視覺語言映射模塊,D = (D_t, F) 表示包含分詞器 D_t 和 K 層 transformer 的底座大模型 F。當輸入一組 “圖像 - 文本” 對 {v_n, t_n}, n = 1,..., N 給模型,會從大模型第 k 層 F_k 得到該層關于數據對 {v_n, t_n} 的視覺 token 特征 f_k^{v_n} 和文本 token 特征 f_k^{t_n},即

圖片

研究者們將多個樣本的特征 f_k^{v_n} 合并到一起得到 f_k^v,同理 f_k^{t_n} 可以合并得到 f_k^t,并且定義 f_{k, i}^v 為第 i 個視覺 token 特征,f_{k, j}^t 為第 j 個語言 token 特征。

文本中心歸一化

由于越深層的 token 特征在數值絕對尺度上明顯比淺層的大,并且不同模態特征間在絕對尺度上存在差異,直接使用 Frechet 距離等度量函數、或是把所有 token 特征統一歸一化后再使用度量函數都是不合適的。為此,研究者們設計了一種文本中心的歸一化方法,對于 f_k^t 中的總共 s 個文本 token 特征,計算尺度因子:

圖片

然后對第 k 層對應的視覺特征和文本特征都使用該因子進行放縮,在保證跨層對比合理性的同時,保持模態間絕對尺度帶來的差異。

離群值篩除

許多工作如 StreamLLM [1]、Massive Activations [2] 都提到,有極少部分絕對數值異常大的 token 會用來在注意力模塊的 SoftMax 計算中使總和填充到 1。為了避免此類離群值對整體統計分布的影響,這里使用 “3-sigma” 的準則對于所有 f_k^v 和 f_k^t 中的離群值進行篩除。以下用 omega 表示這個操作。

模態融合率

在經過文本中心歸一化以及離群 token 篩除之后,模態融合率 MIR 可以通過累和大模型逐層的模態域間距離來得到:

圖片

其中,mu_{v, k} 和 mu_{t, k} 分別是處理后視覺 token 特征和文本 token 特征的均值,而

圖片

對應于各自的協方差計算。最后的平方根項通常在 PyTorch 中計算緩慢,這是由于大模型的特征維度普遍較高。因此研究者們使用 Newton-Schulz 迭代近似的方式估計該項,在大大提高計算速度的同時,保證實踐中誤差不超過 1%。總體上來看,越低的 MIR 代表著越高的預訓練模態對齊質量。

可學習模態校準

在對 MIR 的探究推導過程中,證明了底座大模型在訓練過程中展現出的在淺層逐漸縮小模態間差距的傾向。這促使研究者們重新思考多模態大模型中一些繼承自大型語言模型的設計是否不利于促進跨模態對齊。為此,研究者們提出了 MoCa,一個可插拔輕量級的可學習模塊,來促進跨模態對齊。簡單來說,即對于每一層的視覺 token 特征單獨進行一個可學習的縮放和偏移:

圖片

其中縮放向量 u 初始化為全一向量,偏移向量 v 初始化為全 0 向量,兩者隨著模型一起訓練,但是基本不增加額外參數量。

實驗探究

研究者們首先展示了 MIR 在在擴大預訓練數據規模時衡量預訓練質量的有效性。這里采用兩種預訓練策略:1) 僅訓練 MLP 投影模塊;2) 解鎖視覺編碼器后半部分和整個 LLM。在第一種策略下,SFT 后的性能在 800K~1M 數據規模時逐漸改善但趨于飽和。而在使用第二種策略時,即使在 1.8M 數據規模下,性能仍持續顯著提升。該結果說明了了 MIR 在擴大預訓練數據時的有效性,也說明了適當地放開視覺編碼器或 LLM 在大規模數據上有持續改善預訓練的效果。

圖片

研究者們也探究了 MIR 在超參數調整、預訓練策略選擇上的有效性。在超參數調整方面,研究者們發現 MIR 與 SFT 后下游測試基準性能之間存在正相關,這說明 MIR 直接反映不同訓練超參數對于在預訓練質量的影響,以后對照 MIR 就可以實現預訓練調參煉丹!

圖片

在訓練策略方面,研究者們探討了 MIR 如何指導選擇有效的預訓練放開策略。結果顯示,放開 LLM 顯著降低了 MIR,且顯著增強下游基準上的表現。

圖片

同時,MIR 也可以幫助選擇一些有利于跨模態對齊的模塊設計。如下圖所示,當使用不同的視覺語言投影模塊結構時,MIR 可以很準確的對應到 SFT 之后的測試基準性能。

圖片

同樣,所提出的可學習模態校準 MoCa 也可以有效幫助不同模型在下游測試基準上漲點,并取得更低的 MIR。

圖片

本文仍有較多其他方面的實驗和探索,有興趣的同學可以參考原文!

責任編輯:張燕妮 來源: 機器學習
相關推薦

2023-12-04 13:23:00

數據訓練

2025-04-15 09:22:00

AI訓練模型

2021-12-06 09:53:09

自然語言神經網絡人工智能

2023-10-30 15:06:00

模型數據

2022-09-01 16:58:52

DTW算法鴻蒙

2024-11-13 09:39:13

2025-03-13 09:47:29

2022-02-28 10:31:22

人工智能視覺檢測

2025-05-26 09:41:26

2025-01-13 03:00:00

模型數據訓練

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2024-05-27 07:21:43

2025-04-07 00:00:00

多模態大模型

2025-04-08 09:00:00

AI模型數據

2024-12-09 10:15:00

AI技術

2025-04-01 09:32:00

模型訓練AI

2024-03-25 12:30:18

AI訓練開源

2022-03-08 09:15:29

人工智能語音識別模型

2025-02-26 13:00:00

2023-11-09 15:10:00

訓練數據
點贊
收藏

51CTO技術棧公眾號

狂野欧美性猛交xxxx巴西| 麻豆视频久久| 欧美国产乱子伦| 亚洲自拍中文字幕| 久久国产精品免费看| 精品视频久久| 欧美精品一区二区三区一线天视频| 国产肥臀一区二区福利视频| 成a人v在线播放| 国内精品久久久久影院色| 国模私拍一区二区三区| 国产在线综合视频| 爱高潮www亚洲精品| 欧美丝袜丝交足nylons| 日b视频免费观看| 高h视频在线| 成人性生交大片免费看中文网站 | 88xx成人永久免费观看| 亚洲欧美日韩久久| 欧美午夜精品久久久久久蜜| 国产色在线视频| 日韩精品一级中文字幕精品视频免费观看 | 久久97超碰国产精品超碰| 中文国产成人精品久久一| 伊人久久一区二区三区| 欧美aaaaaa| 好吊成人免视频| 亚洲小视频在线播放| 国产三级视频在线播放线观看| 国产+成+人+亚洲欧洲自线| 国产精品扒开腿做爽爽爽男男 | 男人天堂av电影| 中文无码日韩欧| 欧美精品第1页| 三年中国国语在线播放免费| 免费一二一二在线视频| 亚洲综合一区在线| 午夜久久久久久久久久久| 国产高清在线| 久久久五月婷婷| 久久精品久久精品国产大片| 高清国产mv在线观看| 国产精品911| 成人福利网站在线观看11| 日韩国产成人在线| 性娇小13――14欧美| 久久久欧美精品| 久久久久香蕉视频| 欧美视频一区| 欧美精品在线观看91| 日韩一级片大全| 老司机精品福利在线观看| 日本激情一区二区三区| 成人h精品动漫一区二区三区| 91黄色精品| www.av黄色| 国产盗摄女厕一区二区三区| av成人观看| 黄色av一区二区三区| 成人av电影在线网| 国产综合欧美在线看| 天天色天天操天天射| 91尤物视频在线观看| 欧美激情专区| 在线视频自拍| 亚洲日本韩国一区| 一本大道东京热无码aⅴ| 青青草原av在线| 五月婷婷激情综合| 日韩av片在线看| 韩国精品主播一区二区在线观看 | 亚洲激情在线播放| 久草免费福利在线| 亚洲国产欧美日本视频| 欧美视频精品在线| 国产乱码一区二区三区四区| 伊人精品综合| 亚洲欧美另类在线观看| 国产又粗又猛又爽又黄的视频四季 | 亚洲午夜久久久久中文字幕久| 99精品视频网站| 女子免费在线观看视频www| 天天综合色天天| 日韩亚洲在线视频| **日韩最新| 亚洲激情自拍图| 女人黄色一级片| 这里只有精品在线| 98精品国产自产在线观看 | 日韩精品一级二级| 成人中文字幕+乱码+中文字幕| 性一交一乱一色一视频麻豆| 91社区在线播放| 中文字幕在线亚洲精品| a国产在线视频| 欧美三级蜜桃2在线观看| 无套内谢丰满少妇中文字幕| 天堂成人娱乐在线视频免费播放网站| 中文字幕v亚洲ⅴv天堂| 欧美精品乱码视频一二专区| 久久性天堂网| www日韩av| 成人免费视频| 性做久久久久久免费观看| 日韩亚洲在线视频| 成人18夜夜网深夜福利网| 国产亚洲精品久久久久久777| 国产性一乱一性一伧一色| 久久夜色精品| 国产精品一区二区三区不卡| 香港伦理在线| 性做久久久久久免费观看欧美| 久久久久久久久久一区二区| 中文字幕亚洲影视| 久久久久亚洲精品| 伊人影院中文字幕| xnxx国产精品| 成人午夜免费在线| 国产精品久一| 在线观看久久av| 日韩乱码人妻无码中文字幕| 经典一区二区三区| 日韩亚洲视频在线| 小草在线视频免费播放| 精品国产一区二区三区久久久蜜月 | 国产精品21p| 国产精品一区二区三区网站| 日韩亚洲视频| 免费观看欧美大片| 精品99一区二区| 国产大片免费看| 免费精品视频最新在线| 欧美1o一11sex性hdhd| 波多野结衣视频一区二区| 日韩欧美国产一区二区在线播放 | 国产精品88久久久久久| 日本一区二区三区四区视频| 天天干天天做天天操| 一区二区三区在线高清| 欧美激情国内自拍| 91日韩欧美| 91精品久久久久久久久久久久久久| 欧美zozo| 在线观看亚洲a| 精品人妻一区二区三区蜜桃视频| 亚洲一区二区三区免费在线观看 | 国产精品丝袜久久久久久高清| 女人偷人在线视频| 欧美三级xxx| 自拍偷拍中文字幕| 久久综合图片| 日韩色妇久久av| 日本一区二区三区中文字幕| 国产亚洲精品日韩| 亚洲熟女乱色一区二区三区久久久 | 婷婷中文字幕在线观看| 久久美女视频| 国产精品自拍偷拍| 免费在线午夜视频| 9191久久久久久久久久久| 911国产在线| 国产综合色在线| 久久久久久av无码免费网站下载| 日本精品视频| 亚洲18私人小影院| 欧美色综合一区二区三区| 色又黄又爽网站www久久| 欧美福利第一页| 精品一区二区久久久| 日本黄网站色大片免费观看| 97久久综合精品久久久综合| 久久久免费观看视频| 神马久久久久| 欧美色视频一区| 免费黄色激情视频| 国产999精品久久| 欧美a在线视频| 日本一区二区在线看| 成人午夜在线观看| 爱福利在线视频| 国产一区二区三区在线免费观看| 一卡二卡在线观看| 亚洲成av人综合在线观看| 美国黄色a级片| 久久99久久99小草精品免视看| 中国黄色录像片| 三级小说欧洲区亚洲区| 国产精品视频xxxx| 久久一卡二卡| 在线观看免费高清视频97| 亚洲AV无码一区二区三区少妇| 激情成人在线视频| 亚洲人做受高潮| 99久久精品免费看国产免费软件| 黄色aaa级片| 伊人精品在线| 这里只有精品66| 日韩aaa久久蜜桃av| 成人黄色在线观看| 涩涩在线视频| 欧美猛少妇色xxxxx| 你懂的在线网址| 欧美成人一级视频| 国产99久久久久久免费看| 一区二区三区91| 大又大又粗又硬又爽少妇毛片| 国产精品资源站在线| 欧美一级片中文字幕| 黄色欧美成人| 在线观看欧美一区| 免费久久久久久久久| 电影午夜精品一区二区三区| 成人免费毛片嘿嘿连载视频…| 8x拔播拔播x8国产精品| 成人在线观看亚洲| 伊人久久大香线蕉av一区二区| 黄色一级大片在线免费看国产| 精品视频1区2区3区| 99久热在线精品996热是什么| 亚洲欧美日韩国产综合在线| 人妻互换一区二区激情偷拍| 久久这里只有精品首页| 亚洲成年人av| 国产精品伊人色| 精品亚洲一区二区三区四区| 国产欧美日韩综合一区在线播放 | 日韩欧美中文字幕一区| 这里只有久久精品视频| 欧美日韩一二三四五区| 久久9999久久免费精品国产| 亚洲精品videosex极品| 日本激情视频一区二区三区| 日本一区二区三区在线观看| 一二三不卡视频| 2023国产精品自拍| 奇米777第四色| 国产1区2区3区精品美女| 又黄又爽又色的视频| 精品一区二区三区久久久| 久久人人爽av| 精品一区二区三区在线视频| 亚洲综合av在线播放| 久久91精品久久久久久秒播| 国产成人美女视频| 精品亚洲国内自在自线福利| 亚洲最大天堂网| 国产自产高清不卡| 永久看看免费大片| 国产精品一区二区无线| 日批视频免费看| 成人午夜视频在线| 手机免费看av片| av在线综合网| 黄色片视频免费观看| 91女神在线视频| 西西444www无码大胆| 欧美国产精品v| 永久免费看片视频教学| 亚洲激情校园春色| 久久午夜鲁丝片午夜精品| 亚洲福利一区二区三区| 中日韩黄色大片| 日本韩国一区二区三区| 中文字幕视频二区| 正在播放亚洲一区| 亚洲av色香蕉一区二区三区| 亚洲精品在线观看网站| 无码精品一区二区三区在线| 亚洲欧洲激情在线| 亚洲1卡2卡3卡4卡乱码精品| 另类少妇人与禽zozz0性伦| 污的网站在线观看| 97av视频在线| 播放一区二区| 成人亚洲激情网| 国产+成+人+亚洲欧洲在线| 国产亚洲精品美女久久久m| 偷拍一区二区| 在线观看免费91| 亚洲美女黄色| 中文字幕国产免费| 粉嫩一区二区三区性色av| 免费观看av网站| 亚洲欧美电影一区二区| 亚洲日本韩国在线| 欧美日韩精品电影| 黄片毛片在线看| 中文字幕av日韩| 欧美1—12sexvideos| 国产精品27p| 波多野结衣在线一区二区 | 伊人青青综合网| 亚洲欧洲日产国码无码久久99| 免费成人av在线播放| 折磨小男生性器羞耻的故事| 国产亚洲欧美在线| 麻豆视频在线观看| 色综合视频在线观看| 亚洲AV无码精品自拍| 伊人av综合网| 大香伊人中文字幕精品| 国产精品一久久香蕉国产线看观看| 视频精品国内| 亚洲欧美精品| 亚洲综合电影一区二区三区| 男插女视频网站| 国产精品美女久久久久久久网站| www.youjizz.com亚洲| 欧美日韩小视频| 亚洲av成人精品毛片| 欧美多人爱爱视频网站| av在线播放一区| 精品免费国产| 国精品一区二区| 三级性生活视频| 欧美激情一区二区在线| 亚洲精品www久久久久久| 欧美一区二区大片| 91xxx在线观看| 国产盗摄xxxx视频xxx69| 久久精品亚洲成在人线av网址| 日本美女爱爱视频| 日本美女一区二区三区| 91视频免费观看网站| 亚洲国产成人av好男人在线观看| 国产孕妇孕交大片孕| 国产小视频91| 桃花岛成人影院| 久久福利电影| 亚洲黄色视屏| 成年人小视频在线观看| 亚洲乱码国产乱码精品精可以看| 在线观看中文字幕2021| 国产亚洲精品久久久| 亚洲电影有码| 日韩欧美电影一区二区| 天堂蜜桃一区二区三区| 黑人巨大精品欧美| 欧美午夜宅男影院在线观看| 五月婷婷在线播放| 午夜精品理论片| 免费成人蒂法| 六月丁香婷婷激情| www欧美成人18+| 无码人妻久久一区二区三区 | 黄a在线观看| 成人免费淫片aa视频免费| 国产精品久久久久无码av| 国产精品一区二区小说| 国产精品国产三级国产aⅴ入口 | 日本免费成人| 黄色www在线观看| 国产精品一区二区在线观看不卡 | 99国产在线视频| 欧美三区在线| 亚洲啪av永久无码精品放毛片 | 久久人人爽人人爽爽久久| 久久天堂影院| 懂色av粉嫩av蜜臀av| 国产一区二区导航在线播放| a级片在线观看免费| 日韩久久精品一区| 国产伦理精品| 欧美下载看逼逼| 久久99最新地址| 亚洲av鲁丝一区二区三区| 欧美成人精品高清在线播放| 在线天堂新版最新版在线8| 色999五月色| 国产自产视频一区二区三区| 黄色小说在线观看视频| 亚洲欧美日韩图片| 亚洲成人毛片| 日本一本中文字幕| 久久久久久久av麻豆果冻| 日本一区二区三区久久| 久久综合国产精品台湾中文娱乐网 | 综合自拍亚洲综合图不卡区| 99精品免费观看| 亚洲2020天天堂在线观看| 欧美日韩第一| 无人码人妻一区二区三区免费| 亚洲国产裸拍裸体视频在线观看乱了| 天天综合网在线| 国产精品一区二区久久精品| 欧美特黄视频| 国产中年熟女高潮大集合| 91精品福利在线一区二区三区| 91九色在线播放| 亚洲欧美日韩另类精品一区二区三区| 国产一区二区伦理| 91video| 欧美成人免费小视频| 一本色道久久综合亚洲精品酒店 | av电影在线观看不卡| 少妇无套内谢久久久久| 欧美激情视频播放| 日韩欧美高清在线播放| 国产草草浮力影院| 91精品国产综合久久香蕉的特点 |