精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

蘋果大模型MM1殺入場:300億參數、多模態、MoE架構,超半數作者是華人

人工智能 新聞
蘋果也在搞自己的大型多模態基礎模型,未來會不會基于該模型推出相應的文生圖產品呢?我們拭目以待。

今年以來,蘋果顯然已經加大了對生成式人工智能(GenAI)的重視和投入。此前在 2024 蘋果股東大會上,蘋果 CEO 蒂姆?庫克表示,今年將在 GenAI 領域實現重大進展。此外,蘋果宣布放棄 10 年之久的造車項目之后,一部分造車團隊成員也開始轉向 GenAI。

如此種種,蘋果向外界傳達了加注 GenAI 的決心。目前多模態領域的 GenAI 技術和產品非常火爆,尤以 OpenAI 的 Sora 為代表,蘋果當然也想要在該領域有所建樹。

今日,在一篇由多位作者署名的論文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,蘋果正式公布自家的多模態大模型研究成果 —— 這是一個具有高達 30B 參數的多模態 LLM 系列。

圖片

論文地址:https://arxiv.org/pdf/2403.09611.pdf

該團隊在論文中探討了不同架構組件和數據選擇的重要性。并且,通過對圖像編碼器、視覺語言連接器和各種預訓練數據的選擇,他們總結出了幾條關鍵的設計準則。具體來講,本文的貢獻主要體現在以下幾個方面。

首先,研究者在模型架構決策和預訓練數據選擇上進行小規模消融實驗,并發現了幾個有趣的趨勢。建模設計方面的重要性按以下順序排列:圖像分辨率、視覺編碼器損失和容量以及視覺編碼器預訓練數據。

其次,研究者使用三種不同類型的預訓練數據:圖像字幕、交錯圖像文本和純文本數據。他們發現,當涉及少樣本和純文本性能時,交錯和純文本訓練數據非常重要,而對于零樣本性能,字幕數據最重要。這些趨勢在監督微調(SFT)之后仍然存在,這表明預訓練期間呈現出的性能和建模決策在微調后得以保留。

最后,研究者構建了 MM1,一個參數最高可達 300 億(其他為 30 億、70 億)的多模態模型系列, 它由密集模型和混合專家(MoE)變體組成,不僅在預訓練指標中實現 SOTA,在一系列已有多模態基準上監督微調后也能保持有競爭力的性能。

具體來講,預訓練模型 MM1 在少樣本設置下的字幕和問答任務上,要比 Emu2、Flamingo、IDEFICS 表現更好。監督微調后的 MM1 也在 12 個多模態基準上的結果也頗有競爭力。

得益于大規模多模態預訓練,MM1 在上下文預測、多圖像和思維鏈推理等方面具有不錯的表現。同樣,MM1 在指令調優后展現出了強大的少樣本學習能力。 

圖片

圖片

方法概覽:構建 MM1 的秘訣

構建高性能的 MLLM(Multimodal Large Language Model,多模態大型語言模型) 是一項實踐性極高的工作。盡管高層次的架構設計和訓練過程是清晰的,但是具體的實現方法并不總是一目了然。這項工作中,研究者詳細介紹了為建立高性能模型而進行的消融。他們探討了三個主要的設計決策方向:

  • 架構:研究者研究了不同的預訓練圖像編碼器,并探索了將 LLM 與這些編碼器連接起來的各種方法。
  • 數據:研究者考慮了不同類型的數據及其相對混合權重。
  • 訓練程序:研究者探討了如何訓練 MLLM,包括超參數以及在何時訓練模型的哪些部分。

消融設置

由于訓練大型 MLLM 會耗費大量資源,研究者采用了簡化的消融設置。消融的基本配置如下:

  • 圖像編碼器:在 DFN-5B 和 VeCap-300M 上使用 CLIP loss 訓練的 ViT-L/14 模型;圖像大小為 336×336。
  • 視覺語言連接器:C-Abstractor ,含 144 個圖像 token。
  • 預訓練數據:混合字幕圖像(45%)、交錯圖像文本文檔(45%)和純文本(10%)數據。
  • 語言模型:1.2B 變壓器解碼器語言模型。

為了評估不同的設計決策,研究者使用了零樣本和少樣本(4 個和 8 個樣本)在多種 VQA 和圖像描述任務上的性能:COCO Cap tioning 、NoCaps 、TextCaps 、VQAv2 、TextVQA 、VizWiz 、GQA 和 OK-VQA。

模型架構消融試驗

研究者分析了使 LLM 能夠處理視覺數據的組件。具體來說,他們研究了(1)如何以最佳方式預訓練視覺編碼器,以及(2)如何將視覺特征連接到 LLM 的空間(見圖 3 左)。

  • 圖像編碼器預訓練。在這一過程中,研究者主要消融了圖像分辨率和圖像編碼器預訓練目標的重要性。需要注意的是,與其他消融試驗不同的是,研究者本次使用了 2.9B LLM(而不是 1.2B),以確保有足夠的容量來使用一些較大的圖像編碼器。
  • 編碼器經驗:圖像分辨率的影響最大,其次是模型大小和訓練數據組成。如表 1 所示,將圖像分辨率從 224 提高到 336,所有架構的所有指標都提高了約 3%。將模型大小從 ViT-L 增加到 ViT-H,參數增加了一倍,但性能提升不大,通常不到 1%。最后,加入 VeCap-300M (一個合成字幕數據集)后,在少樣本場景中性能提升超過了 1%。

圖片

  • 視覺語言連接器和圖像分辨率。該組件的目標是將視覺表征轉化為 LLM 空間。由于圖像編碼器是 ViT,因此其輸出要么是單一的嵌入,要么是一組與輸入圖像片段相對應的網格排列嵌入。因此,需要將圖像 token 的空間排列轉換為 LLM 的順序排列。與此同時,實際的圖像 token 表征也要映射到詞嵌入空間。
  • VL 連接器經驗:視覺 token 數量和圖像分辨率最重要,而 VL 連接器的類型影響不大。如圖 4 所示,隨著視覺 token 數量或 / 和圖像分辨率的增加,零樣本和少樣本的識別率都會提高。

圖片

預訓練數據消融試驗

通常,模型的訓練分為兩個階段:預訓練和指令調優。前一階段使用網絡規模的數據,后一階段則使用特定任務策劃的數據。下面重點討論了本文的預訓練階段,并詳細說明研究者的數據選擇(圖 3 右)。

有兩類數據常用于訓練 MLLM:由圖像和文本對描述組成的字幕數據;以及來自網絡的圖像 - 文本交錯文檔。表 2 是數據集的完整列表:


  • 數據經驗 1:交錯數據有助于提高少樣本和純文本性能,而字幕數據則能提高零樣本性能。圖 5a 展示了交錯數據和字幕數據不同組合的結果。
  • 數據經驗 2:純文本數據有助于提高少樣本和純文本性能。如圖 5b 所示,將純文本數據和字幕數據結合在一起可提高少樣本性能。
  • 數據經驗 3:謹慎混合圖像和文本數據可獲得最佳的多模態性能,并保留較強的文本性能。圖 5c 嘗試了圖像(標題和交錯)和純文本數據之間的幾種混合比例。
  • 數據經驗 4:合成數據有助于少樣本學習。如圖 5d 所示,人工合成數據確實對少數幾次學習的性能有不小的提升,絕對值分別為 2.4% 和 4%。

最終模型和訓練方法

研究者收集了之前的消融結果,確定 MM1 多模態預訓練的最終配方:

  • 圖像編碼器:考慮到圖像分辨率的重要性,研究者使用了分辨率為 378x378px 的 ViT-H 模型,并在 DFN-5B 上使用 CLIP 目標進行預訓練;
  • 視覺語言連接器:由于視覺 token 的數量最為重要,研究者使用了一個有 144 個 token 的 VL 連接器。實際架構似乎不太重要,研究者選擇了 C-Abstractor;
  • 數據:為了保持零樣本和少樣本的性能,研究者使用了以下精心組合的數據:45% 圖像 - 文本交錯文檔、45% 圖像 - 文本對文檔和 10% 純文本文檔。

為了提高模型的性能,研究者將 LLM 的大小擴大到 3B、7B 和 30B 個參數。所有模型都是在序列長度為 4096、每個序列最多 16 幅圖像、分辨率為 378×378 的情況下,以 512 個序列的批量大小進行完全解凍預訓練的。所有模型均使用 AXLearn 框架進行訓練。

他們在小規模、9M、85M、302M 和 1.2B 下對學習率進行網格搜索,使用對數空間的線性回歸來推斷從較小模型到較大模型的變化(見圖 6),結果是在給定(非嵌入)參數數量 N 的情況下,預測出最佳峰值學習率 η:

圖片

通過專家混合(MoE)進行擴展。在實驗中,研究者進一步探索了通過在語言模型的 FFN 層添加更多專家來擴展密集模型的方法。

要將密集模型轉換為 MoE,只需將密集語言解碼器替換為 MoE 語言解碼器。為了訓練 MoE,研究者采用了與密集骨干 4 相同的訓練超參數和相同的訓練設置,包括訓練數據和訓練 token。

關于多模態預訓練結果,研究者通過適當的提示對預先訓練好的模型在上限和 VQA 任務上進行評估。表 3 對零樣本和少樣本進行了評估:

圖片

監督微調結果

最后,研究者介紹了預訓練模型之上訓練的監督微調(SFT)實驗。

他們遵循 LLaVA-1.5 和 LLaVA-NeXT,從不同的數據集中收集了大約 100 萬個 SFT 樣本。鑒于直觀上,更高的圖像分辨率會帶來更好的性能,研究者還采用了擴展到高分辨率的 SFT 方法。

監督微調結果如下:

表 4 展示了與 SOTA 比較的情況,「-Chat」表示監督微調后的 MM1 模型。

首先,平均而言,MM1-3B-Chat 和 MM1-7B-Chat 優于所有列出的相同規模的模型。MM1-3B-Chat 和 MM1-7B-Chat 在 VQAv2、TextVQA、ScienceQA、MMBench 以及最近的基準測試(MMMU 和 MathVista)中表現尤為突出。

其次,研究者探索了兩種 MoE 模型:3B-MoE(64 位專家)和 6B-MoE(32 位專家)。在幾乎所有基準測試中,蘋果的 MoE 模型都比密集模型取得了更好的性能。這顯示了 MoE 進一步擴展的巨大潛力。

第三,對于 30B 大小的模型,MM1-30B-Chat 在 TextVQA、SEED 和 MMMU 上的表現優于 Emu2-Chat37B 和 CogVLM-30B。與 LLaVA-NeXT 相比,MM1 也取得了具有競爭力的全面性能。

不過,LLaVA-NeXT 不支持多圖像推理,也不支持少樣本提示,因為每幅圖像都表示為 2880 個發送到 LLM 的 token,而 MM1 的 token 總數只有 720 個。這就限制了某些涉及多圖像的應用。

圖 7b 顯示,輸入圖像分辨率對 SFT 評估指標平均性能的影響,圖 7c 顯示,隨著預訓練數據的增加,模型的性能不斷提高。

圖像分辨率的影響。圖 7b 顯示了輸入圖像分辨率對 SFT 評估指標平均性能的影響。

預訓練的影響:圖 7c 顯示,隨著預訓練數據的增加,模型的性能不斷提高。

更多研究細節,可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-02 15:01:53

GPT-4人工智能Keyframer

2025-01-08 08:21:16

2023-04-26 13:56:17

模型ChatGPT

2025-01-06 07:00:00

大模型人工智能LLM

2024-02-22 07:44:02

2024-10-23 08:24:13

2025-09-16 09:35:52

2024-09-12 12:44:36

AI訓練

2025-04-14 00:30:00

2024-03-12 13:22:00

訓練數據

2024-12-30 00:01:00

多模態大模型Python

2023-08-30 13:23:00

模型訓練

2023-03-10 13:56:42

ChatGPT

2024-12-18 18:57:58

2024-11-13 09:39:13

2023-12-30 13:31:30

模型數據信息

2024-03-18 08:47:34

馬斯克GrokOpenAI

2021-05-13 16:45:10

人工智能自然語言技術

2024-05-06 07:58:23

MoE模型系統
點贊
收藏

51CTO技術棧公眾號

成人免费观看在线视频| 免费视频网站www| 精品3atv在线视频| 国产精品情趣视频| 亚洲一区二区三| 日本在线观看中文字幕| 国产欧美一区二区精品久久久| 欧美日韩一区二区在线观看| 人人妻人人澡人人爽欧美一区| 亚洲欧美综合在线观看| 久久99精品久久久| 欧美一区二区三区艳史| 精品一区二区在线观看视频| 国产精品115| 欧美网站大全在线观看| 黄网站欧美内射| av影片在线看| 成人av影院在线| 91精品久久久久久久久不口人| 国产一卡二卡在线| 久久久久久久久99精品大| 亚洲国产中文字幕久久网| 三上悠亚av一区二区三区| 欧亚av在线| 亚洲综合久久av| 亚洲一区二区高清视频| 欧美91精品久久久久国产性生爱| 国产在线不卡一卡二卡三卡四卡| 日韩av观看网址| 日韩xxxxxxxxx| 欧美日韩综合| 久久视频国产精品免费视频在线| 成人午夜剧场视频网站| 99re6热只有精品免费观看| 在线播放日韩导航| 亚洲一级片网站| 欧美aa视频| 欧美日韩免费网站| 全黄性性激高免费视频| 牛牛精品视频在线| 亚洲精品欧美激情| 一级黄色免费在线观看| 午夜免费播放观看在线视频| 久久精品亚洲精品国产欧美| 欧美久久久久久| 日韩欧美在线番号| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 欧美日韩国产综合视频| 国产99一区视频免费| 国产乱肥老妇国产一区二| 小泽玛利亚一区二区三区视频| 久久成人国产| 国产福利精品在线| 国产三级精品三级在线观看| 一区二区日韩免费看| 午夜欧美大片免费观看| 久久久精品福利| 久久精品在线| 国产精品吹潮在线观看| 中文字幕观看在线| 久久99久久精品| 亚洲综合成人婷婷小说| 国产黄色一级大片| 成人一区二区三区| 久久综合精品一区| 高清美女视频一区| 亚洲欧洲av另类| 麻豆传媒网站在线观看| 美女网站视频在线| 欧美性猛交xxxx乱大交3| 欧美一区二区三区爽大粗免费| 成人av观看| 欧美午夜电影在线播放| 91 视频免费观看| 一区二区三区在线资源| 日韩国产欧美区| 亚洲午夜久久久久久久国产| 国产精品福利在线观看播放| 欧美国产日产韩国视频| 精品美女久久久久| 免费不卡在线观看| 成人自拍偷拍| 成人在线免费观看| 亚洲精品国产一区二区精华液| 精品国产一区二区三区无码| 高清不卡av| 欧美电影一区二区| 挪威xxxx性hd极品| 成人羞羞网站入口免费| 久久视频在线播放| 超碰超碰超碰超碰| 人禽交欧美网站| 大波视频国产精品久久| 黄色av网站在线看| 亚洲一区二区三区小说| 麻豆av免费在线| 麻豆精品国产| 亚洲午夜av久久乱码| 免费看一级一片| 欧美亚洲在线| 99re视频| 色综合久久影院| 精品欧美一区二区三区| 亚洲综合激情视频| 国产精品亚洲片在线播放| 欧美乱妇40p| 国产精品sm调教免费专区| 国产不卡视频在线观看| 一级日韩一区在线观看| 激情aⅴ欧美一区二区欲海潮| 欧美日韩国产a| 国产精品一区二区入口九绯色| 久久久久久久久国产一区| 日韩av毛片网| 污污网站在线免费观看| 亚洲另类色综合网站| 四季av一区二区| 欧美一区二区三区红桃小说| www.国产精品一二区| 亚洲婷婷综合网| 成人av资源在线| 91大学生片黄在线观看| 国产精品99| 亚洲色图国产精品| 日本免费观看视| 国产成人免费在线观看| 在线观看日韩片| 99欧美精品| 在线午夜精品自拍| 无码任你躁久久久久久久| 91在线码无精品| 免费毛片网站在线观看| 无人区乱码一区二区三区| www.美女亚洲精品| 91麻豆国产在线| 国产精品亲子伦对白| 成年人免费大片| 欧美在线关看| 91超碰中文字幕久久精品| 黄色aaa大片| 亚洲一区二区三区影院| 第一页在线视频| 国产一区亚洲| av观看久久| 日韩三级电影视频| 欧美变态口味重另类| 日本老熟俱乐部h0930| 国产精品一区二区黑丝| 欧美极品少妇无套实战| 操欧美女人视频| 欧美极品美女电影一区| 蜜桃av噜噜一区二区三区麻豆| 亚洲综合图片区| 亚洲一二三四五| 99在线精品免费视频九九视| 精品欧美日韩| 在线观看福利电影| 国产午夜精品全部视频在线播放| 国产精品传媒在线观看| 国产精品系列在线| 亚洲一区二区偷拍| 雨宫琴音一区二区在线| 精品欧美国产| 国产一区一一区高清不卡| 日韩有码视频在线| 亚洲国产剧情在线观看| 亚洲va韩国va欧美va| 30一40一50老女人毛片| 秋霞成人午夜伦在线观看| 中文字幕在线乱| 岛国精品一区| 国产极品精品在线观看| 黄色网址免费在线观看| 亚洲精品一区二区三区精华液 | 狠狠色丁香久久综合频道| 国产精品一区二区a| 松下纱荣子在线观看| 国产亚洲视频中文字幕视频| 国产日韩精品suv| 亚洲国产日韩综合久久精品| 欧洲美熟女乱又伦| 国产另类ts人妖一区二区| 久久久久久久久久久视频| 欧美色婷婷久久99精品红桃| **亚洲第一综合导航网站| 天堂√8在线中文| xvideos成人免费中文版| 国产91久久久| 91久久久免费一区二区| 中文字幕手机在线观看| 久久久青草青青国产亚洲免观| 中文字幕一区二区在线观看视频 | 欧美视频国产视频| 亚洲黄色三级| 自拍偷拍视频在线| 性人久久久久| 99精品国产高清在线观看| 欧美色网一区| 久久久之久亚州精品露出| 91福利在线视频| 亚洲第一av在线| 在线观看免费高清视频| 五月婷婷综合网| 女人18毛片毛片毛片毛片区二 | 日韩欧美国产精品一区| 国产精品va无码一区二区三区| 亚洲精品中文字幕乱码三区| 51妺嘿嘿午夜福利| av一区二区不卡| 久久6免费视频| 日韩成人精品在线| 波多野结衣家庭教师在线播放| 女人香蕉久久**毛片精品| 日本黄网免费一区二区精品| 欧美黑人做爰爽爽爽| av一区二区三区免费| 日韩美女在线| 国产精品久久久久久av福利软件| 午夜av不卡| 午夜精品在线观看| 欧美寡妇性猛交xxx免费| 日韩一区av在线| 国产女主播在线写真| 日韩成人中文字幕| 黄色美女一级片| 日韩欧美区一区二| 国产乱人乱偷精品视频| 欧美日韩国产欧美日美国产精品| 无码人妻丰满熟妇精品| 色综合天天狠狠| 久久国产精品免费看| 亚洲大片一区二区三区| 久久久精品91| 一区二区三区免费看视频| 欧美风情第一页| 亚洲欧洲国产日韩| 99热这里只有精品4| 国产精品久久久久久久久图文区 | 99精品美女| 在线观看欧美亚洲| 91一区二区| 在线观看一区二区三区三州| 97欧美在线视频| 麻豆中文字幕在线观看| 68国产成人综合久久精品| 一级特黄录像免费播放全99| 国产韩日影视精品| 热这里只有精品| 亚洲精品国产成人影院| 日本老太婆做爰视频| 一区二区影视| 国产免费xxx| 狠狠入ady亚洲精品经典电影| 丁香婷婷综合激情| 亚洲精品一级| 97视频在线免费播放| 久久久人人人| 青青青在线视频免费观看| 蜜臀va亚洲va欧美va天堂 | 加勒比在线一区| 精品污污网站免费看| 96日本xxxxxⅹxxx17| 日韩亚洲欧美在线| 香港一级纯黄大片| 国产亚洲视频在线| 国产激情在线| 国内成人精品一区| 国产不卡网站| 成人久久精品视频| 成午夜精品一区二区三区软件| 久久影院理伦片| 91日韩欧美| 黄色三级中文字幕| 免费精品视频| 亚洲va在线va天堂va偷拍| 高清av一区二区| mm131丰满少妇人体欣赏图| 中文字幕亚洲电影| 日韩欧美中文字幕一区二区| 欧美性高清videossexo| a天堂在线观看视频| 日韩精品免费综合视频在线播放| h网站视频在线观看| 久久av在线播放| 性欧美18~19sex高清播放| 国产日韩精品综合网站| 久久综合另类图片小说| 亚洲日本理论电影| 伊人久久久大香线蕉综合直播| 久久久国产欧美| 国产福利一区二区三区视频在线| 免费一级做a爰片久久毛片潮| 亚洲老妇xxxxxx| 国产高清中文字幕| 日韩精品中文字幕在线不卡尤物| 欧美高清电影在线| 久久久久久久久久亚洲| 草民电影神马电影一区二区| 国产不卡一区二区在线观看| 欧美男gay| 欧美一级片免费播放| 久久99国产精品免费| aa片在线观看视频在线播放| 亚洲男同性视频| 一级黄色av片| 日韩成人中文电影| 欧美人与牲禽动交com| 国产精品自拍网| 亚洲大片精品免费| 国产欧美123| 美女视频黄免费的久久| 午夜理伦三级做爰电影| 亚洲综合色噜噜狠狠| 国产人妖一区二区| 中文字幕不卡av| 91精品影视| 美国av一区二区三区 | 欧美国产亚洲一区| 国产成人鲁色资源国产91色综| 欧美自拍偷拍网| 色先锋aa成人| 五月婷婷免费视频| 欧美日韩ab片| 中文字幕综合| 一本一道久久a久久综合精品| 日韩中文字幕一区二区三区| 国产精品久久不卡| 午夜久久久久久久久久一区二区| aa视频在线免费观看| 日韩视频第一页| 欧美性生活一级| 在线观看一区二区三区三州 | 福利视频导航一区| 色wwwwww| 97精品一区二区视频在线观看| 伊色综合久久之综合久久| 国产一二三四五| 国产伦精一区二区三区| 欧洲美女女同性互添| 欧美日本在线观看| 日本电影全部在线观看网站视频 | 国产一区二区女内射| 色一区av在线| 日韩欧乱色一区二区三区在线| 在线视频不卡国产| 韩国毛片一区二区三区| 成年人午夜剧场| 日韩欧美你懂的| www.综合网.com| 九色91在线视频| 天堂久久久久va久久久久| 欧美 日韩 国产 成人 在线观看| 日本韩国精品在线| 五月婷婷在线观看| 成人在线播放av| 国内精品福利| 国产chinese中国hdxxxx| 黑人极品videos精品欧美裸| 欧美孕妇性xxxⅹ精品hd| 国产精品扒开腿做| 国产二区精品| 熟女人妻一区二区三区免费看| 午夜亚洲福利老司机| 免费国产在线观看| 国产在线拍偷自揄拍精品| 欧美 日韩 国产 一区| 国模私拍在线观看| 欧美在线短视频| 国产高清一区二区三区视频 | 91日韩欧美| aaa黄色大片| 色综合久久66| 日本韩国在线视频爽| 不卡视频一区二区| 麻豆久久精品| 北条麻妃在线观看视频| 精品毛片乱码1区2区3区| 亚洲最大成人| 这里只有精品66| 91视频.com| 亚洲一级视频在线观看| 久久男人av资源网站| 精品视频97| 深夜视频在线观看| 色婷婷精品久久二区二区蜜臀av| 欧美日本高清| 久久精品五月婷婷| 狠狠色狠狠色合久久伊人| 五月天婷婷网站| 视频直播国产精品| 欧美sss在线视频| 午夜一区二区视频| 欧美视频在线视频| 国产福利视频在线| 日韩av一区二区三区在线| 国产成人无遮挡在线视频| 成人一级免费视频| 性欧美激情精品| 91精品国产乱码久久久久久| 免费看污黄网站在线观看|