精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

收斂速度最高8倍,準確率提升超30%!華科發布MoE Jetpack框架 | NeurIPS 2024

人工智能 新聞
華中科技大學的研究人員提出了MoE Jetpack框架,通Checkpoint Recycling方法和SpheroMoE結構,將密集激活模型的預訓練權重微調為混合專家(MoE)模型,從而免去了MoE模型的預訓練過程,大幅提升了MoE在下游任務中的精度和收斂速度。

混合專家模型(MoE, Mixture of Experts)是一種通過動態激活網絡的部分結構來提升計算效率的架構,可以在保持相對穩定的計算成本的前提下大幅增加參數量,從而有效提升模型性能。

這一特性使得MoE能夠兼顧模型的規模與效率,已廣泛應用于各種大規模任務。

然而,MoE模型通常需要在大型數據集上預訓練以獲得理想性能,導致其對時間和計算資源的需求極高,這也限制了其在深度學習社區中的普及性。

為解決這一問題,華中科技大學的研究人員提出了MoE Jetpack框架,利用密集模型的預訓練權重(Dense checkpoints)來微調出視覺混合專家模型(MoE,Mixture of Experts)。

目前,這項工作已被NeurIPS 2024接收。

圖片

論文標題:MoE Jetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Tasks

論文地址: https://arxiv.org/abs/2406.04801

代碼地址: https://github.com/Adlith/MoE-Jetpack

MoE Jetpack框架的核心創新包括:

1. Checkpoint recycling:通過采樣密集模型權重產生差異化的專家,組成MoE模型的初始化權重,從而加速模型收斂、提升性能,并避免大規模的MoE模型預訓練。

2. SpheroMoE Layer:通過調整MoE結構,利用交叉注意力機制進行專家分配,將query和key投影到超球空間以提升微調過程的穩定性,并通過一系列專家正則化方法有效緩解MoE模型微調過程中的過擬合現象。

實驗結果表明,MoE Jetpack在多個數據集和網絡結構上實現了顯著的性能提升。在ImageNet-1K上,模型收斂速度提升2倍,準確率提高了2.8%;在小規模數據集上,收斂速度可達8倍提升,準確率提升超過30%。

圖片

圖1 (a)MoE Jetpack將密集預訓練權重轉化為MoE模型的初始化權重,在性能提升的同時保持等效的FLOPs。(b) 未預訓練的ViT、微調的ViT、未預訓練的Soft MoE 與MoE Jetpack在多個視覺數據集上的性能比較。

在多個下游數據集上的實驗表明,該框架能夠高效利用預訓練權重,實現更快的收斂速度和更優的性能表現。

研究方法

MoE Jetpack的核心由兩個階段組成:Checkpoint Recycling(用于MoE模型的初始化)和SpheroMoE層(用于微調MoE模型),如下圖所示。

圖片

圖2 Checkpoint Recycling和SpheroMoE結構

Checkpoint Recycling:作為MoE Jetpack的基礎階段,Checkpoint Recycling通過將預訓練的密集模型權重轉換為高質量的MoE初始化權重,使新模型在性能和收斂速度上都得以提升。

具體地,Checkpoint Recycling從密集權重的多層感知器(MLP)中采樣出部分權重構建專家層,以確保專家的多樣性和靈活性。

本文比較了四種主要的權重回收策略:

1. 重要性采樣(Importance-Based Weight Sampling):重要性采樣是 MoE Jetpack 默認的權重采樣方法,通過計算輸出特征的均值,選擇top-d' 個最重要的特征維度,同時根據隱藏單元的激活值大小進行獨立采樣。這種方法確保每個專家包含關鍵的特征和隱藏單元,有助于提升模型的初始化質量和訓練效率。

2. 圖劃分法(Co-Activation Graph Partitioning):圖劃分法通過構建共激活圖,將常一起激活的隱藏單元分組,使用圖劃分算法(如 Metis),將密集權重的隱藏單元劃分成多個子圖,組合不同的子圖形成不同專家層,確保專家專注于不同的功能區域,提升模型的特征表達能力。

3. 均勻采樣(Uniform Weight Selection):均勻采樣在特征維度和隱藏單元上均勻選擇權重,保證每個 MoE 專家層均衡分布初始化權重。此方法實現簡單,但不考慮特征重要性,因此性能提升效果較為一般。

4. 隨機采樣(Random Weight Sampling):隨機采樣在特征維度和隱藏單元中隨機抽取,生成專家層的初始化權重。該方法實現簡便,但由于沒有關注特征的重要性,性能通常較低。

Checkpoint Recycling引入的計算開銷幾乎可以忽略,同時顯著提升模型性能并與收斂速度。

SpheroMoE層

在MoE模型權重初始化后,SpheroMoE層進一步優化微調過程。SpheroMoE 層的引入解決了 MoE 模型在優化過程中面臨的數值不穩定、專家過度專一等問題。它通過三種機制來提升模型在下游任務的性能和穩定性:

1. 超球路由機制:利用cross attention結構,將輸入動態分配給 MoE 模型的不同專家。這種機制首先對隨機初始化的專家查詢(Q, query)和輸入鍵(K, key)進行歸一化投影(L2 Norm)至超球空間,以確保數值穩定性,并通過余弦相似度來選擇輸入對應的專家。最終輸出由各個專家的結果組合而成,保證 MoE 模型的輸出特征和密集模型之間的分布一致性。

2. 自適應雙路徑MoE:為提升計算效率,SpheroMoE路由將輸入劃分為高重要性和低重要性兩類,并引導其進入不同計算路徑:高重要性輸入分配至包含更大參數量的核心專家;低重要性輸入則進入包含較小專家的通用路徑。這樣的雙路徑結構通過劃分細粒度的專家增加了專家的數量,優化了資源利用,提升了模型的性能與計算效率。

圖片

圖3 自適應雙路徑MoE

3. 專家正則化:為避免專家層過度專注于特定輸入或出現過度特化,本文引入可學習的軟溫度參數,用以調整softmax的平滑程度以精確控制輸入的分配和輸出的組合。

此外,使用專家隨機失活機制能有效防止模型對特定專家的依賴。

這些設計使MoE Jetpack在下游任務微調中不僅具備了更快的收斂速度,還實現了顯著的性能提升。

實驗結果

本文在 ViT 和 ConvNeXt 兩種典型網絡結構以及八個圖像分類任務上進行了廣泛實驗。實驗結果表明,MoE Jetpack 在性能上顯著優于隨機初始化的 Soft MoE 模型,并且利用密集權重的微調效果明顯超過直接微調經過預訓練的密集模型。

圖片

表1 MoE Jetpack基于ViT和ConvNeXt在8個下游數據集上的性能表現

此外,論文還對MoE Jetpack的多種配置進行了深入研究,系統分析了不同專家數量、不同原始網絡尺寸大小等因素對模型性能的影響。

圖片

表2 各種參數量的MoE Jetpack都展示出了顯著的性能提升

下圖展示了微調的全過程中MoE Jetpack對加速模型收斂速度和提升模型性能方面的效果,突顯了其作為 MoE 模型預訓練替代方法的潛力。

圖片

圖4 MoE Jetpack帶來了收斂速度提升

專家注意力圖展示了不同的專家關注圖像的不同區域,各司其職。專家貢獻分布圖表明,核心專家和普通專家在不同層次的貢獻差異顯著,展示了模型的自適應路由調度機制。

圖片

圖5 專家注意力圖和專家貢獻分布圖

總結

MoE Jetpack是一個創新框架,旨在將預訓練的密集模型權重高效轉換為MoE模型。通過提出Checkpoint Recycling技術,MoE Jetpack能夠有效繼承密集模型的知識;引入的SpheroMoE 層,顯著提升微調過程的穩定性和性能。

該框架不僅降低了MoE模型的訓練成本和硬件要求,還減少了對環境的影響,使得研究者在普通計算資源下也能輕松使用混合專家模型,為MoE的廣泛研究與應用提供了有力支持。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-03-01 13:31:21

2023-06-28 13:49:12

AI人工智能

2023-03-03 18:31:23

網絡承運商路由

2024-01-15 13:01:33

編程神器深度學習代碼自動補

2025-10-17 17:50:01

大模型推理AI

2023-11-01 13:15:13

單點端識別框架

2024-10-21 12:30:00

模型框架

2021-10-11 17:27:50

框架計算機開發

2023-10-28 13:36:48

模型ChatGPT

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2023-10-23 10:02:00

模型技術

2024-09-12 13:50:00

模型訓練

2022-02-28 17:56:51

英偉達天氣預報神經網絡

2022-09-25 17:07:27

訓練圖像

2014-12-31 13:17:18

百度預測開放平臺

2020-11-19 15:02:56

TensorFlow數據機器學習

2023-08-22 14:39:00

模型訓練

2024-12-26 15:30:00

模型深度學習AI

2023-09-19 14:56:00

模型訓練
點贊
收藏

51CTO技術棧公眾號

国产精品久久久久久av福利| 日韩av一区二区在线观看| 亚洲日本精品国产第一区| 91精品国自产| 国模套图日韩精品一区二区| 99re成人在线| 国产在线精品一区免费香蕉| 国产一级免费观看| 欧美熟乱15p| 日韩欧美国产一二三区| 黑森林福利视频导航| 97成人在线观看| 欧美激情成人在线| 国产亚洲视频在线| 涩多多在线观看| 日韩电影大全网站| 99久久国产综合色|国产精品| 日本高清久久天堂| 久久中文免费视频| 国产成人3p视频免费观看| 日韩欧美精品在线视频| 性刺激的欧美三级视频| 成年网站在线视频网站| 国产精品免费aⅴ片在线观看| 4k岛国日韩精品**专区| 免费成人深夜夜行网站| 台湾色综合娱乐中文网| 欧美一区二区日韩一区二区| 欧美伦理视频在线观看| 123区在线| √…a在线天堂一区| 农村寡妇一区二区三区| 亚洲精品久久久久久久久久久久久久 | 欧美精品黑人猛交高潮| 日韩在线观看一区二区三区| 欧美三级韩国三级日本三斤| av黄色在线网站| 欧美寡妇性猛交xxx免费| |精品福利一区二区三区| 日韩精品伦理第一区| 欧美日韩在线精品一区二区三区激情综| 国产精品亚洲一区二区三区妖精| 国产精品自拍偷拍视频| 蜜臀尤物一区二区三区直播| 亚洲视频大全| 国模视频一区二区三区| 久久久久久久久久一区二区三区| 天天精品视频| zzijzzij亚洲日本成熟少妇| 黄色永久免费网站| 欧美特黄aaaaaaaa大片| 午夜视频在线观看一区二区| 日韩精品一区二区在线视频| 香蕉国产在线视频| 成人在线视频一区| 国产亚洲欧美一区二区三区| 视频一区二区免费| 99精品国产热久久91蜜凸| 国产精品一区在线播放| 日韩中文字幕综合| 久久伊人亚洲| 日韩av色在线| 日本妇乱大交xxxxx| 日本vs亚洲vs韩国一区三区二区| 天天综合网 天天综合色| 精品视频1区2区| 国产精品欧美激情在线观看 | 欧美精品videossex性护士| 免费看一级一片| 99国产精品自拍| 欧美中文字幕在线观看| 波多野结衣电车痴汉| 久久99精品久久久久久国产越南| 成人黄色av网站| 亚洲av永久无码国产精品久久| 福利91精品一区二区三区| 欧美激情一区二区三级高清视频| 精品爆乳一区二区三区无码av| 黄色亚洲免费| 国产91九色视频| 亚洲中文字幕在线观看| 国产91丝袜在线播放0| 久久久久se| 欧美成人精品网站| 老司机一区二区| 91精品国自产在线观看| 天堂中文在线资| 国产欧美一区二区三区网站| 欧美aaa在线观看| 亚洲av片一区二区三区| 国产午夜亚洲精品羞羞网站| 一道精品一区二区三区| 黄色成人在线网| 色狠狠av一区二区三区| 中文字幕在线观看日| 国产劲爆久久| 欧美一区2区视频在线观看| av av在线| 波多野结衣一区| 欧美极品少妇xxxxⅹ免费视频| 老熟妇仑乱一区二区av| 99精品久久| 国产精品久久久久久久久借妻 | 色综合天天色| 精品国产麻豆免费人成网站| 高清国产在线观看| 黄色国产精品| 国产色综合天天综合网 | 成人av动漫在线| 亚洲成人第一| 成人欧美magnet| 日韩免费一区二区| 天堂网中文在线观看| 日韩视频三区| 51蜜桃传媒精品一区二区| 国产高清视频在线观看| 亚洲高清免费一级二级三级| 爱爱爱爱免费视频| 欧美猛男同性videos| 久久久久久这里只有精品| 一区二区视频免费观看| 99久久久无码国产精品| 91麻豆天美传媒在线| 欧美日韩激情电影| 亚洲精品视频二区| 国产一国产二国产三| 经典三级在线一区| 午夜精品一区二区三区四区| 小草在线视频免费播放| 精品国产乱码久久久久久久| 夫妻性生活毛片| 日韩电影免费在线| 欧美二级三级| 日本一区视频| 亚洲国产精品综合小说图片区| av中文字幕网址| 色婷婷一区二区三区| 国产福利视频一区二区| 色就是色亚洲色图| 天天操天天色综合| av无码一区二区三区| 伊人蜜桃色噜噜激情综合| av资源一区二区| 欧美xxxx免费虐| 亚洲爱爱爱爱爱| 久久国产在线观看| 成人网男人的天堂| 真人抽搐一进一出视频| 风间由美性色一区二区三区四区| 九九久久久久99精品| 国产成a人亚洲精v品无码| 亚洲免费在线视频一区 二区| 毛片av在线播放| 欧美另类中文字幕| 欧美精品在线视频观看| 国产夫妻性生活视频| 亚洲女同ⅹxx女同tv| 亚洲高清在线不卡| 国产精品国码视频| 精品国产乱码久久久久久108| 123区在线| 亚洲欧洲日本专区| 中文字幕乱码中文字幕| 1024亚洲合集| 一级少妇精品久久久久久久| 亚洲天堂成人| 麻豆蜜桃91| 国产69精品久久| 欧美成aaa人片在线观看蜜臀| 亚洲成人av综合| 婷婷夜色潮精品综合在线| 手机免费看av| 国产一区二区三区在线观看免费| 8x8x华人在线| 老司机成人在线| 久久这里只有精品视频首页| 国产成年妇视频| 亚洲mv在线观看| 亚洲无人区码一码二码三码的含义| 免费在线观看一区二区三区| 久久久久久久香蕉| 宅男在线一区| 91在线观看免费高清完整版在线观看| 久草在线视频网站| 亚洲女同性videos| 亚洲一区在线观| 亚洲成人激情av| 国产精品久久久视频| 国产精品一区专区| 麻豆av免费在线| 欧美三区美女| 亚洲高清视频一区二区| 成人在线视频你懂的| 国产精品久久久久9999| 国产又色又爽又黄刺激在线视频| 亚洲天天在线日亚洲洲精| 国产免费黄色片| 色偷偷久久一区二区三区| 欧美xxxxx精品| 日韩av一区二区三区| 无码人妻精品一区二区蜜桃网站| 综合亚洲色图| 99久热re在线精品996热视频| 成人国产二区| 欧美第一黄色网| 超碰国产在线| 亚洲精品视频久久| 丰满人妻一区二区三区四区53| 91精品91久久久中77777| 久久99久久久| 综合久久久久久久| 色综合99久久久无码国产精品| 国产成人自拍网| 午夜免费看毛片| 日韩成人午夜电影| 欧美视频第一区| 精品白丝av| 青青草原网站在线观看| 波多野结衣在线观看一区二区三区| 国产精品区一区二区三在线播放| 色狠狠一区二区三区| www.美女亚洲精品| 爽爽视频在线观看| 精品欧美乱码久久久久久1区2区| 丰满熟女人妻一区二区三| 精品日韩美女的视频高清| 久久久久亚洲av成人片| 综合激情成人伊人| 免费看的黄色录像| 久久九九99视频| 免费a在线观看播放| 成人毛片视频在线观看| 中文字幕乱码在线人视频| 亚洲视频免费| 18视频在线观看娇喘| 欧美残忍xxxx极端| 亚洲一卡二卡三卡| 第一会所sis001亚洲| 欧美国产综合视频| 亚洲a级精品| 老牛影视免费一区二区| 色婷婷久久久| 欧美精品免费观看二区| 神马午夜久久| 欧美久久在线| 精品日韩免费| 亚洲二区三区四区| 日本一本不卡| 伊甸园精品99久久久久久| 色小子综合网| 热这里只有精品| 中文字幕一区二区精品区| 警花观音坐莲激情销魂小说 | 国产一区 在线播放| 欧美色一级片| 少妇高潮毛片色欲ava片| 亚洲永久网站| av免费网站观看| 久久99精品国产麻豆婷婷洗澡| 国产永久免费网站| 国产激情视频一区二区在线观看| 国产伦理在线观看| 不卡视频一二三| 少妇真人直播免费视频| 国产欧美日韩亚州综合 | 调教+趴+乳夹+国产+精品| 国产一级18片视频| 欧美系列日韩一区| 国产精品日韩无码| 精品久久久久久| 天堂网中文字幕| 欧美日韩电影一区| 亚洲AV无码精品国产| 亚洲国产中文字幕在线观看| 蜜桃成人在线视频| 久久精品国产欧美激情| 久久五月精品中文字幕| 欧美在线视频一二三| 成人黄色图片网站| 91亚洲精品丁香在线观看| 老汉色老汉首页av亚洲| 亚洲国产精品久久久久久女王| 7777久久香蕉成人影院| 日本在线播放不卡| 欧美国产一级| www.成年人视频| 日韩va亚洲va欧美va久久| 善良的小姨在线| 久久综合色播五月| www色aa色aawww| 欧美性猛交xxxxx水多| 国产探花精品一区二区| 国产视频精品一区二区三区| 日本在线观看| 欧美性受xxxx黑人猛交| 老司机亚洲精品一区二区| 蜜桃传媒一区二区| 欧美久久99| 污网站免费在线| 91香蕉视频污| 国产精品三级在线观看无码| 成人午夜又粗又硬又大| 性欧美一区二区| 亚洲丶国产丶欧美一区二区三区| 最近日韩免费视频| 日韩精品在线观看视频| 最近中文字幕免费mv2018在线| 日韩美女激情视频| 精品久久97| 99久久久精品视频| 国产一区二区三区免费| 人妻一区二区视频| 五月综合激情日本mⅴ| 国产视频一区二区三| 在线一区二区日韩| 中文字幕在线官网| 国产精品福利视频| 在线国产一区二区| 亚洲精品性视频| 欧美国产精品v| 国产一级免费视频| 亚洲激情视频网站| 动漫一区二区| 99精品国产一区二区| 五月天久久777| 亚洲欧美自偷自拍另类| 国产日韩欧美不卡| 日韩黄色在线播放| 亚洲国产欧美自拍| 黄色在线观看视频网站| 91超碰在线电影| 欧美+亚洲+精品+三区| 亚洲人视频在线| 中文字幕在线观看不卡视频| 中文字幕 国产| 亚洲一区二区精品| 欧美va在线观看| 亚洲v国产v| 毛片av一区二区| 激情高潮到大叫狂喷水| 欧美视频日韩视频| 亚洲成人影院麻豆| 国产精品第一区| 成人影院在线| 国产乱码一区二区三区四区| 国产精品传媒入口麻豆| 国产一区二区三区黄片| 日韩一区二区久久久| 99精品视频在线免费播放| 最新中文字幕久久| 国产99久久久国产精品潘金 | 不卡一区二区三区视频| 欧美日韩国产色综合一二三四| 国产精品二区视频| 亚洲成精国产精品女| 亚欧在线观看视频| 国产精品草莓在线免费观看| 欧美顶级大胆免费视频| 亚洲高清视频免费| 亚洲一区二区三区四区不卡| 日韩中文字幕综合| 国产成人精品在线播放| 久久国产精品成人免费观看的软件| 老司机久久精品| 亚洲一二三区视频在线观看| 午夜国产在线观看| 国产精品高精视频免费| 久久精品一区二区不卡| 特黄特色免费视频| 日韩欧美中文字幕在线观看| av电影在线观看| aa成人免费视频| 国产精品乱看| 五月天婷婷丁香网| 日韩免费视频线观看| 深夜av在线| 亚洲午夜精品久久久中文影院av| 国产福利91精品| 日本一区二区三区精品| 色婷婷av一区二区三区在线观看| 深夜福利一区| 黄色高清无遮挡| 亚洲免费在线观看视频| 欧洲天堂在线观看| 91在线无精精品一区二区| 中文久久精品| 国产一区二区播放| 日韩精品视频免费专区在线播放| 欧洲成人一区| 亚洲国产精品无码av| 中文一区二区在线观看| 亚洲精品喷潮一区二区三区| 国产国语videosex另类| 欧美激情亚洲| 久久久久久成人网| 日韩精品视频在线观看免费| 韩国一区二区三区视频| 国产一级片黄色| 亚洲不卡一区二区三区| 国内精品久久久久久野外|