精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟讓MoE長出多個頭,大幅提升專家激活率

人工智能 新聞
MH-MoE 能優化幾乎所有專家,實現起來非常簡單。

混合專家(MoE)是個好方法,支持著現在一些非常優秀的大模型,比如谷歌家的 Gemini 1.5 以及備受關注的 Mixtral 8x7B。

稀疏混合專家(SMoE)可在不顯著增加訓練和推理成本的前提下提升模型的能力。比如 Mixtral 8×7B 就是一個 SMoE 模型,其包含 8 個專家(共 7B 參數),而其表現卻可以超過或比肩 LLaMA-2 70B 和 GPT-3.5。

但是,它也有兩個問題。一是專家激活率低 —— 也就是搞不好會出現下圖這種情況:

圖片

具體來說,就是在優化時只有一小部分專家會被激活,如圖 1a 所示(8.33% 的激活率),這會導致在學習應對復雜任務的大量專家時,會出現性能次優和效果不佳的問題。

圖片

二是無法細粒度地分析單個 token 的多重語義概念,比如多義詞和具有多重細節的圖塊。

近日,微軟研究院和清華大學提出了多頭混合專家(MH-MoE)。顧名思義,MH-MoE 采用了多頭機制,可將每個輸入 token 分成多個子 token。然后將這些子 token 分配給一組多樣化的專家并行處理,之后再無縫地將它們整合進原來的 token 形式。

圖片


  • 論文標題:Multi-Head Mixture-of-Experts
  • 論文地址:https://arxiv.org/pdf/2404.15045
  • 代碼地址:https://github.com/yushuiwx/MH-MoE

圖 2 展示了 MH-MoE 的工作流程。可以看到,當輸入單個 token 時,MH-MoE 會將其分成 4 個子 token,進而激活 4 個專家,而 SMoE 僅激活 1 個專家。

圖片

如圖 2 所示,分配給專家 3 和 2 的子 token 包含對圖塊內每個角色動作的詳細理解,而分配給專家 1 和 4 的子 token 則顯式地建模了錯誤的同源詞「camera」的語義。

專家處理完成后,再將子 token 無縫地重新整合進原來的 token 形式,由此可以避免后續非并行層(例如注意力層)的任何額外計算負擔,同時還集成從多個專家捕獲的語義信息。

這樣的操作可讓 MH-MoE 從整體上關注來自不同專家內不同表征空間的信息,從而可以加深上下文理解能力,同時提升專家激活率。該項目的代碼也將發布。

MH-MoE 的具有以下優勢:

  1. 專家激活率更高且擴展性更好。MH-MoE 能優化幾乎所有專家,從而可以緩解專家激活率低的問題并大幅提升更大專家的使用率,如圖 1a 所示實現了 90.71% 的激活率,這能讓模型能力獲得更高效的擴展。
  2. 具有更細粒度的理解能力。MH-MoE 采用的多頭機制會將子 token 分配給不同的專家,從而可以聯合關注來自不同專家的不同表征空間的信息,最終獲得更好更細粒度的理解能力。舉個例子,如圖 1b 的明亮區域所示,子 token 會被分配給更多樣化的一組專家,這有助于捕獲語義豐富的信息。
  3. 可實現無縫整合。MH-MoE 實現起來非常簡單,而且與其它 SMoE 優化方法(如 GShard)無關,反而可以將它們整合起來一起使用以獲得更好的性能。

方法

圖 3 給出了 MH-MoE 的整體架構,其使用了多頭機制將每個 token 分拆為子 token,然后將這些子 token 路由給不同的專家。

多頭混合專家

為了能清楚說明,這里僅描述單層 MH-MoE。

首先,通過一個多頭層將輸入 token 序列投射成一個新序列。

之后,沿 token 維度將新序列中的每個 token 分拆為多個子 token,并根據原始 token 序列并行排布這些子 token,進而構成一個新的特征空間。

然后將所有這些子 token 輸送給一個門控函數。將特定子 token 路由到第 p 個專家的門控值的計算方式為:

圖片

對于路由方法,這篇論文關注的重點方法是 top-k 路由,也就是激活路由分數最大的 k 個專家。然后讓這些激活的專家處理子 token。

之后,按子 token 原來的順序重新排布并整合所得結果。

然后,通過一個 token 合并操作將所得整合結果轉換回原始 token 形式。

最后,使用一個融合層將轉換后的結果投射成多個特征的有效整合形式,此時這些特征已捕獲了不同專家表征空間的詳細信息。這樣便可得到單層 MH-MoE 的最終輸出。

訓練目標

MH-MoE 的訓練目標是最小化兩個損失:針對具體任務的損失和輔助性的負載平衡損失。

圖片

實驗

實驗設置

為了進行比較,該研究的實驗采用了兩種基準模型:(1) Dense,這是沒有整合稀疏激活的并行模塊(SMoE 層)的 Transformer 解碼器。(2) X-MoE,基于 Chi et al. (2022) 的論文《On the representation collapse of sparse mixture of experts》提出的方法的實現。

實驗中的 MH-MoE 基于 X-MoE 并使用了與其一樣的設置。

實驗任務有三個:以英語為中心的語言建模、多語言語言建模、掩碼式多模態建模。

更多有關數據集和模型架構的設置請參閱原論文。

困惑度評估

他們在兩種專家設置(8 個專家和 32 個專家)下研究了所有預訓練模型和預訓練任務的驗證困惑度曲線。圖 4 給出了困惑度趨勢,表 1 是最終的困惑值。

圖片

圖片

據此可以看出:

  1. 相比于基準,MH-MoE 的困惑度總是更低,這說明其能更有效地學習;
  2. 在三個不同的設置中,MH-MoE 的困惑度是最低的;
  3. 當專家數量增多時,MH-MoE 的困惑度會下降,這說明隨著專家數量增多,其表征學習能力會提升,模型也能從中受益。

這些結果表明 MH-MoE 在多種預訓練范式下都有更優的學習效率和語言表征能力。

下游任務評估

為了驗證 MH-MoE 的效果,該團隊也為每個預訓練任務執行了對應的下游任務評估。

以英語為中心的語言建模

這里使用了 9 個不同的零樣本評估基準,可以評估模型解決多種不同自然語言任務的能力,比如常識推理、一般語言理解和知識理解。評估框架為 LLM Evaluation Harness。結果見表 2。

圖片

可以看到,相比于 Dense 模型,X-MoE 有明顯優勢,這說明較大的模型能讓 SMoE 模型(如 X-MoE)受益。總體而言,MH-MoE 在所有基準上都表現最佳。

多語言語言建模

他們在跨語言自然語言推理(XNLI)語料庫(14 種語言)上評估了新的多語言語言模型。評估框架依然是 LLM Evaluation Harness,同樣使用了零樣本設置。結果見表 3。

圖片

MH-MoE 依然表現最佳,這體現了多頭機制在建模跨語言自然語言方面的有效性。

掩碼式多模態建模

他們也在社區廣泛使用的視覺 - 語言理解和生成基準上執行了評估,包括視覺問答、視覺推理和圖像描述。評估結果見表 4。

圖片

可以看到,MH-MoE 在這三個任務上有著全面的優勢。這些結果表明 MH-MoE 具有更強的視覺信息理解能力,這也驗證了新提出的多頭機制在捕獲視覺數據中的不同語義和詳細信息方面的有效性。

消融研究

為了驗證 MH-MoE 各組件和參數的效果,該團隊也進行了消融研究。他們研究的內容包括頭的數量、多層感知器層(包括多頭層和融合層)、token 拆分與融合操作、MLP 層的數量。

表 5、6、7 給出了研究結果。整體而言,MH-MoE 各組件的效果得到了驗證,并且他們也得到了一些有趣的結果,比如從表 7 可以看出單層 MLP 足以實現 token 分割和融合。

圖片

圖片

圖片

分析

專家激活分析

最后該團隊還通過可視化分析等方法對 MH-MoE 進行了分析。

圖 5 給出了 X-MoE 和 MH-MoE 中專家激活的分布情況。

圖片

可以看到,MH-MoE 的專家激活率明顯更高,并且隨著頭的數量 h 增大,專家激活的頻率也會上升。

圖 6 則對比了 X-MoE 和 MH-MoE 的可擴展性(專家數量從 8 擴展到 256)。

圖片

可以看到 MH-MoE 的優勢非常明顯,并且 X-MoE 的下游性能會在專家數為 64 時達到飽和,而 MH-MoE 卻還能繼續提升。

分析細粒度理解能力

為了進一步分析多頭機制對 MH-MoE 的幫助,該團隊更深入地分析了其理解多樣且復雜的語義信息的能力,比如理解語言中的多義詞和錯誤同源詞(記為 PF token)以及圖像中的信息豐富的區域。

對于語言數據,他們計算和比較了從 PF token 和非 PF token 拆分出的子 token 的散度層級(即這些子 token 路由到的不同專家的數量)。結果見圖 7。

圖片

可以看到相比于非 PF token,PF token 的散度分布明顯靠右。這說明,在 MH-MoE 的推理過程中,PF token 會將其子 token 路由到更多不同專家,從而會捕獲到與非 PF token 不同的語義信息,實現更好的多義詞和錯誤同源詞建模。

對于圖像數據,他們分析的是不同圖塊的散度層級在訓練過程中的變化情況,結果見圖 8。

圖片

有趣的是,可以看到隨著訓練步驟增多,高頻紋理區域(即有豐富語義信息的區域)的散度層級會逐漸增大,而低頻紋理區域的散度層級則會逐漸降低。這表明在訓練過程中,MH-MoE 傾向于將具有復雜紋理的區域的 token 路由到更多不同專家,由此可讓模型對該區域的語義有更細粒度的理解。

該團隊也執行了復雜性和參數分析,詳見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-11 13:24:02

2025-03-05 09:50:00

2024-11-21 10:21:06

2024-06-04 00:00:01

微軟EdgeReact

2025-03-11 00:35:00

DeepSeektoC業務

2024-01-10 16:01:28

2023-04-10 09:15:25

Vite 4.3SWC 插件

2025-06-09 09:41:25

2025-04-14 08:30:00

模型智能技術

2023-11-09 08:46:24

2025-02-17 03:00:00

LLMsMoELLM

2022-09-25 17:07:27

訓練圖像

2024-10-10 11:49:27

2024-11-13 10:05:56

2013-12-10 14:41:52

BYOD

2014-06-05 10:20:53

2022-12-27 13:36:39

審計工作人工智能

2023-11-26 09:04:10

Vue性能

2009-06-28 22:55:00

SAN惠普存儲

2022-02-18 09:43:43

Windows 游戲操作系統Windows11
點贊
收藏

51CTO技術棧公眾號

国产成人愉拍精品久久| 九九九热999| 日本裸体美女视频| 国产精品毛片aⅴ一区二区三区| 亚洲欧洲日产国码二区| 国产精华一区| 国产精品xxxxxx| 欧美人成在线| 亚洲乱亚洲乱妇无码| 免费成年人高清视频| 国产丝袜在线播放| 国产欧美日韩综合| 国产精品国产一区二区| 中文字幕免费观看视频| 亚洲二区视频| www国产精品com| 在线观看av一区| 国产伦精品一区二区三区四区免费 | 欧美91看片特黄aaaa| 国产精品国产精品国产专区不蜜 | 免费观看成人在线视频| 1769免费视频在线观看| 久久久久久**毛片大全| 999视频在线免费观看| 天堂网一区二区| 影音国产精品| 久久国产精品久久久久| 熟女少妇内射日韩亚洲| 久久人人爽人人爽人人片av不| 欧美在线观看视频一区二区| 成人在线观看你懂的| 成人在线视频亚洲| 国产视频一区二区在线| 国产伦理一区二区三区| 国产免费不卡视频| 日韩精品成人一区二区三区| 亚洲18私人小影院| 妺妺窝人体色www聚色窝仙踪| 欧美jizz| 最近2019中文字幕大全第二页 | 99热一区二区| 日本高清不卡一区二区三区视频| 午夜婷婷国产麻豆精品| 精品免费久久久久久久| fc2ppv国产精品久久| 中文字幕一区视频| 亚洲精美视频| 97超碰人人在线| 国产欧美视频一区二区| 日韩hmxxxx| 福利在线播放| 日本一二三四高清不卡| 婷婷亚洲婷婷综合色香五月| 国产天堂素人系列在线视频| 久久精品视频在线看| 欧美第一黄网| 国产最新视频在线| 国产日韩欧美综合在线| 午夜精品一区二区三区在线观看| 国产一级片在线| 国产亚洲人成网站| 日韩av在线一区二区三区| 97在线观看免费观看高清 | 青青操视频在线播放| 亚洲人metart人体| 欧美激情久久久久久| 久久婷婷国产麻豆91| 1024日韩| 日韩av免费一区| 中文字幕人妻丝袜乱一区三区| 免费黄网站欧美| 91欧美激情另类亚洲| www日本高清视频| 99热这里都是精品| 欧美日韩国产综合在线| 91激情在线| 亚洲免费观看高清在线观看| www.xxx麻豆| 电影一区二区三| 欧美日韩在线播放一区| 特黄特黄一级片| 国产图片一区| 亚洲一区二区福利| 精品国产精品国产精品| 亚洲二区视频| 国产精品视频免费观看www| 国产精品人人爽| av综合在线播放| 日韩亚洲不卡在线| 午夜在线激情影院| 欧美性猛交xxxx乱大交极品| 污网站免费在线| 999在线精品| 一区二区三区精品99久久 | 嫩草精品影院| 亚洲天堂免费看| 久久久久久久久久久视频| 国产成人精品一区二区三区在线 | 久久精品无码专区| av中字幕久久| 久久久久久69| 中文字幕有码无码人妻av蜜桃| 国产福利91精品| 欧美日韩在线精品| 午夜小视频在线观看| 色狠狠色狠狠综合| 亚洲图片欧美另类| 成人在线免费观看视频| 国内精品久久久| 夜夜躁狠狠躁日日躁av| 99久久99久久精品国产片果冻 | 国产富婆一区二区三区| www.av在线| 都市激情亚洲色图| 女人扒开双腿让男人捅| 色男人天堂综合再现| 69av成年福利视频| 国产jzjzjz丝袜老师水多| 国产色婷婷亚洲99精品小说| 久久亚洲国产成人精品无码区| 日本精品裸体写真集在线观看| 欧美精品一区二区三区蜜臀| 97精品在线播放| 日一区二区三区| 久久精品日产第一区二区三区精品版| 18网站在线观看| 欧美日韩精品综合在线| 老司机福利av| 国产欧美日韩一级| 成人av资源网| 超碰人人在线| 欧美久久久久久久久| 无码少妇一区二区| 性伦欧美刺激片在线观看| 国产精品毛片va一区二区三区| 思思99re6国产在线播放| 日韩欧美精品中文字幕| 人妻丰满熟妇av无码久久洗澡| 欧美日韩国产亚洲一区| 99re在线视频上| 中文字幕中文字幕在线十八区| 欧美电影在线免费观看| 欧美日韩国产一二三区| 久久精品999| 亚洲图片都市激情| 国产美女久久| 色多多国产成人永久免费网站| 日韩欧美国产另类| 国产欧美日韩三区| 91国产精品视频在线观看| 精品国产乱码久久久| 国产精品视频免费观看www| 久久久精品美女| 成 年 人 黄 色 大 片大 全| 亚洲国产天堂| 日韩中文在线不卡| 黄色影视在线观看| 国产成人精品一区二区三区视频 | 国产97在线|日韩| 偷拍自拍在线视频| 欧美视频一区二区三区…| 亚洲av无码一区二区三区网址 | 欧美天堂在线视频| 大桥未久av一区二区三区| 人妻丰满熟妇av无码久久洗澡| 国产一区白浆| 日韩欧美在线观看强乱免费| 成人福利片在线| 精品国模在线视频| 99国产精品99| 亚洲成av人影院| 久久精品无码一区| 久久99久久精品欧美| 黄色一级片av| 欧美顶级毛片在线播放| 国产精欧美一区二区三区| 欧美69xxx| 精品乱码亚洲一区二区不卡| av网站中文字幕| 中文字幕av在线一区二区三区| 国产精品嫩草影视| 99精品免费视频| 日韩精品在在线一区二区中文| 婷婷激情成人| 91精品国产高清久久久久久久久| 国产高清美女一级毛片久久| 在线91免费看| 欧美一级片免费在线观看| 国产日韩欧美a| 亚洲熟女乱综合一区二区| 国产精品普通话对白| 亚洲精品中文综合第一页| 91蜜桃臀久久一区二区| 国产v综合ⅴ日韩v欧美大片| 91精品久久| 国产亚洲视频在线| 欧美视频xxx| 欧美日韩精品一区二区三区蜜桃| 久久午夜无码鲁丝片午夜精品| 久久这里都是精品| 亚洲精品久久久久久| 亚洲女优在线| 欧妇女乱妇女乱视频| 九九视频精品全部免费播放| 亚洲一区二区三区在线视频 | 国内精品久久久久久久97牛牛 | 我不卡一区二区| 国产成人a级片| 午夜免费高清视频| 最新日韩在线| 99精品视频网站| 国产麻豆精品久久| 国产在线一区二区三区播放| 成人51免费| 国产精品video| 国产一二在线播放| 欧美激情在线视频二区| 男人在线资源站| 国产亚洲视频在线| 亚洲av成人无码久久精品老人| 欧美一级久久久| 中文在线资源天堂| 色综合天天视频在线观看| 久久午夜无码鲁丝片| 亚洲免费观看高清| 久久久久亚洲AV成人无在| 91色视频在线| 好吊色视频一区二区三区| 国产精品资源网| 亚洲精品免费一区亚洲精品免费精品一区 | 北条麻妃一区二区三区在线观看| 91久久精品国产91性色| 久久婷婷五月综合色丁香| 庆余年2免费日韩剧观看大牛| 大香伊人中文字幕精品| 色综合天天综合网国产成人网| free性欧美hd另类精品| 久久福利视频网| yellow91字幕网在线| 久久久av一区| 国产黄色小视频在线| 久久久精品久久久久| 黄色av电影在线观看| 啊v视频在线一区二区三区 | 亚洲 另类 春色 国产| 亚洲第一偷拍网| 天堂在线视频免费观看| 亚洲大胆人体在线| 婷婷色在线视频| 国产午夜精品理论片a级探花| 深夜福利视频一区| 亚洲免费人成在线视频观看| 久久av少妇| 伊人久久综合97精品| 91精品国产91久久久久游泳池 | 91九色国产在线播放| 国内精品视频一区| 91精品小视频| 国产馆精品极品| 国内自拍偷拍视频| 成人性视频网站| 无码人妻aⅴ一区二区三区| 99精品国产热久久91蜜凸| 中文字幕av观看| 国产日产欧美精品一区二区三区| 大胸美女被爆操| 亚洲欧美色综合| 日本少妇bbwbbw精品| 日韩欧美亚洲成人| 波多野结衣一本一道| 欧美日本乱大交xxxxx| 国产福利第一视频| 亚洲福利视频网| 黄网在线免费| 精品久久久999| 日本h片在线| 奇门遁甲1982国语版免费观看高清| 日韩成人亚洲| 91精品国产综合久久久久久丝袜| 久久影视三级福利片| 日本一区二区三区四区高清视频 | 成人免费在线小视频| 日韩精品亚洲专区| 国产资源中文字幕| 92国产精品观看| 国产精品国产三级国产传播| 亚洲v日本v欧美v久久精品| 成人h动漫精品一区二区下载| 555www色欧美视频| 亚洲色图欧美视频| 日韩视频第一页| 在线免费看h| 亚洲a在线播放| 国产一区二区三区不卡视频网站| 老司机午夜免费福利视频| 久久久久久9| 又黄又色的网站| 国产精品色一区二区三区| 精品无码m3u8在线观看| 欧美日韩午夜影院| 姝姝窝人体www聚色窝| 久久激情视频免费观看| 韩日成人影院| 国产精品综合久久久久久| 成人在线国产| 国产亚洲天堂网| 国产传媒日韩欧美成人| 国产激情av在线| 亚洲成人1区2区| 国产手机视频在线| 国产一区二区三区三区在线观看| 电影k8一区二区三区久久| 国产专区精品视频| 不卡一区综合视频| 夫妻免费无码v看片| 国产98色在线|日韩| 日韩一卡二卡在线观看| 欧美性猛交xxxx黑人交| 午夜国产在线视频| 欧美激情奇米色| 精品视频91| 亚洲在线视频一区二区| 日日夜夜免费精品视频| 国产乱了高清露脸对白| 亚洲自拍偷拍欧美| 精品人妻少妇嫩草av无码专区| 日韩中文字幕视频在线| 日韩在线免费| 欧美日韩精品免费观看| 在线亚洲精品| 国产精品成人99一区无码| 亚洲影视资源网| 午夜精品久久久久久久99| 九九九久久久久久| 日韩精品一区国产| 黄色小视频大全| 国产精品一区免费视频| 久久国产精品国语对白| 在线播放视频一区| 黄色在线免费看| 亚洲淫片在线视频| 午夜精品视频| 中文字幕在线视频一区二区| 亚洲欧美成aⅴ人在线观看| 国产女人高潮毛片| 久久久精品久久| 日韩黄色av| 97中文字幕在线| 成人福利视频在线看| 国产成人亚洲欧洲在线| 亚洲男人天堂网| 97久久网站| 日本特级黄色大片| 国产精品538一区二区在线| 最新一区二区三区| 日韩欧美一级片| a级片在线免费观看| 国产精品久久久久久久天堂第1集| 精品动漫一区| 国产精品成人99一区无码| 高潮白浆女日韩av免费看| 精品视频二区| 国产欧美一区二区三区视频 | 国产a∨精品一区二区三区不卡| 自拍欧美一区| 日韩av卡一卡二| 一区二区三区**美女毛片| 免费观看国产视频| 奇门遁甲1982国语版免费观看高清| 国产影视一区| 一区二区在线免费看| 一区二区三区四区在线| 人妻一区二区三区| 国产精品6699| 久久精品久久久| 天天躁日日躁狠狠躁av| 91高清在线观看| a视频在线播放| 久久久久久久久久久久久9999| 另类图片国产| 最新一区二区三区| 日韩精品中文字幕视频在线| 国产精品久久久久77777丨| 日日噜噜夜夜狠狠久久丁香五月 | 天天综合天天综合色| 永久免费看mv网站入口78| 日韩欧美亚洲国产一区| 欧美成人hd| 国产伦精品一区二区三区在线 | 黄色在线小视频| 国产欧美一区二区三区久久人妖| 欧美黄色一区二区| 成人av.网址在线网站| 国产一区二区三区亚洲综合| 妺妺窝人体色www看人体| a级高清视频欧美日韩| 亚洲一区中文字幕永久在线| 欧美精品久久久久a| 欧美综合另类| 亚洲天堂资源在线|