精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顏水成袁粒提出新一代MoE架構:專家吞吐速度最高提升2.1倍!

人工智能 新聞
這個通用架構叫做MoE++,由顏水成領銜的昆侖萬維2050研究院與北大袁粒團隊聯合提出。

比傳統MoE推理速度更快、性能更高的新一代架構,來了!

這個通用架構叫做MoE++,由顏水成領銜的昆侖萬維2050研究院與北大袁粒團隊聯合提出。

總體來看,MoE++的創新之處在于引入了“零計算量專家”,得益于這個設計,使得新架構有了三大優勢:

  • 降低計算成本:MoE++允許每個Token使用可變數量的FFN專家,甚至可以完全跳過當前的MoE層。
  • 提升性能:通過減少簡單Token所需的FFN專家數量,MoE++使更多專家能夠專注于復雜的Token,釋放出比傳統MoE更大的性能潛力。
  • 零計算量專家的參數極小:可以在每個GPU上同時部署所有的零計算量專家,避免了分布式FFN專家部署帶來的通信開銷和專家負載不均的問題。

除此之外,MoE++還讓每個Token在選擇專家時參考前一層的路由路徑。

實驗結果表明,在0.6B到7B參數規模的LLMs上,MoE++在相同模型大小的情況下,相比傳統MoE,性能更優,同時實現了1.1到2.1倍的專家吞吐速度。

并且這個模型權重也已開源!

那么MoE++具體是如何做到的,我們繼續往下看。

MoE++是如何做到的?

現有的大多數混合專家(MoE)方法通常為所有Token激活固定數量的FFN專家。

在許多研究中,每個Token會選擇Top-2 FFN專家,并將它們的輸出加權合成為下一層的輸入。然而,并非所有Token的預測難度都是相同的。

例如,像逗號等簡單符號可能只需要一個FFN專家來處理。

甚至在某些特殊情況下,某些Token如果與當前MoE層的專家不匹配,繞過該層而不選擇Top-2 FFN專家反而可能更為高效。

基于這一見解,研究團隊認為,現有MoE使用的固定混合機制可能導致訓練和推理效率下降,同時限制模型性能。

為了在提升速度的同時增強性能,研究團隊提出了一種通用的異構MoE框架,稱為MoE++。

具體來說,團隊引入了三種零計算量專家:

  • Zero專家,輸出空向量
  • Copy專家,將輸入直接作為輸出
  • Constant專家,用可訓練的向量替代輸入作為輸出。

如圖1所示,與傳統MoE方法不同,MoE++允許每個Token使用可變數量的FFN專家,接受恒定向量的替換,甚至完全跳過當前的MoE++層。

圖片

△圖1:MoE++和普通MoE的對比

這種異構結構通過擴大網絡的組合空間,提升了模型的擬合能力,并顯著降低了計算成本。

此外,研究團隊還將前一層的路由分數整合到當前層的專家選擇中,使Token在選擇專家時能夠參考其先前的路由路徑,從而實現更穩定的專家分配。

研究團隊認為,新設計的MoE架構應滿足以下標準:

  1. 設計應盡量簡化,以高效處理簡單的Token
  2. 為了確保公平比較,新增參數應保持在可忽略的范圍

在這些原則的指導下,研究團隊引入了零計算量專家,每個專家僅執行最基本的操作。

如圖2(a)所示,團隊設計了三種類型的零計算量專家:Zero專家、Copy專家和Constant專家,分別對應丟棄、跳過和替換操作。

圖片

△圖2:MoE++的核心組成部分

Zero專家

最簡單的零計算量專家是丟棄當前輸入的Zero專家。

本質上,Zero專家的存在可以將Top-2 MoE++層降級為Top-1 MoE++層。

具體來說,當Zero專家被激活時,Top-2 MoE++層的輸出將等同于另一個專家的單獨輸出。

這樣,Zero專家的引入提升了模型在處理簡單Token和復雜Token時的靈活性。

圖片

Copy專家

Copy專家直接將輸入作為輸出,直觀上相當于跳過當前MoE++層。

具體而言,當輸入Token與現有專家的匹配較差時,選擇繞過MoE++層可能更為有利。

圖片

Constant專家

Constant專家通過可訓練向量替換輸入Token。

然而,完全替換會導致輸入Token信息的丟失。

為此,研究團隊引入了可訓練的權重矩陣,用于動態預測替換的比例。由于Constant專家的計算開銷極小,因此仍被歸類為零計算量專家。

圖片

路由分數殘差

由于MoE++包含異構專家,因此與普通MoE相比,路由器的設計變得更加關鍵。

為此,如圖2(b)所示,研究團隊提出了一種路徑感知路由器,它在選擇合適的專家時考慮了前一層所采用的路徑。

具體來說,MoE++將前一層的路由分數通過一個可學習的轉換矩陣合并到當前層的專家選擇中。

這些路由分數殘差使每個Token在選擇專家時可以考慮其先前的路由路徑。

圖片

為什么MoE++比MoE更好(Why)?

對于這個問題,主要可以總結三點原因。

首先就是靈活的計算量分配

MoE++通過為簡單Token分配較少的FFN專家,優化了計算資源的分配,從而使更多FFN專家能夠專注于處理更具挑戰性的Token。

正如圖3所示,研究團隊發現,在MoE++中,動詞激活的FFN專家數量最多,其次是名詞,而拆分后的詞片激活的FFN數量最少。

這表明,MoE++能夠讓語義較少的Token使用更少的FFN專家,從而釋放更多專家來處理語義更豐富的Token。因此,MoE++不僅減少了計算開銷,還提升了整體性能。

圖片

△圖3:在MoE++中不同Token所需要的平均FFN專家數量

其次是穩定的路由

MoE++將前一層的路由分數合并到當前層的專家選擇中。

這些路由分數殘差使每個Token在選擇專家時考慮其先前的路由路徑。

如圖4所示,路由分數殘差有效地建立了不同MoE++層之間的聯系,減小了路由分數的方差。

同時,路由分數殘差不改變路由分數的均值和取值范圍。因此,路由分數殘差有助于在MoE++中實現異構專家架構的穩定路由。

圖片

△圖4:路由分數殘差對路由分數分布的影響

最后是更低的計算復雜度

如下表所示,MoE++具有比普通MoE更低的理論計算復雜度。

圖片

實驗結果

從0.6B的參數量逐漸擴展到7B參數量的大量實驗結果表明,MoE++方法明顯優于普通MoE方法。

與相同大小的普通MoE模型相比,MoE++的專家吞吐量提高了約15% ~ 111%,同時具有更高的性能。

圖片
圖片

現有的LLMs模型通常需要大量的訓練預算,比如OpenMoE-8B/32E使用1.1T Tokens,TinyLlama-1.1B使用3T Tokens。

研究人員也將MoE++模型的訓練預算擴展到1T Tokens。

研究人員發現MoE++模的性能與具有2到3倍激活參數的稠密模型相當。

值得注意的是,MoE++優于OpenMoE-8B/32E,這是一個從零開始訓練的更大的MoE模型,使用更多的訓練Tokens。

這些結果表明,MoE++框架是一種很有前途的LLMs框架方案。

圖片

任務級專家負載分布的可視化

研究人員還探索了MoE++模型中跨不同任務的專家負載分。這些可視化揭示了幾個有趣的發現:

  1. 專家負載在不同層之間存在相關性,特別是在相鄰層之間。例如,當第j層激活很大比例的FFN專家時,第j + 1層很可能也會以同樣大的比例激活FFN專家。
  2. 與中間層相比,淺層和最后一層的專家分配模式在不同任務之間的差異更大。這表明該模型主要通過其淺層和最終層而不是中間層來適應不同的任務。未來的工作可以集中在這些層中設計更復雜的結構,以增強模型對不同任務的適應性。
  3. 不同任務中每個Token激活的FFN專家數量存在顯著差異,但并不一定是更簡單的任務激活更少的FFN專家。例如,ARC Challenge任務通常比ARC Easy任務激活更多的FFN專家。這些結果表明,MoE++模型根據知識內容和Token級別的復雜性來分配專家,而不是根據整體任務難度來分配專家。
  4. 在所有專家類型中,Zero專家的平均激活次數最高,更簡單的任務顯示出更高的平均激活次數。例如,ARC Easy任務比ARC Challenge任務激活更多的零專家。這表明Zero專家的激活水平可能可以作為模型任務難度的一個指標。
  5. 在MoE++模型的所有層中,不同任務主題的專家分配差異顯著,這表明MoE++模型通過采用不同的專家分配模式來處理不同主題的任務。

圖片
圖片
圖片
圖片
圖片

論文地址:https://arxiv.org/abs/2410.07348

GitHub地址:https://github.com/SkyworkAI/MoE-plus-plus

Huggingface地址:https://huggingface.co/Chat-UniVi/MoE-Plus-Plus-7B

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-10-12 09:44:09

AdobeAcrobat XI

2021-01-29 11:37:26

同態加密HE隱私保護

2016-09-29 15:13:34

以太網網絡速度

2009-03-20 11:12:32

HX 路由器產品Hughes

2012-08-30 09:34:08

VMware

2012-08-06 13:28:25

Wi-Fi

2010-12-14 12:48:43

SafeNetPKI應用程序虛擬環境

2015-02-04 11:06:39

VMware

2011-04-28 20:37:12

2020-09-30 10:39:01

VMware

2013-12-12 14:14:15

戴爾

2014-05-13 13:33:33

2017-04-12 16:05:24

思科MDS存儲網絡導向器

2015-11-23 17:58:25

疊云

2011-07-11 17:33:36

華為TP3106智真系統

2014-12-15 10:43:19

戴爾

2021-12-14 15:59:38

數據模型推理

2024-01-02 15:15:00

AI模型開源
點贊
收藏

51CTO技術棧公眾號

午夜电影亚洲| 99久久婷婷国产综合精品首页| 国产一区福利在线| 欧美人交a欧美精品| 你懂得在线视频| 中文字幕一区久| 国产精品久久久一本精品| 3d动漫精品啪啪一区二区三区免费| 黄色一级片在线免费观看| 欧美三级电影在线| 777亚洲妇女| 成人黄色av片| 国产视频中文字幕在线观看| 不卡av电影在线播放| 国产成人拍精品视频午夜网站| 看黄色录像一级片| 免费看久久久| 91麻豆精品国产91久久久久久久久 | 九九热最新视频//这里只有精品 | 无码人妻丰满熟妇区毛片| 麻豆网站在线| 久久久久久一级片| 国产精品成人一区二区三区| 无码人妻精品一区二| 中文字幕av亚洲精品一部二部| 亚洲精品一区二区三区婷婷月| 天天操精品视频| 成人午夜在线| 色综合欧美在线视频区| 久久亚洲精品无码va白人极品| 69视频在线观看| 久久品道一品道久久精品| 亚洲一区二区三区777| 91丨九色丨海角社区| aa国产精品| 美日韩在线视频| 女性裸体视频网站| 极品美女一区二区三区| 日韩av有码在线| 中文字幕1区2区| 精品一区二区三区中文字幕在线| 在线观看av一区二区| 极品粉嫩国产18尤物| 中文字幕在线播放网址| 亚洲欧洲日韩女同| 亚洲一区二区高清视频| 国产在线观看黄| 久久久影院官网| 久久国产精品久久| 午夜一区在线观看| aaa国产一区| 久久久久九九九| 天天干,天天操,天天射| av成人老司机| 久久久亚洲综合网站| 色视频在线看| 久久夜色精品国产欧美乱极品| 精品国产一区二区三区四区精华 | 久久综合伊人77777蜜臀| 美国精品一区二区| 国产大片一区| 久久人体大胆视频| 三级在线观看免费大全| 91精品亚洲| 色与欲影视天天看综合网| 日韩一区二区三区四区在线| 欧美精品日韩| 久久频这里精品99香蕉| 国产三级av片| 免费在线成人网| 成人性生交大片免费看小说| 国产女无套免费视频| 国产精品一区一区| 国产一区二区三区奇米久涩| 性感美女福利视频| 国产欧美日韩亚州综合 | 啪啪免费视频一区| 亚洲第一主播视频| www.日日操| 成人动漫视频在线观看| 精品国产不卡一区二区三区| 99久久人妻精品免费二区| 亚洲毛片免费看| 神马久久桃色视频| 欧美人妻一区二区| 久久香蕉精品| 91在线视频免费| 婷婷伊人综合中文字幕| 国产婷婷色一区二区三区在线| 亚洲区一区二区三区| 午夜激情在线| 日本精品一区二区三区四区的功能| 日本在线观看免费视频| 日本精品一区二区三区在线观看视频| 亚洲成人精品久久| 9.1片黄在线观看| 狠狠爱综合网| 国产精品久久久久久中文字| 国产黄色小视频在线观看| 99精品国产视频| 7777在线视频| 亚洲欧美小说色综合小说一区| 欧美日韩黄色影视| 久久无码人妻精品一区二区三区| 97色伦图片97综合影院| 91精品国产91久久久久久| 一区二区自拍偷拍| av在线播放不卡| 异国色恋浪漫潭| 裤袜国产欧美精品一区| 日韩一区二区视频| 精品人伦一区二区| 亚洲人体偷拍| 91久久国产综合久久蜜月精品| 久久99久久| 亚洲国产精品一区二区尤物区| 色乱码一区二区三区在线| 美女网站色精品尤物极品姐弟| 久久精品视频中文字幕| 国产suv精品一区二区33| 成人爽a毛片一区二区免费| 杨幂一区欧美专区| 日韩免费小视频| 日韩av在线直播| 男人的天堂久久久| 激情文学综合丁香| 五月天婷亚洲天综合网鲁鲁鲁| 成人一级福利| 精品日产卡一卡二卡麻豆| 一级免费黄色录像| 久久福利资源站| 五月婷婷综合色| 欧美韩国亚洲| 亚洲美女在线视频| 国产香蕉视频在线| 成人精品小蝌蚪| 青青青青在线视频| 亚洲国产精品免费视频| 欧美成aaa人片在线观看蜜臀| 日韩欧美国产另类| 日本一区二区三区四区在线视频| 91国视频在线| 国产成人在线中文字幕| 欧美激情综合色综合啪啪五月| 国产欧美日韩综合精品一区二区三区| 国产精品伦一区二区三级视频| 国产一级不卡毛片| 欧洲杯半决赛直播| 国产精品亚洲视频在线观看| 粉嫩av在线播放| 欧美视频在线观看一区| 夫妇露脸对白88av| 捆绑变态av一区二区三区| 亚洲精品永久www嫩草| 朝桐光一区二区| 中文字幕亚洲图片| 国产不卡精品视频| 亚洲一区二区三区小说| 亚洲麻豆一区二区三区| 国产日韩欧美一区二区三区在线观看| 精品国产乱码一区二区三区四区| 亚洲优女在线| 国产一区二区三区日韩欧美| 伊人影院中文字幕| 亚洲黄色尤物视频| 一级黄色片毛片| 欧美亚洲一区二区三区| 色999五月色| www.久久草.com| 欧美精品xxx| 欧美日韩在线中文字幕| 欧美日韩免费观看一区二区三区 | 影视亚洲一区二区三区| 99久热re在线精品996热视频| av影视在线看| 国产一区二区三区三区在线观看 | 亚洲国产天堂网精品网站| 四虎成人永久免费视频| 国产精品网站在线播放| 佐山爱在线视频| 国产午夜精品一区二区三区欧美| 日本一区二区不卡高清更新| 国产成人视屏| 456国产精品| 黄色免费在线网站| 亚洲精品av在线播放| 在线观看视频二区| 亚洲午夜一区二区三区| 第一次破处视频| 国产宾馆实践打屁股91| 国内自拍在线观看| 国产高清一区| 欧美日韩综合另类| 中文在线综合| 日韩免费在线免费观看| mm1313亚洲国产精品美女| 亚洲毛茸茸少妇高潮呻吟| 国产乱色精品成人免费视频 | 国产午夜精品福利| 韩国三级在线看| 蜜臀av一区二区三区| 韩日视频在线观看| 久久中文字幕二区| 久久亚洲精品欧美| 日韩精品一区二区三区中文在线| 欧美一级片一区| 性欧美videos高清hd4k| 国产一区二区日韩精品欧美精品| 成人av手机在线| 欧美日韩午夜在线| youjizz在线视频| 夜夜亚洲天天久久| 蜜桃av.com| 久久久久久久久久美女| 香蕉在线观看视频| 美女精品自拍一二三四| 日本毛片在线免费观看| 午夜精品久久| 91制片厂免费观看| 色婷婷热久久| 偷拍视频一区二区| av在线不卡顿| 欧美亚州在线观看| 天天操综合520| 国产伦精品一区二区三区视频孕妇| 午夜不卡一区| 国产精品视频yy9099| 在线免费三级电影网站| 97精品国产97久久久久久春色| av网址在线| 久久亚洲精品一区| 麻豆影院在线| 菠萝蜜影院一区二区免费| 成年人在线视频免费观看| 亚洲久久久久久久久久| 香蕉人妻av久久久久天天| 欧美va亚洲va在线观看蝴蝶网| 一级黄色片在线观看| 欧美日韩在线三区| 这里只有精品国产| 91激情五月电影| 日韩在线 中文字幕| 欧美午夜宅男影院在线观看| 九九热在线视频播放| 午夜精品久久久久久久久| 天堂资源在线播放| 狠狠色噜噜狠狠狠狠97| 成人午夜视频在线播放| 欧美丝袜美女中出在线| 成人在线免费看视频| 欧美性色19p| 日本免费精品视频| 欧美性三三影院| 夜夜嗨aⅴ一区二区三区| 欧美日韩国产bt| 99热精品在线播放| 精品国产一区二区三区不卡 | 日韩av高清在线看片| 亚洲激情影院| av动漫在线看| 日韩av网站免费在线| 中文字幕网av| 国产精品资源在线看| 日韩不卡的av| 成人久久18免费网站麻豆| 青青草视频成人| 欧美高清在线视频| 91高清免费观看| 一区二区三区在线观看国产| 日本熟妇毛耸耸xxxxxx| 欧美性jizz18性欧美| 国产在线观看第一页| 91麻豆精品国产自产在线| 噜噜噜久久,亚洲精品国产品| 亚洲福利视频在线| 免费理论片在线观看播放老| 日韩在线视频网站| 欧美xxxx黑人又粗又长| 日本欧美一二三区| 电影91久久久| 六月婷婷久久| 忘忧草精品久久久久久久高清| www.在线观看av| 视频在线在亚洲| 欧美一级免费在线| 91在线视频18| 登山的目的在线| 狠狠色狠狠色综合日日小说 | 亚洲精品天天看| 免费高清在线观看| 91高潮精品免费porn| 福利视频亚洲| 国产欧美丝袜| 五月天久久网站| 97av视频在线观看| 国产乱妇无码大片在线观看| 国产精品无码午夜福利| 亚洲男女一区二区三区| 天码人妻一区二区三区在线看| 在线综合视频播放| 可以免费看污视频的网站在线| 久久躁狠狠躁夜夜爽| 婷婷综合六月| 国产精品自拍首页| 国产国产精品| 老头吃奶性行交视频| 国产成人一区二区精品非洲| 免费网站在线高清观看| 亚洲va国产va欧美va观看| 97人妻精品一区二区三区软件| 日韩电影中文字幕| 色图在线观看| 91免费在线视频| 不卡视频在线| 欧美黄色免费影院| www.日韩大片| 欧美黄色免费在线观看| 欧美日韩国产高清一区| 国产一区二区三区福利| 97国产精品人人爽人人做| 亚洲高清在线一区| 国产系列第一页| 麻豆精品视频在线观看| 免费在线观看你懂的| 亚洲第一主播视频| 黄色片一区二区| 欧美成人午夜剧场免费观看| 欧美亚洲福利| 一区二区三区我不卡| 日韩高清在线电影| 亚洲激情视频小说| 欧美性xxxxhd| 欧美精品久久久久久久久久丰满| 久久久久久欧美| 99精品国产高清一区二区麻豆| aaa免费在线观看| 黑人巨大精品欧美一区| 老司机精品免费视频| 欧美丝袜丝交足nylons图片| 美州a亚洲一视本频v色道| 欧美一二三视频| 蜜桃a∨噜噜一区二区三区| 成人毛片视频网站| 久久久五月婷婷| 国产视频1区2区| 在线电影av不卡网址| 国产精品诱惑| 亚洲国产一区二区三区在线| 男人操女人的视频在线观看欧美| 在线不卡av电影| 欧洲激情一区二区| 婷婷免费在线视频| 成人国产在线视频| 欧美国产91| 欧美久久久久久久久久久| 午夜精品久久久久久不卡8050| 人妻精品一区二区三区| 51久久精品夜色国产麻豆| 国产精品亚洲二区| 亚洲一级片网站| 亚洲免费高清视频在线| 亚洲美女福利视频| 欧洲成人免费视频| 成人网18免费网站| 午夜影院免费观看视频| 亚洲国产综合在线| 日韩美女一级视频| 国产精品视频一区二区高潮| 国产高清欧美| 欧产日产国产精品98| 色老综合老女人久久久| 无遮挡动作视频在线观看免费入口| 91久久国产婷婷一区二区| 国产精品www.| 伊人网在线视频观看| 欧美美女一区二区| 超级碰碰不卡在线视频| 欧美精品一区在线发布| 国产在线国偷精品免费看| 国产大片中文字幕| 在线观看久久av| 91蝌蚪精品视频| 婷婷激情四射五月天| 亚洲精品国产一区二区精华液 | 一区二区三区四区在线播放| 人妻少妇精品无码专区| 国产精品久久视频| 午夜精品视频| 亚洲av成人无码久久精品| 日韩免费电影网站| 国产精品字幕| 日本国产在线播放| 国产精品久久久久aaaa樱花| 秋霞视频一区二区| 国产日韩在线播放| 国产精品人人爽人人做我的可爱| 永久免费看片直接| 亚洲女同精品视频| **爰片久久毛片| 亚洲三级在线观看视频|