精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型面經——MoE混合專家模型總結 原創

發布于 2024-10-17 11:31
瀏覽
0收藏

?本篇將介紹MoE(Mixture of Experts,混合專家模型)相關面試題。

以下是一個快捷目錄:

一、MoE介紹

二、MoE出現的背景

三、有哪些MoE模型

四、介紹稀疏 MoE 層

五、介紹門控網絡或路由

六、為什么門控網絡要引入噪聲呢

七、如何均衡專家間的負載

八、“專家”指什么

九、專家的數量對預訓練有何影響?

十、什么是topK門控

十一、MoE模型的主要特點

十二、MoE和稠密模型的對比

十三、MoE的優勢

十四、MoE的挑戰

十五、微調MoE的方法

十六、MoE的并行計算

回答

一、MoE介紹

"Mixture of Experts"(MoE)是一種機器學習模型,特別是在深度學習領域中,它屬于集成學習的一種形式。MoE模型由多個專家(experts)和一個門控網絡(gating network)組成。每個專家負責處理輸入數據的不同部分或不同特征,而門控網絡則負責決定每個輸入應該由哪個專家來處理。

例如,在下圖中,“More”這個 token 被發送到第二個專家,而“Parameters”這個 token 被發送到第一個專家。

大模型面經——MoE混合專家模型總結-AI.x社區

二、MoE出現的背景

本質上來說就是一種高效的 scaling 技術,用較少的 compute 實現更大的模型規模,從而獲得更好的性能。

三、有哪些MoE模型

Switch Transformers、Mixtral、GShard、DBRX、Jamba DeepSeekMoE 等等。

以Mixtral為例

Mixtral 是一個稀疏的專家混合網絡。它是一個decoder-only的模型,其中前饋塊從一組 8 個不同的參數組中選擇。在每一層,對于每個令牌,路由器網絡選擇其中兩個組(“專家”)來處理令牌并附加地組合他們的輸出。

大模型面經——MoE混合專家模型總結-AI.x社區

混合專家層

這種技術在控制成本和延遲的同時增加了模型的參數數量,因為模型只使用每個令牌總參數集的一小部分。具體來說,Mixtral 總共有 46.7B 個參數,但每個令牌只使用 12.9B 個參數。因此,它以與 12.9B 型號相同的速度和相同的成本處理輸入和生成輸出。

Mixtral 基于從開放 Web 中提取的數據進行預訓練——同時培訓專家和路由器。

四、介紹稀疏 MoE 層

稀疏 MoE 層一般用來替代傳統 Transformer 模型中的前饋網絡 (FFN) 層。MoE 層包含若干“專家”(例如 8 個),每個專家本身是一個獨立的神經網絡。在實際應用中,這些專家通常是前饋網絡 (FFN),但它們也可以是更復雜的網絡結構,甚至可以是 MoE 層本身,從而形成層級式的 MoE 結構。

五、介紹門控網絡或路由

門控網絡接收輸入數據并執行一系列學習的非線性變換。這一過程產生了一組權重,這些權重表示了每個專家對當前輸入的貢獻程度。通常,這些權重經過softmax等函數的處理,以確保它們相加為1,形成了一個概率分布。這樣的分布表示了在給定輸入情境下每個專家被激活的概率。一個典型的門控函數通常是一個帶有 softmax 函數的簡單的網絡。

六、為什么門控網絡要引入噪聲呢

為了專家間的負載均衡。也即防止一句話中的大部分token都只有一個專家來處理,剩下的七個專家(假設一共八個專家)“無所事事”。

七、如何均衡專家間的負載

引入噪聲、引入輔助損失(鼓勵給予所有專家相同的重要性)、引入隨機路由、設置一個專家能處理的token數量上限

八、“專家”指什么

一個“專家”通常是前饋網絡 (FFN)。數據經過門控網絡選擇后進入每個專家模型,每個專家根據其設計和參數對輸入進行處理。每個專家產生的輸出是對輸入數據的一種表示,這些表示將在后續的步驟中進行加權聚合。或者通過單個專家模型進行處理。

九、專家的數量對預訓練有何影響?

增加更多專家可以提升處理樣本的效率和加速模型的運算速度,但這些優勢隨著專家數量的增加而遞減 (尤其是當專家數量達到 256 或 512 之后更為明顯)。同時,這也意味著在推理過程中,需要更多的顯存來加載整個模型。值得注意的是,Switch Transformers 的研究表明,其在大規模模型中的特性在小規模模型下也同樣適用,即便是每層僅包含 2、4 或 8 個專家。

十、什么是topK門控

選擇前k個專家。為什么不僅選擇最頂尖的專家呢?最初的假設是,需要將輸入路由到不止一個專家,以便門控學會如何進行有效的路由選擇,因此至少需要選擇兩個專家。

十一、MoE模型的主要特點:

  • 靈活性:每個專家可以是不同類型的模型,例如全連接層、卷積層或者遞歸神經網絡。
  • 可擴展性:通過增加專家的數量,模型可以處理更復雜的任務。
  • 并行處理:不同的專家可以并行處理數據,這有助于提高模型的計算效率。
  • 動態權重分配:門控網絡根據輸入數據的特點動態地為每個專家分配權重,這樣模型可以更加靈活地適應不同的數據。
  • 容錯性:即使某些專家表現不佳,其他專家的表現也可以彌補,從而提高整體模型的魯棒性。

十二、moe和稠密模型的對比

1、預訓練

  相同計算資源,MoE 模型理論上可以比密集模型更快達到相同的性能水平。

2、推理

  moe:高顯存,高吞吐量;

  稠密模型:低顯存,低吞吐量

十三、moe的優勢

   1、訓練優勢:預訓練速度更快;

   2、推理優勢:推理速度更快

十四、moe的挑戰

   1、訓練挑戰:微調階段,泛化能力不足,容易過擬合

   2、推理挑戰:對顯存的要求更高

十五、微調moe的方法

   1、凍結所有非專家層的權重,專門只訓練專家層

   2、只凍結moe層參數,訓練其它層的參數

十六、moe的并行計算

大模型面經——MoE混合專家模型總結-AI.x社區

圖片來源:b站 算法豬立業


參考資料

??https://blog.csdn.net/2201_75499313/article/details/136412787??

??https://www.zhihu.com/question/634844209/answer/3467132890??

??https://zhuanlan.zhihu.com/p/674698482??

???https://b23.tv/jCL0r4N??

?

文轉載自公眾號瓦力算法學研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/b_FeWWHcwXPxAC_SL6ABfg???

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
久久久精品福利| 激情内射人妻1区2区3区| 草草视频在线播放| 国产亚洲一区在线| 国产一区二区动漫| 欧美一级小视频| 美女在线视频免费| 中文字幕欧美一区| 精品视频在线观看| 国产美女www| 精品动漫av| 色妞欧美日韩在线| 91av在线免费| 懂色av色香蕉一区二区蜜桃| 狠狠色狠狠色综合日日小说| 天天干天天色天天爽| 欧洲天堂在线观看| 国产ts人妖一区二区| 国产精品视频1区| 日本在线视频免费观看| 久久久久久久久久久久久久| 亚洲人成在线观看| 国产伦精品一区二区三区精品| 外国电影一区二区| 欧美日韩中文字幕在线| 日本美女爱爱视频| 午夜免费视频在线国产| 91麻豆swag| 国产精品三区www17con| 91欧美日韩麻豆精品| 久久久国产精品一区二区中文| 欧美国产日产韩国视频| 黄色a级片在线观看| 私拍精品福利视频在线一区| 欧美大片免费久久精品三p| 一区二区三区 欧美| 在线观看欧美日韩电影| 亚洲国产cao| 欧美人与动牲交xxxxbbbb| 日韩在线免费电影| 国产欧美精品一区二区色综合 | 日本成人一区| 亚洲爱爱视频| 大荫蒂欧美视频另类xxxx| 精品视频在线观看一区二区| 香港伦理在线| 国产精品黄色在线观看| 五月天婷亚洲天综合网鲁鲁鲁| 水莓100在线视频| 99综合电影在线视频| 国产另类自拍| 日本精品999| 成年人网站91| 久草一区二区| 日本电影一区二区在线观看| 久久综合给合久久狠狠狠97色69| 久久精品99久久| 视频一区二区在线播放| 久久久国产综合精品女国产盗摄| 免费成人看片网址| 精品电影在线| 中文字幕乱码久久午夜不卡| 亚洲欧美精品在线观看| 免费在线看黄| 一区二区三区四区激情| 国产一区二区三区小说| 麻豆理论在线观看| 91福利视频网站| 国产成年人视频网站| 国产一区二区三区免费观看在线| 日韩免费视频一区二区| 中文字幕在线视频播放| 亚洲a级精品| 一区二区三区视频免费| 欧美视频www| 亚洲精品影院在线观看| 日本a级片电影一区二区| 在线观看免费观看在线| 国产成人自拍高清视频在线免费播放| 国产二区一区| 国产999免费视频| 国产国语videosex另类| 日韩精品在线中文字幕| av3级在线| 日韩中文欧美| 91麻豆精品国产| 精品人妻一区二区三区免费| 91国内精品白嫩初高生| 亚洲精品美女久久久久| 91在线无精精品白丝| 你懂的视频一区二区| 91av在线国产| 国产精品伦一区二区三区| 岛国精品在线播放| 天堂资源在线亚洲资源| 午夜伦理在线| 精品日韩视频在线观看| 91精产国品一二三产区别沈先生| 国产极品模特精品一二| 中文字幕一精品亚洲无线一区| 久草资源在线视频| 喷白浆一区二区| 成人资源视频网站免费| 高清毛片在线看| 亚洲永久免费av| 狠狠热免费视频| 亚洲一区二区三区免费| 国产一区二区三区中文| 国产一级特黄视频| 久久机这里只有精品| 久久综合婷婷综合| 丝袜国产在线| 欧美日韩精品欧美日韩精品一综合| 精品无码av一区二区三区| 欧美人与牛zoz0性行为| 国模私拍一区二区三区| 国产区精品在线| 国产午夜精品美女毛片视频| av日韩一区二区三区| 亚洲热av色在线播放| 亚洲人成绝费网站色www| 久草视频手机在线观看| 精品一区二区三区免费观看| 日韩精品欧美专区| 午夜激情电影在线播放| 亚洲成人黄色在线观看| 欧美 日韩 国产 一区二区三区| 久久黄色影院| 欧美日本国产精品| 涩涩网在线视频| 亚洲国产精品人人爽夜夜爽| 在线免费日韩av| 精品一区二区三区av| 翔田千里亚洲一二三区| 综合在线影院| 亚洲人成亚洲人成在线观看| 日韩精品一区二区亚洲av| 不卡av电影在线播放| 老司机激情视频| 自拍偷拍欧美日韩| 久久影院在线观看| 国产露脸91国语对白| 中文字幕一区在线| 在线观看免费不卡av| 欧美日中文字幕| 国产第一区电影| 黄色毛片在线看| 色哦色哦哦色天天综合| 扒开jk护士狂揉免费| 性久久久久久| 欧美黑人3p| 欧美性suv| 国产午夜精品美女视频明星a级| 丁香社区五月天| 国产欧美一区二区三区沐欲| 色播五月综合网| 国产精品久久久久一区二区三区厕所 | 欧美网站大全在线观看| 波多野结衣 在线| 视频一区二区不卡| 亚洲国内在线| 国产精品久久久久久久久久辛辛| 久久视频在线直播| 亚洲精品福利网站| 偷偷要91色婷婷| 日韩中文字幕电影| 免费在线视频一区| 欧美交换配乱吟粗大25p| 韩国女主播一区二区三区| 91av国产在线| 中文字幕在线免费| 日韩欧美一级特黄在线播放| 国产香蕉在线视频| 久久久无码精品亚洲日韩按摩| 可以免费在线看黄的网站| 日韩精品网站| 9a蜜桃久久久久久免费| 超碰aⅴ人人做人人爽欧美| 中文字幕日韩电影| 国产黄色一区二区| 欧美日韩免费网站| 蜜桃视频最新网址| 92精品国产成人观看免费 | 国产无码精品久久久| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 亚洲精品小说| 久久99精品久久久久久三级 | 亚洲熟女少妇一区二区| 中文一区一区三区高中清不卡免费| 欧美精品1区| 成人av免费在线看| 国产精品高清乱码在线观看 | 在线免费观看黄色网址| 日韩一本二本av| 天天干天天干天天干天天| 国产精品久久久久久久久动漫 | 亚洲国产欧美国产第一区| 4k岛国日韩精品**专区| 黄av在线免费观看| 亚洲欧美日韩国产成人| 精品国产亚洲AV| 欧美性猛交xxxx黑人| 一区二区成人免费视频| 国产亚洲福利社区一区| 在线免费看黄色片| 精品一区二区三区在线播放视频 | 亚洲国产精品小视频| 一区二区三区亚洲视频| 精品毛片网大全| 我家有个日本女人| 欧美国产禁国产网站cc| 国产精品第七页| 国产伦精品一区二区三区免费迷| 久久国产乱子伦免费精品| 欧美视频不卡| 国产美女视频免费| 波多野结衣在线观看一区二区| 精品一卡二卡三卡四卡日本乱码 | 高清一区二区三区四区| 色婷婷综合久久| 国产无遮挡又黄又爽在线观看| 国产精品免费久久| 中文字幕第4页| 99久久久精品| 亚洲精品一区二区18漫画| 久久国产免费看| www.99在线| 日韩电影一区二区三区| 欧美 日韩精品| 中文一区二区| 国产一区二区三区视频在线观看| 人人妻人人澡人人爽欧美一区| 九九热线有精品视频99| wwwxx欧美| 国产在线一区不卡| 91精品久久久久久蜜桃| 97久久中文字幕| 国产日韩欧美另类| 国产亚洲一区二区手机在线观看 | 国产精品99久久久久久董美香 | 人妻少妇精品久久| 欧美色一级片| 丁香婷婷综合激情| 黑丝一区二区| r级无码视频在线观看| 亚洲天堂男人| 欧美在线一区视频| 日韩一级在线| 能在线观看的av| 国产农村妇女精品一二区| 日本三级免费网站| 日日摸夜夜添夜夜添国产精品| www日韩在线观看| 全部av―极品视觉盛宴亚洲| 五月婷婷六月合| 国产在线看一区| 日批免费观看视频| 99国产精品一区| 精品人妻无码一区二区三区换脸| 国产亚洲精品bt天堂精选| 能直接看的av| 成人免费在线观看入口| 国产va在线播放| 午夜电影网亚洲视频| 国产精品suv一区| 欧美日韩久久久一区| 99在线观看精品视频| 亚洲国产精品成人精品| 日本一级在线观看| 在线观看成人黄色| aaa大片在线观看| 国内精品久久久久影院优| 日韩欧美另类一区二区| 国产主播欧美精品| 99国产精品久久一区二区三区| 九九热久久66| 日韩欧美综合| 久久av综合网| 蜜臀av性久久久久av蜜臀妖精| 中文字幕日韩久久| 91在线精品一区二区三区| 色欲狠狠躁天天躁无码中文字幕| 最新中文字幕一区二区三区| 日本少妇性高潮| 欧美日韩视频不卡| 亚洲国产中文字幕在线| 亚洲日韩欧美视频| 天天干在线视频论坛| 蜜臀久久99精品久久久久久宅男| 黄色污在线观看| av在线一区二区三区| 美国一级黄色录像| 亚洲国产欧美另类丝袜| 国产情侣呻吟对白高潮| 精品国精品国产尤物美女| 福利小视频在线观看| 欧美劲爆第一页| 日本免费成人| 久久综合狠狠综合久久综青草| 91精品国产麻豆国产在线观看| 久久久999视频| 国产精品538一区二区在线| 在线不卡av电影| 午夜av一区二区三区| 国产精品国产一区二区三区四区| 日韩电影免费观看中文字幕| 手机免费观看av| 国产在线视频资源| 欧美一区电影| 国产精品日韩欧美一区二区三区| 精品国产一区二区三区久久久蜜臀 | 91丨porny丨探花| 我不卡影院28| 男人女人黄一级| 99久久久国产精品| 久久中文字幕无码| 欧美精品久久天天躁| 国产在线视频资源| 欧美一级在线亚洲天堂| 91精品啪在线观看国产爱臀| 亚洲欧美精品在线观看| 视频一区二区三区中文字幕| 亚洲精品乱码久久| 亚洲夂夂婷婷色拍ww47| 国产三级小视频| 日韩亚洲欧美中文在线| 欧洲成人一区| 欧美一区1区三区3区公司| 国产精品毛片| 国产人妻人伦精品1国产丝袜| 一区二区三区国产精品| 99久久精品国产成人一区二区| 精品99一区二区| 菠萝蜜视频在线观看www入口| 亚洲综合在线播放| 午夜精品剧场| 免费黄色av网址| 亚洲国产精品尤物yw在线观看| 99在线观看免费| 欧美激情精品久久久久| 91精品国产自产精品男人的天堂| 日本一道在线观看| 国产精一区二区三区| 超碰手机在线观看| 日韩美一区二区三区| 欧美极品少妇videossex| 国产高清在线一区| 中文一区在线| 在线观看日本中文字幕| 91福利在线观看| 欧美性videos| 亚洲一区二区三区香蕉| 韩国一区二区三区在线观看| 激情av中文字幕| 欧美日韩美女视频| 国产精品一区二区三区四区色| 国产v综合ⅴ日韩v欧美大片| 欧洲美女日日| 亚洲自拍第三页| 亚洲成av人影院| 狠狠色伊人亚洲综合网站l| 国产精品久久不能| 亚洲精品小说| 熟妇人妻久久中文字幕| 色偷偷88欧美精品久久久| 中国日本在线视频中文字幕| 欧美精品自拍偷拍动漫精品| 色婷婷.com| av资源网一区| 久久久黄色大片| 在线亚洲国产精品网| 国产精品亚洲综合在线观看| 久久99中文字幕| 久久久不卡网国产精品二区| 国产精品国产精品国产专区| 久久久人成影片一区二区三区观看| 色老板在线视频一区二区| 9久久婷婷国产综合精品性色| 亚洲天堂av一区| 亚洲AV第二区国产精品| 国产精品一区二区久久久久| 欧美日韩国产一区精品一区| 中文字幕在线播放视频| 欧美日韩三级在线| 后进极品白嫩翘臀在线播放| 日韩精品一区二区三区丰满 | 992tv人人草| 福利视频第一区| 免费观看在线黄色网| 国产在线资源一区| 免费观看日韩电影| 国产一级生活片| 久久精品99久久久久久久久| 日韩大片在线免费观看| 亚洲美女性囗交| 欧美体内谢she精2性欧美| 午夜小视频在线观看| 五月天亚洲综合小说网| proumb性欧美在线观看| 国产精品久久久午夜夜伦鲁鲁|