精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為MoE解綁:全新「專家即服務」推理架構發布,超細粒度擴展銳減37.5%成本

人工智能 新聞
本文作者提出了一種全新的 MoE 模型推理系統 ——Expert-as-a-Service (EaaS),旨在通過架構層面的創新來提升大規模 MoE 推理的效率、擴展性和魯棒性。

本文第一作者劉子銘為新加坡國立大學三年級博士生,本科畢業于北京大學,研究方向為機器學習系統中的并行推理與訓練效率優化。通信作者為上海創智學院馮思遠老師和新加坡國立大學尤洋老師。共同作者來自于上海奇績智峰智能科技有限公司,北京基流科技有限公司等。

近年來,大型語言模型的參數規模屢創新高,隨之而來的推理開銷也呈指數級增長。如何降低超大模型的推理成本,成為業界關注的焦點之一。Mixture-of-Experts (MoE,混合專家) 架構通過引入大量 “專家” 子模型,讓每個輸入僅激活少數專家,從而在參數規模激增的同時避免推理計算量同比增長。這一稀疏激活策略使模型能擴展到數萬億參數規模,但也給推理系統帶來了新的挑戰:

  • 擴展性差:現有主流 MoE 推理框架大多要求使用大規模同步通信組來部署模型,一次性占用大量 GPU 資源,使彈性資源伸縮變得十分困難。這種粗粒度伸縮方式導致資源供給無法嚴格按照當前用戶流量進行調整,只能按整塊單元增加或減少,造成資源浪費。
  • 容錯性低:傳統 MoE 推理采用全局緊耦合架構,各 GPU 間通過 All-to-All 等大規模集體通信協同工作。在這種高度依賴統一通信組的設計下,任意一個節點故障都可能迫使整個服務集群重啟,導致服務中斷。也就是說,系統缺乏容錯能力,一處故障即全局崩潰。
  • 負載不均:MoE 中的專家調用是動態稀疏的,哪個專家被激活取決于輸入內容,在不同的工作負載下被激活的分布有很大區別。固定的專家映射和資源分配策略難以適應這種波動。某些專家所在 GPU 因頻繁命中而過載,而其他專家節點長期閑置,造成資源利用低下。

通過觀察,作者發現這些問題其實有共同的根本原因:整個系統被當作一個龐大的 “有狀態整體” 去管理。事實上,專家層本質上是無狀態的,它對輸入執行純函數計算,不依賴歷史上下文。作者利用這一特性,將專家層的計算抽象為獨立的無狀態服務,與維護 KV 緩存的 Attention 前端解耦部署。盡管近期也有研究嘗試解耦 Attention 層與專家層、按不同組件拆分部署,但仍未根本解決伸縮僵化、大規模容錯等問題。為此,本文作者提出了一種全新的 MoE 模型推理系統 ——Expert-as-a-Service (EaaS),旨在通過架構層面的創新來提升大規模 MoE 推理的效率、擴展性和魯棒性。

方法

EaaS 的 “專家即服務” 的架構轉變,使 MoE 推理能夠像微服務一樣靈活調度。在這一前提下,作者對系統進行了如下設計:

  • 專家服務化、無狀態設計:EaaS 將每個專家拆分成獨立服務模塊,專家不維護會話狀態,僅根據請求計算輸出。Attention 層(客戶端)通過 gating 動態選取需要調用的專家服務。由于專家之間相互獨立,整個模型不再是一個龐大的緊耦合應用,而是由許多可獨立擴展的服務組成,為精細擴展奠定基礎。在這種架構下,模型初始部署規模可以很小(例如 16 塊 GPU 起步),可以一次增加 / 減少一塊 GPU 來精確匹配負載需求。

EaaS 專家服務器的動態批處理機制。

  • 解耦 Attention 層與專家層:在傳統架構中,Attention 計算和專家計算放置在同一組計算節點內,而 EaaS 將 Attention 客戶端與專家服務端職責解耦開來,二者通過高效通信機制銜接。這樣一方面減少了全局同步點,Attention 端可以異步等待專家結果,同時著手處理下一批次計算,從而提升流水線利用率;另一方面 Attention 和專家可以獨立擴展,互不影響,突破了傳統架構中必須同步擴容的限制。

EaaS 利用 InfiniBand GPUDirect Async (IBGDA) 來實現低通信延遲,并通過完全 CUDA graph 捕獲來最小化內核啟動開銷,從而實現無 CPU 控制的通信。

  • 高性能異步通信 (IBGDA):為支撐上述解耦架構,EaaS 研發了定制的無通信組、非對稱、異步點對點通信庫。該庫基于 InfiniBand GPUDirect Async (IBGDA) 技術,實現了 GPU 直連網絡的通信模式,完全繞過 CPU 參與。具體來說,GPU 可以直接通過 InfiniBand 網卡收發數據,不需經由 CPU 協調。此外,該通信庫支持單邊 RDMA 操作和靈活的緩沖管理,不要求通信雙方對稱協同,突破了 NCCL 和 NVSHMEM 等通信庫需整組同步的限制。借助 IBGDA 通信,EaaS 實現了真正的 CPU-free 數據傳輸:網絡通信由 GPU 主動驅動,能夠與 CUDA Graph 等機制結合,將整個端到端計算過程封裝為單一調度單元,最大程度減少通信對計算流水線的干擾。
  • 動態負載均衡:由于專家服務彼此獨立,EaaS 可以方便地引入實時負載均衡策略。例如,當監測到某個專家被請求的頻率過高(“熱” 專家)時,系統可動態增添該專家服務的實例來分攤流量;反之對于長期 “冷門” 的專家,可減少其實例以節省資源。


  • 容錯與故障恢復機制:EaaS 通過客戶端 - 服務端的松耦合通信取代了集體通信,天然具備更強的容錯性。系統設置了一個中央監控組件,實時追蹤各實例健康狀態。當某個專家服務發生故障停止響應時,通知相關的 Attention 客戶端自動切換到該專家的其他可用實例繼續服務,無需重建全局通信組。同樣地,如果某個 Attention 客戶端節點故障,其他客戶端不會直接中斷,新客戶端加入也不會擾亂正在運行的專家服務。

實驗

論文通過一系列大規模實驗,利用端到端的 benchmark 對比了 EaaS 與當前主流 MoE 推理方案(如 SGLang + DeepEP、vLLM + DeepEP 以及 SGLang + TP 等組合)的性能,在擴展性和容錯等方面展現出 EaaS 的優勢。

  • 擴展能力:在隨請求密度進行擴展(也即弱擴展)的實驗中,隨著 GPU 節點數從 32 增加到 64,EaaS 的總吞吐量幾乎按比例提升。同時,EaaS 打破了傳統架構對 GPU 數量整除比的要求。使用傳統專家并行的系統只能在 GPU 數量是既定專家總數因子的情況下擴容,而 EaaS 由于專家服務松耦合,支持任意數量 GPU 的部署組合,可以細粒度地按需增減算力。這意味著云服務商可以靈活地為 MoE 模型調配資源,例如在負載下降時將推理集群從 64 GPU 縮減到 40 GPU 仍保持同等吞吐。實驗顯示,與靜態架構相比,EaaS 能夠實現同等性能下最高約 37.5% 的 GPU 資源節省。

  • 容錯與魯棒性:在模擬故障場景中,EaaS 展現出卓越的服務連續性。當實驗中隨機失效 GPU 節點時,EaaS 幾乎不中斷地完成了請求處理,吞吐量僅略微下降不到 2%。相比之下,采用 DeepEP 等傳統方案的系統由于所有解碼 GPU 綁定在單一通信組內,任一節點故障都會使整個組停止服務,無法在故障期間繼續推理。EaaS 中有故障的專家請求被即時路由到備用副本處理,客戶端自身故障也被其他實例接管,整個服務保持了高可用性。

  • 高吞吐與低延遲兼顧:在端到端推理吞吐量上,EaaS 與現有最優系統表現相當,能夠達到媲美 SOTA 的生成速度。同時,EaaS 在響應延遲上保持穩定,得益于高效通信與動態資源調配,能將每個 token 的平均生成延遲維持在較低水平。整體評估顯示,EaaS 在吞吐 - 延遲權衡上達到優秀平衡,在保證用戶響應及時性的同時提供了強勁的處理能力。

1 對 3 往返通信平均延遲

2 對 2 往返通信平均延遲

除此以外,作者也將 EaaS 的通信庫與當前開源的 Step3 中 StepMesh 使用的通信庫進行了 torch 側調用從端到端的延遲比較,并發現在對稱與非對稱的場景下,EaaS 的通信庫通過 IBGDA 本身的高效通信模式與僅 CPU-free 的結構支持的 CUDA graph 帶來的 kernel launch 開銷的 overlap,最多將延遲降低了 49.6%。

總結

面向未來,EaaS 展現出在云端大模型推理和模型即服務(MaaS)等場景中的巨大潛力。其細粒度的資源調配能力意味著云服務提供商可以根據實時負載彈性地調整 MoE 模型的算力分配,從而以更低的成本提供穩定可靠的模型推理服務。這種按需伸縮、平滑容錯的設計非常契合云計算環境下的多租戶和持續交付需求。另一方面,EaaS 的服務化架構具有良好的可運營和可演化特性:模塊化的專家服務便于獨立升級和維護,通信調度組件也可以逐步優化迭代,從而使整套系統能夠隨著模型規模和應用需求的變化不斷演進。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-19 15:17:24

2024-06-27 08:00:00

存儲數據庫細粒度

2010-04-14 11:04:53

Oracle細粒度

2010-04-19 09:35:58

Oracle細粒度

2009-04-16 17:59:25

細粒度權限

2025-09-01 08:10:09

細粒度圖像分類細粒度視覺分類FGVC

2009-10-27 09:31:24

Windows Ser口令策略

2024-04-26 12:13:45

NameNodeHDFS核心

2018-02-25 04:05:16

2025-10-21 12:40:05

2010-04-16 16:39:25

Oracle細粒度

2010-04-22 13:39:31

Oracle細粒度訪問

2016-09-26 14:45:46

微服務

2018-02-07 14:53:42

2010-12-30 14:34:43

云計算供應商

2010-10-20 15:09:05

2025-02-18 09:10:00

2022-11-07 12:15:13

開源深度學習

2022-06-27 17:58:42

pwrueBPF工具

2025-03-04 04:00:00

擴散模型DDPM
點贊
收藏

51CTO技術棧公眾號

男人添女人下面免费视频| 成人av中文| 日韩av网站在线播放| 蜜桃精品一区二区三区| 午夜久久久影院| 日韩av在线电影观看| 999精品国产| 香蕉久久夜色精品| 日韩在线免费视频观看| 制服丝袜第一页在线观看| 成人国产网站| 精品国产精品三级精品av网址| 日本一区二区三区视频在线播放| 国产精品女同一区二区| 国产日本精品| 久久精品中文字幕一区| 九色porny自拍视频| 久久九九精品视频| 欧美性色欧美a在线播放| 国产九色porny| 蜜桃视频在线观看免费视频网站www| 懂色av一区二区在线播放| 国产极品精品在线观看| 国产极品在线播放| 99热国内精品永久免费观看| 精品无人区太爽高潮在线播放 | 欧美特大特白屁股xxxx| 亚洲人吸女人奶水| 日本不卡在线观看| 亚洲 欧美 自拍偷拍| 国产精品亚洲一区二区三区妖精| 国产精品av在线播放| 天天操天天干视频| 国产精品jizz在线观看美国| 最近2019中文免费高清视频观看www99| 精品少妇人妻av一区二区三区| 国产精品毛片aⅴ一区二区三区| 色欧美乱欧美15图片| 和岳每晚弄的高潮嗷嗷叫视频| 麻豆传媒视频在线观看免费| 国产人久久人人人人爽| 久久久久久久久久码影片| 黄色小视频免费观看| 国产精品资源在线观看| 成人免费在线网址| 国产又粗又大又黄| 久久精品av麻豆的观看方式| 国产精品 欧美在线| 在线观看亚洲天堂| 亚洲激情在线| 91地址最新发布| 日韩精品国产一区二区| 激情综合视频| 国色天香2019中文字幕在线观看| 久草网视频在线观看| 欧美在线首页| 欧美高跟鞋交xxxxhd| 日本妇女毛茸茸| 欧美日韩一区自拍| 欧美日韩aaaa| 国产91视觉| 阿v天堂2017| 秋霞在线视频| 亚洲激情六月丁香| 免费看日b视频| 91老司机福利在线| 精品久久久久久中文字幕| 男女激情无遮挡| 色偷偷色偷偷色偷偷在线视频| 欧美日韩国产综合视频在线观看中文| 日韩av在线第一页| 日韩成人影音| 欧美性猛交xxxx乱大交退制版| 成年网站在线播放| 成人在线日韩| 精品国产乱码久久久久久夜甘婷婷| 国产一线在线观看| 神马午夜久久| 一个色综合导航| 日本精品在线免费观看| 欧美在线看片| 91成人精品网站| 中文字幕在线一| 国产一区二区91| 国产日韩欧美一区二区三区四区| 手机看片福利在线观看| 国产亚洲欧美激情| av不卡在线免费观看| 深夜国产在线播放| 色综合一区二区| 亚洲娇小娇小娇小| 99a精品视频在线观看| 日韩精品视频在线| 国产精品久久免费观看| 欧美国产专区| 国产激情综合五月久久| 国产成人毛毛毛片| 91麻豆.com| 先锋影音男人资源| 日韩精品av| 欧美一区午夜精品| 国精品无码人妻一区二区三区| 久久神马影院| 久久久免费观看| 中文字幕人妻一区二区三区视频| 高清av一区二区| 日韩av在线电影观看| a级片免费在线观看| 欧美亚洲图片小说| 免费不卡的av| 五月开心六月丁香综合色啪| 97成人超碰免| 国产极品999| 国产精品久久久久9999吃药| 亚洲一区二区三区av无码| 欧美亚洲福利| 亚洲欧洲成视频免费观看| 久久久久久久极品内射| 日本网站在线观看一区二区三区 | 亚洲国产精品传媒在线观看| 国产免费xxx| 女生影院久久| 亚洲国产天堂网精品网站| 91人妻一区二区三区蜜臀| 久久三级福利| 欧美lavv| 亚洲精品**中文毛片| 亚洲第一免费网站| 欧美 日韩 国产 一区二区三区| 久久久久免费| 国产亚洲欧美一区二区| 中文av资源在线| 欧美日韩黄色影视| 亚洲最大成人综合网| 亚洲少妇在线| 国产一级特黄a大片99| 182tv在线播放| 91精品久久久久久蜜臀| 天美传媒免费在线观看| 久久尤物视频| 欧美连裤袜在线视频| 超碰在线公开| 亚洲精品不卡在线| 精品在线视频观看| 成人亚洲一区二区一| 欧美一区二区视频在线播放| 日本免费精品| 欧美激情亚洲国产| 亚洲黄色小说网| 亚洲国产精品久久不卡毛片| 国产裸体视频网站| 欧美日韩网站| 狠狠色综合一区二区| 黄毛片在线观看| 亚洲国产日韩欧美在线动漫| 亚洲国产精品午夜在线观看| 高清日韩电视剧大全免费| 国产黄色激情视频| 一区二区免费| 91wwwcom在线观看| 午夜视频福利在线| 日韩欧美在线免费| 女人黄色一级片| 久久国产精品72免费观看| 最新国产精品久久| 日韩精品三级| 性色av一区二区三区| 欧美黄色小说| 欧美午夜宅男影院| 国产精品三区在线观看| 国产成人自拍在线| 无码中文字幕色专区| 亚洲制服欧美另类| 国产在线拍揄自揄视频不卡99| 欧美高清视频| 精品精品国产高清一毛片一天堂| 91久久国产视频| 久久精品在线免费观看| 欧美日韩精品区别| 亚洲高清电影| 日韩欧美精品在线不卡| 亚洲精品自拍| 97在线观看视频国产| 成人在线二区| 欧美xxxxxxxxx| 毛片在线免费播放| 亚洲精品亚洲人成人网在线播放| 久久精品女同亚洲女同13| 日本视频中文字幕一区二区三区| 玖玖精品在线视频| 免费福利视频一区| 国产日韩换脸av一区在线观看| 成人性生交大片免费看网站| 亚洲性av在线| 韩国av免费在线观看| 91成人国产精品| 91aaa在线观看| 欧美极品aⅴ影院| 国产69视频在线观看| 久久精品理论片| www.射射射| 99久久99久久精品国产片果冰| 精品国产免费一区二区三区| 欧美另类激情| 日韩美女免费视频| 欧美巨大xxxx做受沙滩| 在线观看日韩欧美| 无码国产精品一区二区免费16| 欧美日韩国产精品自在自线| 青青国产在线观看| 亚洲精品欧美在线| 一级片视频免费看| 成人白浆超碰人人人人| 超碰在线资源站| 男女性色大片免费观看一区二区 | 久久99国产乱子伦精品免费| 青娱乐自拍偷拍| 国产一在线精品一区在线观看| 五月天色一区| 国产亚洲精品美女久久久久久久久久| 国产精品av一区| 亚洲免费一区| 国产美女精品免费电影| 深夜视频一区二区| 日韩av日韩在线观看| 麻豆国产在线| 久久久久久香蕉网| 免费的黄网站在线观看| 中日韩美女免费视频网站在线观看 | 欧美人与禽性xxxxx杂性| 久久久久999| 免费观看久久久久| 中文字幕欧美在线| 91大神在线网站| 国产午夜精品全部视频播放| 欧美精品少妇| 亚洲人成在线观看网站高清| 日本视频在线观看一区二区三区| 亚洲国产精品嫩草影院久久| 亚洲美女综合网| 欧美α欧美αv大片| 亚洲国产精品视频在线| 欧美成人猛片aaaaaaa| 国产成人精品一区二区无码呦| 欧美一区二区三区在线电影| 一级黄色大毛片| 91.麻豆视频| 99久久精品国产成人一区二区| 777奇米四色成人影色区| 国产精品久久久久毛片| 在线播放日韩导航| 国产富婆一级全黄大片| 欧美mv日韩mv亚洲| 男人天堂av网| 亚洲精品国产综合区久久久久久久| 日本黄色三级视频| 精品亚洲一区二区三区在线播放 | 精品素人av| 久久精品日产第一区二区三区乱码| 青青草原在线亚洲| 日本不卡一区| 婷婷亚洲最大| 日韩久久久久久久久久久久| 1024成人| 亚洲黄色av网址| 国产一区二区三区免费播放| 国产精品欧美性爱| 91在线观看视频| 亚洲一区二区自偷自拍 | 免费在线观看亚洲视频| 老妇喷水一区二区三区| 一起操在线视频| 国产成人综合精品三级| 欧美精品欧美极品欧美激情| 国产清纯白嫩初高生在线观看91| 网站永久看片免费| 亚洲一区二区三区视频在线播放 | 激情综合网五月婷婷| 欧美日韩免费在线| 中文字幕在线网站| 精品国产乱码久久久久久老虎 | 欧美大胆在线视频| 三级在线看中文字幕完整版| 国产精品青青在线观看爽香蕉| 欧美午夜网站| 欧美高清视频一区| 久久久久午夜电影| 国产网站免费在线观看| 美女视频免费一区| 中文成人无字幕乱码精品区| 国产欧美日韩在线视频| 久久婷婷国产麻豆91| 色94色欧美sute亚洲13| 超碰免费在线97| 在线成人免费网站| 超碰97免费在线| 91精品免费视频| 少妇一区二区视频| 久久久久久av无码免费网站下载| 日韩黄色免费电影| 日韩精品视频一区二区| 国产精品入口麻豆九色| 五月天综合激情| 日韩久久精品一区| 色三级在线观看| 庆余年2免费日韩剧观看大牛| 国产精品免费精品自在线观看| 欧美三级网色| 在线日本高清免费不卡| 亚洲精品免费一区亚洲精品免费精品一区| av在线不卡电影| 九九视频免费看| 欧美喷水一区二区| 国产最新视频在线观看| 国内精品久久久久久久| 久久视频免费| 亚洲欧美成人一区| 久久久久国产精品一区二区| 国产精品国产三级国产有无不卡 | 国产成人高清| www污在线观看| 国产麻豆精品95视频| 免费看91的网站| 日韩欧美成人免费视频| 欧美熟妇交换久久久久久分类 | 亚洲天堂成人在线视频| 欧美大片黄色| 成人免费视频网| 99久久精品费精品国产| 一区二区三区视频网| 国产午夜精品一区二区三区嫩草 | 黄色网页在线观看| 国产精品久久久久77777| 一区二区美女| 亚洲欧洲日产国码无码久久99| 成人综合婷婷国产精品久久免费| 91香蕉视频在线播放| 欧美日本高清视频在线观看| 视频一区二区三区不卡| 国产精品丝袜高跟| 欧美亚洲高清| av网站在线不卡| 国产精品电影院| 国产精品欧美亚洲| 久久久精品一区| 日韩成人久久| 欧美黄色免费网址| 国产+成+人+亚洲欧洲自线| 欧美人妻精品一区二区免费看| 欧美一区2区视频在线观看| 中文在线字幕免费观看| 操一操视频一区| 亚洲国产美女| 日本丰满少妇裸体自慰| 高跟丝袜一区二区三区| 九九热视频在线观看| 国产精品白嫩美女在线观看| 国产精品一线天粉嫩av| 五月婷婷丁香综合网| 亚洲欧美在线视频| 99热这里只有精品在线观看| 九九热精品视频在线播放| 国产成人精品亚洲线观看| 3d动漫一区二区三区| 久久久久久久久岛国免费| 少妇一级淫片日本| 欧美xxxx做受欧美.88| 136导航精品福利| 久久久久久久久久久视频| 国产日韩一级二级三级| 国产孕妇孕交大片孕| 欧美日韩福利视频| 天堂综合网久久| 亚洲欧洲日本精品| 亚洲影视在线播放| 美女欧美视频在线观看免费| 国产精品一区久久久| 国产精品videosex极品| 中文字幕丰满孑伦无码专区| 欧美日韩中文另类| av在线看片| 欧美一区二区视频在线| 精品一区二区三区免费观看| 99视频在线看| 色哟哟亚洲精品一区二区| 日本超碰一区二区| 国产一区二区视频免费在线观看 | 韩国黄色一级大片| 91在线视频免费91| 国产又黄又爽视频| 26uuu国产精品视频| 亚洲va在线| 老司机福利av| 日韩视频在线观看一区二区| 在线观看特色大片免费视频| 伊人久久婷婷色综合98网| 不卡一二三区首页| 一本色道久久综合亚洲| 97精品视频在线| 午夜精品亚洲|