精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

聊聊大模型推理系統之Hetis:如何讓“高低配”GPU集群跑出2.25倍吞吐?

人工智能
Hetis 的出現,為異構算力環境下的大模型部署提供了全新的技術范式。它標志著 LLM 服務正從粗放式的資源堆砌,邁向精細化、動態化的智能調度時代。這一思路與國家倡導的綠色計算和算力普惠政策高度契合,有助于盤活存量算力資產,降低 AI 應用門檻。

在大模型時代,算力需求如潮水般上漲。然而,現實中的生產集群往往并非清一色的頂級顯卡,而是由A100、3090甚至老舊的P100等不同性能和內存配置的 GPU 混搭而成——這種異構 GPU 集群雖能降低成本,卻給大語言模型(LLM)服務帶來了巨大挑戰:高配 GPU 空轉等待,低配 GPU 內存耗盡,整體效率大打折扣。

面對這一行業痛點,最新研究提出了一套顛覆性解決方案。來自澳門大學與中山大學的研究團隊在 SC '25 上發表論文,推出了名為 Hetis 的新型 LLM 服務系統。該系統不僅將服務吞吐量最高提升了2.25 倍,還將推理延遲降低了1.49 倍,其背后究竟有何創新玄機?

核心看點

圖片圖片

Hetis 的核心突破在于徹底改變了傳統 LLM 服務中“一刀切”的并行策略。它首次提出了細粒度動態并行機制,精準匹配異構硬件資源與模型模塊特性。具體而言,Hetis 通過主工作節點并行化(Primary Worker Parallelism)優化計算密集型模塊(如 MLP),僅在高性能 GPU 間進行協作;同時引入動態頭級注意力并行化(Dynamic Head-wise Attention Parallelism),將輕量級的Attention計算靈活分發至所有 GPU,包括低性能設備。在此基礎上,系統還設計了在線調度算法,實時平衡網絡、計算與內存負載,從而實現了資源利用率的全局最優化。

研究背景

當前主流的 LLM 服務系統在異構環境下面臨兩大核心瓶頸:內存效率低下與計算資源錯配。以 Splitwise 為代表的階段拆分方案,將預填充(Prefill)與解碼(Decode)任務分別交給高/低性能 GPU 執行,雖緩解了計算壓力,卻導致 KV 緩存空間嚴重不足。而 Hexgen 等采用非對稱參數劃分的系統,則因計算能力與內存容量的不匹配,造成高端 GPU 內存大量閑置。

圖片圖片

更深層的問題在于,現有方法普遍采用靜態并行策略,無法適應請求長度、批次大小等動態變化。例如,MLP 模塊在 A100 與 P100 上的運算速度差距可達 24.5 倍,若強行統一并行,低效設備將成為拖累整體性能的“短板”。與此同時,Attention 模塊因其無參數特性和較低的計算強度,在各類 GPU 上表現相對均衡,具備更高的并行靈活性。Hetis 正是抓住了這一關鍵差異,開啟了精細化調度的新思路。

核心貢獻

方法創新:模塊級差異化并行架構

圖片圖片

Hetis 的核心是“按需分配”的并行哲學。對于計算密集的 MLP 和預填充階段的 Attention,系統通過一個層次化搜索過程,自動篩選出最優的主工作節點組合,并在此子集內應用數據、流水線與張量并行(DP/PP/TP),力求最小化通信開銷與計算延遲。那些未被選中的低端 GPU 則被劃為注意力工作節點(Attention Workers),專司 Attention 計算任務。

圖片圖片

針對 Attention 模塊,Hetis 創新性地采用頭維度(head-wise)進行分割。相比按請求或序列長度拆分,頭級并行能顯著減少跨設備通信量。實驗表明,在僅卸載 20%負載時,頭級分割的通信開銷比序列級分割降低近2.68 倍;當使用 4 個注意力工作節點時,延遲優勢可達3.55 倍。

實證成果:吞吐與延遲雙重突破

在包含 A100、3090 和 P100 的真實異構集群上,Hetis 展現了卓越性能。測試涵蓋Llama-13B、OPT-30B和Llama-70B等多種模型及真實工作負載(聊天、代碼生成、長文本摘要)。結果顯示:

圖片圖片

  • 吞吐量最高提升至基線系統的2.25 倍(對比 Splitwise)和1.33 倍(對比 Hexgen);
  • 推理延遲方面,P95 的TTFT(首令牌時間)和TPOT(每令牌處理時間)分別改善最多1.47 倍和1.39 倍;
  • KV 緩存空間利用率提升顯著,最大可用緩存空間比基線多出1.87 倍,有效支持更多并發請求。

這些數據充分驗證了 Hetis 在復雜動態環境下的魯棒性與高效性。

圖片圖片

在方法創新的基礎上,團隊進一步驗證了系統的自適應能力。Hetis 內置的在線調度器(Dispatcher)基于對計算與通信成本的顯式建模,實時決策每個請求的注意力頭分配方案。當遇到超長上下文導致負載不均時,系統還能觸發重調度機制(Re-dispatching),動態遷移部分計算任務,避免單點瓶頸。

此外,為支撐頭級并行,Hetis 實現了頭粒度 KV 緩存管理,開發了新的 CUDA 內核以高效索引與傳輸緩存塊。盡管存儲元數據開銷增加13% ,但得益于 CPU 多核加速,緩存獲取時間反而減少了26% ,實現了總體性能凈增益。

行業意義

Hetis 的出現,為異構算力環境下的大模型部署提供了全新的技術范式。它標志著 LLM 服務正從粗放式的資源堆砌,邁向精細化、動態化的智能調度時代。這一思路與國家倡導的綠色計算和算力普惠政策高度契合,有助于盤活存量算力資產,降低 AI 應用門檻。

未來,Hetis 所驗證的模塊感知并行(Module-aware Parallelism)理念有望推動整個分布式推理技術路線的演進。無論是邊緣計算中的混合芯片,還是云平臺上的搶占式實例,此類動態適配機制都將成為提升資源利用效率的關鍵。可以預見,隨著大模型應用場景的不斷下沉,像 Hetis 這樣的智能調度系統,將在構建高效、可持續的 AI 基礎設施中扮演變革性角色。

論文原文:Hetis: Serving LLMs in Heterogeneous GPU Clusters with Fine-grained and Dynamic Parallelism[1]

參考資料

[1] Hetis: Serving LLMs in Heterogeneous GPU Clusters with Fine-grained and Dynamic Parallelism: https://arxiv.org/abs/2509.08309

責任編輯:武曉燕 來源: 機智流
相關推薦

2025-08-29 01:15:00

大模型Arrow自適應

2023-12-11 15:40:32

PyTorch代碼大模型

2024-10-21 12:30:52

2025-11-04 16:01:56

英偉達模型AI

2023-06-27 13:49:00

GPU通信RLHF

2023-05-30 14:17:00

模型推理

2025-10-28 08:50:00

AI模型訓練

2024-07-19 09:59:31

2024-11-02 10:28:03

2025-07-30 08:40:00

AI編程模型

2023-06-21 13:20:14

系統模型

2025-09-12 09:03:00

2025-04-08 00:40:00

谷歌合成數據大模型

2023-11-30 18:25:57

數據訓練

2024-12-27 13:59:33

數據訓練模型

2024-11-01 20:25:28

2024-01-24 13:11:00

AI模型

2024-07-08 13:04:01

點贊
收藏

51CTO技術棧公眾號

亚洲精品一区三区三区在线观看| 国产99对白在线播放| 久久97视频| 欧美色精品天天在线观看视频| 椎名由奈jux491在线播放 | 日韩中文字幕区一区有砖一区 | 久久久久人妻一区精品色| 日本免费一区二区三区视频| 精品免费在线视频| 一区二区不卡在线视频 午夜欧美不卡' | 99久久亚洲精品蜜臀| 4438x亚洲最大成人网| 免费国产黄色网址| 黄色网址视频在线观看| 99国产精品一区| 成人av在线亚洲| 国产成人无码一区二区在线播放| 国产精品久久久久无码av| 亚洲国产精品va在线| 女同激情久久av久久| 在线看片福利| 亚洲激情男女视频| 亚洲一卡二卡三卡| 男操女在线观看| 国产成人免费视频网站高清观看视频| 热99精品里视频精品| 一区二区在线观看免费视频| 精品久久久久久久| 精品视频偷偷看在线观看| 三级网站免费看| 日本在线一区二区| 欧洲国内综合视频| 99蜜桃臀久久久欧美精品网站| 日本精品600av| 国产精品国产三级国产aⅴ无密码| 韩国精品一区二区三区六区色诱| www.中文字幕| 国产尤物一区二区在线| 国产精品小说在线| 欧美 亚洲 另类 激情 另类| 亚洲免费在线| 欧美一级免费看| 日本少妇毛茸茸高潮| 欧美不卡视频| 欧美猛男性生活免费| 成人免费视频国产免费观看| 日韩精品首页| 在线日韩日本国产亚洲| 玖玖爱在线观看| 亚洲春色h网| 精品呦交小u女在线| 亚洲mv在线看| 女王人厕视频2ⅴk| 欧美一区久久久| 欧美午夜精品久久久久久浪潮| 日本a视频在线观看| 久久青青色综合| 亚洲高清中文字幕| 91视频 -- 69xx| 日本在线高清| 一本色道久久综合精品竹菊| 热久久精品国产| 99re66热这里只有精品4| 色综合久久久久综合99| 免费国产成人av| 成人做爰免费视频免费看| 欧美亚一区二区| 中文字幕第100页| 日韩综合久久| 日韩欧美中文字幕精品| 2018国产精品| 日韩av字幕| 亚洲天堂免费在线| 一区二区91美女张开腿让人桶| 舐め犯し波多野结衣在线观看| 你懂的在线观看一区二区| 亚洲欧美激情一区| 国产精品综合激情| 欧美1区2区视频| 午夜精品久久久久久99热| 亚洲 欧美 成人| 久久精品国产77777蜜臀| 91福利入口| 婷婷视频在线观看| 国产三级欧美三级日产三级99| 亚洲一区三区在线观看| 亚洲综合伊人久久大杳蕉| 亚洲v日本v欧美v久久精品| 国产精品秘入口18禁麻豆免会员| 久久久久久久| 日韩午夜在线影院| 日本一区二区三区网站| 久久社区一区| 69国产精品成人在线播放| 国产成人精品一区二区色戒| 国产乱码精品一区二区三区五月婷 | jizz国产精品| 亚洲日韩欧美视频一区| 久久久久亚洲av无码专区体验| 99精品国产一区二区青青牛奶| 国产精品旅馆在线| 欧美 日韩 国产 成人 在线 91| 国产亚洲精品7777| 99久久久精品视频| 电影亚洲一区| 精品国产乱码久久久久久图片| 国产全是老熟女太爽了| 午夜国产欧美理论在线播放| 欧美整片在线观看| 亚洲精品字幕在线| 中文一区在线播放| 亚洲 高清 成人 动漫| gogo大尺度成人免费视频| 日韩精品久久久久久福利| 911国产在线| 在线免费观看毛片| 欧美激情成人在线| 国产精品人成电影在线观看| 神马午夜电影一区二区三区在线观看 | 欧美午夜精品| 国产国语videosex另类| 三级网站免费观看| 亚洲激情第一区| 日韩成人精品视频在线观看| 免费电影一区二区三区| 午夜精品久久久久久久久久久久久 | 插吧插吧综合网| 亚洲第一毛片| 99精品99久久久久久宅男| 欧洲不卡av| 在线免费精品视频| 自拍偷拍亚洲天堂| 亚洲免费网站| 牛人盗摄一区二区三区视频| gogo久久| 精品电影一区二区三区 | 国产精品99在线观看| 国产成人精彩在线视频九色| 先锋av资源站| 亚洲aⅴ怡春院| 中文字幕天堂av| 狠狠噜噜久久| 国产伦精品一区二区三区在线| 欧美性受ⅹ╳╳╳黑人a性爽| 欧美一二三四区在线| 成人涩涩小片视频日本| 免费精品视频在线| 亚洲成色最大综合在线| 亚洲承认视频| 亚洲午夜未满十八勿入免费观看全集| 制服.丝袜.亚洲.中文.综合懂色| 不卡一卡二卡三乱码免费网站| 日本a视频在线观看| 日本成人a网站| 欧洲成人免费视频| 国产黄色免费在线观看| 欧美色综合影院| 天堂а√在线中文在线鲁大师| 另类综合日韩欧美亚洲| 在线电影看在线一区二区三区| 亚洲成人毛片| 美女啪啪无遮挡免费久久网站| 国产精品视频在线观看免费| 亚洲黄色在线视频| 一级欧美一级日韩片| 久久狠狠婷婷| 亚洲成人午夜在线| 久久视频社区| 97免费视频在线播放| 亚州精品国产精品乱码不99按摩| 色综合天天综合网国产成人综合天| 在线视频第一页| 黄页网站大全一区二区| 8x8x华人在线| 美女一区二区在线观看| 国产成人欧美在线观看| 欧美成人三区| 亚洲а∨天堂久久精品喷水| 国产91国语对白在线| 国产精品大尺度| 成人欧美精品一区二区| 久久成人亚洲| 好吊色这里只有精品| 精品精品国产三级a∨在线| 日韩免费观看网站| 黄色网在线免费观看| 亚洲国产成人在线播放| 在线观看亚洲国产| 亚洲亚洲精品在线观看| 摸摸摸bbb毛毛毛片| 国产a久久麻豆| 欧美一级黄色影院| 国产一区视频在线观看免费| 麻豆视频成人| 亚洲一二av| 国产精品1234| 国产伦子伦对白在线播放观看| 色先锋资源久久综合5566| 日本wwwxxxx| 欧美日韩国产bt| 日韩久久中文字幕| 依依成人综合视频| 波多野结衣一二三四区| 不卡av电影在线播放| 成 人 黄 色 小说网站 s色| 99精品视频免费观看视频| 蜜桃视频成人在线观看| 国内成人精品| 精品国产一区二区三区麻豆免费观看完整版 | 亚洲国产精品欧美一二99| 亚洲色图 激情小说| 91天堂素人约啪| 国产xxx在线观看 | av2014天堂网| 国产精品系列在线播放| 九九热在线免费| 国产精品乱看| 中文字幕日韩精品无码内射| 成人同人动漫免费观看| 九九九九久久久久| 视频一区在线| 亚洲自拍小视频| 欧洲亚洲精品| 国产精品永久在线| 日韩精品一区二区三区| 26uuu亚洲伊人春色| 91美女主播在线视频| 欧美成人精品一区二区三区| 色影院视频在线| 原创国产精品91| 国产中文字幕在线视频| 精品呦交小u女在线| 四虎永久在线观看| 精品免费国产二区三区| 国产高清不卡视频| 日韩欧美在线一区二区三区| 国产三级午夜理伦三级| 欧美麻豆精品久久久久久| 国产偷人爽久久久久久老妇app | 亚洲精品高清无码视频| 男人的天堂亚洲| www.com毛片| 国产精品一区毛片| 爱福利视频一区二区| 久久久久久色| www.99在线| 麻豆视频一区二区| 五月天激情播播| 国产精品自拍三区| 波多野结衣三级视频| 懂色av中文一区二区三区| 95视频在线观看| 91在线国内视频| 69精品无码成人久久久久久| 国产亚洲欧洲一区高清在线观看| 国产三级av在线播放| 欧美国产日本视频| 99久久99久久精品国产| 一区二区三区美女| 久久久久久久黄色| 欧美日韩久久久久| 天天爱天天做天天爽| 欧美日韩www| 国产三级视频在线播放| 精品久久人人做人人爽| 天天综合天天色| 亚洲午夜性刺激影院| 黄在线免费观看| 欧美国产极速在线| 丝袜老师在线| 国产精品一区二区性色av| 91精品亚洲一区在线观看| 97中文在线观看| 亚洲区小说区图片区qvod按摩| 日韩videos| 欧美日韩精品一本二本三本| 奇米精品一区二区三区| 日韩精品一二三四| 黑人巨大猛交丰满少妇| 99热在这里有精品免费| 久久久免费看片| 亚洲精品老司机| 九九热在线免费观看| 欧美日韩综合色| 亚洲精品18p| 在线看片第一页欧美| 手机电影在线观看| 日韩av电影在线免费播放| 91丨精品丨国产| 国产精品久久亚洲7777| 日韩av密桃| 激情伊人五月天| 久久99精品国产.久久久久| 亚洲精品第二页| 中文字幕精品一区| 国产91av视频| 欧美日韩色综合| 日本美女一级片| 日韩亚洲精品视频| 在线观看爽视频| 操人视频欧美| 四虎国产精品免费观看| 国产黄页在线观看| 国产精品综合在线视频| 免费看91的网站| 亚洲成人www| 国产精品美女一区| 亚洲人成网站999久久久综合| 最爽无遮挡行房视频在线| 国产精品99久久久久久白浆小说 | 精品处破学生在线二十三| a天堂在线资源| 热久久免费国产视频| 超碰在线一区| 91社在线播放| 日本不卡在线视频| 国产特黄级aaaaa片免| 亚洲一区免费在线观看| 91精品人妻一区二区三区果冻| 国产丝袜一区二区三区免费视频 | 青草国产精品| 国产精品视频一区二区三区四区五区| 国产一区二区三区在线观看免费视频 | 国产精品人人做人人爽人人添| 国产污污视频在线观看| 精品国产乱码久久久久久夜甘婷婷| 超碰在线免费公开| 国产主播喷水一区二区| 欧美在线免费看视频| 少妇人妻互换不带套| 91在线视频播放地址| 亚洲视频免费播放| 精品国产乱码久久久久久1区2区| 国产在线观看a| 成人写真视频福利网| 爽成人777777婷婷| 天天操天天干天天做| 国产精品久久久久久久久久免费看 | 成人做爽爽免费视频| 日韩精品一区二区三区免费观看| 日韩免费高清在线| 国产日韩欧美制服另类| 久草视频在线免费| 亚洲美女av网站| 美女福利一区二区| 日本欧美精品久久久| 日韩av中文字幕一区二区三区| 欧美大波大乳巨大乳| 91成人免费网站| 91精品专区| 91精品综合久久久久久五月天| 亚洲精品国产偷自在线观看| 日韩av福利在线观看| 亚洲黄色尤物视频| 人成网站在线观看| 91精品国产91久久久久久吃药 | 欧美h视频在线观看| 狠狠网亚洲精品| 精品欧美一区二区久久久久| 日韩欧美电影在线| 蜜桃视频在线网站| 奇米888一区二区三区| 蜜桃精品在线观看| 亚洲天堂网av在线| 日韩欧美一级二级三级久久久| www.综合| 欧美日韩国产精品一卡| 日韩电影免费一区| 一级黄色录像视频| 亚洲国产三级网| 成人开心激情| 五月天男人天堂| 成人午夜又粗又硬又大| 日韩av大片在线观看| 中文字幕免费精品一区| 日韩精品一区二区三区中文| 日韩在线综合网| 日本一区二区在线不卡| 99久久久久成人国产免费| 午夜免费日韩视频| jizzjizz欧美69巨大| 日韩成人av免费| 无码av免费一区二区三区试看 | 黄色高清无遮挡| 国产精品久久久久久久久果冻传媒 | 久久精品免费看| 久草成人在线视频| 影音先锋日韩有码| 成人av激情人伦小说| 中文字幕在线观看第三页| 一区二区三区四区亚洲| 能在线看的av| 99国产在线| 日本不卡一区二区三区高清视频| 久草视频免费在线播放| 亚洲一二三在线| 嗯用力啊快一点好舒服小柔久久| 一区二区三区 日韩| 亚洲va韩国va欧美va| 黄色在线观看网站|