精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達、DeepSeek集體跟進!18個月前被忽視,如今統治AI推理

人工智能 新聞
2024年,加州大學圣地亞哥分校「Hao AI Lab」提出了DistServe的解耦推理理念,短短一年多時間,迅速從實驗室概念成長為行業標準,被NVIDIA、vLLM等主流大模型推理框架采用,預示著AI正邁向「模塊化智能」的新時代。

如果說「摩爾定律」認為計算能力每18個月翻倍,如今大模型推理成本的下降速度,已遠超「摩爾定律」關于計算能力迭代速度的預測。

這并非只是芯片性能提升之功,更重要的是來自推理系統的自身進化。而加速這一進化的,源自一個在DistServe系統中首次提出并實踐的「解耦推理」理念。

該系統由加州大學圣地亞哥分校的「Hao AI Lab」于2024年3月推出,并提出了一個簡單而大膽的設想:

將大模型的推理過程拆分為「預填充」和「解碼」兩個階段,并讓它們分別在獨立的計算資源池中進行伸縮與調度。

如今,這種解耦推理架構已被NVIDIA、llm-d、vLLM、MoonCake等主流大模型推理框架采用,并開始在大規模、真實推理場景中發揮強大力量。

推出DistServe系統的「Hao AI Lab」,由加州大學圣地亞哥分校助理教授Hao Zhang領導,他也是2025年谷歌機器學習與系統青年教師獎的獲得者。

加州大學圣地亞哥分校助理教授Hao Zhang

「Hao AI Lab」團隊,2025年還獲得了NVIDIA贈送的DGX B200系統,用于強化AI研究基礎設施。

「Hao AI Lab」團隊獲得NVIDIA贈送的DGX B200系統

Hao Zhang團隊以「解耦推理」的最初設計者身份,詳細回顧了「預填充-解碼」解耦架構(prefill-decode disaggregation)如何從研究概念走向生產系統,以及在大模型推理持續擴展的背景下,解耦推理又將如何演進。

從同址部署到解耦推理

在DistServe出現之前,大多數推理框架都采用「同址部署」方式:

即在同一塊GPU上同時執行「預填充」(prefill)和「解碼」(decode)階段。

在每一次推理迭代中,調度器會盡可能將多個用戶請求打包成一個批次,運行一輪計算,然后為這些請求各生成一個輸出token。

這種稱為「連續批處理」技術最早由Orca提出,后由vLLM推廣。

這種方法曾因其先進性而成為業界標準做法,但它同時也有兩個根本性的限制。

一是干擾。

「prefill」和「decode」共享同一塊GPU,它們的延遲(latency)會不可避免地相互干擾。

即使采用了「分塊預填充」等緩解措施,一個大型預填充請求仍可能讓TPOT(time-per-output-token)膨脹2到3倍,尤其在負載突發時更為明顯。

如上圖(上),當prefill(橙色)與decode(藍色)同址部署時,兩者互相干擾,導致decode階段停滯;上圖(下),當將prefill與decode分離到不同機器時,兩者即可無干擾地順暢運行。

二是耦合伸縮。

在實際生產環境中,企業級應用通常將TTFT(time-to-first-token)和TPOT視為關鍵的用戶體驗延遲指標。

當prefill和decode被部署在同一組GPU上時,資源分配器必須同時滿足兩種最壞情況的延遲需求。

這意味著系統需要過度預留資源,導致計算資源利用率低下,整體效率不佳。

隨著部署規模不斷擴大、延遲要求日益嚴格,以上兩個問題產生的成本也隨之劇增。

正是這些現實痛點推動了DistServe的出現。

DistServe通過將prefill與decode拆分為獨立的計算池,徹底打破二者的干擾,并首次實現了獨立伸縮,使其可以各自獨立地滿足TTFT和TPOT的延遲要求,同時保持高整體效率。

最初推出DistServe時,Hao Zhang團隊便認為這將是一個具有顛覆性的想法。

但出乎意料的是,它最初并未獲得廣泛采用。

在2024年的大部分時間里,開源社區都對這一思路持保留態度,因為對原有推理系統進行深度的架構重構,需要大量工程投入。

然而到了2025年,局面突然發生逆轉:幾乎所有主流的大模型推理棧都將「解耦」視為默認方案。

首先,主要是由于越來越多企業將大模型作為其核心業務組件,「延遲控制」成為決定業務增長乃至生死存亡的關鍵因素。

而DistServe正好擊中了這一痛點:它讓prefill和decode的延遲易于觀測和控制,且在真實生產環境中可持續優化。

其次,隨著模型體量急劇擴大、訪問流量激增,推理系統必須擴展到數百乃至上千張GPU才能支撐這些龐大且變化劇烈的負載。

在這種規模下,「解耦架構」的優勢完全顯現:它可以為不同階段獨立分配資源,并靈活配合多種并行策略,實現極高的資源利用率。

第三,「解耦」意味著系統架構的可組合性大大增強。

當下的解耦推理

如今,曾被視為激進的架構理念,已經成為大模型推理的主要設計原則之一。

幾乎所有與大模型推理相關的生產級框架——從編排層、推理引擎、存儲系統,甚至到新興的硬件架構,都以某種形式采用了這一解耦推理的思想。

在編排層,最有代表性的是NVIDIA Dynamo。

NVIDIA Dynamo架構示意圖

NVIDIA Dynamo是目前最先進、最成熟的開源數據中心級分布式推理框架之一,專為P/D解耦而設計。

此外,還有llm-d、Ray Serve等都是基于解耦推理架構。

在存儲層,由芝加哥大學團隊開發的LMCache通過加速從prefill實例到decode實例的KV緩存移動來優化P/D解耦過程。

LMCache架構示意圖

Kimi AI團隊開發的MoonCake,以「KVCache中心化」為核心思想,構建了一個面向P/D解耦的LLM推理平臺。

它將系統中未充分利用的存儲介質統一抽象為一個集中式KV緩存池,從而使prefill實例可以無縫將緩存傳輸給集群中decode實例。

MoonCake架構示意圖

如今,LMCache與MoonCake已成為大規模LLM推理系統的標準存儲后端。

在核心引擎層,幾乎所有開源的LLM推理引擎,如SGLang與vLLM,都已原生支持「解耦推理」。

解耦推理的未來

「預填充-解碼解耦」的推理理念,在2025年已逐漸成熟。

然而,這僅僅是一個起點。

從更長遠的角度看,解耦不僅是一種「架構技巧」,更是一種更深層次的系統哲學:

打破神經網絡推理中的「計算單體」結構,讓系統能夠在計算、存儲與通信之間實現自由重組。

而學術界和工業界也正在探索多種新方向,推動解耦架構邁向「通用分解式推理(Generalized Disaggregated Inference)」階段。

計算層面的解耦

1. Attention-FFN解耦(Attention-FFN Disaggregation)

以往的P/D解耦主要解決了「上下文輸入與自回歸輸出」的階段性分離問題,但模型內部結構仍然被視為不可拆解的整體。

如今,研究者開始嘗試在模型層級上細化解耦粒度。

2025年,MIT CSAIL與DeepSeek Research提出了「Attention–FFN Disaggregation」框架,將Transformer的注意力模塊(Attention)與前饋層(Feed Forward Network,FFN)分別放置于不同計算節點。

這種架構可以使不同節點利用異構硬件優勢。

這意味著未來的推理系統可能不再是「每個節點運行完整模型副本」,而是每個節點運行模型的一個功能子模塊。

2. 流水線解耦(Pipeline Disaggregation)

解耦架構的另一種自然延伸,是跨層級的流水線分解。目前已有多個研究團隊提出框架,如:

  • Stanford DAWN的「DisPipe」系統;
  • Meta AI的「HydraPipe」;
  • Alibaba DAI-Lab的「PipeShard」。

這些系統都嘗試讓推理過程在不同節點之間以「階段流」的方式流動,從而實現全局流水線化推理。

這種方式能讓不同階段的計算使用不同類型的加速器,更適合未來多芯片異構系統。

跨模態與多模型的解耦

1. 模態分解

隨著多模態大模型的出現,推理系統正面臨更復雜的資源編排問題,將它們全部塞入同一推理流程會導致資源利用率顯著下降。

因此,未來的趨勢是將多模態推理解耦為多個模態子推理流,再在編排層通過調度器進行異步融合。

2. 多模型協同

在推理系統中同時運行多個LLM或專用子模型也變得常見,這些架構天然適合解耦化設計。

內存與緩存體系的解耦

當前的解耦體系仍依賴于「集中式KV緩存池」或「共享SSD集群」,未來的研究方向在于讓緩存體系本身也實現多層解耦與自治調度。

1. 層級化緩存架構

MIT與ETH Zürich的研究者提出HiKV(Hierarchical KV Cache)框架,將KV緩存劃分為三個層次:

  • L1:GPU本地緩存;
  • L2:節點共享緩存;
  • L3:分布式持久緩存。

系統根據上下文熱度自動遷移KV片段,從而使解耦推理的內存管理更具彈性。

2.存算協同

一些硬件廠商已開始探索原生支持解耦架構的芯片,這意味著未來的「解耦推理」不僅是軟件架構問題,而將演化為軟硬件一體化體系。

邁向模塊化智能

如Google Brain Zürich與FAIR等一些研究團隊,提出更加大膽的設想:

既然推理可以解耦,那么訓練與持續學習是否也能被解耦?

他們將模型的學習過程被分為多個相互獨立的子任務,每個子任務在不同硬件上運行,并通過共享梯度緩存與語義路由器實現跨任務通信。

這種理念被稱作「解耦學習」,被視為解決大模型「災難性遺忘」與「持續適應」問題的潛在關鍵路徑:

目前,Google Zürich團隊的內部項目「Hope」模型就是在該思想指導下誕生的。

過去十年,深度學習系統的趨勢是「從分散到集中」,所有計算匯聚在單體模型中。

而如今的趨勢正在反轉:從集中到解耦。

這種演進并非倒退,而是一種成熟的標志,AI系統也正在走向模塊化智能,不同功能模塊可獨立演化、獨立擴展、獨立優化。

而「解耦推理」正是這一趨勢的起點。

未來,或許將看到「解耦學習」「解耦推理」「解耦認知」三者融合的智能架構體系。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-05-20 09:44:13

人工智能機器人

2025-05-20 14:37:33

AI工具GenAI安全風險

2011-08-17 10:04:13

vSphere 5虛擬化

2025-03-19 10:10:43

2010-01-28 10:11:18

IT金飯碗

2024-03-28 07:00:00

英偉達云計算

2025-04-18 09:43:38

2023-11-06 18:02:28

Linux實用命令

2022-06-01 16:47:53

AI模型開源

2019-11-04 09:32:50

云計算數據中心技術

2012-11-28 15:53:16

災難恢復

2019-08-30 12:01:48

2025-10-15 00:00:05

2025-07-28 08:42:00

2025-02-27 09:09:45

2017-02-08 09:51:27

JavaScript細節

2023-08-04 14:31:43

Python核心項目

2023-10-24 18:05:00

2025-08-07 09:13:00

2023-05-26 17:15:45

點贊
收藏

51CTO技術棧公眾號

成人免费视频一区| 欧美日韩夜夜| 亚洲夂夂婷婷色拍ww47| 久久精品人成| 一二区在线观看| 亚洲不卡av不卡一区二区| 精品日韩成人av| 中文字幕无码不卡免费视频| 男人天堂手机在线| av亚洲产国偷v产偷v自拍| 国产精品久久久久久网站| 最新一区二区三区| 香蕉久久精品| 正在播放亚洲一区| 无码aⅴ精品一区二区三区浪潮 | 欧美成人免费在线观看视频| 97超碰人人在线| 成人国产精品免费| 成人国产精品久久久| 久久久国产精品成人免费| 亚洲激情五月| 伊人久久男人天堂| 在线免费播放av| 日韩最新av| 欧美女孩性生活视频| 日本精品免费在线观看| 国产亚av手机在线观看| 亚洲欧洲在线观看av| 欧美日韩电影一区二区三区| 黄色美女一级片| 久久精品999| 国产成人精品日本亚洲| 日本在线视频免费观看| 欧美一区影院| 日韩少妇与小伙激情| 免费看污片的网站| 影视先锋久久| 精品夜色国产国偷在线| 日韩少妇一区二区| 午夜日韩影院| 欧美一级日韩免费不卡| av在线网址导航| 国产乱子精品一区二区在线观看| 色婷婷综合在线| 91免费视频网站在线观看| 91老司机福利在线| 亚洲成av人片观看| 99在线免费视频观看| 五月婷婷视频在线观看| 亚洲天堂成人网| 亚洲日本精品| 秋霞a级毛片在线看| 国产精品色在线| 先锋在线资源一区二区三区| 国产在线网站| 中文字幕的久久| 亚洲一区二区精品在线观看| 1024国产在线| 亚洲婷婷综合久久一本伊一区| 伊人精品久久久久7777| 在线观看二区| **性色生活片久久毛片| 宅男一区二区三区| 综合久久2019| 亚洲第一精品在线| 99精品在线免费视频| 一个人看的www视频在线免费观看| 欧美日韩国产限制| 黄色一级大片在线观看| 亚洲成人va| 在线不卡中文字幕| 日韩精品在线播放视频| 成人偷拍自拍| 亚洲图片在线综合| 欧美另类videoxo高潮| 欧美日韩亚洲一区在线观看| 国内精品久久久久久中文字幕| 国产免费av一区二区| 久久久久久亚洲精品杨幂换脸| 国产精品久久久久久婷婷天堂| 国产又粗又黄又爽| 成人午夜在线视频| 日韩福利视频| a视频在线观看免费| 亚洲mv大片欧洲mv大片精品| 不卡影院一区二区| 精品国产亚洲一区二区三区大结局| 日韩免费视频一区| 日韩一级视频在线观看| 久久免费大视频| 久久久久久国产精品久久| 欧美一区二区三区网站| 精品综合免费视频观看| 国产亚洲欧美一区二区| av在线免费一区| 艳妇臀荡乳欲伦亚洲一区| 国产素人在线观看| 成人国产精品久久| 精品亚洲一区二区三区四区五区| 老熟妇高潮一区二区三区| 亚洲美女少妇无套啪啪呻吟| 国产精品视频免费在线观看| 欧美自拍偷拍一区二区| 国产精品萝li| 成人av一级片| 亚洲综合影院| 色婷婷综合久久久久| 午夜精品久久久久久久久久久久久蜜桃 | 久久天天躁狠狠躁老女人| 日本三级中文字幕| 国产一区二区三区四| 欧美在线日韩精品| 青春草免费在线视频| 欧美撒尿777hd撒尿| 亚洲男人在线天堂| 欧美福利网址| 国产精品自产拍高潮在线观看| 色综合久久久久久| 亚洲黄色免费网站| 日日干夜夜操s8| 亚洲色图丝袜| 77777少妇光屁股久久一区| 91在线视频国产| 国产午夜亚洲精品理论片色戒| 国产自产在线视频| 在线日韩成人| 九九热这里只有精品6| 在线观看国产黄| 久久精品在这里| 少妇av一区二区三区无码| 9l视频自拍九色9l视频成人| 久久夜色精品国产欧美乱| 欧美大片网站在线观看 | 黄色免费成人| 91在线视频免费| 伊人免费在线| 欧美日韩日本视频| 神马久久久久久久久久久| 亚洲欧美日韩精品一区二区| 国产日韩三区| f2c人成在线观看免费视频| 精品国产亚洲一区二区三区在线观看| 日韩在线中文字幕视频| 激情图片小说一区| 在线一区高清| 成人国产精品一区二区网站| 久久精品视频在线播放| 国产99对白在线播放| 亚洲精品视频在线看| 亚洲av毛片在线观看| 久久精品一区二区不卡| 91中文在线视频| 99福利在线| 日韩精品一区国产麻豆| 国产亚洲欧美久久久久| 成人小视频免费在线观看| 日韩欧美精品免费| 欧洲亚洲视频| 国产成人福利视频| 3p视频在线观看| 91精品久久久久久久91蜜桃| 久久久久久久久久99| 成人精品视频.| 男人靠女人免费视频网站 | 懂色中文一区二区在线播放| 亚洲人成无码网站久久99热国产 | 国产午夜无码视频在线观看| 欧美国产激情二区三区| 中文字幕国产免费| 中文在线日韩| 精品乱子伦一区二区三区| 日韩欧美另类一区二区| 中文字幕国产精品久久| va婷婷在线免费观看| 午夜不卡av在线| 永久免费毛片在线观看| 国产自产v一区二区三区c| 国产xxxx振车| 国产一区网站| 亚洲一区二区三区成人在线视频精品 | 欧美成人第一页| 天堂中文资源在线观看| 欧洲人成人精品| 久久国产精品波多野结衣av| 久久这里只有精品视频网| caoporm在线视频| 亚洲理伦在线| 亚洲电影免费| 粉嫩精品导航导航| 国产精品久久久久久久久借妻 | 无码精品在线观看| 欧美日韩免费视频| 天堂资源在线播放| 国产精品福利一区| 国产精品久久久久久亚洲色| 日本美女一区二区| 青青青在线视频播放| 日韩电影一区| 久久久精品国产一区二区三区| 亚洲精品乱码日韩| 97视频在线免费观看| 免费av网站在线观看| 另类图片第一页| 日韩一级精品视频在线观看| 51国产偷自视频区视频| 亚洲欧洲精品一区二区三区| 久久免费精品国产| 久久99国内精品| 天天摸天天碰天天添| 欧美激情麻豆| 亚洲激情一区二区三区| 任你弄精品视频免费观看| 91亚洲精品久久久| 日本一区免费网站| 97色伦亚洲国产| 91小视频xxxx网站在线| 日韩在线免费视频| 九色网友自拍视频手机在线| 日韩女优av电影| 国产精品视频第一页| 在线观看视频一区二区欧美日韩| 久久久精品91| 亚洲精品久久7777| 少妇视频一区二区| 国产欧美视频一区二区三区| 亚洲熟女乱综合一区二区三区| 国产乱码一区二区三区| 中文字幕中文在线| 裸体在线国模精品偷拍| 国产情侣av自拍| 亚洲综合不卡| 中文字幕无码精品亚洲35| 欧美日本二区| 毛片在线视频观看| 亚洲最大黄网| 最新视频 - x88av| 婷婷色综合网| 五月天综合婷婷| 亚洲电影影音先锋| 400部精品国偷自产在线观看| 日韩中文欧美| 一区不卡视频| 午夜av一区| 国产盗摄视频在线观看| 亚洲色图插插| 99久re热视频精品98| 中文精品久久| www.男人天堂网| 亚洲天堂久久| 国产a级片网站| 国产日韩欧美一区| 99爱视频在线| 日韩国产在线观看| 午夜免费看毛片| 尤物av无码色av无码| 午夜影院在线观看国产主播| 国模精品系列视频| 激情国产在线| 国产suv精品一区二区| 性欧美1819sex性高清| 国产精品video| 精品三级在线| 亚洲va久久久噜噜噜| 日韩三级av高清片| 极品尤物一区二区三区| 国精品人伦一区二区三区蜜桃| 99国产精品久久久久久久| 无码人妻丰满熟妇区96| 日韩影院在线观看| 欧美在线a视频| 懂色av一区二区夜夜嗨| 欧洲一级黄色片| 国产欧美日本一区视频| 国产suv精品一区二区68| 一个色综合网站| 国产嫩bbwbbw高潮| 欧美天堂亚洲电影院在线播放| a天堂视频在线| 亚洲精品国产成人| 北岛玲日韩精品一区二区三区| 日韩在线观看免费av| 国产一线二线在线观看| 国产成人精品久久亚洲高清不卡| 国产精品久久久久久av公交车| 国产一区国产精品| 日韩欧美网址| av免费看网址| 久色婷婷小香蕉久久| 亚洲无人区码一码二码三码| 国产亚洲一区二区三区四区| 国产67194| 91久久精品国产91性色tv| 国产人妖一区二区| 亚洲人成网站999久久久综合| а√资源新版在线天堂| 日本三级久久久| 婷婷综合国产| 一区二区三区av在线| 午夜亚洲影视| wwwxxxx在线观看| 久久精品人人做人人爽人人| 免费在线一区二区三区| 欧美性生活一区| 日韩一区免费视频| www.日本久久久久com.| 自拍偷拍欧美视频| 波多野结衣一区二区三区在线观看| 国产成人手机高清在线观看网站| 国产制服91一区二区三区制服| 日韩成人一区二区三区在线观看| www.四虎在线| 亚洲人成在线播放网站岛国| 波多野结衣电车痴汉| 亚洲黄色在线观看| 婷婷在线播放| 成人一区二区电影| 成人91在线| 麻豆av免费在线| av不卡免费电影| 久久网免费视频| 欧美一区二区三区小说| 中文字幕在线播放| 日韩av片免费在线观看| 久久精品凹凸全集| 精品一区二区三区无码视频| 国产麻豆精品久久一二三| 美女网站视频色| 色哟哟在线观看一区二区三区| 欧美一区二区公司| 久久久久久一区二区三区 | 国产精品久久久久久久7电影| 久久夜色精品国产噜噜av小说| 女人床在线观看| 极品美女销魂一区二区三区免费| 欧美极品jizzhd欧美18| 欧美综合天天夜夜久久| 阿v免费在线观看| 国产成人欧美在线观看| 国产成人影院| 97公开免费视频| 中文字幕av不卡| 亚洲综合免费视频| 少妇高潮久久久久久潘金莲| 精品久久在线| 五月天av影院| 国产乱码精品一区二区三区忘忧草| www.99re7| 欧美xxxxx牲另类人与| 波多野结衣乳巨码无在线观看| 国产亚洲一区在线播放| 国产亚洲一区在线| 成人片黄网站色大片免费毛片| 在线视频一区二区三| 18视频免费网址在线观看| 成人乱人伦精品视频在线观看| 欧美全黄视频| 国产福利在线观看视频| 懂色av一区二区三区| 国产在线免费观看| 91精品久久久久久久久久久久久| 亚洲字幕久久| 精品无码国产一区二区三区51安| 懂色av中文一区二区三区天美| 免费福利在线观看| 国产日韩欧美中文| 欧美视频网站| 亚洲第一页av| 欧美日韩国产中文| 日本小视频在线免费观看| 久久综合九色综合久99| 免费高清视频精品| 九九免费精品视频| 日韩精品在线视频美女| 久久久成人av毛片免费观看| 国产精品夜夜夜爽张柏芝| www.日本不卡| 亚洲自拍偷拍另类| 性色av一区二区三区免费| 欧美精品系列| 久久av一区二区三| 一本久久a久久精品亚洲| 麻豆影视国产在线观看| 精品久久久三级| 美女国产一区二区| 日本亚洲欧美在线| 丝袜一区二区三区| 久久免费视频66| 国内外成人免费在线视频| 亚洲超碰精品一区二区| av在线电影网| 国产伦精品一区二区三区视频孕妇| 久久久国产精品一区二区中文| 中文字幕美女视频| 国产丝袜一区视频在线观看| 91成人精品观看| 欧美日韩亚洲一二三| 亚洲一区二区三区四区在线免费观看| 户外极限露出调教在线视频| 国产精品美女久久久久av福利| 蜜桃视频一区二区三区在线观看|