精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

吞吐量提升近30倍!田淵棟團隊最新論文解決大模型部署難題

人工智能 新聞
大語言模型在實際部署中,存在內存和輸入長度限制的問題。最近,田淵棟團隊一舉解決這兩大難題,將推理系統的吞吐量提高了近30倍。

大型語言模型 (LLM) 在今年可謂是風光無限。不過驚艷的效果背后是一個巨大的模型以及夸張的硬件資源。

LLM在現實中部署時通常會面臨兩個難題:昂貴的KV緩存成本,以及對長序列的泛化能力差。

近日,田淵棟團隊發表了一篇論文,成功解決以上兩個難題,并將推理系統的吞吐量提高了近30倍!

論文地址:https://arxiv.org/pdf/2306.14048.pdf

代碼地址:https://github.com/FMInference/H2O

這個成果也將在NeurIPS'23上展示。

下面,我們來看一下這兩個難題的具體情況,以及論文提供的解決方案。

首先是緩存,KV緩存用于存儲生成過程中的中間注意力鍵和值,以避免重新計算。

通常,除了模型參數外,還會將大量瞬態信息(KV緩存)存儲在GPU內存中,這部分的內存占用,與序列長度和批處理大小線性相關。

例如,一個輸入批次大小為128、序列長度為1024的300億參數模型需要180GB的KV緩存。

其次,由于硬件限制,LLM會以固定的序列長度進行預訓練(例如Llama-2使用固定長度4K的序列)。

然而,這其實也對推理過程中的注意力窗口施加了限制,使得模型在面對更長輸入序列時無法發揮作用,阻礙了更廣泛的應用。

對此,論文提出了一種實現KV緩存的新方法,顯著減少了內存占用,且在長輸入序列的任務中表現良好。

方法基于這樣一個事實:在計算注意力分數時,一小部分tokens貢獻了大部分的價值,——這里稱這些tokens為Heavy Hitters (H2)。

通過綜合調查,作者發現H2的出現是自然的,且與文本中詞組的頻繁共現密切相關,而去除它們會導致顯著的性能下降。

基于此,作者提出了Heavy Hitter Oracle( H2O ),一種KV緩存逐出策略,可動態保持最近的tokens和H2 tokens的平衡。

另外,作者將KV緩存驅逐表述為一個動態的子模塊問題,為提出的驅逐算法提供了理論保證。

最后,作者使用OPT、LLaMA和GPT-NeoX在各種任務中驗證算法的準確性。

其中,在OPT-6.7B和OPT-30B上實現的H2O,將DeepSpeed Zero-Inference、Hugging Face Accelerate和FlexGen這三個推理系統的吞吐量分別提高了29倍、29倍 和3倍,且在相同的批量大小下,H2O最多可以減少1.9倍 的延遲。

論文細節

上圖為在 LLM 生成中部署不同 KV 緩存策略的符號圖;左下為H2O的框架概述;右下為不同策略下的準確性與內存消耗的對比。

我們可以看出,將前幾種方法應用于預訓練的LLM ,會導致高未命中率并降低精度。

解決KV緩存問題,面臨著三個技術挑戰。

首先,目前尚不清楚是否可以限制KV緩存的大小——原則上,每個解碼步驟可能需要訪問所有先前的注意力鍵和值。

其次,確定保持生成準確性的最佳逐出策略是一個組合問題。

最后,即使可以暴力解開最佳策略,在實際應用程序上部署也是不可行的。

幸運的是,作者通過研究發現了一些有趣的結果。

小緩存大小的稀疏性:即使在密集訓練時,LLM的注意力矩陣在推理時也有超過95% 的稀疏率(圖a)。這適用于各種預訓練的LLM。

因此,在每個生成步驟中,只需要5% 的KV緩存就足以解碼相同的輸出tokens,這表明KV緩存大小最多可以減少20倍,而不會降低精度。

Heavy Hitters( H2 ):注意力區塊中所有tokens的累積注意力分數都遵循冪律分布(圖b)。這表明存在一小群有影響力的tokens,這些tokens在生成過程中至關重要,是重量級tokens ( H2 )。這使我們可以擺脫組合搜索問題,并確定保持準確性的逐出策略。

低成本策略的貪婪算法:在每個解碼步驟中保留基于局部統計數據的H2(僅將前面tokens的注意力分數相加)與考慮未來tokens的注意力一樣有效(圖d)。

基于上述內容,作者定義了在大小受限的KV緩存中, LLM的生成過程,并提出了Heavy-Hitter Oracle ( H2O ),該框架利用了上面提到的性質,并使用簡單、低成本的驅逐策略。

方法與分析

LLM的生成過程包括兩個不同的階段:

提示階段:使用輸入序列來生成KV緩存(由鍵和值嵌入組成),類似于LLM訓練期間采用的前向傳遞;

tokens生成階段:利用和更新KV緩存以增量方式生成新tokens 。每個生成步驟都依賴于先前生成的tokens。

本文的重點是在tokens生成階段提高KV緩存的注意力效率,從而加速LLM推理。

作者定義了具有有限KV緩存大小的生成過程,包括注意力查詢矩陣Q和鍵矩陣K。

驅逐策略:

圖片

以及采用了驅逐策略的生成過程:

圖片

接下來討論在不降低精度的情況下,減少KV緩存大小的可能性。

上圖中,(a)表示預訓練OPT模型中的注意力稀疏性;(b)表示累積注意力分數相對于相應單詞的分布(紅色散點)和數據中單詞的共現次數(灰色曲線),x軸表示詞匯表中的單詞索引;(c)表示具有完整KV緩存的基線模型與本文模型(H2O)的性能比較;(d)表示具有完整KV緩存的基線模型、具有局部統計量的H2O、具有全局統計量的H2O和僅具有最新KV(局部)的模型之間的比較。

給定由查詢矩陣Q和鍵矩陣K計算的歸一化注意力得分Softmax矩陣,將閾值設置為每行最大值的百分之一,并計算相應的稀疏度。

然后在Wiki-Text-103的驗證集上使用預訓練的OPT模型進行零樣本推理,繪制注意力塊內的逐層稀疏性,并可視化了歸一化的注意力得分矩陣。

結果如下圖所示,盡管LLM是密集訓練的,但由此產生的注意力得分矩陣是高度稀疏的,幾乎所有層的稀疏度都超過95%。

注意力塊的稀疏性表明,生成下一個tokens時,不需要訪問所有先前的鍵和值嵌入,所以可以逐出不必要的KV嵌入,也就減少了生成過程中對KV緩存的需求。

不過,逐出的策略需要謹慎,因為一旦驅逐了重要的KV,由于LLM生成的順序依賴性,可能會破壞LLM的性能。

作者研究發現,注意力區塊內所有tokens的累積注意力分數都遵循冪律分布,如下圖所示。

這表明存在一小部分在生成過程中至關重要的tokens,也就是前文談到的Heavy-Hitters (H2)。

此外,每個單詞的累積注意力分數(紅點)與它們在數據中的共現(灰色曲線)具有高度相關性。

作者基于以上現象設計了一種貪婪驅逐策略:

在生成過程中,當令tokens數量超過分配的KV緩存預算時,根據其累積的注意力分數統計數據,以及緩存中的本地tokens來保留重量級tokens。

一般而言,需要使用整個生成過程中的統計數據,才能得到最理想的結果,但這在實際部署中顯然是不可行的,因為無法訪問未來生成的tokens。

于是,作者進行了下圖的實驗,發現在每個解碼步驟中使用局部統計數據計算的局部H2 ,與考慮未來tokens的情況效果差不多(紅線和藍線)。

隨后,作者將這種動態注意力分數計算(有空間限制)定義為一種新的動態的子模塊問題(dynamic submodular type problem):

圖片

利用上面的形式定義KV緩存驅逐策略:

圖片

上圖展示了驅逐算法,以及說明性示例。這里假設KV緩存的預算大小為3 ,完成第四個解碼步驟后,根據累積的注意力分數逐出與第三個token關聯的KV嵌入,被逐出的KV嵌入在后續解碼步驟中將不可訪問。

另外,作者還提到了實際實現中的細節。比如,為了保證I/O效率,我們在驅逐存儲的KV時不會交換內存,而是直接填充新添加的KV。

實驗結果

論文的實驗選用了三個具有代表性的LLM模型系列,包括OPT,LLaMA和GPT-NeoX-20B 。

選取了8個評估任務:COPA , MathQA , OpenBookQA , PiQA , RTE , Winogrande , XSUM , CNN/Daily Mail 。

實驗的硬件采用NVIDIA A100 80GB GPU。

考慮到H2O所采用的緩存策略,這里除了完整的KV緩存(Full),還將本地緩存策略(Local)也作為基線方法。

由上面的圖和表可知:在不同的KV緩存預算下,本文提出的方法(H2O)在各種不同條件的測試中都優于Local策略。

同時,在低于20%的KV緩存預算之下,H2O實現了與全KV嵌入模型(Full)相當的性能,且在更具挑戰性的長序列生成任務、XSUM和CNN/Daily Mail中表現良好。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-11-02 10:28:03

2024-11-01 20:25:28

2024-11-01 13:30:56

2024-02-26 00:20:00

AI模型

2024-12-19 09:48:07

2024-12-12 09:00:00

2024-05-23 16:41:40

2025-05-09 02:00:00

代碼接口吞吐量

2024-12-13 13:58:53

2023-12-01 14:36:33

模型數據

2024-12-27 13:59:33

數據訓練模型

2025-09-11 02:00:00

2023-06-28 18:10:27

羊駝家族大模型集體進化

2025-10-08 10:19:29

2023-06-30 09:49:23

模型Meta

2022-05-26 15:17:54

訓練模型

2024-10-28 08:50:00

2025-03-03 09:16:00

Meta模型預測

2022-12-25 13:46:37

生成器

2023-03-17 08:28:17

GPT-4AI
點贊
收藏

51CTO技術棧公眾號

激情小说亚洲图片| av在线免费播放| 秋霞国产午夜精品免费视频| 日韩在线观看高清| 午夜免费福利影院| 欧洲一级精品| 亚洲精品第一国产综合野| 狠狠色伊人亚洲综合网站色| 波多野结衣高清视频| 围产精品久久久久久久| 亚洲国产成人精品一区二区| 亚洲欧洲日本精品| 视频在线观看入口黄最新永久免费国产 | 视频国产在线观看| 日韩电影在线一区| 国模视频一区二区| 日韩欧美123区| 免费av一区| 精品国产一区二区三区忘忧草| 蜜臀av午夜一区二区三区| 成人在线免费看黄| 久久久高清一区二区三区| 91久久久一线二线三线品牌| 中文字幕一区二区人妻视频| 激情综合电影网| 日韩一级黄色av| 成人乱码一区二区三区av| 亚洲精品一区二区三区中文字幕 | 三级黄色片免费观看| 天堂av在线网| 亚洲国产一区视频| 国产免费xxx| 在线激情小视频| 久久嫩草精品久久久久| 国产一级二级三级精品| jizz中国女人| 久久精品久久久精品美女| 日本成人激情视频| 国产一区二区99| 亚洲国产日本| 久久久久久久一区二区三区| 男人与禽猛交狂配| 天天综合亚洲| 色偷偷av一区二区三区| 免费一级黄色录像| 国产精品欧美在线观看| 日韩电影免费观看在线观看| 日韩少妇一区二区| 成人知道污网站| 日韩精品一区二区三区在线观看| 又色又爽又黄视频| 四虎国产精品永久在线国在线| 在线观看国产精品网站| 免费男同深夜夜行网站| 欧美成人资源| 欧美亚洲国产bt| 国产原创精品在线| 一区二区三区无毛| 91精品久久久久久蜜臀| 伊人成人免费视频| 日韩精品免费视频一区二区三区| 欧美一级黄色大片| 中国男女全黄大片| 国产精品毛片av| 亚洲第一福利网站| 少妇精品一区二区三区| 精品国产91乱码一区二区三区四区| 亚洲男人天堂久| 五月天综合视频| 成人午夜国产| 欧美成aaa人片在线观看蜜臀| 午夜剧场免费在线观看| 国产精品啊啊啊| 91精品国产高清久久久久久| 亚洲不卡视频在线观看| 日本伊人午夜精品| 91久久国产婷婷一区二区| 亚洲AV无码乱码国产精品牛牛| 成人亚洲一区二区一| 久久99国产精品99久久| 国产69精品久久app免费版| 亚洲国产精品黑人久久久| 一区二区精品在线观看| 性xxxfreexxxx性欧美| 午夜在线成人av| 人妻无码视频一区二区三区| 国产精品色婷婷在线观看| 精品国精品自拍自在线| 成人免费无遮挡无码黄漫视频| 日韩精品欧美| 色综合久久天天综线观看| 羞羞影院体验区| 久久黄色级2电影| 国产免费一区| 无遮挡动作视频在线观看免费入口| 日本一区二区成人在线| 超碰成人免费在线| 国产精品久久久久久久久免费高清| 欧美日韩国产乱码电影| 日韩少妇一区二区| 99久久.com| 97在线观看免费高清| 中文字幕精品在线观看| 成人综合在线网站| 亚洲欧美国产一区二区| 免费在线小视频| 91麻豆精品国产91久久久资源速度 | 91麻豆天美传媒在线| 欧美调教sm| 日韩一级大片在线| www.av天天| 在线日本高清免费不卡| 成人激情视频在线观看| 美州a亚洲一视本频v色道| 亚洲在线观看免费视频| www.日本一区| 亚洲肉体裸体xxxx137| 欧美成人亚洲成人日韩成人| 国产99久久久久久免费看| 成人激情午夜影院| 美国av在线播放| 国产经典一区| 国产视频综合在线| 国产性生活网站| 国内精品免费**视频| 日韩少妇中文字幕| 中文字幕在线中文字幕在线中三区 | 黄色免费观看视频网站| 亚洲网一区二区三区| 中文字幕在线看视频国产欧美在线看完整| 日韩三级视频在线播放| 国产91丝袜在线观看| 欧美日韩在线免费观看视频| abab456成人免费网址| 亚洲美女视频网站| 亚洲欧美在线视频免费| 国产v综合v亚洲欧| 中国女人做爰视频| 国产高清视频一区二区| www.亚洲一区| 中文字幕在线网址| 中文字幕第一区二区| 国产精品69页| 免费成人av| 国产精品黄色av| 精品视频一二三| 色成年激情久久综合| 欧美丰满少妇人妻精品| 国产精品毛片在线| 久久涩涩网站| 中文字幕影音在线| 亚洲天堂视频在线观看| 自拍偷拍校园春色| 国产欧美精品日韩区二区麻豆天美| 免费在线激情视频| 视频一区在线观看| 国产精品国产三级国产aⅴ浪潮| 国产高清免费av在线| 欧洲一区二区av| 欧美乱大交做爰xxxⅹ小说| 开心九九激情九九欧美日韩精美视频电影| 性欧美videosex高清少妇| a屁视频一区二区三区四区| 少妇高潮 亚洲精品| 国产麻豆精品一区| 亚洲综合偷拍欧美一区色| 天天躁日日躁狠狠躁av麻豆男男| 亚洲毛片av| 欧美一区二区视频在线| 91国拍精品国产粉嫩亚洲一区| 色偷偷偷亚洲综合网另类| 99热这里只有精品1| 亚洲欧美色综合| 白嫩情侣偷拍呻吟刺激| 天堂影院一区二区| 国产麻豆电影在线观看| 国产人妖ts一区二区| 国产精品69精品一区二区三区| 97超碰国产一区二区三区| 欧美一区二区三区思思人| 日本熟女一区二区| 中文字幕成人网| 免费看三级黄色片| 免费在线亚洲欧美| 国产免费色视频| 六月丁香久久丫| 国产精品精品一区二区三区午夜版| 浪潮av一区| 亚洲国产精品久久久| 懂色av中文字幕| 亚洲在线中文字幕| 国产性猛交xx乱| 高清av一区二区| 成人在线看视频| 一区二区三区午夜视频| 六月婷婷久久| 日韩在线成人| 国产精品狠色婷| а√在线中文在线新版 | 好久没做在线观看| 中文字幕不卡在线视频极品| 国模无码一区二区三区| 欧美性感一区二区三区| 国产性一乱一性一伧一色| 国产精品区一区二区三| 国产一线在线观看| 极品销魂美女一区二区三区| 99热成人精品热久久66| 欧美日韩亚洲一区| 亚洲午夜精品国产| 久9久9色综合| 国产精品综合久久久久久| 视频欧美精品| 国产精品久久久久99| caoporn视频在线| 不卡av电影在线观看| 国产视频福利在线| 日韩www在线| 亚洲欧美另类一区| 911精品产国品一二三产区| 无码一区二区三区在线观看| 亚洲成人黄色影院| 69xx绿帽三人行| 亚洲欧洲日韩女同| 久久精品国产亚洲AV成人婷婷| 91视频xxxx| 国产精品九九视频| 成人午夜激情片| 日韩精品――色哟哟| 国产精品一区二区在线播放 | 日本a级c片免费看三区| 精品久久久久久久中文字幕| 久艹视频在线观看| 亚洲精品国产a| 国产av 一区二区三区| 成人欧美一区二区三区小说| 日本综合在线观看| 国产日韩欧美一区二区三区综合| 精品夜夜澡人妻无码av | 精品女人久久久| 国产欧美日韩视频一区二区| 日本xxxx裸体xxxx| 92国产精品观看| 捆绑凌虐一区二区三区| av电影在线观看一区| 欧产日产国产精品98| 成人国产亚洲欧美成人综合网| 野花视频免费在线观看| 国产成人av一区二区三区在线| 熟妇女人妻丰满少妇中文字幕| 国产精品综合二区| 一级黄色大片免费看| 丁香一区二区三区| 亚洲啪av永久无码精品放毛片| 成人激情小说乱人伦| av黄色一级片| 久久精品亚洲精品国产欧美| 色屁屁草草影院ccyy.com| 亚洲欧洲日韩在线| 久久久久噜噜噜亚洲熟女综合| 亚洲午夜影视影院在线观看| 豆国产97在线 | 亚洲| 五月天激情小说综合| 欧产日产国产69| 欧美亚日韩国产aⅴ精品中极品| 伊人成人在线观看| 日韩欧美一级精品久久| 神宫寺奈绪一区二区三区| 亚洲精品一区二区三区不| 户外极限露出调教在线视频| 色婷婷综合成人| 日本高清在线观看| 欧美亚洲第一页| 韩国精品视频在线观看| 99精品国产一区二区| 亚洲精品进入| 中文字幕久久综合| 在线日韩欧美| 日韩爱爱小视频| 国产成人自拍网| 亚洲天堂久久新| 亚洲伦理在线精品| 你懂的国产在线| 欧美精品久久一区二区三区| 亚洲国产精品国自产拍久久| 亚洲欧美成人网| а天堂中文在线官网| 欧美性资源免费| 91亚洲精品在看在线观看高清| 国外成人在线视频网站| 成人系列视频| 97成人在线免费视频| 美腿丝袜亚洲色图| 亚洲av成人精品一区二区三区| 国产欧美一区二区精品忘忧草 | 日韩精品电影在线| 日本中文字幕在线不卡| 久久久国际精品| 久久免费精彩视频| 欧美日韩aaa| 日韩av成人| 欧美激情精品久久久久久| 色猫猫成人app| 精品乱码一区二区三区| 伊人青青综合网| 无需播放器的av| 99久久99久久精品免费观看| 亚洲二区在线播放| 在线看一区二区| 午夜影院免费体验区| 美日韩精品视频免费看| 日本欧美韩国| 免费国产在线精品一区二区三区| 欧美精品不卡| 国产aⅴ爽av久久久久| 久久久久久久久久久久久女国产乱 | 午夜在线观看视频18| 欧美日韩国产91| 精品久久免费| 一区二区成人国产精品| 老司机午夜精品视频在线观看| 国模私拍在线观看| 亚洲已满18点击进入久久| 国产麻豆免费观看| 日韩一区二区欧美| 69堂免费精品视频在线播放| 久久综合久久综合这里只有精品| 国产主播一区| 国产又黄又嫩又滑又白| 中文字幕亚洲成人| 这里只有精品6| 伊人久久精品视频| 日韩一级二级| 亚洲精品一区二区三区av| 老妇喷水一区二区三区| 四虎影成人精品a片| 欧美午夜精品久久久久久人妖| 日本激情一区二区三区| 久久久久久伊人| 国产伦精品一区二区三区在线播放 | 午夜成年人在线免费视频| 亚洲自拍高清视频网站| 一精品久久久| 中文字幕人妻无码系列第三区| 亚洲手机成人高清视频| 国产欧美久久久精品免费| 久久伊人91精品综合网站| 成人国产精品久久| 欧美性受黑人性爽| 国产精品一二三四| 国产小视频在线看| 日韩成人av网| 韩国成人在线| 强伦女教师2:伦理在线观看| 国产一区二区三区精品欧美日韩一区二区三区 | av亚洲精华国产精华精华| 麻豆视频在线观看| 精品日韩99亚洲| 男人的天堂免费在线视频| 欧美一区二区三区四区夜夜大片 | 黄色短视频在线观看| 欧美日韩在线看| 国产三级电影在线观看| 国产精品视频网站| 图片小说视频色综合| 农村末发育av片一区二区| 午夜一区二区三区视频| 毛片免费在线| 成人黄色av网站| 黄页网站一区| 国产精久久一区二区三区| 555夜色666亚洲国产免| 日韩成人伦理| 欧美日韩在线播放一区二区| 另类小说综合欧美亚洲| 人妻少妇精品一区二区三区| 亚洲国模精品一区| 日本h片久久| 激情五月六月婷婷| 久久先锋资源网| 97国产精品久久久| 久久久视频免费观看| 精品精品久久| 欧美图片自拍偷拍| 色哦色哦哦色天天综合| av免费在线观看网址| 欧美不卡三区| 国产伦精品一区二区三区免费迷 | 久久久123| 欧美性色黄大片人与善| 国产在线精品一区二区| 日韩不卡视频在线| 久久久精品在线| 亚洲精品播放| 深夜视频在线观看| 欧美性生活一区| 阿v视频在线| 一区二区精品国产| 久久综合九色综合97婷婷| 国产成人精品免费看视频|