精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

把注意力計算丟給CPU,大模型解碼吞吐量提高1.76~4.99倍

人工智能 新聞
MagicPIG是將經典的哈希算法和高維向量估計用到LLM解碼上的嘗試。

CPU+GPU,模型KV緩存壓力被緩解了。

來自CMU、華盛頓大學、Meta AI的研究人員提出MagicPIG,通過在CPU上使用LSH(局部敏感哈希)采樣技術,有效克服了GPU內存容量限制的問題。

圖片

與僅使用GPU的注意力機制相比,MagicPIG在各種情況下提高了1.76~4.99倍的解碼吞吐量,并在檢索和推理任務中實現了更高的下游準確率,優于Quest等現有技術。

概括而言,這項研究主要貢獻有兩點:

1、相比于其他的稀疏注意力(Sparse Attention),MagicPIG基于采樣/估計而非搜索,提升了推理質量。

2、研究把解碼階段注意力模塊的計算和哈希表卸載到CPU上,探索了異構計算的可能性,并且提升了吞吐量,有望降低實際模型部署成本。

下面具體來看。

KV緩存限制了GPU高效利用

在長上下文大模型(LLM)的推理過程中,KV緩存(Key-Value Cache)成為關鍵瓶頸。KV緩存主要用于存儲中間的注意力鍵和值,從而避免重復計算。

然而,其顯存占用隨著批量大小和序列長度的線性增長而迅速增加,這嚴重限制了GPU的批量處理能力,導致計算資源無法被充分利用。

NVIDIA A100-40GB GPU為例,在處理Llama-3.1-8B模型且上下文長度為128k時,僅支持單個請求,且近一半的解碼時間都消耗在訪問KV緩存上,GPU利用率明顯不足。

此外,推理過程中采用的一些策略,如多樣性生成(Best-of-N)和長鏈式推理(Long Chain-of-Thoughts),會進一步增加生成的Token數量,加劇顯存壓力,導致推理效率進一步下降。

TopK Attention的問題

眾所周知,注意力機制本質上具有稀疏性,因此動態稀疏注意力和基于TopK的近似方法得到了廣泛研究。

然而,這些方法往往伴隨著顯著的質量下降問題。

目前已有的KV緩存壓縮技術,如Quest、H2O和Loki,主要通過篩選出KV緩存中注意力得分最高的子集來提高效率。然而,盡管這些方法在實踐中表現出一定的效果,基于TopK的注意力依然是一種存在偏差的近似方法,且缺乏理論上的嚴格保障。

這種不足限制了其在高精度場景中的廣泛應用。

下圖顯示,即使是精確的TopK注意力機制也會導致顯著的估計誤差和下游任務性能下降。

這一問題在需要高上下文利用率的復雜任務中尤為突出,例如聚合任務、常用詞提取(CWE)、高頻詞提取(FWE)以及邏輯推理任務。在這些場景中,基于TopK近似方法的性能下降尤其嚴重。

圖片

以下幾點觀察揭示了為何TopK注意力機制無法始終有效工作

這些觀察不僅解釋了注意力機制的行為,還可能對模型訓練具有重要意義:

1、首個輸入token(注意力匯聚點,sink)的隱藏狀態(包括但不限于鍵和值狀態)幾乎不隨輸入變化而改變。(見左圖, 在采樣的輸入中,其最小相似度均高于0.99)

2、鍵狀態的中心方向在不同輸入句子中保持穩定。(見中圖, 相似度均高于0.9)

3、鍵狀態的中心與匯聚點token的鍵狀態幾乎相反。(見右圖, -0.9至-0.8之間)

圖片

這些現象為理解注意力機制提供了新的視角,同時也表明傳統的TopK近似方法在某些場景下可能存在局限性。

為了解決這一問題,研究提出了一種基于采樣而非搜索TopK鍵值緩存的新方法。

算法:基于采樣的注意力估計

與僅依賴注意力分數最高的鍵值對相比,融入基礎分布信息可以顯著提高估計的準確性。

研究將這一問題視為采樣中的偏差校正問題。在生物學、社會學和機器學習等領域,無偏且高效的采樣技術已被廣泛研究,并具有堅實的理論保障。

如圖所示,基于注意力分數按比例進行采樣(即所謂的Oracle Sampling,研究把注意力模塊的輸出看成value向量的期望值,對應的分布是注意力得分)相比于傳統的TopK選擇方法,其估計誤差要小得多,最多可降低4倍。

圖片

這表明采樣技術在注意力近似中的潛力。

從注意力得分??中采樣,在實際中不可行。重要性采樣(Importance Sampling)允許從一個已知分布??中抽取樣本??1,??2,…,??B,來估計未知分布??的期望。

最終的輸出由下式給出:
圖片
重要性采樣要求??和??的峰值對應以降低估計方差,為此,研究使用局部敏感哈希(LSH) 來生成采樣概率??。

需要指出的是,因為存在Softmax(注意力得分需要歸一化), 所以研究實際上試圖近似的是自歸一化重要性采樣。

圖片

系統:將注意力計算和哈希表放在CPU上

除了精度下降的問題外,受限的GPU顯存容量也限制了現有動態KV緩存壓縮方法(如Quest和Loki)在許多場景中的適用性。

與此同時,像DeepSpeed-Zero-Inference和FastDecode這樣的技術展示了將KV緩存和注意力計算卸載到CPU上的潛力。

CPU的內存帶寬大約是GPU顯存帶寬的10%-20%,這引出了一個自然的問題:

能否在不犧牲精度的前提下,將注意力計算中的內存訪問量減少10倍?

通過利用采樣算法,例如MagicPIG中基于LSH(局部敏感哈希)的采樣技術進行注意力估計,研究大幅降低了內存訪問量。這種方法等效地提升了CPU的內存帶寬,使得在維持精度的情況下實現高效的注意力計算。

論文的系統設計擴展了以往的工作,將大語言模型(LLM)的解碼分為以下四個部分:

  • 參數計算:包括所有線性投均在GPU上運行。
  • 注意力計算:涉及公式圖片,該部分在CPU上運行。
  • 隨機投影:在生成過程中,對于每個??執行K x L次隨機投影以生成哈希碼。由于所有注意力頭可以共享相同的隨機投影器,內存開銷較小(在實際實現中約為400KB)。實驗中K=9或10,而L為數百,因此該步驟主要受計算限制,放置在GPU上運行。
  • 檢索:需要在L個哈希表中查找q的哈希碼。這部分計算開銷非常輕量,但預構建的哈希表占用的內存較大,因此更適合放置在CPU上運行。通過上述任務分區,可以支持更大規模的K和L哈希表,而無需擔心哈希碼計算和哈希表存儲的開銷。

圖片

實驗

研究從準確率推理速度兩個方面來評估MagicPIG系統的能力。

圖片中的百分比為實際采樣的KV cache的數量,對于MagicPIG而言,K10L150≈2%, K10L170≈2.5%。

長文本RULER

以Llama-3.1-8B-Instruct為例,MagicPIG在檢索和推理任務中比Quest(稀疏注意力的SOTA基線)實現了更高的下游準確率。

圖片

推理速度和吞吐量

在L20 + Intel 8563C上測試吞吐量,MagicPIG與僅使用GPU的注意力機制相比,在各種情況下提高了1.76~4.99倍的解碼吞吐量。

圖片

整體而言,MagicPIG是將經典的哈希算法和高維向量估計用到LLM解碼上的嘗試。

接下來,研究將支持更加高效的局部敏感哈希算法,并希望進一步降低LLM部署成本,探索異構計算的可能性。

論文:https://arxiv.org/abs/2410.16179
項目地址:www.lsh-ai.com

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-07-01 12:17:54

2024-11-02 10:28:03

2023-02-09 08:57:11

Callable異步java

2024-11-01 20:25:28

2013-04-25 10:38:40

思科存儲交換機

2023-12-07 06:51:18

AI模型

2024-09-12 15:24:29

2024-09-09 14:12:38

2024-06-28 08:04:43

語言模型應用

2024-06-03 10:56:53

2024-11-01 13:30:56

2024-12-09 00:00:10

2025-05-09 02:00:00

代碼接口吞吐量

2024-12-13 13:58:53

2025-10-22 08:52:23

2025-07-16 10:15:51

2023-05-05 13:11:16

2025-10-16 09:00:00

大模型

2024-05-23 16:41:40

2013-04-19 09:45:20

AMPLabHadoopHDFS
點贊
收藏

51CTO技術棧公眾號

1区2区3区国产精品| 亚洲国产午夜| 在线播放亚洲一区| 永久免费网站视频在线观看| 日韩一级片免费在线观看| 午夜一区不卡| 欧美成人一二三| 青青草视频成人| 免费观看亚洲天堂| 色欧美片视频在线观看在线视频| 9999在线观看| 爽爽视频在线观看| 国产精品资源在线看| 欧美做爰性生交视频| 亚洲国产成人精品综合99| 亚洲午夜久久| 亚洲成人国产精品| 国产原创精品在线| 亚洲男人av| 亚洲综合精品久久| 一区二区三区精品国产| 天天影院图片亚洲| 高清不卡在线观看av| 91精品久久久久久久久久久| www日韩精品| 欧美大片专区| 日韩亚洲精品视频| 欧美图片第一页| 成人看片爽爽爽| 91精品国产福利| 我要看一级黄色大片| 一区二区精品伦理...| 亚洲精品水蜜桃| 一区二区三区四区欧美日韩| 激情小视频在线| aaa亚洲精品| 国产伦精品一区二区三区| 国产欧美久久久| 美女网站一区二区| 日本韩国欧美精品大片卡二| 久久久久久久99| 国产精品激情| 欧美大片大片在线播放| www.xxxx日本| 亚洲精品国产成人影院| 日韩亚洲综合在线| 开心激情五月网| 成人直播大秀| 日韩专区中文字幕| 成年人网站在线观看视频| 日韩国产一区二区| 色婷婷av一区二区三区在线观看| 欧美波霸videosex极品| 国内精品久久久久久久久电影网| 亚洲男人天堂2023| 久久精品国产亚洲av麻豆| 首页亚洲中字| 亚洲免费精彩视频| 欧美人与性囗牲恔配| 伊人久久大香线蕉| 怡红院精品视频| 久久久精品成人| 日韩欧美大片| 久久久国产精品一区| 成年人午夜剧场| 女人天堂亚洲aⅴ在线观看| 久久成人精品一区二区三区| 1024手机在线视频| 在线观看一区| 日韩女优人人人人射在线视频| 香蕉污视频在线观看| 免费在线成人网| 91在线观看免费高清完整版在线观看| 亚洲精品18在线观看| 成人高清视频在线观看| 欧美午夜免费| 黄色网址视频在线观看| 亚洲成在人线在线播放| 欧美成人xxxxx| 国产成人福利夜色影视| 日韩欧美的一区| 日本aaa视频| 久久精品国产大片免费观看| 麻豆成人在线看| 日韩男人的天堂| 日韩成人午夜精品| 91国产丝袜在线放| 午夜视频福利在线| 中文字幕一区二区三区在线不卡 | 超碰在线资源站| 欧美.com| 亚洲午夜小视频| 日韩欧美中文字幕视频| 亚洲欧美日韩国产一区二区| 国产精品一区二区电影| 狠狠躁日日躁夜夜躁av| 欧美国产日韩a欧美在线观看| 在线视频一二三区| 东京一区二区| 日韩亚洲国产中文字幕欧美| 亚洲成人网在线播放| 中文字幕免费精品| 国产精彩精品视频| 成人免费视频国产| 国产精品毛片大码女人| 大陆极品少妇内射aaaaa| 95精品视频| 亚洲欧美日韩综合| 久久精品免费av| 激情图区综合网| 欧美人与性禽动交精品| 欧美人与动牲性行为| 欧美性生活大片视频| 美女久久久久久久久| 日韩情爱电影在线观看| 欧美亚洲一级片| www.av网站| 亚洲国产精品ⅴa在线观看| 欧美变态另类刺激| 日韩三级精品| 久久精品人人爽| 午夜一区二区三区四区| www.欧美日韩| www插插插无码免费视频网站| 国产69精品久久| 亚洲视频欧美视频| 国产情侣在线视频| 成人免费不卡视频| 日本a在线天堂| 台湾天天综合人成在线| 自拍偷拍免费精品| 久久久久久久亚洲| 久久欧美一区二区| 欧美 日韩精品| 欧美理伦片在线播放| 久久久久久国产| 国产模特av私拍大尺度| 日韩毛片在线免费观看| 性生活免费在线观看| 精品理论电影在线| 国产精品r级在线| 欧美少妇另类| 色婷婷av一区二区三区之一色屋| 国产高清自拍视频| 亚洲国产午夜| 另类欧美小说| 午夜无码国产理论在线| 亚洲欧美一区二区精品久久久| 1级黄色大片儿| 99re这里只有精品6| 黄色免费福利视频| 色老板在线视频一区二区| 4p变态网欧美系列| 大地资源中文在线观看免费版| 一本高清dvd不卡在线观看| 熟女俱乐部一区二区| 日韩国产在线观看一区| 视频在线精品一区| **精品中文字幕一区二区三区| 日韩视频一区在线| 精品人妻一区二区三区四区不卡| 夜夜精品浪潮av一区二区三区| 性猛交╳xxx乱大交| 在线欧美不卡| 欧美极品日韩| 久久久久久一区二区三区四区别墅| 日韩中文字幕亚洲| 丰满少妇被猛烈进入| 精品国产91久久久久久| www在线观看免费视频| 日韩av网站在线观看| 中文字幕不卡每日更新1区2区| 国产在线不卡一区二区三区| 久久久久久美女| 欧美一区二区视频| 欧美日韩你懂得| 久久久久无码精品国产| 久久天堂av综合合色蜜桃网 | 国产一区不卡视频| 免费高清一区二区三区| 国产精品欧美在线观看| 成人a在线视频| 123区在线| 中文字幕不卡在线视频极品| hs视频在线观看| 一本大道久久a久久综合婷婷| 男女全黄做爰文章| 北条麻妃一区二区三区| 热久久精品免费视频| 亚洲午夜精品一区 二区 三区| 国产欧美韩日| 日本成人在线网站| 亚洲2020天天堂在线观看| 95在线视频| 亚洲国产精品美女| 国产又粗又猛又色又| 午夜久久久影院| 成人欧美一区二区三区黑人一| 成人久久视频在线观看| 欧美日韩中文不卡| 亚洲综合三区| 99热这里只有精品免费| 国产91精品对白在线播放| 99国产精品久久久久老师| 精品亚洲美女网站| 久久久久久久久久国产| 国产盗摄在线观看| 日韩精品在线免费观看| a网站在线观看| 欧美日韩在线一区二区| 免费日韩一级片| 亚洲午夜电影网| 四虎884aa成人精品| 国产欧美一区二区精品仙草咪 | 久久精品欧美一区二区三区不卡| ass极品水嫩小美女ass| 美女www一区二区| 99热成人精品热久久66| 精品福利av| 糖心vlog在线免费观看| 成人a'v在线播放| 久久手机视频| 精品国产午夜肉伦伦影院| 91超碰rencao97精品| 日韩综合av| 国产精品男人的天堂| 丁香六月综合| 欧美在线性爱视频 | 三级一区二区三区| 丁香花五月婷婷| 国产.欧美.日韩| 亚洲一二区在线观看| 男男视频亚洲欧美| 亚欧在线免费观看| 久久久久久色| 麻豆av免费在线| 国产女优一区| 18岁网站在线观看| 国产精品外国| 国产亚洲精品网站| 六月天综合网| 91av俱乐部| 视频在线在亚洲| 人妻无码视频一区二区三区| 亚洲欧美网站| 激情网站五月天| 日韩激情一区二区| www.涩涩涩| 麻豆久久久久久久| 成人性生交视频免费观看| 激情五月婷婷综合| 中文字幕无人区二| 成人18视频日本| 91视频在线网站| 国产日产欧美一区二区三区| 女人黄色一级片| 国产精品成人免费在线| 欧美日韩午夜视频| 夜夜嗨av一区二区三区网页| 精品无码人妻一区二区三区品| 亚洲成人动漫一区| 日韩熟女一区二区| 欧美日韩久久不卡| 国产丰满美女做爰| 日韩精品在线免费播放| 91官网在线| 九九久久久久久久久激情| 色在线视频网| 情事1991在线| 色8久久久久| 国产欧美日韩在线播放| 精品中文一区| 免费观看黄色的网站| 欧美日韩综合| 欧洲av无码放荡人妇网站| 久久国产生活片100| 欧美日韩一区二区区别是什么| 91在线高清观看| 战狼4完整免费观看在线播放版| 一级日本不卡的影视| 波多野结衣视频网站| 欧美日韩成人激情| 偷拍精品一区二区三区| 国产亚洲a∨片在线观看| jizz性欧美| 日本亚洲欧洲色α| 久久爱www.| 麻豆精品传媒视频| 女人色偷偷aa久久天堂| 亚洲精品乱码久久久久久自慰| 久久国产麻豆精品| 偷偷色噜狠狠狠狠的777米奇| 日本一区二区三区国色天香 | 国产日韩欧美成人| 精品伊人久久久| 亚洲成年人专区| 香蕉国产精品偷在线观看不卡| 网站在线你懂的| 久久精品视频在线看| 2021亚洲天堂| 欧美日韩一区久久| 午夜视频免费看| 欧美另类99xxxxx| 456成人影院在线观看| 国产福利不卡| 婷婷久久一区| 国产视频一区二区三区在线播放 | 亚洲综合日韩| 久久久久99人妻一区二区三区| 国产日产欧产精品推荐色 | 国产婷婷精品| 无码国产精品一区二区高潮| 欧美激情一区不卡| 国产成人综合欧美精品久久| 日韩精品专区在线影院重磅| 天堂中文а√在线| 国产99视频精品免视看7| 国产精品久av福利在线观看| 一区二区不卡在线观看| 日韩va欧美va亚洲va久久| 久久福利小视频| 亚洲国产日产av| 国产成人毛毛毛片| 久久精品国产免费观看| 精品福利在线| 精品国产综合久久| 在线日韩欧美| av电影中文字幕| 亚洲制服欧美中文字幕中文字幕| 亚洲自拍第二页| 色噜噜亚洲精品中文字幕| 99精品在免费线偷拍| 日韩久久精品一区二区三区| 国产一区二区三区的电影 | 欧美日韩激情美女| 内射无码专区久久亚洲| 色综合久久久久久中文网| 国产在线不卡一区二区三区| 一区中文字幕在线观看| 精品中文字幕一区二区| 久久精品色妇熟妇丰满人妻| 欧美性受xxxx| 免费黄色网页在线观看| 成人网址在线观看| 自由日本语亚洲人高潮| 伊人成人免费视频| 亚洲免费观看高清完整版在线观看 | 中日韩男男gay无套| 久久性爱视频网站| 亚洲成av人**亚洲成av**| 黄色一级大片在线免费看国产| 欧美俄罗斯性视频| 精品av导航| 国产男女无遮挡| av资源站一区| 日韩人妻精品中文字幕| 国产一区二区三区丝袜| 四虎精品在线观看| 欧美做暖暖视频| 99视频精品在线| 国产婷婷色一区二区在线观看| 亚洲男人的天堂在线播放| 电影亚洲精品噜噜在线观看| 手机看片福利永久国产日韩| 九九热在线视频观看这里只有精品| 日韩精品一区二区三区在线视频| 日韩一区二区免费在线观看| 天堂av最新在线| 精品久久久久久乱码天堂| 久久精品麻豆| 欧美手机在线观看| 精品国产乱码久久久久久影片| 小早川怜子影音先锋在线观看| 日韩精品极品视频在线观看免费| 久久精品国产秦先生| 激情小说中文字幕| 日韩成人在线观看| 另类一区二区三区| 国产欧美久久久久| 久久一二三国产| h片在线免费看| 国产91ⅴ在线精品免费观看| 日韩成人a**站| 插我舔内射18免费视频| 在线日韩一区二区| 午夜小视频福利在线观看| 欧美精品一区在线| 国产一区欧美日韩| 在线视频一区二区三区四区| www.欧美免费| 日韩电影不卡一区| 亚洲高清在线不卡| 婷婷久久综合九色综合绿巨人 | 曰本一区二区三区视频| www.成年人| 色哟哟欧美精品| 成人性生交大片免费看在线播放| 日韩av不卡播放| 成人免费视频视频在线观看免费| 中文字幕乱码人妻二区三区|