精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

KVSharer:基于不相似性實現跨層 KV Cache 共享

發布于 2024-10-29 11:47
瀏覽
0收藏

一、背景

本文中我們介紹一種最新的 KV Cache 共享論文 KVSharer,與之前常見的層內共享不同,KVSharer 主要關注跨層共享,并且是整個層的共享。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

對應的論文:[2410.18517] KVSharer: Efficient Inference via Layer-Wise Dissimilar KV Cache Sharing

對應的代碼庫:????https://github.com/yangyifei729/KVSharer/tree/main??

二、摘要

LLM 推理過程中對 GPU 內存的需求不斷增加,而其中 Attention 的 KV Cache 占據了超過 80% 的空間。當前,大多數現有的 KV Cache 壓縮算法主要集中在單個 Transformer 層內的壓縮,而較少有研究涉及層間壓縮(PS:其實我們之前介紹過的 Character.AI 方案和 MixAttention 都是層間共享)。

本文中,作者提供了一種即插即用的方案,稱為 KVSharer,通過在層間共享 KV Cache 來實現層間壓縮。作者發現一個反直覺的現象:共享相似性較低的 KV Cache 更能保持模型性能(PS:這里實現時其實有個約束,要同時避免對 LM head 之前的 Hidden State 的影響過大)。實驗表明,KVSharer 能夠在減少 30% 的 KV Cache 計算,以及內存開銷,而對模型性能影響不大,同時還能實現至少 1.3x 的生成加速。此外,作者實驗表明,KVSharer 與現有的層內 KV Cache 壓縮方案兼容,兩者結合可進一步節約內存。

三、方案

3.1 概述

如下圖 Figure 2 所示為本文方案的示例,其主要包含幾個步驟:

  • 校正集上推理,并記錄 KV Cache。
  • 計算任意兩層的歐式距離。
  • 排序,按相似性從低到高排列。
  • 從排序的組合中依次篩選可以共享的層。
  • 在整個后續推理中保持離線搜索的共享策略。?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

3.2 搜索策略

如下圖 Algorithm 1 為詳細的搜索算法,其大體包含兩個階段:

KV Cache 相似性計算和初始化(1-4):

  • 首先使用校準集所有樣本進行推理,獲得所有 Layer 的 KV Cache。
  • 在每一層,對所有樣本的 KV Cache 求平均。
  • 將每一層的 KV Cache 拉平為一維 Embedding。
  • 計算任意兩層 KV Cache Embedding 的歐式距離(距離越大越不相似),構成 S。
  • 按照距離降序排列(距離越大,越不相似),得到 R。

共享策略搜索(5-18):

  • 初始空的共享策略 Z 和空的共享 Layer 個數 P。
  • 依次遍歷排序后的候選共享層 R:

將當前候選 r 添加到共享策略 Z。

替換候選共享策略 Z 中的所有相關層(保留靠近輸入的層,靠近輸出的層共享靠近輸入的層),然后使用校準集驗證最后一層 Hidden Stage 和未替換時的相似度。

如果相似度小于閾值 T,表示替換后影響較大,則從 Z 中刪除當前后續 r。

如果相似度大于等于閾值 T,則可以作為候選。

如果候選集容量滿足 C,則直接結束。?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

PS:需要說明的是,以上是基于貪心搜索策略,這種逐步判斷并添加的方式往往只能找到局部最優解,并不一定是全局最優的。要想找到全局最優,通常需要進行全局搜索,比如窮舉所有可能的共享組合,或者產生更復雜的搜索算法,但是往往會大幅增加計算成本,因此這種貪心搜索是計算效率和效果的折衷。

3.3 推理

如下圖 Figure 3 所示,在推理階段直接使用離線階段搜索出來的共享策略,可以看出其實是會存在多個 Layer 共享一個 Layer 的。但是圖中似乎有問題,論文中并沒有討論共享的傳遞性,比如Layer 2 和 3 共享 Layer 1,而 Layer 4 共享 Layer 3,Layer 5 共享 Layer 4,那豈不是 Layer 2,3,4,5 都共享 Layer 1?

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖所示為代碼中的注釋(KVSharer/llama_real_share/modeling_llama_kvsharer.py#L364-L371):

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

四、實驗&結果

4.1 精度

如下圖 Table 1 所示,作者測試幾個常見模型 LLaMA2-7B/13B(PS:如果有 LLaMA3 的結果更有說服力)、InternLM2-7B/20B(中英文能力不錯)和 Mistral-7B 在一些主要任務上的精度。其中 Layer 表示實際計算的層數,Layer 越小,表示共享的越多。Percent 表示共享后的平均精度相比原始平均精度的比例。可以看出,共享越多效果越差,并且各個模型表現各不相同,比如在 LLaMA2-13B(40->30) 和 Mistral-7B(32->24) 在共享 25% 時,平均精度就不到 90% 了。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

其實,從困惑度(PPL)上來看,影響也是挺大的,尤其是與 H2O 和 PyramidInfer 這些層內壓縮結合后:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

4.2 推理

如下圖 Table 2 所示,作者以 LLaMA2-13B-Chat 模型為例,對比了不同方案對 Memory 的開銷以及推理的加速比。其中的 KVSharer(25%)表示 25% 的壓縮比,也就意味著 40 層只計算 30 層的 KV Cache。(PS:這里的結論很奇怪,25% 的壓縮比理論上最多節約 25% 內存,最多吞吐提升 25%?更何況 Q 和 Attention 還要正常計算,而實際上 1024+4096 時節約了 36% 的內存,吞吐提升 1.53x。)

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

4.3 消融實驗

如下圖 Figure 6 所示,作者實驗表明:共享相似性較低的 KV Cache 更能保持模型性能。

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 3 所示,使用 Wikipedia 或 BookCorpus 作為校準集對精度的影響不是特別大:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 4 所示,隨機共享相比本文的 KVSharer 會導致精度下降比較多,證明本文方法的有效性:

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

如下圖 Table 5 所示,KVSharer 在幾個模型的 Base 模型和 Chat 模型上的精度影響比較類似,證明了方法的通用性。(PS:不過 PPL 確實影響挺大的)

KVSharer:基于不相似性實現跨層 KV Cache 共享-AI.x社區

五、參考鏈接

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
久蕉在线视频| 四虎精品免费视频| 亚洲成人看片| 亚洲视频综合在线| 国产高清精品一区| 东京热一区二区三区四区| 999精品免费视频| 97超碰资源站在线观看| 成人av在线看| 国产精品日韩一区| 久久高清无码视频| 欧美精选一区二区三区| 91精品国产乱| 久久久噜噜噜www成人网| 日本精品在线| 2014亚洲片线观看视频免费| 91精品中国老女人| 日韩综合在线观看| 自拍日韩欧美| 一区二区三区精品99久久 | 日韩精品电影一区二区三区| 一区二区网站| 欧美三级韩国三级日本一级| 欧美成人三级在线视频| 大片免费在线观看| 国产欧美一二三区| 久久手机视频| 亚洲精品国产精| 国产在线视频精品一区| 国产精品黄色影片导航在线观看| 日本中文字幕网| 牛牛国产精品| 久久五月情影视| 黄色av免费播放| 一本久久青青| 日韩成人在线视频| 日韩女优在线视频| 麻豆国产精品| 91精品国产一区二区三区香蕉 | 欧美精选视频一区二区| 婷婷夜色潮精品综合在线| 大地资源网在线观看免费官网| 天堂资源在线中文| 国产精品乱码妇女bbbb| 日韩久久不卡| 成人全视频高清免费观看| 337p粉嫩大胆噜噜噜噜噜91av| 国产精品免费一区二区| 亚洲第一页视频| 国产激情精品久久久第一区二区 | 国产福利一区视频| 中文字幕在线直播| 欧美性20hd另类| 啊啊啊一区二区| 欧美13videosex性极品| 天天操天天干天天综合网| av日韩一区二区三区| 欧美色图天堂| 亚洲成a人在线观看| 久久这里只有精品18| 图片区小说区亚洲| 亚洲国产视频在线| 国产午夜福利100集发布| sm在线播放| 图片区小说区国产精品视频| 精品国产一二三四区| 人成在线免费网站| 色8久久人人97超碰香蕉987| 九九九在线观看视频| 国产91亚洲精品久久久| 欧美一区二区三区日韩| 日本泡妞xxxx免费视频软件| 国产日韩三级| 亚洲偷熟乱区亚洲香蕉av| 国精产品视频一二二区| 中文在线日韩| 国内精品模特av私拍在线观看| 国产福利拍拍拍| 亚洲欧美日韩专区| 国产精品一区二区女厕厕| 国产丝袜在线视频| 成人美女在线视频| 日韩久久不卡| 四虎亚洲精品| 色先锋资源久久综合| 91国内在线播放| 福利在线一区| 国产亚洲精品日韩| 欧美日韩在线视频免费播放| 亚洲欧美日本日韩| 成人国产亚洲精品a区天堂华泰| 午夜精品久久久久久久爽| 91小视频在线观看| 国产又爽又黄ai换脸| 国产高清中文字幕在线| 欧美日韩国产成人在线91 | 91网址在线看| 亚洲一区二区在线观| www.综合网.com| 欧美丝袜自拍制服另类| 超碰caoprom| 日韩精品四区| 91av在线影院| 国产富婆一级全黄大片| 久久久亚洲欧洲日产国码αv| 在线视频亚洲自拍| 日韩激情电影| 日韩片之四级片| 国产欧美小视频| 亚洲精品男同| 亚洲在线免费看| 国产精品四虎| 精品电影在线观看| 中文字幕12页| 奇米影视亚洲| 456亚洲影院| 亚洲第一大网站| 最新日韩av在线| 国产成人精品无码播放| 丁香5月婷婷久久| 精品国产自在精品国产浪潮| 无码一区二区三区| 91在线视频播放| 黄色a级片免费看| 一区二区三区日本视频| 亚洲网址你懂得| 久久青青草原亚洲av无码麻豆| 国产成人久久精品77777最新版本| 无码免费一区二区三区免费播放| 九色porny丨入口在线| 欧美成人a视频| 国产午夜手机精彩视频| 理论电影国产精品| 色女人综合av| 91精品韩国| 亚洲欧美制服丝袜| 狠狠人妻久久久久久| 99精品视频中文字幕| 欧美日韩不卡在线视频| 亚洲高清在线一区| 欧美成人精品xxx| 国产麻豆一精品一男同| 亚洲素人一区二区| 国产又粗又长又爽又黄的视频| 日韩理论在线| 国产综合福利在线| 麻豆视频免费在线观看| 在线成人av网站| 日日操免费视频| 老司机免费视频一区二区三区| 少妇精品久久久久久久久久| abab456成人免费网址| 夜夜嗨av一区二区三区免费区 | 免费久久一级欧美特大黄| 麻豆免费在线| 精品在线观看国产| www.久久久久久久| 久久精品人人爽人人爽| av污在线观看| 久久精品影视| 99三级在线| 国产精品一品| 国产视频精品久久久| 波多野结衣av无码| 国产精品国产三级国产| 中文字幕1234区| 韩国在线视频一区| 久久资源亚洲| 国产a亚洲精品| 精品自拍视频在线观看| 少妇高潮一区二区三区69| 欧美色道久久88综合亚洲精品| 亚洲一级中文字幕| 麻豆成人在线观看| 六月婷婷激情综合| 宅男在线一区| 91视频国产高清| 国产黄色大片在线观看| 亚洲美女喷白浆| 91亚洲国产成人精品一区| 亚洲欧美日韩精品久久久久| 日本性生活一级片| 日欧美一区二区| 精品日韩在线播放| 色婷婷狠狠五月综合天色拍| 国产精品男女猛烈高潮激情| 中文字幕中文字幕在线中高清免费版| 亚洲大胆人体在线| 中文字幕一区2区3区| 一区二区三区在线不卡| a级大片在线观看| 精品一区在线看| 美女日批免费视频| 亚洲成人av| 欧美激情第六页| japansex久久高清精品| 欧美一区二区.| av网站在线免费| 亚洲日韩欧美视频一区| www.久久久久久| 91成人免费网站| 久久免费公开视频| 国产精品视频第一区| 蜜臀视频在线观看| 另类小说欧美激情| 成人小视频在线看| 欧美精品国产一区| 亚洲精品影院| 日韩电影不卡一区| 99re视频| 欧美xxxx网站| 日韩美女视频免费在线观看| 欧美女同一区| 久久精品视频亚洲| 国产一二三在线观看| 亚洲第一区第一页| 99久久亚洲精品日本无码| 欧美伊人久久久久久午夜久久久久| 久久久久97国产| 国产精品久久网站| 伊人网在线视频观看| 99这里只有久久精品视频| 亚洲第一区第二区第三区| 日本成人在线视频网站| 国产免费黄视频| 亚洲精品1234| 激情五月婷婷六月| 欧美激情1区| 日本黄色播放器| 欧美3p视频| 亚洲精品美女久久7777777| 亚洲三级网址| 欧美极品色图| 丝袜久久网站| 亚洲欧洲日韩av| 免费看成人片| 欧美1区二区| 国产 高清 精品 在线 a| 青青久久精品| 国产精品欧美激情| 国精产品一区一区三区四川| 欧美一级淫片videoshd| 偷拍自拍在线看| 久久久综合av| 91超碰免费在线| 久久久欧美一区二区| 女子免费在线观看视频www| 久久天天躁狠狠躁夜夜躁| 日本a级在线| 久久精品国产亚洲7777| 水蜜桃一区二区三区| www.成人在线.com| 成人乱人伦精品视频在线观看| 久久免费影院| 成人在线免费观看视视频| 91视频亚洲| 99热最新在线| 老司机精品在线| 久久精品人成| 精品一区二区三区在线| 一区二区三区四区视频在线观看| 国产精品成久久久久| 日本三级福利片| 欧美一区二区三区另类| 黄色三级中文字幕| 国产精品毛片| 不要播放器的av网站| 美女一区二区视频| 少妇性l交大片7724com| 丁香六月久久综合狠狠色| 精品熟女一区二区三区| 久久久电影一区二区三区| 天天舔天天操天天干| 亚洲青青青在线视频| 国产乡下妇女做爰| 色综合天天综合色综合av| 免费av中文字幕| 欧美一区午夜视频在线观看| 国精品人妻无码一区二区三区喝尿 | 成人免费av网站| 最近中文字幕免费| 亚洲色图欧美偷拍| 欧美三级韩国三级日本三斤在线观看| 日本乱码高清不卡字幕| 国产精品毛片一区视频播 | 色婷婷av一区二区三区之一色屋| 波多野结衣爱爱| 精品国产乱子伦一区| 免费在线高清av| 免费99精品国产自在在线| 欧美办公室脚交xxxx| 国产精品69精品一区二区三区| 成人国产在线激情| 国产精品一区二区精品| 精品福利影视| 久久激情电影| 一区二区三区美女| 久热这里只有精品在线| 狠狠色香婷婷久久亚洲精品| 一级做a爱片久久毛片| 亚洲第一精品自拍| 免费在线看黄| 日韩美女在线播放| 澳门久久精品| 中文字幕一区二区中文字幕| 亚洲影院一区| 中文字幕1区2区| 中文字幕中文字幕中文字幕亚洲无线| 日韩 欧美 综合| 日韩欧美综合在线| 一级毛片视频在线| 日韩av色在线| 欧美a一欧美| 日韩精品久久一区二区| 麻豆91精品91久久久的内涵| 法国伦理少妇愉情| 亚洲高清免费视频| 国产成人精品无码高潮| 伊是香蕉大人久久| 亚洲一区资源| 久久综合中文色婷婷| 精品电影一区| 制服.丝袜.亚洲.中文.综合懂 | 2014国产精品| 久久精品国产大片免费观看| 狠狠热免费视频| 久久久综合九色合综国产精品| 国产黄色片视频| 亚洲成色999久久网站| 欧美24videosex性欧美| 91久久国产综合久久蜜月精品| 国产精品97| 午夜啪啪小视频| 国产精品福利一区| 国产一区二区视频免费观看| 中文字幕日韩av综合精品| 国产成人免费9x9x人网站视频| 精品一区二区三区视频日产| 亚洲美女网站| 国产麻豆xxxvideo实拍| 亚洲h在线观看| 手机看片1024日韩| 97精品在线视频| 香蕉久久精品| 国产精品视频黄色| 中国av一区二区三区| 中文在线资源天堂| 最近2019年中文视频免费在线观看| 成人精品电影在线| 亚洲日本无吗高清不卡| 麻豆freexxxx性91精品| 国产精品三区在线观看| 日韩欧美一区二区免费| av老司机免费在线| 久久精品国产99精品国产亚洲性色| 国产日韩欧美一区在线 | 九九免费精品视频在线观看| 无码人妻丰满熟妇区毛片| 久久精品亚洲精品国产欧美kt∨| 69av视频在线观看| 久久久国产一区| 亚洲一区二区三区中文字幕在线观看| 性高湖久久久久久久久aaaaa| 91在线你懂得| 最近中文字幕av| 欧美成人一二三| 欧美顶级毛片在线播放| 中文字幕第80页| 亚洲免费观看高清完整| 丰满少妇高潮在线观看| 欧美一区三区三区高中清蜜桃| 精品国产乱码久久久久久蜜坠欲下 | 亚洲精品一区三区三区在线观看| 亚洲国内在线| 国产999精品久久久久久绿帽| 日韩 欧美 综合| 在线视频精品一| 日本综合精品一区| 日本三区在线观看| 亚洲欧美一区二区三区极速播放 | 亚洲一级免费视频| 国产一区二区| 欧美牲交a欧美牲交aⅴ免费真| 亚洲国产成人午夜在线一区| 国产按摩一区二区三区| 青青草精品毛片| 亚洲精品tv久久久久久久久久| 国产xxxxxxxxx| 欧美日韩精品三区| 98色花堂精品视频在线观看| 亚洲欧美日韩国产yyy| 粉嫩嫩av羞羞动漫久久久| 国产在线一级片| 久久久女人电视剧免费播放下载 | 久久电影一区二区| 欧美精美视频| 老司机av网站| 欧美四级电影在线观看| 亚洲精品福利电影| www.国产亚洲|