精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention

發布于 2024-10-8 16:03
瀏覽
0收藏

一、背景

我們之前的文章中介紹過 Character.AI 的 LLM 推理最佳實踐,其在 1 年多的時間里將推理成本降低了 33 倍。其中一個關鍵技術是對 KV Cache 的跨層共享以及與 Local Attention 的結合。本文我們介紹 MixAttention,其思路和上述方案完全一致,不過針對長文本場景做了更多實驗和調整。

對應的論文為:[2409.15012] Inference-Friendly Models With MixAttention

LLM 稀疏化相關工作可以參考:

二、方案

2.1 Character.AI 方案

如下圖所示為 Character.AI 的方案,左側為標準的 Transformer Layer,全部是 Global Attentio;右側為 Character.AI 的方案,結合了跨層 KV Cache 共享和 Sliding Window Attention:

  • 藍色的 1,7,13 使用 Global Attention,并且 7 和 13 共享 1 的 KV Cache。
  • 綠色的  2,4,8,10 和紅色的 3,5,6,9,11,12 使用 Local Attention,并且紅色的 3 會共享綠色2 的 KV Cache,紅色的 5 和 6 會共享綠色4 的 KV Cache。?

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

2.2 本文方案

如下圖 Figure 2 所示為本文 MixAttention 與標準 Transformer Attention 以及 Sliding Window Attention 的區別。基本與上述的 Character.AI 的方案一致,只不過共享的位置不太一樣。其中紅點表示被共享的 Global Attention,藍點表示被共享的 Sliding Window Attention。

  • MA:與 Character.AI 方案一致。
  • MA-Offset:起始的幾個 Layer 先使用 Sliding Window Attention,關注局部;然后才會有 Global Attention。
  • MA-EndSlide:和 MA-Offset 相反,在結束的 Layer 也采用 Sliding Window Attention。如下圖 Figure 3 所示。這個主要是為了評估最后一層 Global Attention 對長序列的影響有多大
  • MA-Pairs:Global Attention 也采用 Pair 的方式。在 MA 和 MA-Offset 只會有一層的全局 KV Cache,在 MA-Pairs 中會有多層的全局 KV Cache。?

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

作者也探索了更多連續層共享 Global KV Cache 的方案,以 MA-Successive 為前綴,如下圖 Figure 9 所示:

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

除此之外,作者還探索了沒有共享 Global KV Cache 的方案,以 MA-NoShare 為前綴,如下圖所示:

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

三、實驗和結果

3.1 訓練

訓練分為 3 個階段:

  • Stage 1:101B Token 預訓練,Max Sequence Length 為 4K,RoPE 的 theta 為 0.5M。
  • Stage 2:9B Token 自然語言和代碼數據,Max Sequence Length 擴展到 32K,RoPE 的 theta 擴展到 8M。
  • Stage 3:0.5B 長文本合成數據,Max Sequence Length 依然是 32K。

3.2 評估

所有模型在前兩個 Stage 上的 Loss 都非常接近,而在 Stage 3 有較大區別。如下圖 Figure 4 所示,MA、Sliding Window Attention 和 MA-EndSlide 的效果明顯差于其他模型,在長文本 RULER 評估上也有類似的結論。作者也分析了相關原因,MA 和 MA-EndSlide 的 Global Attention KV Cache(非共享)都是在第 1 層,而 MA-Offset 和 MA-Pairs 至少有一個 Global Attention KV Cache(非共享)在深層。

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

3.3 推理速度

如下圖 Figure 8 所示,作者在單個 H100 GPU 上使用 SGLang 驗證了不同模型的推理速度,使用 300 個 Prompt,輸入長度 31K,輸出長度 1K。可以看出,MA 相關的方案在速度上都有比較明顯的提升,大約 2x-3x。此外,支持的最大 Token 數目也更多,不過其中 Sliding Window Attention 還沒有優化,所以支持的最大 Token 數和標準 LLM 相同。

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

PS:這里的實驗有點單薄,只在一個單一的數據場景,也沒有測試不同壓力下的性能。

3.4 總結

如下圖所示,從各種評估中可以看出本文的 MA-Offset 和 MA-Pairs 在推理速度,長短文本任務上都獲得了不錯的結果,而標準的 MA 在長文本任務上性能較差。

MixAttention:跨層 KV Cache 共享 + 滑動窗口 Attention-AI.x社區

四、參考鏈接

  1. ???https://arxiv.org/abs/2409.15012????

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
亚洲二区视频在线| 盗摄精品av一区二区三区| 深夜成人在线观看| 日韩a一级欧美一级| 国语对白在线刺激| 不卡一卡二卡三乱码免费网站| 97超碰蝌蚪网人人做人人爽| 娇妻被老王脔到高潮失禁视频| 一级欧美视频| 精品国产91久久久久久| 在线看无码的免费网站| 刘亦菲毛片一区二区三区| 久久一区视频| 久久久人成影片一区二区三区| 亚洲无人区码一码二码三码的含义| 亚洲男男av| 日韩欧美aⅴ综合网站发布| 在线观看欧美激情| 日韩在线免费看| 国产成人精品亚洲777人妖| 日产精品99久久久久久| 欧美成人免费观看视频| 精品国产乱码| 亚洲精品www久久久| 中文字幕亚洲影院| 欧美韩国亚洲| 欧美性xxxx在线播放| 午夜久久久久久久久久久| 国产黄在线播放| av在线一区二区三区| 91九色精品视频| 337p粉嫩色噜噜噜大肥臀| 国自产拍偷拍福利精品免费一| 揄拍成人国产精品视频| 黄色短视频在线观看| 中文无码日韩欧| 欧美一区三区四区| 国产成人黄色网址| 秋霞国产精品| 日韩欧美中文在线| 国产日韩欧美精品在线观看| 国产超级va在线视频| 日本一区二区成人在线| 日韩精品一区二区三区四区五区 | 日韩理论片在线观看| 天天射,天天干| 成人av网站在线| 国产福利久久精品| 亚洲第一黄色片| 国产一区二区三区av电影| 国产一区视频在线| 亚洲午夜精品久久久| 久久一区二区三区超碰国产精品| 欧美在线视频一区二区| 久久精品国产成人av| 国产一区二区三区的电影| 91国在线精品国内播放| 成人免费看片98欧美| 99热免费精品| 日本人成精品视频在线| 狠狠人妻久久久久久综合| 美女网站久久| 国产精品美女久久久久久免费| 中文字幕永久在线| 蜜桃久久久久久| 国产一区欧美二区三区| 国产av无码专区亚洲av麻豆| 国产91丝袜在线18| 国内精品二区| 噜噜噜在线观看播放视频| 国产视频911| 一区精品视频| 国产精品69xx| 色偷偷88欧美精品久久久| 免费日韩中文字幕| 色综合久久久| 精品噜噜噜噜久久久久久久久试看| 蜜桃视频无码区在线观看| 精品福利一区| 国产亚洲精品久久久久动| 精品丰满少妇一区二区三区| 91精品国产自产在线观看永久∴| 欧美日韩国产成人在线| 在线观看免费av片| 久久成人av少妇免费| 亚洲综合在线播放| 午夜视频福利在线| 中文字幕中文字幕一区二区| 日本天堂免费a| 老色鬼在线视频| 欧美日韩免费视频| 亚洲成a人片在线www| 国产成人手机高清在线观看网站| 最近2019好看的中文字幕免费| 久久国产精品国语对白| 一区二区三区福利| 91久久精品美女高潮| 天天操天天干天天| 亚洲欧美自拍偷拍| 午夜肉伦伦影院| 国产乱码精品一区二区三区亚洲人| 亚洲国产欧美一区| 国产男女猛烈无遮挡在线喷水| 伊人影院久久| 国产欧美在线看| 天天操天天插天天射| 中文字幕制服丝袜一区二区三区| av之家在线观看| 免费精品一区| 一区二区三区www| 国产乡下妇女做爰| 久久91精品国产91久久小草| 久久99国产精品| av在线免费播放| 色婷婷亚洲精品| 国产xxxx视频| 综合久久亚洲| 国产伦精品免费视频| 天堂网在线观看视频| 亚洲天堂av一区| 亚洲黄色a v| 在线日韩网站| 97久久精品国产| 成人黄色在线观看视频| 国产精品欧美一区喷水| 337p粉嫩大胆噜噜噜鲁| 国产一区二区三区亚洲| 美女性感视频久久久| 中国一级特黄视频| 久久久久久久av麻豆果冻| www.av毛片| 欧美三级一区| 久久综合网hezyo| 最近国语视频在线观看免费播放| 91蜜桃免费观看视频| 18禁网站免费无遮挡无码中文| 精品国产亚洲日本| 欧美成人精品在线| 国产精品人人爽| 亚洲视频一区二区免费在线观看| 亚洲成人福利在线观看| 久久99视频| 日本免费一区二区三区视频观看| 天天射天天色天天干| 亚洲丰满少妇videoshd| 中文字幕在线视频播放| 日韩图片一区| 久久综合久久久| 香蕉久久免费电影| 在线视频精品一| 亚洲男人天堂网址| 国产精品久久久久婷婷二区次| 色综合天天色综合| 91免费精品| 成人黄色片在线| av网站大全在线| 日韩视频在线你懂得| 2021亚洲天堂| 成人免费高清视频在线观看| www.av毛片| 在线日韩网站| 国产日韩欧美视频| 精品黄色免费中文电影在线播放| 5858s免费视频成人| 免费在线一区二区三区| 成人性生交大片| 91传媒久久久| 久久精品99久久无色码中文字幕| 国产精品久久久久av免费| 在线观看av的网站| 91精品国产91久久久久久最新毛片 | 一级成人免费视频| 一区二区视频在线| 精品无码在线视频| 免费欧美日韩国产三级电影| 亚洲欧美日韩不卡| 欧美在线导航| 国产精品女主播视频| av电影高清在线观看| 亚洲国产精品高清久久久| 无码人妻精品一区二区50| 中文成人av在线| 男人添女人荫蒂国产| 国产精品久久久久久久免费软件 | 国产一区国产精品| 精品网站在线| 欧美超级乱淫片喷水| 性感美女福利视频| 欧美精品色一区二区三区| 久久精品一级片| 久久综合久久综合久久综合| 自拍偷拍一区二区三区四区| 亚洲午夜在线| 日韩福利二区| 91蝌蚪精品视频| 国产精品久久久久久久久久尿 | 97久久久免费福利网址| wwwxxx在线观看| 精品国产一区二区亚洲人成毛片| 亚洲国产成人精品女人久久| 洋洋成人永久网站入口| 国产激情av在线| 99视频精品在线| 一二三级黄色片| 视频一区二区中文字幕| 97久久国产亚洲精品超碰热| 成人av动漫在线观看| 国产九区一区在线| 国产精品va视频| 国产精品久久网| 三妻四妾的电影电视剧在线观看| 久久精品国产欧美亚洲人人爽| 色视频免费在线观看| 日韩亚洲欧美综合| 91av国产精品| 91搞黄在线观看| 天天爽夜夜爽夜夜爽精品| 亚洲人成电影网站色mp4| 实拍女处破www免费看| 国产69精品久久久久777| 一起操在线视频| 天堂资源在线中文精品| 亚洲熟妇无码一区二区三区导航| 欧美+日本+国产+在线a∨观看| 日韩欧美在线观看强乱免费| 一道本一区二区三区| 国产精品初高中精品久久| 国产视频一区二| 成人黄色免费在线观看| 懂色aⅴ精品一区二区三区| 日韩免费观看高清| 免费观看一级欧美片| 81精品国产乱码久久久久久| a级片在线免费| 欧美大秀在线观看| 午夜av在线免费观看| 久久伊人精品一区二区三区| 中文字幕日本在线观看| 在线视频欧美日韩| 国产二区在线播放| 中文字幕不卡av| 性开放的欧美大片| 最近中文字幕mv在线一区二区三区四区| 深夜影院在线观看| 亚洲理论在线a中文字幕| 五月婷婷六月激情| 亚洲精品一二区| 国产理论电影在线观看| 最近更新的2019中文字幕| 欧美尤物美女在线| 日韩在线观看av| 亚洲丝袜精品| 欧美激情视频免费观看| h片视频在线观看| 91豆花精品一区| 欧美成人性网| 国产欧美一区二区三区四区| 婷婷精品久久久久久久久久不卡| 91免费高清视频| 亚洲福利合集| 精品网站在线看| 一道在线中文一区二区三区| 小说区图片区图片区另类灬| 日韩一区二区在线| 亚洲国产精品女人| 在线精品福利| 国产精品少妇在线视频| 久久激五月天综合精品| 一级黄色片在线免费观看| 国产精品1区2区3区| www国产视频| 国产亚洲短视频| 一级性生活免费视频| 一区二区三区中文在线观看| 国产无人区码熟妇毛片多| 91激情在线视频| 国产普通话bbwbbwbbw| 精品久久久久久久人人人人传媒| 亚洲人视频在线观看| 中文字幕精品在线| 青春草在线免费视频| 国产成人精品视| 日韩三级不卡| 蜜桃麻豆91| 91精品二区| 亚洲欧洲日产国码无码久久99| 麻豆成人综合网| 成人性生活免费看| 国产精品网友自拍| 日韩高清精品免费观看| 欧美日韩一区二区三区免费看| 性做久久久久久久久久| 亚洲欧美综合v| 午夜在线激情影院| 国产精品伦子伦免费视频| a看欧美黄色女同性恋| 亚洲精品一区二| 在线亚洲精品| 日韩精品视频网址| 久久青草欧美一区二区三区| 青青草免费av| 精品视频色一区| 午夜激情在线视频| 欧美精品一本久久男人的天堂| 美女福利一区二区三区| 成人免费在线看片| 天天av综合| 免费在线观看毛片网站| 国产精品99久久久久久久vr| 丁香激情五月少妇| 五月综合激情日本mⅴ| 国产美女主播在线观看| 亚洲夜晚福利在线观看| 波多野结依一区| 91欧美精品午夜性色福利在线| 免费成人高清在线视频theav| 日韩精品久久一区二区| 激情综合网天天干| 长河落日免费高清观看| 日韩欧美精品免费在线| 人妻一区二区三区| 欧美成人第一页| 电影一区二区三区久久免费观看| 欧美日韩一区二区视频在线| 国产一区二区高清| 国产又粗又长又爽| 亚洲午夜精品17c| 国产色视频在线| 久久艹在线视频| 亚洲福利影视| 亚洲国产精品综合| 免费人成在线不卡| 人成免费在线视频| 欧美亚洲综合网| 成年人视频免费在线观看| 日韩av免费在线| 中文有码一区| 久章草在线视频| 久久美女艺术照精彩视频福利播放 | 99免费精品| 亚洲黄色片免费| 亚洲三级理论片| 国产黄色高清视频| 欧美国产乱视频| 黄色美女久久久| 国产精品网站免费| 91麻豆成人久久精品二区三区| 国产无遮挡又黄又爽| 亚洲精品99999| 欧洲亚洲两性| 亚洲黄色一区二区三区| 久久精品国产精品亚洲精品| 国产乱子轮xxx农村| 69堂精品视频| 色屁屁www国产馆在线观看| 国产九色精品| 天堂蜜桃91精品| 1024手机在线观看你懂的| 777a∨成人精品桃花网| av软件在线观看| 精品国产一区二区三区日日嗨 | 四虎成人av| 男女视频在线观看网站| 亚洲综合免费观看高清完整版| 亚洲av无码乱码国产精品久久| 高清一区二区三区日本久| 亚洲影院天堂中文av色| 中文字幕一区二区三区四区在线视频| 国产精品激情偷乱一区二区∴| 国产精品久久久久久久成人午夜 | 日本一二三区视频| 亚洲激情 国产| 亚洲精品.com| 只有这里有精品| 97国产一区二区| 伊人免费在线观看| 欧美国产欧美亚洲国产日韩mv天天看完整| avtt综合网| 日本中文字幕高清| 亚洲一线二线三线视频| 国产在线一二三| 亚洲已满18点击进入在线看片 | 污污视频在线免费看| 国产精品成人播放| 亚洲视频一区| 谁有免费的黄色网址| 制服丝袜亚洲网站| 黄色视屏在线免费观看| 自拍偷拍亚洲色图欧美| 99久久国产综合精品色伊| 亚洲精品国产精品国自产网站按摩| 久久影院资源网| 偷拍视屏一区| 超级砰砰砰97免费观看最新一期| 精品日本高清在线播放 | 性欧美长视频免费观看不卡| 精品国产日韩欧美| av免费观看不卡| 欧美久久一二三四区| 成人性生活av|