精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又快又準,即插即用!清華8比特量化Attention,兩倍加速于FlashAttention2,各端到端任務均不掉點!

人工智能 新聞
大模型中,線性層的低比特量化(例如 INT8, INT4)已經逐步落地;對于注意力模塊,目前幾乎各個模型都還在用高精度(例如 FP16 或 FP32)的注意力運算進行訓練和推理。

論文第一作者張金濤來自清華大學計算機系,論文通訊作者陳鍵飛副教授及其他合作作者均來自清華大學計算機系。

大模型中,線性層的低比特量化(例如 INT8, INT4)已經逐步落地;對于注意力模塊,目前幾乎各個模型都還在用高精度(例如 FP16 或 FP32)的注意力運算進行訓練和推理。然而,隨著大型模型需要處理的序列長度不斷增加,Attention(注意力運算)的時間開銷逐漸成為網絡優化的主要瓶頸。

為了提高注意力運算的效率,清華大學陳鍵飛團隊提出了 8Bit 的 Attention(SageAttention)。實現了 2 倍以及 2.7 倍相比于 FlashAttention2 和 xformers 的即插即用的推理加速,且在視頻、圖像、文本生成等大模型上均沒有端到端的精度損失

圖片


  • 論文標題:SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration
  • 論文鏈接:https://arxiv.org/abs/2410.02367
  • 開源代碼:https://github.com/thu-ml/SageAttention

即插即用舉例

SageAttention 可以一行代碼輕松替換掉 torch 中當前最優的 Attention 接口(scaled_dot_product_attention),實現即插即用的推理加速。

圖片

具體來說,SageAttention 的使用非常方便,使用 pip install sageattention 后,

只需要在模型的推理腳本前加入以下三行代碼即可:

圖片

效果上,以開源視頻生成模型 CogvideoX 為例,使用 SageAttention 可以端到端加速 35%,且生成的視頻無損:

全精度 Attention

SageAttention

接下來,將從背景與挑戰,技術方案,以及實驗效果介紹 SageAttention。

背景

隨著大模型需要處理的序列長度越來越長(比如 Llama3.1 支持 128K 的序列長度),Attention 的速度優化變得越來越重要。下圖展示了一個標準的 Transformer 模型中各運算隨著序列長度變化的時間占比:

圖片

挑戰

為了方便指代注意力元算中包含的矩陣,我們先回顧一下注意力的計算公式:

圖片

將神經網絡中各運算的數值類型從高比特量化至低比特是一種有效提升計算和訪存效率的方法。然而,研究團隊發現直接將注意力運算中的 Q, K, P, V 從 FP16 量化為 INT8 或者 FP8 后將會導致在幾乎所有模型和任務上都會得到極差的結果,例如,在 Unidiffuser 文生圖模型中,會得到一張完全模糊的圖像;在 Llama2-7B 進行四選一選擇題任務上得到 25.5% 的準確率。

圖片

經過仔細分析后,研究團隊發現主要是兩個原因導致了量化注意力的不準確:

  • 大多視頻、圖像生成模型中,矩陣 K 表現出了極強的通道維度的異常值分布,直接使用 INT8 或者 FP8 數據類型對其進行量化會導致巨大的誤差。

圖片


  • 在所有模型中,對矩陣 P, V 進行量化不能保證一個模型中所有層的精度。下表展示了對 P, V 量化后,Llama2-7B 和 Unidiffuser 模型所有層中,最差情況的層對應的量化注意力的準確度,(該準確度為量化注意力相比全精度注意力的誤差),可以發現不管對 P, V 矩陣進行何種 8Bit (INT8,E4M3,E5M2)量化,總有些層的準確率非常差,導致了端到端效果的下降。

圖片

技術方案

為了解決上述的兩個關鍵問題,研究團隊提出了對應的解決辦法。

  • 對 K 進行平滑處理。SageAttention 采用了一個簡單但非常實用的方法來消除矩陣 K 的異常值:K = K – mean (K) 其中 mean (K) 是沿著通道維度求平均值。這個簡單的做法不僅不會影響注意力計算的正確性 Softmax (QK^T) = Softmax (Q (K-mean (K))^T) ;且對整個 Attention 速度的影響只有 0.2%;同時還保證了量化后的注意力運算的精度:

圖片

  • 對 Q, K 進行分塊 INT8 量化。對于矩陣 Q, K,SageAttention 采用了以 FlashAttention 的分塊大小為粒度的 INT8 量化。這是因為:1. 對 Q, K 矩陣進行 INT8 量化相比于進行 FP8 量化,注意力的精度更高。2. 在一些常用卡上,比如 RTX4090,INT8 矩陣乘法(INT32 為累加器)的速度是 FP8(FP32 為累加器)的兩倍。
  • 對 P, V 采用 FP16 數據類型的矩陣乘法累加器。對于矩陣 P, V,SageAttention 采用了保留 P, V 為 FP16 的類型,但進行矩陣乘法時采用 FP16 數據類型的累加器。這是因為:1. PV 矩陣乘法的數值范圍始終在 FP16 的表示范圍內,且經過大量實驗驗證,FP16 作為累加器的數據類型不會帶來任何精度損失(見下表)。2. 在一些常用卡上,比如 RTX4090,以 FP16 為累加器數據類型的矩陣乘法的速度是 FP32 作為累加器的兩倍。

圖片

SageAttention 的流程圖及算法如下所示:

圖片

圖片

實驗效果

SageAttention 實現了底層的 GPU Kernel,在算子速度以及各個模型的端到端精度上都有十分不錯的表現。

具體來說,算子速度相比于 FlashAttention2 和 xformers 有 2.1 以及 2.7 倍的加速。以下 4 張圖展示了在 RTX4090 上,不同的序列長度下 SageAttention 的各種 Kernel 與其他方法的速度比較。

圖片


圖片

以下 4 張圖展示了在 RTX3090 上,不同的序列長度下 SageAttention 的各種 Kernel 與其他方法的速度比較。

圖片


圖片

下表展示了在 RTX4090 上,各模型中的注意力模塊中 SageAttention 相比于使用模型原始的注意力的加速比。

圖片

真實任務的精度上,下表展示了 SageAttention 在視頻、圖像、文本生成等大模型上均沒有端到端的精度損失:

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-27 09:30:00

AI數據訓練

2025-06-30 08:42:00

模型訓練AI

2025-06-19 09:07:00

2025-07-08 09:10:00

2024-06-06 16:16:00

2009-06-30 19:12:16

云計算SOAIT

2025-06-30 14:02:00

視覺模型AI

2025-03-27 09:47:23

訓練模型AI

2024-07-09 10:24:13

2025-07-01 09:21:33

2022-12-15 22:01:04

TLog日志標簽

2025-05-08 09:14:54

2024-12-05 13:50:00

AI大模型

2011-11-11 16:29:00

斐訊電力貓FH2001

2009-08-19 16:59:51

美國西蒙光纜結構綜合布線

2016-11-28 14:11:32

搜索

2021-06-08 21:49:06

比特幣區塊鏈礦工

2023-09-04 19:09:00

訓練模型數據

2017-09-19 10:11:57

德國電信

2019-09-23 16:06:50

物聯網大數據IOT
點贊
收藏

51CTO技術棧公眾號

婷婷久久综合九色综合伊人色| 狠狠色丁香久久婷婷综合丁香| 日韩av在线一区二区| 久久久久久久久久久99| 超碰国产在线观看| 国产成人精品免费视频网站| 欧美一级大片在线观看| 夫妇交换中文字幕| 亚洲国产中文在线| 在线观看亚洲a| 中文字幕av久久| 天堂中文在线资| 国产一区二区免费看| 国内精品久久久久久| 69xxx免费| 国产香蕉精品| 欧美精品三级在线观看| 黄色一级视频片| 国产视频中文字幕在线观看| 久久综合久久久久88| 91中文精品字幕在线视频| 国产亚洲欧美在线精品| 国产精品jizz在线观看美国| 亚洲深夜福利网站| 88av在线播放| 欧美欧美在线| 制服.丝袜.亚洲.中文.综合| 日本精品久久久久中文字幕| 91福利在线免费| 亚洲情趣在线观看| 亚洲不卡1区| 亚洲 欧美 自拍偷拍| 国产suv精品一区二区6| 国产日韩精品一区二区| 黄色片视频免费| 亚洲影院免费| 国外视频精品毛片| 久草视频在线资源站| 91精品国产乱码久久久久久 | 91国内精品久久| 天天看片中文字幕| 香港欧美日韩三级黄色一级电影网站| 亚洲欧美中文日韩在线| 成人网站免费观看| 人妖一区二区三区| 亚洲国产精品大全| 国产麻豆剧传媒精品国产av| 136导航精品福利| 日韩一级黄色大片| 久久久久无码精品| 试看120秒一区二区三区| 欧美一区二区啪啪| 色欲欲www成人网站| 秋霞一区二区三区| 欧美一级欧美一级在线播放| 久久综合在线观看| 欧美电影院免费观看| 日韩一区二区电影在线| 日本成人在线免费观看| 一区二区三区视频免费视频观看网站| 欧美一区二区三区在线观看 | 久久久久久久网| 欧美二区三区| 成人18在线| 成人欧美一区二区三区在线播放| 国产系列第一页| 国产在线高潮| 亚洲国产日韩一区二区| 国产中文字幕二区| 91p九色成人| 欧美视频三区在线播放| 中文字幕在线视频精品| 日韩高清在线观看一区二区| 精品国产髙清在线看国产毛片| 91日韩精品视频| 久久99成人| 亚洲国产成人爱av在线播放| 在线天堂www在线国语对白| 红杏aⅴ成人免费视频| 亚洲精品在线不卡| 国产第一页精品| 欧美日韩在线大尺度| 国产69精品99久久久久久宅男| 天天操夜夜操视频| 麻豆一区二区三| 亚洲自拍偷拍第一页| 特级丰满少妇一级aaaa爱毛片| 国产日韩欧美电影| 91精品国产毛片武则天| 国内激情视频在线观看| 欧美视频中文字幕| 一本色道久久hezyo无码| 自拍自偷一区二区三区| 超碰97人人做人人爱少妇| 黄色一级片免费看| 日韩 欧美一区二区三区| 97视频中文字幕| 狠狠色伊人亚洲综合网站l| 亚洲欧洲无码一区二区三区| 人人妻人人添人人爽欧美一区| 99riav视频一区二区| 欧美精品v国产精品v日韩精品| 一级黄色免费视频| 精品国产乱码| 久久久这里只有精品视频| 久草热在线观看| aa级大片欧美| 婷婷视频在线播放| 在线成人视屏| 亚洲第一精品久久忘忧草社区| 战狼4完整免费观看在线播放版| 亚洲无毛电影| 96国产粉嫩美女| 国际av在线| 亚洲国产精品欧美一二99| 日韩一级免费片| 日韩高清电影免费| 欧美大片免费看| 欧美激情一区二区三区免费观看| 成人午夜激情影院| 中国成人在线视频| 亚洲成人人体| 亚洲精品理论电影| 久久久久免费看| 久久精品国产久精国产爱| 欧美日韩无遮挡| 成人免费观看在线观看| 日韩精品专区在线影院重磅| 免费黄色国产视频| 青草国产精品久久久久久| 蜜桃91精品入口| 日韩伦理在线一区| 亚洲国产福利在线| 国产一级生活片| 国产白丝精品91爽爽久久| 亚洲一区二区三区涩| av在线日韩| 亚洲欧美中文字幕| 在线观看免费国产视频| 成+人+亚洲+综合天堂| 99er在线视频| 精品视频一二| 欧美成人免费网| 精品国产一级片| 亚洲精品久久嫩草网站秘色| 亚洲天堂av一区二区三区| 日韩欧美一区二区三区在线视频| 国产不卡av在线| 狠狠v欧美ⅴ日韩v亚洲v大胸| 天涯成人国产亚洲精品一区av| 一边摸一边做爽的视频17国产| 亚洲欧美文学| 91视频在线免费观看| 青青草原av在线| 精品欧美一区二区三区精品久久 | 欧美久久一区| av色综合网| 免费在线观看的电影网站| 欧美大胆一级视频| 九九九国产视频| 成人丝袜视频网| 国产乱子伦农村叉叉叉| 偷拍自拍一区| 国产精品视频久久久久| 成年人视频在线观看免费| 在线不卡欧美精品一区二区三区| 一级性生活免费视频| 国产成a人亚洲| 一二三四视频社区在线| 国产九一精品| 成人av番号网| 美洲精品一卡2卡三卡4卡四卡| 亚洲国产天堂久久综合网| 精品人妻一区二区三区免费看| 欧美国产日韩亚洲一区| 伊人色在线视频| 精品成人久久| 日韩国产美国| 欧美成人精品午夜一区二区| 国产69久久精品成人看| 自拍视频在线免费观看| 欧美videos中文字幕| 国产午夜性春猛交ⅹxxx| 国产精品美女视频| wwwxxx色| 日韩精品乱码免费| 男女爱爱视频网站| 欧美一区二区三区红桃小说| 国产精品极品尤物在线观看 | 亚洲综合色视频| 成人无码www在线看免费| 美国一区二区三区在线播放| 欧美狂野激情性xxxx在线观| 色综合中文网| 成人综合色站| yiren22亚洲综合| 欧美激情一二区| eeuss影院在线观看| 精品美女被调教视频大全网站| 日韩精品一区不卡| 亚洲欧美成人一区二区三区| 熟女丰满老熟女熟妇| 国内精品写真在线观看| 国产美女无遮挡网站| 自产国语精品视频| 欧美视频1区| 亚洲精品a区| 国产精品美女在线| 漫画在线观看av| 久久成人精品一区二区三区| 日av在线播放| 日韩免费在线观看| 一级特黄色大片| 欧日韩精品视频| 青青草av在线播放| 一区二区在线免费| 中国1级黄色片| 久久综合五月天婷婷伊人| 9191在线视频| 激情文学综合丁香| 97公开免费视频| 免费看的黄色欧美网站| 无码av天堂一区二区三区| 国产精品久久久久久| 欧美精品欧美精品| 久久夜色精品国产噜噜av小说| 成人黄色av网| 日韩成人免费av| 国产精品入口免费视频一| 成人性生活视频| 91国产一区在线| h片在线观看下载| 欧美人与性动交| av毛片在线| 久久精品视频一| 中文字幕在线免费| 一区二区福利视频| 国产在线视频福利| 亚洲欧美激情四射在线日| 先锋av资源站| 亚洲激情自拍图| 人人妻人人澡人人爽久久av| 精品av久久707| 欧美一级淫片aaaaaa| 欧美xxxxx牲另类人与| 亚洲精品18在线观看| 日韩免费成人网| 午夜精品久久久久久久99| 欧美一卡二卡在线观看| 国产视频在线观看免费| 91麻豆精品国产91久久久更新时间| 伊人网免费视频| 7777精品伊人久久久大香线蕉完整版| 影音先锋国产在线| 欧美人狂配大交3d怪物一区| 国产裸体美女永久免费无遮挡| 日本高清免费不卡视频| 艳妇乳肉豪妇荡乳av无码福利| 欧美三级午夜理伦三级中视频| 91 中文字幕| 日韩一区二区电影| 少妇高潮一区二区三区69| 亚洲精品成人久久| 国产三级电影在线观看| 中文字幕成人精品久久不卡| 日本视频在线播放| 精品自在线视频| 川上优av中文字幕一区二区| 欧美影院久久久| 成人免费在线观看视频| 成人精品久久久| 成人在线超碰| 99麻豆久久久国产精品免费| 9.1在线观看免费| 99久久精品国产一区| 亚洲自拍偷拍图| 国产精品天天看| 91在线播放观看| 亚洲成人免费影院| www.av88| 日韩丝袜美女视频| 日韩电影在线观看完整版| 在线日韩精品视频| 手机av免费在线| 国产97在线|日韩| a一区二区三区亚洲| 国产伦视频一区二区三区| 久久99国产成人小视频| 一卡二卡3卡四卡高清精品视频| 亚洲欧美一级二级三级| 日韩福利视频在线| 国产精品亚洲一区二区三区妖精| 日韩 中文字幕| 一区精品在线播放| 国产成人愉拍精品久久| 欧美区视频在线观看| 日韩在线视频观看免费| 色哟哟网站入口亚洲精品| aa国产成人| 成人性生交大片免费看视频直播 | 日本网站在线免费观看| 欧美日韩午夜影院| 天堂在线资源8| 久久天天躁狠狠躁夜夜爽蜜月| 性国裸体高清亚洲| 亚洲自拍偷拍色图| 成人羞羞网站| 黄色片一级视频| 不卡影院免费观看| 五月天色婷婷丁香| 一本大道久久a久久精品综合| 国产视频www| 中文字幕亚洲一区在线观看| f2c人成在线观看免费视频| 91在线免费观看网站| 精品久久久久久久久久久aⅴ| 无码粉嫩虎白一线天在线观看| 久久99久久久久| japanese中文字幕| 天天色图综合网| 亚洲精品911| 久久精品2019中文字幕| 中文.日本.精品| 久久亚洲综合网| 国产精品日韩久久久| 老熟女高潮一区二区三区| 自拍偷拍亚洲欧美日韩| 中文字幕丰满人伦在线| 亚洲男人天堂久| 亚洲人成在线网站| 久久精品国产理论片免费| 黄色综合网站| 无码国产精品久久一区免费| 亚洲欧美偷拍三级| 国产伦精品一区二区三区免.费| 中日韩美女免费视频网址在线观看 | 毛片在线播放网址| 性欧美亚洲xxxx乳在线观看| 9l视频自拍蝌蚪9l视频成人| 国产精品8888| 国产高清不卡一区二区| 538精品在线视频| 欧美精品久久99| av片在线观看永久免费| 亚洲资源在线看| 欧美日韩三级电影在线| 日本wwww色| 亚洲高清免费在线| 欧美熟女一区二区| 97国产精品久久| 亚洲丝袜啪啪| 久久久久久香蕉| 国产欧美精品一区二区色综合朱莉 | 国产伦精品一区二区三区妓女| 香蕉加勒比综合久久| 亚欧洲精品视频| 国产精品aaaa| 色综合久久网| 亚洲制服中文字幕| 亚洲精品国产高清久久伦理二区| 亚洲第一视频在线| 91国内在线视频| 国产欧美高清视频在线| 亚洲欧美日本一区二区三区| 亚洲天天做日日做天天谢日日欢| a天堂在线视频| 国色天香2019中文字幕在线观看| 亚洲精品合集| 日韩中文字幕a| 一区二区三区精品| 神马亚洲视频| 国产男人精品视频| 韩国久久久久| 国产真实乱人偷精品人妻| 欧美美女网站色| 国产深夜视频在线观看| 欧美精品七区| 韩日av一区二区| 日韩精品视频免费播放| 国产一区二区欧美日韩| 成人综合日日夜夜| 无码人妻少妇伦在线电影| 久久精品一区二区| 精品女同一区二区三区| 日本久久久久久久久久久| 91亚洲自偷观看高清| 国产一级黄色录像| 欧美专区日韩专区| 羞羞视频在线观看不卡| 欧美一进一出视频| 国产白丝精品91爽爽久久| 在线观看国产区| 久久久久一本一区二区青青蜜月| 国产成人调教视频在线观看| 亚洲国产日韩在线一区| 色婷婷综合激情| 丝袜国产在线| 亚洲一卡二卡| 久久综合色婷婷| 精品国产乱码久久久久久蜜臀网站|