精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比標準Attention提速5-9倍,大模型都在用的FlashAttention v2來了

人工智能 新聞
一年時間,斯坦福大學提出的新型 Attention 算法 ——FlashAttention 完成了進化。這次在算法、并行化和工作分區等方面都有了顯著改進,對大模型的適用性也更強了。

近來,幾種長上下文語言模型陸續問世,包括 GPT-4(上下文長度為 32k)、MosaicML 的 MPT(上下文長度為 65k)Anthropic 的 Claude(上下文長度為 100k)。長文檔查詢和故事寫作等新興用例已經表明擴展語言模型上下文窗口是非常必要的。

然而,擴大 Transformer 的上下文長度是一個挑戰,因為其核心的注意力層在時間復雜度和空間復雜度與輸入序列長度的平方成正比。

一年前,來自斯坦福大學、紐約州立大學布法羅分校的研究者共同提出一種快速、內存高效的注意力算法 ——FlashAttention。該算法無需任何近似即可加速注意力并減少內存占用。現在,已經有許多機構和研究實驗室采用 FlashAttention 來加速訓練和推理

FlashAttention 示意圖。FlashAttention 示意圖。

盡管 FlashAttention 的速度已經是優化基線的 2-4 倍,但它仍然有相當大的改進空間。FlashAttention 仍然不如優化過的矩陣乘法 (GEMM) 運算快,僅達到理論最大 FLOPs/s 的 25-40%。

現在,研究團隊宣布推出 FlashAttention-2。FlashAttention-2 完全從頭開始重寫,使用 Nvidia 的 CUTLASS 3.x 及其核心庫 CuTe 的原語(primitive)。

圖片圖片

FlashAttention-2 開發者 Tri Dao。他是斯坦福大學博士生,還是 Together.AI 首席科學家,并將于 2024 年 9 月開始任職普林斯頓大學計算機科學助理教授。

FlashAttention-2 的速度是 FlashAttention 的 2 倍,在 A100 GPU 上達到 230 TFLOPs/s。在端到端訓練 GPT 類語言模型時,FlashAttention-2 可讓訓練速度高達 225 TFLOPs/s(模型 FLOP 利用率為 72%)。

FlashAttention-2 將加速現有模型的訓練、微調和推理。這意味著我們可以用相同成本訓練 2 倍上下文長度的語言模型。這將有助于語言模型理解長篇書籍和報告、高分辨率圖像、音頻和視頻。

圖片圖片

  • 項目地址:https://github.com/Dao-AILab/flash-attention
  • 技術報告:https://tridao.me/publications/flash2/flash2.pdf

FlashAttention 是什么?

FlashAttention 是一種重新排序注意力計算的算法,它利用平鋪、重計算等經典技術來顯著提升計算速度,并將序列長度中的內存使用實現從二次到線性減少。其中平鋪意味著將輸入塊從 HBM(GPU 內存)加載到 SRAM(快速緩存),并對該塊執行注意力操作,更新 HBM 中的輸出。

此外通過不將大型中間注意力矩陣寫入 HBM,內存讀寫量減少,帶來了 2-4 倍的時鐘時間加速。

下圖為 FlashAttention 的前向傳遞圖:通過平鋪和 softmax 重新縮放,研究者按塊進行操作,避免從 HBM 中讀取 / 寫入,同時獲得正確的輸出,無需近似操作。

圖片圖片

然而,FlashAttention 仍然存在一些低效率問題,原因在于不同線程塊之間的工作分區不理想以及 GPU 上的 warp。這些導致低占用率或不必要的共享內存讀寫。

FlashAttention-2

更好的算法、并行化和工作分區


更少的非矩陣乘法 Flops

研究者調整了 FlashAttention 的算法,從而減少了非矩陣乘法(non-matmul)的 Flops 數量。這點很重要,因為現代 GPU 具有專門的計算單元(例如 Nvidia GPU 上的張量核心),使得矩陣乘法速度更快。

舉例而言,A100 GPU 的 FP16/BF16 矩陣乘法的最大理論吞吐量為 312 TFLOPs/s,但非矩陣乘法 FP32 的理論吞吐量僅為 19.5 TFLOPs/s。

換一種思考方式,每個非矩陣乘法 FLOP 比矩陣乘法 FLOP 的代價高 16 倍。為了保持高吞吐量,研究者希望在矩陣乘法 FLOP 上花費盡可能多的時間。因此他們重寫了 FlashAttention 中使用的在線 softmax 技巧,以減少重新縮放操作、邊界檢查和因果掩碼操作的數量,而無需更改輸出

更好的并行化

FlashAttention v1 在批大小和頭(head)數量上進行并行化。研究者使用 1 個線程塊來處理一個注意力頭,總共有(批大小 * 頭數量)個線程塊。每個線程塊都計劃在流式多處理器(SM)上運行,例如 A100 GPU 上有 108 個這樣的 SM。當這個數字非常大(如 >= 80)時,這種調度是有效的,這時可以高效地使用 GPU 上幾乎所有計算資源。

在長序列的情況下(通常意味著小批量或少量頭),為了更好地利用 GPU 上的多處理器,現在研究者在序列長度維數上額外地進行并行化,使該機制顯著加速

更好的工作分區

即使在每個線程塊內,研究者也必須決定如何在不同的 warp 之間劃分工作(一組 32 個線程一起工作)。通常情況下,每個線程塊使用 4 或 8 個 warp,分區方案如下圖所述。 

研究者改進了 FlashAttention-2 中的這種分區,減少不同 warp 之間的同步和通信量,進而減少共享內存讀寫

圖片圖片

對于每個塊,FlashAttention 將 K 和 V 分割到 4 個 warp 上,同時保持 Q 可被所有 warp 訪問。這被稱為「sliced-K」方案。不過,這種方案是低效的,原因在于所有 warp 都需要將它們的中間結果寫入共享內存,并同步,然后將中間結果相加。這些共享內存讀寫會減慢 FlashAttention 中的前向傳遞速度。

在 FlashAttention-2 中,研究者將 Q 分割在 4 個 warp 上,同時保持 K 和 V 可被所有的 warp 訪問。每個 warp 執行矩陣乘法以獲得 Q K^T 的切片,然后只需與 V 的共享切片相乘就能獲得相應的輸出切片。warp 之間不需要通信。共享內存讀寫的減少也可以提升速度。

新特性:頭維數高達 256、多查詢注意力

我們知道,FlashAttention 僅支持最高 128 的頭維數,這適用于大多數模型,但有一些模型被遺漏了。

因此,FlashAttention-2 支持了高達 256 的頭維數,這意味著 GPT-J、CodeGen 和 CodeGen2、StableDiffusion 1.x 等模型可以使用 FlashAttention-2 來獲得加速和節省內存

此外,FlashAttention-2 還支持了多查詢注意力(multi-query attention, MQA)以及分組查詢注意力(grouped-query attention, GQA)。它們是注意力的變體,其中多個查詢頭關注相同的鍵和值頭,以減少推理過程中 KV 緩存的大小,并可以顯著提高推理吞吐量。

注意力基準結果

研究者在 A100 80GB SXM4 GPU 上,測量不同設置(無 / 有因果掩碼、頭維數 64 或 128)下不同注意力方法的運行時。 

結果發現, FlashAttention-2 的速度是 FlashAttention(以及 xformers 庫和 Triton 中的其他實現)的 2 倍。與 PyTorch 中的標準注意力實現相比,FlashAttention-2 的速度最高是它們的 9 倍。

A100 GPU 上的注意力前向 + 后向速度

A100 GPU 上的注意力前向 + 后向速度。

此外只需要在 H100 GPU 上 運行相同的實現(不使用特殊指令來利用 TMA 和第四代 Tensor Core 等新硬件功能),研究者最高獲得了 335 TFLOPs/s。

圖片

H100 GPU 上的注意力前向 + 后向速度。

當用于端到端 GPT 類模型訓練時,FlashAttention-2 有助于在 A100 GPU 上實現最高 225 TFLOPs/s(模型 FLOPs 利用率為 72%)。與優化良好的 FlashAttention 模型相比,端到端實現 1.3 倍加速。

圖片

這里的基線是不使用 FlashAttention 的 Megatron-LM,它現在也可以選擇使用 FlashAttention 了。不久的將來,FlashAttention-2 也將集成到 Megatron-LM 中

研究團隊表示:下一步將針對 H100 GPU 優化 FlashAttention-2,以使用新的硬件功能。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-15 08:49:44

GoJSONAPI

2023-01-09 12:41:55

模型

2020-06-12 14:25:36

框架PyTorch開發

2023-07-18 14:18:00

Attention模型圖像

2023-09-29 11:55:55

2024-06-28 16:03:38

2024-01-03 13:06:50

2024-12-27 09:30:00

AI數據訓練

2024-12-27 09:50:00

模型數據測試

2013-07-17 10:07:29

Windows Pho功能

2024-05-10 08:47:22

標準庫v2Go

2023-06-27 17:35:39

FastSAM模型SAM

2024-03-13 13:49:22

Sora核心組件DiT

2023-12-11 15:40:32

PyTorch代碼大模型

2023-08-05 13:49:31

鴻蒙操作系統

2010-08-06 14:07:21

RIP V2

2010-08-05 17:00:04

RIP V2協議

2024-01-02 15:15:00

AI模型開源

2023-06-20 08:01:09

RoseDB存儲數據

2025-06-05 08:40:00

點贊
收藏

51CTO技術棧公眾號

91精品视频免费| 亚洲欧美日韩天堂一区二区| 国产乱子伦精品视频| 成 人 免费 黄 色| 国产精品一二| 中文字幕视频在线免费欧美日韩综合在线看 | 亚洲精品a级片| 亚洲电影av在线| 污视频免费在线观看网站| 伊人在我在线看导航| 97超碰欧美中文字幕| 国产精品三级久久久久久电影| 天天干中文字幕| 国产精品一国产精品| 337p亚洲精品色噜噜狠狠| 美女扒开大腿让男人桶| 99re在线视频| 91色porny在线视频| 亚洲精品免费一区二区三区| 精品人妻一区二区三区免费看| 亚洲先锋影音| 在线观看精品国产视频| 91丝袜在线观看| 97久久中文字幕 | 97超碰资源站| 久久黄色网页| 久久久久久久久久国产| 亚洲精品天堂网| 羞羞色国产精品网站| 日韩一级二级三级精品视频| 天天色综合天天色| 欧美一区国产| 亚洲va欧美va国产va天堂影院| 伊人久久99| jizz在线免费观看| 91美女片黄在线| 国产精品免费看一区二区三区| 在线亚洲欧美日韩| 日韩精品亚洲一区二区三区免费| 国内精品久久久久久影视8| 级毛片内射视频| 偷拍一区二区| 亚洲国产精品成人精品| 国产精品成人免费一区久久羞羞| 日韩午夜视频在线| 欧美日韩久久久久久| 亚洲视频在线观看一区二区三区| 色戒汤唯在线| 欧美丝袜一区二区| 国产午夜伦鲁鲁| 国产不卡123| 亚洲www啪成人一区二区麻豆| 久久av高潮av| 黄色污污视频在线观看| 亚洲最大成人网4388xx| 成人区一区二区| 污污网站在线看| 亚洲综合丝袜美腿| 97干在线视频| 免费成人在线电影| 欧美午夜女人视频在线| 国产v亚洲v天堂无码久久久| 天然素人一区二区视频| 欧美日韩中文国产| 99九九99九九九99九他书对| 天堂久久一区| 欧美一级片在线看| 韩国三级hd两男一女| 欧美亚洲大陆| 伊人伊成久久人综合网小说 | 亚洲综合在线免费观看| 欧美久久在线观看| 亚洲欧美韩国| 欧美日韩在线播放三区四区| 亚洲一二三av| 成人黄色av网址| 亚洲精品视频中文字幕| 国产又粗又硬视频| 欧美成人亚洲| 午夜精品一区二区三区在线视频 | 3atv在线一区二区三区| 久久久精品人妻一区二区三区| 91久久精品无嫩草影院| 日韩久久免费视频| 特黄一区二区三区| 韩日欧美一区| 国产精品老牛影院在线观看| 国产免费无遮挡| 不卡一卡二卡三乱码免费网站| 日本一区二区三区四区高清视频| 一本一道波多野毛片中文在线| 亚洲免费在线观看视频| 国产成人a亚洲精v品无码| 国产成+人+综合+亚洲欧美| 日韩欧美视频一区| 亚洲AV无码国产成人久久| 久久精品青草| 5278欧美一区二区三区| 亚洲天堂男人网| 成人黄色一级视频| 在线日韩av永久免费观看| 成年女人在线看片| 91精品国产手机| 久久成人激情视频| 国产综合激情| 成人a在线视频| 午夜av免费在线观看| 亚洲同性gay激情无套| 男女啪啪免费视频网站| 国产系列精品av| yourporn在线观看中文站| 成人欧美一区二区三区1314| 久久久999视频| 日本在线视频一区二区三区| 在线播放精品一区二区三区 | 午夜av免费看| 91精品99| 国产精品久久久久久久久久三级| 国模私拍视频在线| 中文字幕一区二区三区精华液| 伊人成色综合网| 国产一区一区| 在线观看视频99| 精品久久久久久久久久久久久久久久| 国产剧情在线观看一区二区| 亚洲精品在线观看免费| 日本中文字幕高清| 高清不卡av| 精品国产乱码久久久久久久| 日韩精品一区二区亚洲av性色 | 殴美一级特黄aaaaaa| 亚洲欧洲制服丝袜| 亚州精品一二三区| 一区二区导航| 2020欧美日韩在线视频| 人人妻人人玩人人澡人人爽| 洋洋成人永久网站入口| 91香蕉视频免费看| 香蕉av一区二区| 国产日韩精品入口| 国产色a在线| 色综合久久久久网| 强伦人妻一区二区三区| 亚洲深夜福利| 久草精品电影| 日韩伦理在线一区| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 自拍偷拍一区| 欧美做受高潮1| 日本福利片在线| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 国产亚洲精品av| 国产99久久久久久免费看农村| 日韩人妻一区二区三区蜜桃视频| 91嫩草国产线观看亚洲一区二区| 日日噜噜噜夜夜爽亚洲精品| 国产精品久久久久久久一区二区| 国产精品入口麻豆九色| jizz欧美性11| 91精品久久久久久久蜜月| 成人亚洲欧美一区二区三区| 黄色网页在线观看| 日韩久久久精品| 国产精品9191| 久久久蜜臀国产一区二区| 国产第一页视频| 久久国产亚洲精品| 成人在线视频网站| 丁香高清在线观看完整电影视频 | 国产精品久久久久久福利| 欧美理论片在线| 精品少妇一二三区| 26uuu精品一区二区在线观看| av免费中文字幕| 久久精品国产99久久| 91手机在线观看| 国内激情视频在线观看| 亚洲欧洲国产精品| 97精品人妻一区二区三区香蕉| 一级特黄大欧美久久久| av鲁丝一区鲁丝二区鲁丝三区| 狂野欧美一区| 中文字幕中文字幕99 | 欧美videos中文字幕| 日本三级黄色大片| 国产视频一区在线播放| 亚洲精品国产久| 亚洲制服少妇| 亚洲一区二区三区在线观看视频 | 日韩免费视频一区| 日本视频在线观看免费| 亚洲视频一区二区在线观看| 日韩成人av一区二区| 日韩国产精品久久久| 成年在线观看视频| 精品无人区麻豆乱码久久久| 99精彩视频| 亚洲高清黄色| 久久免费国产视频| a√资源在线| 日韩黄色在线免费观看| 国产一区二区麻豆| 欧美日韩国产限制| 国模无码国产精品视频| 国产色产综合色产在线视频| 91久久嫩草影院一区二区| 国产亚洲精品女人久久久久久| 91碰在线视频| 极品白嫩少妇无套内谢| 日韩**一区毛片| 国产精品专区在线| 久久精品欧美一区| 日韩欧美三级电影| 欧美一级二级三级视频| 亚洲曰本av电影| 精品欧美日韩精品| 青青草一区二区| 国产一线二线在线观看 | 精品久久精品久久| 久久天堂久久| 国产在线播放91| 欧美国产日韩电影| 2020久久国产精品| 爱情岛亚洲播放路线| 欧美成人高清视频| 黄网页在线观看| 亚洲一区久久| 日韩久久不卡| 一本色道久久综合亚洲精品酒店| 国产高清在线一区| 秋霞一区二区| 91精品国产综合久久久久久丝袜 | 黄色国产在线播放| 久久先锋影音av| 精品国产av色一区二区深夜久久 | 欧美日韩国产区一| 国产精品自拍第一页| 日韩欧美在线一区| 国产高潮久久久| 欧美日韩一区二区三区在线免费观看| 精品肉丝脚一区二区三区| 亚洲一区二区欧美| 欧美精品入口蜜桃| 亚洲国产一二三| 九九九国产视频| 亚洲午夜久久久| 国产香蕉在线视频| 激情成人在线视频| 日本在线播放视频| 色素色在线综合| 国产在线观看第一页| 欧美三级日韩在线| 国产喷水吹潮视频www| 337p亚洲精品色噜噜狠狠| 99草在线视频| 精品少妇一区二区| 五月天久久久久久| 亚洲欧美一区二区三区四区| 国产资源在线播放| 日韩中文字幕在线免费观看| 九色porny在线| 久久6免费高清热精品| caoporn-草棚在线视频最| 91成人性视频| 日本中文字幕一区二区| 成人乱人伦精品视频在线观看| 国产激情精品一区二区三区| 成人欧美一区二区三区在线观看| 成人搞黄视频| 日本一区二区高清视频| 久久中文字幕av一区二区不卡| 精品国产乱码久久久久久图片| 亚洲女人毛茸茸高潮| 国产精品精品国产色婷婷| wwwav国产| 午夜精品爽啪视频| 中文字幕 视频一区| 91精品国产高清一区二区三区 | aa在线观看视频| 日韩高清电影一区| 色欲无码人妻久久精品| 91丝袜美腿高跟国产极品老师| 精品人妻中文无码av在线| ...xxx性欧美| 免费日韩一级片| 欧美军同video69gay| 国产 日韩 欧美 精品| 亚洲一区二区久久| 影院在线观看全集免费观看| 2019国产精品自在线拍国产不卡| 视频一区在线免费看| 亚洲综合中文字幕68页| 亚洲性视频大全| 欧美大片免费播放| 性伦欧美刺激片在线观看| 九九热精品国产| 91麻豆产精品久久久久久| 天天看天天摸天天操| 一本大道久久a久久综合婷婷| 国产婷婷一区二区三区久久| 亚洲精品一区二三区不卡| 精品176二区| 国产97在线|日韩| aaa国产精品视频| 亚洲一区二区在线观| 亚洲一区二区动漫| 国产精品欧美性爱| 欧美精彩视频一区二区三区| 国产真实夫妇交换视频| 欧美精品丝袜久久久中文字幕| 午夜国产在线观看| 九九九久久国产免费| 欧美a视频在线| 久久偷看各类wc女厕嘘嘘偷窃| 欧美激情精品久久久六区热门| 欧美黄色性生活| 久久久久久久久久久久久久久99| 久久老司机精品视频| 91精品国产一区二区三区蜜臀 | 中文字幕不卡的av| 特级毛片www| 亚洲第一区第二区| 亚洲婷婷噜噜| 91精品视频在线看| 久久一本综合| 91淫黄看大片| 久久亚洲捆绑美女| 国产精品久久久久久久妇| 337p日本欧洲亚洲大胆色噜噜| 米奇精品一区二区三区| 国产精品jizz在线观看麻豆| 日韩伦理一区二区三区| 日韩免费视频播放| av高清不卡在线| 久一区二区三区| 亚洲成年网站在线观看| 韩国成人免费视频| 国产三级精品在线不卡| 国产主播精品| 中文字幕人妻一区| 亚洲五码中文字幕| 亚洲第一天堂网| 久久久亚洲国产| 99re6热只有精品免费观看| 日本国产中文字幕| 成人综合婷婷国产精品久久蜜臀| 青青草手机视频在线观看| 欧美成人精品福利| 久草在线视频网站| 国产伦视频一区二区三区| 亚洲人成久久| 日本xxx在线播放| 一本大道久久a久久综合| 九色视频在线观看免费播放| 国产成人97精品免费看片| 欧美日韩久久精品| 亚洲精品mv在线观看| 亚洲一区在线免费观看| 成人午夜视频一区二区播放| 国内精品久久久久久久| 亚洲丝袜啪啪| 在线观看高清免费视频| 亚洲色图欧洲色图婷婷| 午夜久久久久久久久久| 国语自产精品视频在免费| 久久99国产精品久久99大师| 久久国产成人精品国产成人亚洲| 久久久久久毛片| 亚洲一区中文字幕永久在线| 欧美成人黄色小视频| 国产精品极品国产中出| 18禁男女爽爽爽午夜网站免费| 欧美极品xxx| 亚洲精品久久久久久久久久久久久久| 久久久视频精品| 欧美一级本道电影免费专区| 国产精品探花在线播放| 午夜激情一区二区三区| 国产福利片在线| 99精彩视频| 天使萌一区二区三区免费观看| 99精品中文字幕| 欧美精品一区二| 另类一区二区| 男人日女人视频网站| 欧美经典一区二区| 囯产精品久久久久久| 国产成人激情小视频| 欧美精品首页| 全黄一级裸体片| 精品少妇一区二区三区免费观看| 欧美美女日韩| 国产一级大片免费看| 国产视频一区二区在线观看| 不卡的日韩av| 国产精品va在线播放| 亚洲天堂成人| 国产在视频线精品视频| 日韩成人中文字幕在线观看| 亚洲青青一区|