精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta 新作:FlashAttention 的數值偏差有多大?

發布于 2024-5-28 10:41
瀏覽
0收藏

一、背景

最近 Meta 的研究員開發了一個新的框架來了解 LLM 訓練中數值偏差的影響,并基于該框架評估了 LLM 中廣泛采用的 FlashAttention 的數值偏差。

對應的論文為:[2405.02803] Is Flash Attention Stable?

PS:其實論文很簡單,結論也很簡單:使用 FlashAttention 相比 Baseline Attention 確實會帶來數值偏差。但帶來的數值偏差比從 FP32 到 FP16 的數值偏差小得多,甚至小于不同初始化方法帶來的偏差。吐槽一下,論文中的圖都比較模糊。

二、摘要

LLM 預訓練的代價很高,也更加的復雜。很多 LLM 在預訓練中都遇到了訓練過程不穩定的情況,通常表示為損失的毛刺(Spike)。數值偏差(Numeric Deviation)被認為是導致這種訓練不穩定的潛在原因,但由于訓練的成本很高,量化這一點非常有挑戰性。

本文中,作者開發了一種系統性的方法來理解數值偏差的影響,并使用廣泛采用的 FlashAttention 來驗證了該框架。作者發現,與 Baseline Attention 相比,在單個前向傳播中,BF16 下的 FlashAttention 會有超過一個數量級的數值偏差。然而,使用基于 Wasserstein 距離的數據驅動分析來提供數值偏差對訓練過程中模型權重影響的上限,發現 FlashAttention 中的數值偏差比低精度訓練的影響小 2-5 倍。

三、引言

3.1 數值精度

如下圖為常見的浮點數值精度,其中 sign 表示符號位,exponent 表示指數位,fraction 表示尾數位。相比 float32,float16 的指數位和尾數位都更小,而 bfloat16 的指數位和 float32 相同,只是尾數位更少。因此,通常 float32 轉 float16 時通常會帶來較大的精度損失,而 float32 轉 bfloat16 通常只需要做小數位的截斷,損失相對較小。現在的 LLM 預訓練中通常都會使用 bfloat16。

  • Float32:指數位 8 位,尾數位 23 位,數據范圍為[1.18e-38, 3.40e+38]
  • float16:指數位 5 位,尾數位 10 位,數據范圍為[6.10e-05, 6.55e+04]
  • bfloat16:指數位 8 位,尾數位 7 位,數據范圍為[1.18e-38, 3.39e+38]

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

3.2 數值誤差

在浮點數的計算中會存在兩種常見的誤差:

  • 溢出誤差(Overflow Error):浮點都有一個有限的表示范圍,當計算結果超出這個表示范圍時就會產生溢出錯誤,往往表現為無窮大。比如,令 float a = FLT_MAX * 2,此時 a 的值為正無窮大。
  • 舍入誤差(Rounding Error):浮點數有固定的有效位數,當一個數值不能被精確表示時,就會被舍入到最接近的可表示的浮點數。這種輸入在數值計算中是不可避免的,因為大多數實數在計算機中無法被精確表示。比如在 C 中打印 0.1f,printf("a = %.20f\n", 0.1f),其輸出結果為 0.10000000149011611938,是一個近似值。

除此之外,有時也會提到下溢誤差(Underflow Error):當一個非常小的非零結果小于浮點數表示范圍下限時發生,通常導致結果被舍入為零。

由于 float16 和 bfloat16 的不同指數位和尾數位,也就導致它們出現誤差的場景不太一樣。

  • float16:指數位較少,尾數位較多,表示范圍有限,但表示精度更高,因此更容易發生溢出誤差
  • bfloat16:指數位較多,尾數位較少,表示范圍更大,但表示精度有限,因此更容易發生舍入誤差。下溢誤差也更多一些。

3.3 訓練損失毛刺

在 Meta OPT、BigScience Bloom、Google PaLM、TII Falcon 以及智源 GLM 訓練中都出現了訓練損失出現毛刺的情況,也有一些有效的手段可以緩解,但依舊不知道其根因。比如 Google PaLM 中驗證了其并非是單個樣本導致的。

如下圖所示,是 [2211.05100] BLOOM: A 176B-Parameter Open-Access Multilingual Language Model 中遇到的毛刺現象:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

3.4 評估指標

Wasserstein 距離,也稱為 Earth Mover’s Distance (EMD),是一種衡量兩個概率分布之間差異的方法。這種距離的直觀含義是,將一個概率分布轉變成另一個概率分布所需要的“工作量”或“成本”,其中“工作量”可以理解為將一堆形狀不同的沙子(一個概率分布)鏟動并重塑為另一堆沙子(另一個概率分布)所需要的努力。

Wasserstein 距離基于最優運輸理論。給定兩個概率分布 P 和 ??,以及一個成本函數 ??(??,??),Wasserstein 距離定義為將分布 P 轉變為 Q 所需的最小成本。數學上,它表示為:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

這里的 π 是 P 和 ?? 之間的所有可能的聯合分布的集合,而 Π(P,Q) 表示所有這些聯合分布中,邊際分布分別是 P 和 Q 的集合。

相比其他距離度量(如歐氏距離或 KL 散度),Wasserstein 距離的一個主要優勢在于其能夠更加有效地處理概率分布之間的微小變化,特別是當這些分布不重疊或僅部分重疊時。這使得 Wasserstein 距離在數據稀疏或異構的情況下特別有用。

四、方法&實驗

4.1 方法

作者開發了一個 microbenchmark 來隔離和研究 FlashAttention 引起的數值偏差。其設計如下圖 Fig 2 所示,在原始的 FlashAttention 中只支持 FP16 和 BF16 格式,因此作者重新實現了 FlashAttention,以便分析不同的數值精度的影響。作者進一步修改模型,可以在每次調用 Attention 時計算 Baseline Attention 和 FlashAttention 的注意力矩陣輸出,從而可以使用最大差異(max difference)以及 Wasserstein 距離來度量差異。作者也進行了一系列訓練來度量整個訓練過程中模型權重的差異。

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.2 數據類型的影響

如下圖 Fig.3 所示,作者對比了不同數據類型下 Baseline Attention 和 FlashAttention 的數值偏差,可以看出,數值精度越高,偏差越小:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

為了進一步分析這種數值偏差,作者探索了序列長度對數值偏差的影響,其中會保持 FlashAttention 的 tile 大小和 SRAM 大小相同。如下圖所示,隨著序列長度的增加,數值偏差也會適當增加。其中左圖(a)表示最大誤差,右圖(b)表示誤差的均值。由于序列變長,也就需要更多的 tile,相應也有更多的 resaling,這也就可能產生更多的誤差:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.3 算法配置的影響

如下圖 Fig 6 所示,作者進一步探索了 FlashAttention 中不同配置的影響:

  • (a)和(c)針對不同的 Block/tile Area 大小的影響,使用比較大的 Block 后 Baseline Attention 和 FlashAttention 的差異很小,主要是因為 rescaling 計算更少一些。
  • (b)使用 Square Block 對 Baseline Attention 和 FlashAttention 的影響不大。?

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

4.4 模型權重的變化

作者進一步驗證了訓練中模型權重的變化(對比 Baseline Attention 和 FlashAttention),如下圖 Fig 7 所述,不管是最大誤差還是 Wasserstein 距離都會隨著訓練的迭代而逐漸變大,并且趨勢類似:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

如下圖 Fig.8 所示,作者進一步驗證了整個訓練中其他變量帶來的模型權重的偏差。可以看出,雖然 Baseline Attention 和 FlashAttention 會導致權重產生誤差,但是其甚至比不同初始化方法帶來的誤差還小,更是遠小于 FP16 vs BF16 和 FP16 vs FP32 帶來的誤差:

Meta 新作:FlashAttention 的數值偏差有多大?-AI.x社區

五、參考鏈接

  1. ???https://arxiv.org/abs/2405.02803???
  2. ???https://arxiv.org/abs/2211.05100????

本文轉載自 ??AI閑談??,作者: AI閑談

收藏
回復
舉報
回復
相關推薦
高清av在线| 黄色一级大片在线免费观看| 国模私拍一区二区国模曼安| 99久久综合99久久综合网站| 最新中文字幕亚洲| 久久国产精品国产精品| av观看在线| 不卡av在线网| 国产精品久久久久久久久粉嫩av| 天堂网中文在线观看| 天堂va欧美ⅴa亚洲va一国产| 亚洲图片一区二区| 欧美日韩在线观看一区| 亚洲综合精品在线| 好吊视频一区二区三区四区| 日韩精品在线视频观看| 亚洲综合欧美激情| free性欧美| 91免费国产在线观看| 国产精品视频资源| 久久久久久久国产视频| 九九久久婷婷| 欧美不卡一区二区三区| 天堂中文视频在线| 成年女人在线看片| 亚洲欧洲成人av每日更新| 成人在线观看网址| 午夜精品久久久久久久蜜桃| 重囗味另类老妇506070| 亚洲小视频在线| 欧美激情一区二区三区p站| 视频在线日韩| 午夜精品久久久久久久99樱桃 | 婷婷开心激情网| 久久综合图片| 欧美孕妇孕交黑巨大网站| 劲爆欧美第一页| 亚洲国产精品成人| 色偷偷888欧美精品久久久| 亚洲欧美视频在线播放| 成人av激情人伦小说| 91精品国产综合久久香蕉的特点| 成人午夜激情av| 日产精品一区| 在线精品观看国产| 欧美精品无码一区二区三区| 综合毛片免费视频| 色综合久久综合网欧美综合网 | а√天堂中文资源在线bt| 亚洲女性喷水在线观看一区| 综合操久久久| 国产美女在线观看| 亚洲视频免费在线观看| 一级日韩一区在线观看| 中文字幕日本在线| 日韩美女视频一区| 国产一二三四区在线观看| 成人在线app| 亚洲欧美日韩在线不卡| 日韩视频一二三| av福利在线导航| 五月天欧美精品| 国内外成人激情视频| www.成人影院| 欧美三级日本三级少妇99| 色悠悠久久综合网| 成人激情久久| 亚洲成人久久久| 97人妻精品一区二区三区免| 夜色77av精品影院| 在线视频日本亚洲性| 很污很黄的网站| 欧美性久久久| 欧美在线观看视频| 中文在线字幕免费观| 韩国欧美一区二区| 国产精品国产精品国产专区不卡| 五十路在线观看| 国产精品网站在线观看| 影音先锋亚洲视频| cao在线视频| 欧美日韩亚洲不卡| 欧美激情 亚洲| 欧美一区二区三区激情视频| 久久精品国产欧美激情| 精品午夜福利在线观看| 日韩中文字幕不卡| 亚洲精品日韩av| 青青色在线视频| 中文字幕一区二区三中文字幕| 男人草女人视频| 成人自拍av| 日韩一区二区三| 欧美成人午夜精品免费| 欧美成人精品| 国产精品福利在线观看网址| 亚洲精品久久久久久久久久久久久久| 99视频在线观看一区三区| 亚洲第一在线综合在线| 1024在线看片你懂得| 欧美图片一区二区三区| 欧美大喷水吹潮合集在线观看| 欧美伦理影院| 91禁外国网站| 国产成人精品一区二区无码呦| 99久久精品久久久久久清纯| 中文字幕人成一区| 成人直播视频| 精品国产亚洲在线| 26uuu成人网| 日韩精品一级二级| 国产在线精品一区| 国产调教视频在线观看| 91黄色在线观看| 国产不卡一二三| 欧美一区影院| 成人黄色免费看| 成年人免费在线视频| 午夜av电影一区| 黑人性生活视频| 久久久久久久久国产一区| 国产成人一区二区三区电影| 黄色片一区二区| 一区二区三区四区在线播放| 亚洲综合欧美激情| 日本一区二区免费高清| 欧洲成人在线观看| 四虎精品在线| 五月天激情综合| 天天躁日日躁狠狠躁免费麻豆| 国产精品99在线观看| 国产精品日韩在线| 国产视频网站在线| 日本丶国产丶欧美色综合| 亚洲天堂美女视频| 99伊人成综合| 国产在线一区二区三区四区| 国产网红在线观看| 精品国产一区二区国模嫣然| 国产性一乱一性一伧一色| 国产精品主播直播| 水蜜桃在线免费观看| 99国内精品久久久久| 俺也去精品视频在线观看| 亚洲自拍偷拍另类| 国产精品美女一区二区| 69久久久久久| 日韩精品网站| 国产欧美一区二区三区在线| yiren22综合网成人| 欧美性大战久久久久久久蜜臀 | 亚洲精品成人精品456| 911av视频| 欧美日韩视频| 国产女主播一区二区| 国产在线看片免费视频在线观看| 日韩电影大全免费观看2023年上| 日韩 欧美 综合| 久久九九99视频| 一区二区三区免费播放| 97精品国产福利一区二区三区| 91久久精品一区| 欧美日韩色网| 精品中文字幕久久久久久| caoporn国产| 中文字幕一区二区三区色视频 | 久久亚洲精品成人| 国产成人精品a视频| 午夜国产精品一区| 亚洲精品视频网址| 国产精品自拍一区| 免费看一级大黄情大片| 成人av国产| 99国产超薄肉色丝袜交足的后果| 丁香花视频在线观看| 亚洲欧美在线磁力| 国产免费av电影| 欧美日韩国产页| 操她视频在线观看| 成人精品一区二区三区四区| 久久久999视频| 欧美丰满老妇| 好吊色欧美一区二区三区四区 | 欧美撒尿777hd撒尿| 欧美日韩精品在线观看视频| 99国产精品久久久久久久久久久| 成人免费xxxxx在线视频| 亚洲综合中文| 欧美大香线蕉线伊人久久| 国产精品一区二区三区www| 97婷婷涩涩精品一区| av色图一区| 亚洲精品电影网| 国产一区二区三区三州| 欧美午夜激情在线| 黄色a级片在线观看| 久久五月婷婷丁香社区| www.久久com| 日韩国产成人精品| 蜜臀精品一区二区| 日韩aaaa| 免费看污久久久| 136导航精品福利| 国产一区深夜福利| 国产不卡网站| 国自在线精品视频| 岛国成人毛片| 这里只有精品视频在线| 日韩一二三四| 精品国产a毛片| a天堂在线观看视频| 91国产福利在线| 国产精品777777| 亚洲国产美国国产综合一区二区| 国产白丝一区二区三区| 久久影音资源网| 性色av蜜臀av浪潮av老女人| 国产久卡久卡久卡久卡视频精品| 国产91色在线观看| 日韩激情视频网站| 成年人观看网站| 亚洲国产一区二区精品专区| 肉大捧一出免费观看网站在线播放| 日韩欧美大片| 日韩在线三区| 国产麻豆一区二区三区精品视频| 国产亚洲一区二区三区在线播放| 国产激情一区| 91精品在线观| av在线精品| 91亚洲国产成人久久精品网站| av亚洲一区| 国产精品香蕉av| 澳门av一区二区三区| 人人澡人人澡人人看欧美| 国产免费拔擦拔擦8x在线播放 | 国产v综合v| 国产精品96久久久久久| 电影久久久久久| 国产精品91一区| 国产91欧美| 国产精品网站入口| 亚洲成人高清| 97se在线视频| 99久久香蕉| 精品国产乱码一区二区三区四区| 国产精品中文字幕制服诱惑| 国产精品自拍首页| 希岛爱理av免费一区二区| 精品一区二区三区国产| 免费不卡中文字幕在线| 欧美日韩国产一二| 成人三级视频| 中文字幕一区综合| 欧美精品福利| 日本中文字幕网址| 久久精品免费| 性生活免费在线观看| 国产乱子伦视频一区二区三区| 在线成人免费av| 国产99久久久国产精品免费看| 人妻 丝袜美腿 中文字幕| www.亚洲色图.com| 国产在线综合视频| 最新国产成人在线观看| 精品无码久久久久久久| 欧美性黄网官网| 一二三区中文字幕| 欧美成人video| 国产一级在线| 伦理中文字幕亚洲| 牛牛精品一区二区| 国产精品吴梦梦| 国产精品流白浆在线观看| 青青影院一区二区三区四区| 欧美xxxx中国| 奇米精品一区二区三区| 青青草国产成人av片免费| 91人妻一区二区三区| 99久久精品免费看国产免费软件| 成人免费无遮挡无码黄漫视频| 中文字幕欧美一| 日韩成人免费在线视频| 欧美三级蜜桃2在线观看| www.五月激情| 国产一区二区三区在线看 | 日韩国产福利| 久久综合色88| 日本高清不卡一区二区三区视频 | 国产普通话bbwbbwbbw| 日韩电视剧在线观看免费网站| 亚洲xxxxxx| 26uuu另类亚洲欧美日本一| 欧美一区=区三区| 久久国产精品久久| 91精品国产福利在线观看麻豆| 亚洲熟妇无码另类久久久| 精品一区二区在线视频| www.色多多| 一区二区成人在线观看| 中文字幕一区二区三区人妻四季 | 国产午夜精品久久久久免费视| 欧美一区二区三区免费观看| 国产精品白丝久久av网站| 美女亚洲精品| 精品不卡视频| 免费黄频在线观看| 欧美国产1区2区| 国产乱国产乱老熟| 精品国产制服丝袜高跟| 婷婷成人激情| 国产精品成久久久久三级| 牛牛影视久久网| 欧美 日韩 国产精品| 久久国产精品72免费观看| 国产色视频一区二区三区qq号| 亚洲在线中文字幕| 国产激情久久久久久熟女老人av| 最好看的2019的中文字幕视频| 小h片在线观看| 国产精品污www一区二区三区| 久久久久免费av| 中文字幕av不卡在线| 久久久精品欧美丰满| 国产a∨精品一区二区三区仙踪林| 日韩精品中文字幕在线不卡尤物| 男人的天堂在线视频免费观看 | 日韩欧美午夜| 无码人妻精品一区二区三区66| av不卡在线播放| 日韩视频免费观看高清| 亚洲精品在线观| 国精一区二区三区| 国产精品xxxx| 亚洲午夜在线| 尤物网站在线观看| 亚洲成人免费av| 天堂在线观看免费视频| 97国产suv精品一区二区62| 视频免费一区二区| 成人av在线不卡| 99视频在线观看一区三区| 91精品国产乱码久久久张津瑜| 日韩精品在线播放| 国产不卡网站| 亚洲国产婷婷香蕉久久久久久99| 日韩黄色一级片| 91成人精品一区二区| 欧美麻豆精品久久久久久| 日本黄色片在线观看| 2014国产精品| 亚洲激情一区| 精品人妻一区二区三区视频| 色妞www精品视频| 日本综合在线| 不卡一卡2卡3卡4卡精品在| 亚洲第一网站| av女人的天堂| 欧美日韩国产高清一区二区三区 | 欧美精品网站| 成人网站免费观看| 欧美性猛片xxxx免费看久爱| 免费av毛片在线看| 高清视频一区| 久久九九电影| 日本女人性生活视频| 欧美一级电影网站| 麻豆理论在线观看| 日韩影视精品| 国产高清不卡一区二区| 日本视频免费在线| 在线精品播放av| 亚洲va欧美va人人爽成人影院| 每日在线观看av| 国产欧美一区二区精品忘忧草| 一二三区在线播放| 韩剧1988在线观看免费完整版| av一区二区高清| 毛毛毛毛毛毛毛片123| 日韩欧美视频一区二区三区| 色网站免费在线观看| 成人自拍视频网站| 日韩高清电影一区| 久久久久久久福利| 这里只有精品在线观看| 一区二区三区在线资源| 久久久久久久久久久久久久国产| 自拍偷自拍亚洲精品播放| 午夜av免费在线观看| 成人免费观看a| 国产精品久久久久久久久久妞妞| 99成人在线观看| 日韩精品视频观看| 国产乱码精品一区二区三区亚洲人 | 一本大道久久精品懂色aⅴ| 国产网站在线免费观看| 欧美专区一二三| 99这里只有久久精品视频| 国产又粗又黄又爽的视频| 欧美亚洲国产精品|