精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析

發(fā)布于 2024-8-9 16:50
瀏覽
0收藏

一、背景

之前我們已經(jīng)總結(jié)過 FP8 的發(fā)展歷程,以及其在大規(guī)模語言模型(LLM)訓(xùn)練和推理中的應(yīng)用。如今,F(xiàn)P8 推理幾乎已經(jīng)成為行業(yè)共識,許多 LLM 推理框架已經(jīng)支持 FP8 推理,且多家公司也開源了相應(yīng)的 FP8 模型。例如,Meta 在最近發(fā)布的 LLaMA-3 技術(shù)報告中就提到了 FP8 推理的應(yīng)用。

FP8 推理相比 INT8 推理的最大優(yōu)勢在于其后訓(xùn)練量化(PTQ,Post Training Quantization)能夠獲得幾乎無損的精度,同時顯著提升推理速度。例如,相比 FP16,在 NVIDIA H20 上可以實現(xiàn) 2 倍的加速效果,而在 H100 上也可以獲得超過 1.5 倍的加速。

與此同時,還比較少看到使用 FP8 進行 LLM 訓(xùn)練的工作,目前看到的有如下幾個:

  • 微軟發(fā)布 FP8-LM 論文[2310.18313] FP8-LM: Training FP8 Large Language Models,并開源相應(yīng)的代碼 MS-AMP。
  • 零一萬物在零一萬物面向萬卡集群的 AI Infra 建設(shè)中提到了 FP8 預(yù)訓(xùn)練。
  • NVIDIA 和 Mistral AI 聯(lián)合發(fā)布 Mistral-NeMo-12B 模型,提到了使用 FP8 量化感知訓(xùn)練,但沒有介紹更多細節(jié)。
  • NVIDIA 的 Megatron-LM 也早已通過 Transformer-Engine 庫支持了 FP8 訓(xùn)練。

然而,也有一些工作對 FP8 訓(xùn)練持懷疑態(tài)度,因此我們決定自己做一些實驗,以進一步驗證 FP8 訓(xùn)練。此外,有關(guān) FP8 訓(xùn)練可能的問題,也可以參考 NVIDIA 的官方文檔:探索 FP8 訓(xùn)練中 Debug 思路與技巧。

二、To FP8 and Back Again

2.1. 摘要

在 [2405.18710] To FP8 and Back Again: Quantifying the Effects of Reducing Precision on LLM Training Stability 中,作者指出,之前使用 FP16 訓(xùn)練的穩(wěn)定性不如 BF16,而 FP8 的 Bit 數(shù)更少,可能導(dǎo)致更多穩(wěn)定性問題。因此,作者認為降低精度的訓(xùn)練方案必須具有與更高精度的訓(xùn)練方案相似的訓(xùn)練穩(wěn)定性和超參敏感性,才能具有成本效益。同時,作者發(fā)現(xiàn)目前可用的 FP8 訓(xùn)練方法不夠穩(wěn)健,無法將它們用作當(dāng)前方案的替代品。

PS:當(dāng)然,作者也強調(diào)了使用 FP8 進行 LLM 推理是完全沒問題的。

2.2. 實驗

2.2.1 FP8 訓(xùn)練實驗

作者使用微軟開源的 https://github.com/Azure/MS-AMP.git(作者使用的是 v0.3.0,當(dāng)前最新的為 v0.4.0)來進行 FP8 訓(xùn)練驗證。如下圖 Figure 5 所示,作者使用 8 個 H100 GPU 進行實驗,其中 MS-AMP 僅使用 O1 優(yōu)化,其在 GPT-2 124M 和 LLaMA 120M 上都有比較嚴重的收斂性問題,在 LLaMA 120M 上使用 FP8 訓(xùn)練甚至無法收斂

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

2.2.2 降低 Bit 數(shù)實驗

如下圖 Figure 6 所示,使用 E8M3、E8M4 和 E8M5 來訓(xùn)練 TinyLLaMA 120M 模型,依然會出現(xiàn) Loss 不收斂的問題:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖 Figure 7 所示,進一步使用 E8M3、E8M4、E8M5 和 E8M6 訓(xùn)練 LLaMA 7B,在 E8M5 和 E8M6 時才能保證相對的穩(wěn)定性:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

三、Megatron-LM FP8 訓(xùn)練驗證

3.1. 摘要

對于上述論文中的實驗我們持懷疑態(tài)度,與我們之前看到的各種結(jié)論不符,因此決定進行相應(yīng)的復(fù)現(xiàn)。同時我們也在考慮一個問題:如果無法充分保證 FP8 訓(xùn)練的穩(wěn)定性以及可比 BF16 訓(xùn)練的精度,怎么權(quán)衡是否要使用 FP8 訓(xùn)練。比如說,F(xiàn)P8 訓(xùn)練相比 BF16 訓(xùn)練可以加速 30%,但是 Loss 下降會慢一些,那么是否要使用 FP8 訓(xùn)練呢?除此之外,我們也進一步測試了 GPT3 系列模型在不同 Batch Size 和 Seq Length 下 FP8 相比 BF16 訓(xùn)練的加速比,以便為相關(guān)決策提供參考。

3.2. FP8 訓(xùn)練 Loss 對比

訓(xùn)練在 8*H100 機器進行,訓(xùn)練數(shù)據(jù)集采用 cerebras/SlimPajama-627B · Datasets at Hugging Face。使用 NVIDIA 的 GitHub - NVIDIA/Megatron-LM: Ongoing research training transformer models at scale 訓(xùn)練框架,具體示例可以參考其 examples 中的 gpt3。

如下圖所示為一個 1B 模型使用 FP8 訓(xùn)練和 BF16 訓(xùn)練的 loss 對比,總共訓(xùn)練了 21K 個 Step,其 BF16 的 loss 基本上和 FP8 相當(dāng),并且收斂趨勢完全一致。當(dāng)然,我們也發(fā)現(xiàn) FP8 的 loss 始終會比 BF16 高一點:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示,我們的結(jié)論與 Benchmarking Large Language Models on NVIDIA H100 GPUs with CoreWeave (Part 1) | Databricks Blog 中的結(jié)論基本一致:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

除了 1B 模型之外,我們還驗證了 345M 模型和 13B 模型,結(jié)論基本與上述一致。

3.3. FP8 訓(xùn)練速度對比

在驗證收斂性的同時我們也同步驗證了加速比,其 13B 模型 FP8 相比 BF16 可以獲得 30% 左右的加速,而 1B 模型可能只有 20% 左右,更小的模型加速比甚至小于 10%。(PS:不同的分布式策略都可能產(chǎn)生不同的結(jié)果,我們這里只是簡單同配置下的驗證)

如下圖所示,Benchmarking Large Language Models on NVIDIA H100 GPUs with CoreWeave (Part 1) | Databricks Blog 中 1B,3B 和 7B 模型的 FP8 訓(xùn)練相比 BF16 的訓(xùn)練加速比也只有 1.2x-1.3x:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

為了對比不同配置下的性能,我們使用 Transformer-Engine 構(gòu)建了一個 1 層的 Transformer Block 進行速度對比,同樣在 8*H100 上驗證,采用 8TP,具體示例可以參考 Getting Started — Transformer Engine 1.8.0 documentation。

如下圖所示為 GPT-3 系列模型在 Seq Length=1024 時的性能,其中:

  • 紅色:表示加速比小于 1,通常是模型比較小,Batch Size 比較小的情況。
  • 藍色:表示加速比大于 1 并且小于 1.3,通常是模型相當(dāng)比較大或者 Batch Size 比較大。
  • 綠色:表示加速比大于 1.3,同時是模型很大或者 Batch Size 很大。?

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 2048 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 4096 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

如下圖所示為 Seq Length 為 8192 的情況:

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

從上述結(jié)論可以看出,要想獲得比較大的加速比,通常需要具有比較大的模型或者比較大的 Batch Size、Seq Length。當(dāng)然,也并不是說 Seq Length 越大越好,可以看出,Seq Length 為 8K 是其加速比反而不如 4K。此外,也可以看出,大部分加速比不超過1.5x,甚至很多不超過 1.3x。(在實際使用中最好經(jīng)過一些充分的分析和實驗)

3.4. 零一萬物的實踐

LLM 預(yù)訓(xùn)練的代價很高,比如可能需要上千個 GPU 訓(xùn)練幾個月的時間,30% 的加速比似乎有很大的吸引力。然而,其結(jié)果又像薛定諤的貓,除非同時訓(xùn)練一個 BF16 模型和 FP8 模型,才能確定 FP8 模型是否真的符合預(yù)期。

為了解決上述問題,零一萬物在 零一萬物面向萬卡集群的 AI Infra 建設(shè) 中提到了一個 Trick 的方法。如下圖所示,每隔一段時間就會 Load FP8 的 Checkpoint 并使用 BF16 進行訓(xùn)練,驗證 Loss 是否和 FP8 訓(xùn)練的 Loss 一致。如果出現(xiàn)不一致的情況,就會使用 BF16 的訓(xùn)練代替 FP8,并在一段時間后繼續(xù)使用 FP8 訓(xùn)練。最終作者獲得了 1.3x 的吞吐提升,不過并沒有說明這個提升是純粹的 FP8 相比 BF16 還是也包含了 BF16 的校驗預(yù)算。

FP8 預(yù)訓(xùn)練真的成熟了嗎:一些實踐和分析-AI.x社區(qū)

四、參考鏈接

  1. https://arxiv.org/abs/2310.18313
  2. https://01-ai.github.io/
  3. https://mp.weixin.qq.com/s/ezdGxxmTRfEnzXmrVtwq7g
  4. https://arxiv.org/abs/2405.18710
  5. https://github.com/Azure/MS-AMP.git
  6. https://huggingface.co/datasets/cerebras/SlimPajama-627B
  7. https://github.com/NVIDIA/Megatron-LM
  8. https://www.databricks.com/blog/coreweave-nvidia-h100-part-1
  9. https://docs.nvidia.com/deeplearning/transformer-engine/user-guide/examples/quickstart.html

本文轉(zhuǎn)載自??AI閑談??,作者: AI閑談 ????

收藏
回復(fù)
舉報
1條回復(fù)
按時間正序
/
按時間倒序
wx671aff8936b5b
wx671aff8936b5b

2.2.1 FP8 訓(xùn)練實驗的實驗是錯的,《To FP8 and Back Again》的作者沒有讓最后一層線性層保持高精度。

低比特訓(xùn)練需要讓最后一層線性層保持高精度,其他線性層用低精度。

MS-AMP訓(xùn)練的FP8 GPT-2 124M能夠和BF16模型對齊:

??https://github.com/Azure/MS-AMP/issues/178??


基于nanoGPT整合MS-AMP的代碼已開源:

??https://github.com/wkcn/nanoGPT??


回復(fù)
2024-10-25 10:19:46
回復(fù)
相關(guān)推薦
粗暴91大变态调教| 国产精品毛片va一区二区三区| 精品日韩在线视频| 99久久久国产| 亚洲午夜一区二区三区| 欧美理论一区二区| 国产视频第二页| 国产一区二区高清| 久久久国产成人精品| 中文字幕在线永久| 黄色日韩网站| 精品国产1区2区| 一区二区精品视频| 涩涩视频在线观看免费| 国产一区二区三区国产| 97碰在线观看| 久久久久久久久久久久久女过产乱| 欧美综合精品| 日韩一区二区三区免费看 | 国产福利视频在线观看| 99久久久国产精品免费蜜臀| 亚洲va欧美va国产综合剧情 | 91黄色在线| 久久精品视频在线看| 亚洲一区二区三区在线视频| 波多野结衣午夜| 亚洲激情综合| 免费99精品国产自在在线| 99久久人妻无码精品系列| 一区二区三区在线资源| 在线不卡中文字幕播放| 搡女人真爽免费午夜网站| 九色porny丨入口在线| 一区二区三区欧美日韩| 中文字幕欧美人与畜| 国内精品一区视频| 91在线视频在线| 成人xxxxx色| 国产精品免费无遮挡| 久久久久国产精品一区二区| 57pao成人永久免费视频| 欧美人妻一区二区| 在线看片不卡| 美女视频黄免费的亚洲男人天堂| 少妇高潮一区二区三区喷水| 日韩伦理一区| 中文日韩电影网站| 手机看片日韩av| 精品国产网站| 亚洲色图35p| 国产高清一区二区三区四区| 亚洲8888| 亚洲人午夜精品免费| 在线黄色免费网站| 欧美男人操女人视频| 亚洲精品乱码久久久久久金桔影视| 老熟女高潮一区二区三区| 97品白浆高清久久久久久| 日韩精品一区在线观看| 岛国大片在线免费观看| www.亚洲一二| 日韩成人av一区| 网站免费在线观看| 色哟哟精品丝袜一区二区| 日韩久久午夜影院| 国产精品扒开腿做爽爽| 欧洲杯什么时候开赛| 中文字幕精品国产| 日韩三级久久久| 在线精品国产| 2019日本中文字幕| 免费黄色片视频| 美腿丝袜在线亚洲一区| 91在线免费视频| 成人乱码一区二区三区| 不卡电影免费在线播放一区| 欧美1o一11sex性hdhd| 黄色av网站在线看| 日韩一区中文字幕| 国产尤物av一区二区三区| av毛片午夜不卡高**水| 一本色道综合亚洲| 无限资源日本好片| 日韩区欧美区| 日韩精品中文字| 狂野欧美性猛交| 黄色另类av| 国产成人福利视频| 国产伦精品一区二区三区免.费| 国产成a人亚洲精品| 欧美精品七区| huan性巨大欧美| 欧美性69xxxx肥| 人人爽人人爽av| 九色丨蝌蚪丨成人| 色av中文字幕一区| 日本免费一二三区| 蜜桃av噜噜一区| 国产精品日韩一区二区| 98在线视频| 亚洲va欧美va人人爽午夜| 午夜激情福利在线| 136国产福利精品导航网址应用| 亚洲美女精品成人在线视频| 国产a免费视频| 日韩激情av在线| 国产亚洲一区二区三区在线播放| 在线激情小视频| 欧美日韩国产一区在线| 国产一级免费大片| 欧美色女视频| 欧美亚洲一区在线| 999av视频| 国产午夜亚洲精品不卡| 黄色一级片黄色| 久久av影院| 亚洲男人天堂九九视频| 久草视频手机在线观看| 精品亚洲免费视频| 日本一区二区三区四区高清视频 | 欧美日韩有码| 国外色69视频在线观看| 国产高潮流白浆喷水视频| 国产女人水真多18毛片18精品视频 | theav精尽人亡av| 中文字幕日韩一区二区不卡| 国产精品福利无圣光在线一区| 色噜噜在线播放| 一区二区久久久久| 日韩va在线观看| 欧美手机在线| 国产精品九九九| 可以在线观看的黄色| 同产精品九九九| 久久性爱视频网站| 亚洲天堂偷拍| 国产精品果冻传媒潘| 羞羞电影在线观看www| 欧美高清一级片在线| 欧美极品jizzhd欧美18| 日韩精品每日更新| 日韩av一级大片| 日韩美女在线看免费观看| 精品在线观看国产| 日本午夜视频在线观看| 91小视频免费看| 鲁一鲁一鲁一鲁一色| 国产精品欧美大片| 国语自产在线不卡| 欧美一区二区三区激情| 亚洲福利电影网| 95视频在线观看| 日韩午夜精品| 欧美理论一区二区| 97久久香蕉国产线看观看| 亚洲人精选亚洲人成在线| 无码人妻熟妇av又粗又大| 国产日产精品1区| www.日本xxxx| 999久久久亚洲| 91在线看www| segui88久久综合| 亚洲精品久久视频| aaaaaa毛片| 国产精品全国免费观看高清 | 成人av在线看| 男人日女人逼逼| 国产一区二区三区电影在线观看| 国产精品色视频| 国产高清一区二区三区视频| 欧美变态口味重另类| 中文字幕一区二区三区精品| 久久精品亚洲乱码伦伦中文 | av成人在线网站| 欧美激情乱人伦一区| 天天综合永久入口| 91福利区一区二区三区| 林心如三级全黄裸体| 国产丶欧美丶日本不卡视频| 青青艹视频在线| 精品欧美激情在线观看| 91网站在线看| 丁香花在线电影| 国产一区二区精品丝袜| 国产女人高潮时对白| 亚洲v精品v日韩v欧美v专区 | 国产精品伦理久久久久久| 国产91精品入口17c| 日本精品不卡| 欧美乱妇高清无乱码| 欧美新色视频| 日韩一级黄色片| 国产三级av片| 亚洲黄色免费网站| 国产精品成人一区二区三区电影毛片| 久久精品理论片| 国精产品一区一区三区视频| 成人看的羞羞网站| 国产精品一区而去| 精品176极品一区| 97在线视频一区| 中国av在线播放| 亚洲人成在线播放| 国产福利资源在线| 欧美色视频一区| 草久久免费视频| 亚洲综合一区二区精品导航| 国产视频123区| 久久久噜噜噜久噜久久综合| 永久看看免费大片| 日韩av电影免费观看高清完整版| 国产肉体ⅹxxx137大胆| 99精品视频在线观看播放| 麻豆av一区| 欧美成人午夜77777| 成人性教育视频在线观看| 日韩电影免费观看高清完整版| 欧美国产精品人人做人人爱| 免费在线观看黄色| 国产午夜精品一区理论片飘花| 色婷婷av一区二区三区之e本道| 日韩一级免费观看| 91资源在线视频| 91成人看片片| 午夜婷婷在线观看| 午夜日韩在线电影| 精品无码m3u8在线观看| 亚洲欧洲日韩综合一区二区| 亚洲ⅴ国产v天堂a无码二区| 久久亚洲精华国产精华液| 国产精品久久AV无码| 国产成人在线网站| 中文国产在线观看| 看电视剧不卡顿的网站| 精品少妇无遮挡毛片| 日韩视频不卡| 国产原创中文在线观看| 99精品热6080yy久久| 欧美视频在线免费播放| 一本色道久久综合亚洲精品不卡 | 美日韩一区二区| 宅男噜噜噜66国产免费观看| 日韩高清一级片| 天天碰免费视频 | 少妇伦子伦精品无吗| 国产精品白丝jk白祙喷水网站| 日本精品一区在线| 久久99久久久欧美国产| 91插插插影院| 国产剧情一区二区| 亚洲一区二区三区三州| 国产精品1区二区.| 337p日本欧洲亚洲大胆张筱雨 | 视频在线这里都是精品| 欧美裸身视频免费观看| 色婷婷视频在线观看| 欧美激情奇米色| 九色porny自拍视频在线播放| 欧美有码在线观看视频| 国模一区二区| 成人免费视频在线观看超级碰| 久久av网站| 国产精品免费一区二区三区| 色综合www| 亚洲国产精品久久久久久女王| 久久久久久美女精品 | 日韩一区国产二区欧美三区| 空姐吹箫视频大全| 精品在线欧美视频| 在线观看的av| 欧美成人免费在线视频| 啊啊啊久久久| 国产精品美女免费| 不卡的国产精品| 国产伦理一区二区三区| 国产成人精品一区二区免费看京| 亚洲蜜桃av| 红桃视频亚洲| 日本免费观看网站| 国产一区二区三区久久久| 波多野结衣影院| 中文字幕精品—区二区四季| 天天看片中文字幕| 大伊人狠狠躁夜夜躁av一区 | 欧美mv日韩mv亚洲| 头脑特工队2免费完整版在线观看| 亚洲色图18p| 日本无删减在线| 国产精品1234| 91久久精品无嫩草影院| 日本精品视频一区| 亚洲啊v在线观看| 成年人小视频网站| 国产精品综合久久| 日韩精品电影一区二区| 亚洲精品国产高清久久伦理二区| 国产成人免费看| 欧美一区二区不卡视频| 免费在线稳定资源站| 色综合久久悠悠| 嫩草伊人久久精品少妇av杨幂| 成人xxxxx色| 水蜜桃精品av一区二区| av观看免费在线| 福利电影一区二区三区| 国产一区第一页| 色一情一伦一子一伦一区| 亚洲女同志亚洲女同女播放| 中文字幕亚洲国产| 女人高潮被爽到呻吟在线观看| 亚洲精品免费一区二区三区| 欧洲杯半决赛直播| 欧美色图另类小说| 国产成人aaaa| 深夜福利影院在线观看| 欧美中文字幕不卡| 视频二区在线| 97在线免费视频| 91蝌蚪精品视频| 精品日韩在线播放| 久久精品国产第一区二区三区| 91成年人网站| 精品国产鲁一鲁一区二区张丽 | 男人天堂久久| 欧美在线播放一区| 亚洲欧美视频| 中文字幕无码人妻少妇免费| 亚洲香肠在线观看| 国产成人久久精品77777综合| 色老头一区二区三区在线观看| 久久久一本精品| 免费一区二区三区在在线视频| 亚洲国产国产亚洲一二三| 国产成人av片| 玉米视频成人免费看| 国产精品久久欧美久久一区| 久久精品亚洲热| 96sao精品免费视频观看| 一区二区不卡在线视频 午夜欧美不卡'| 视频一区视频二区中文| 免费a级黄色片| 欧美色视频日本版| 日韩大片b站免费观看直播| 18久久久久久| 中国av一区| 色诱视频在线观看| 久久久一区二区三区捆绑**| 一级片视频在线观看| 亚洲嫩模很污视频| 日韩福利一区| 视频在线99| 精品无码三级在线观看视频| 久久av红桃一区二区禁漫| 欧美日韩在线播放三区| 欧美三级电影一区二区三区| 91久久久久久久久久| 欧美日韩影院| 国产 中文 字幕 日韩 在线| 欧美三级欧美成人高清www| 青青草免费在线| 国产精品三级网站| 婷婷激情综合| 91人妻一区二区| 欧美视频免费在线观看| av播放在线观看| 99在线观看| 在线亚洲免费| 国产一区在线观看免费| 日韩欧美一区二区视频| www.51av欧美视频| 日韩精品久久久| 国产一区二区精品久久| 国产乡下妇女做爰视频| 亚洲色图在线观看| 祥仔av免费一区二区三区四区| 精品成在人线av无码免费看| xf在线a精品一区二区视频网站| 超碰在线97观看| 久久中文字幕在线| 久久亚洲黄色| 日本 片 成人 在线| 一区二区三区欧美激情| 日本大臀精品| 成人综合国产精品| 国产一区二区三区久久| 人与动物性xxxx| 日韩av网站导航| 国产剧情一区二区在线观看| 欧美日韩亚洲一| 亚洲人成电影网站色mp4| 亚洲欧美日韩动漫| 成人欧美在线视频| 亚洲综合不卡| 欧美日韩亚洲国产另类| 亚洲精品自在久久| 国产精品一站二站| 国产成人av影视| 午夜视频一区二区| 在线免费看av| 欧美日韩在线一区二区三区|