精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型訓練loss突刺原因和解決辦法

開發 前端
目前流行的fp8,fp16混合訓練,如果upscale設置的過小,導致梯度在進入優化器之前就下溢,是不是會增加淺層梯度長時間不更新的可能性,進而增加loss spike的出現的頻率。

最近閱讀了《A Theory on Adam Instability in Large-Scale Machine Learning 》這篇論文。比較全面的闡述了100B以上的大模型預訓練中出現loss spike的原因(loss 突然大幅度上漲),并介紹了一些可能的解決辦法。論文寫的非常精彩,但整體上有點散和深,我嘗試著站在工業立場上把它串一下

突刺是什么

首先介紹一下什么是loss spike:

loss spike指的是預訓練過程中,尤其容易在大模型(100B以上)預訓練過程中出現的loss突然暴漲的情況

圖片圖片

如圖所示模型訓練過程中紅框中突然上漲的loss尖峰 loss spike的現象會導致一系列的問題發生,譬如模型需要很長時間才能再次回到spike之前的狀態(論文中稱為pre-explosion),或者更嚴重的就是loss再也無法drop back down,即模型再也無法收斂

PaLM和GLM130b之前的解決辦法是找到loss spike之前最近的checkpoint,更換之后的訓練樣本來避免loss spike的出現。

突刺成因分析

這篇論文(以下稱本文)對loss spike的出現原因做了十分詳細的分析,最后認為預訓練使用的Adam優化器是導致這個現象出現的重要原因之一

Adam算法是牛頓下降法的一個迭代逼近 

圖片圖片

一切顯得十分完美,但是理想很豐滿,現實很骨感,收斂過程并不是一帆風順的

圖片圖片

非穩態

圖片圖片

中間態

圖片圖片

穩態 

進入正態分布的穩態之后,理想的更新參數變化趨勢應該是方差越來越小,所有更新參數逐漸向0靠近。這應該是一個單向的過程,即穩定的單峰狀態(unimodal)不會再次進入非穩定的雙峰狀態(bimodal),但事實并非如此,更新參數會再次進入非穩定的雙峰狀態

本文在理論層面做了研究和解釋,從中心極限定理(可以結合道爾頓板實驗理解)出發,認為隨機事件的疊加進入單峰的正態分布的必要條件之一是各個隨機事件事件之間應該是相互獨立的,但是梯度變化以及更新參數的變化并不能特別好的滿足獨立性這一條件,而這一點恰恰是導致更新參數振蕩,loss spike出現以及loss 不收斂的重要原因之一

圖片圖片

造成梯度變化不獨立的原因(1、淺層參數長時間不更新2、batch太大,后期梯度更新趨于平穩) 上述的理論有些晦澀,本文作者可能也了解這一點,之后開始直接點題,結合實驗觀察拋出了重要現象和結論

即訓練過程中loss spike的出現與:梯度更新幅度, 大小,batch大小這三個條件密切相關

本文作者對loss spike出現時模型的前后變化做了仔細拆解,發現下列一系列連續現象的出現導致了loss spike:

圖片圖片

  1. 當前模型處在穩態(健康狀態),即單峰的正態分布狀態,并且梯度值 ,此時loss平穩,訓練過程正常

圖片圖片

2.模型淺層(embedding層)梯度  ,這一般是由于訓練一段時間之后,淺層的語義知識表示此時一般已經學習的較好。但此時深層網絡(對應復雜任務)的梯度更新還是相對較大

圖片圖片

3.一段時間淺層(embedding層)梯度  之后會導致  ,  。此時趨于0。因此導致淺層參數得不到更新(也對應于上述參數更新事件不獨立的原因)

圖片圖片

4.此時雖然淺層(embedding層)參數長時間不更新,但是深層的參數依然一直在更新。長時間這樣的狀態之后,batch之間的樣本分布變化可能就會直接導致淺層(embedding層)再次出現較大的梯度變化(可以想象成一個水壩蓄水太久終于被沖開了。至于小模型為什么不會出現這種情況,推測是小模型函數空間小,無法捕獲樣本的分布變化,越大規模的模型對樣本之間不同維度的特征分布變化越敏感),此時 , 再次集中在 附近(此時 , ),變成雙峰的非穩定狀態,本文提到了淺層(embedding層)這種突然的參數變化可能造成模型的連鎖反應進而出現loss spike的現象(這也對應了更換樣本重新訓練有可能會減少loss spike的出現頻率,實際上就是選擇分布變化較小的樣本,減小淺層梯度變換幅度)

圖片圖片

5.這個階段模型處于非穩態,梯度變化幅度較大,每一次的梯度變化和更新參數變化事件之間又出現了一定的獨立性,因此經過一定的時間之后模型有可能再次進入穩態,loss再次drop back down(注意,本文著重提了這個再次drop back down并不是一定出現的,也很有可能loss長期處于flat狀態,再也無法收斂)

因此我們得出一些結論,loss spike的出現和淺層的梯度更新幅度, 大小密切相關(batch大小帶來的相關性問題倒是顯得沒那么大說服力),實際上就是淺層網絡參數突然進入到了之前長時間不在的狀態與模型深層參數當前的狀態形成了連鎖反應造成了模型進入非穩態。同時一般情況即使出現loss spike也會自動回復到正常狀態,但也有可能再也不會

突刺解法

本文最后提到了防止loss spike出現的一些方法:

1.如之前提到的PaLM和GLM130B提到的出現loss spike后更換batch樣本的方法(常規方法,但是成本比較高)

2.減小learning rate,這是個治標不治本的辦法,對更新參數的非穩態沒有做改進

3.減小 大小。或者直接把 設為0,重新定義

在等于0時候的值(這應該是個值得嘗試的辦法)

值得一提的是智譜華章在本文發表之前,在去年的GLM130B訓練時似乎也觀察到了淺層梯度變化和loss spike相關這一現象(GLM-130B: An Open Bilingual Pre-trained Model),他采取的是把淺層梯度直接乘以縮放系數 來減小淺層梯度更新值

出自130b出自130b

圖片圖片

其實這塊我有個自己的想法,和是否也可以做衰減,隨著訓練過程逐漸減小,來避免loss spike的現象

另外假設我們能一次性加載所有樣本進行訓練(實際上不可能做到),是否還會出現loss spike的現象

最后目前流行的fp8,fp16混合訓練,如果upscale設置的過小,導致梯度在進入優化器之前就下溢,是不是會增加淺層梯度長時間不更新的可能性,進而增加loss spike的出現的頻率。(這么看來似乎提升upscale大小以及優化 大小是進一步提升模型效果的一個思路)

責任編輯:武曉燕 來源: 包包算法筆記
相關推薦

2009-11-30 11:01:20

MySQL與PHP產生

2015-06-10 13:49:53

2017-06-21 08:30:20

MySQL原因解決辦法

2012-04-16 10:09:52

2010-05-04 13:52:00

Oracle用戶被鎖

2009-07-31 09:14:01

WinCE啟動失敗

2015-03-09 15:41:08

MongoDB查詢超時異常Socket Time

2009-11-30 10:09:31

PHP中文亂碼

2015-10-15 09:38:21

程序員發福

2023-06-20 11:46:58

2022-07-07 08:00:32

前端界面504

2009-06-03 16:41:21

Eclipse亂碼Eclipse

2011-03-04 13:07:47

Filezilla

2019-08-29 14:29:42

JVM內存 Java

2010-09-01 11:32:50

DB2暫掛

2011-05-07 10:05:17

打印機打印空白頁解決方法

2018-09-12 08:44:43

2025-04-29 08:20:00

無線監控網絡無線網絡

2011-10-17 14:41:26

激光打印機解決辦法

2011-06-17 11:10:51

Qt 中文 輸出
點贊
收藏

51CTO技術棧公眾號

国产www视频在线观看| 亚洲高潮女人毛茸茸| 爱看av在线| 国产欧美一区二区精品仙草咪| 国产精品久久久久久久久久久久久| 国产一区二区三区视频播放| 日本成人精品| 色噜噜狠狠色综合中国| 一级特黄妇女高潮| 三级视频在线| 国产一区在线观看视频| 热久久这里只有精品| 天天鲁一鲁摸一摸爽一爽| 欧美交a欧美精品喷水| 欧美日韩午夜影院| 欧美三级一级片| 18videosex性欧美麻豆| 久久久久国产精品麻豆ai换脸| 91中文在线观看| 国产一卡二卡三卡| 悠悠资源网久久精品| 精品国产拍在线观看| 亚洲区免费视频| 高清精品视频| 日韩欧美国产一区在线观看| 婷婷激情四射五月天| 亚洲妇女成熟| 亚洲成人7777| 国内精品国产三级国产99| 国产精品无码2021在线观看| 成人高清视频在线观看| 91在线|亚洲| 在线观看国产小视频| 鲁大师成人一区二区三区| 欧美国产日韩视频| 国产女人18水真多毛片18精品| 国产亚洲一区二区三区不卡| 日韩电影中文字幕av| 26uuu国产| 精品国产亚洲一区二区三区| 在线播放中文字幕一区| 国产九九在线观看| 日韩毛片一区| 欧美亚洲禁片免费| www.色偷偷.com| 欧美性suv| 色综合久久久网| 日批视频在线免费看| 国产精品—色呦呦| 亚洲国产视频a| 久无码久无码av无码| 男女羞羞视频在线观看| 亚洲自拍偷拍麻豆| 久久亚洲国产成人精品无码区| 超碰在线免费公开| 亚洲精品中文在线| 97久久国产亚洲精品超碰热| 综合久久2019| 亚洲一卡二卡三卡四卡| 日韩精品一区在线视频| 欧美aa在线观看| 黑人巨大精品欧美一区免费视频| 夫妻免费无码v看片| 成人国产二区| 欧美亚洲丝袜传媒另类| www.com久久久| 久久9999免费视频| 精品第一国产综合精品aⅴ| xxxwww国产| 一区二区三区日本久久久| 亚洲欧洲视频在线| 任你操精品视频| 亚洲综合专区| 性欧美暴力猛交69hd| 伦av综合一区| 六月丁香婷婷久久| 国产成人一区二区三区免费看| 日本美女一级视频| 国产欧美视频在线观看| 日本三级福利片| а_天堂中文在线| 在线日韩一区二区| 尤物网站在线看| 久久精品国产亚洲5555| 国产亚洲欧美视频| 欧美成人免费看| 国产精品综合| 国产中文字幕亚洲| 天堂av资源在线| 欧美国产日韩在线观看| 国产精品三级一区二区| 色戒汤唯在线观看| 欧美日韩激情在线| 国产又粗又猛又色| 国产精品久久观看| 91精品国产色综合久久不卡98口| 伊人网视频在线| 不卡视频一二三四| 一区高清视频| 电影一区二区三区| 日韩一级欧美一级| 日本一区二区视频在线播放| 亚洲网址在线| 成人深夜直播免费观看| 日本福利片高清在线观看| 亚洲免费av观看| 日韩一级在线免费观看| 超碰cao国产精品一区二区| 中文在线资源观看视频网站免费不卡| 青春草免费视频| 奇米影视一区二区三区小说| 国产精品美女黄网| 黄色国产网站在线播放| 91黄色免费版| 成人免费无码大片a毛片| 亚洲色图二区| 国产精品中文字幕在线观看| 午夜av免费在线观看| 亚洲激情一二三区| 亚洲久久中文字幕| 欧美日韩国产高清电影| 欧洲精品在线视频| 欧性猛交ⅹxxx乱大交| 亚洲人成亚洲人成在线观看图片| 密臀av一区二区三区| 欧美日韩一本| 久久久久久成人精品| 国产精品亚洲lv粉色| 国产欧美日韩在线看| 无码播放一区二区三区| av一级亚洲| 久久影院中文字幕| 91国内精品久久久| 国产日韩欧美综合一区| 成人在线看视频| 青青久久av| 97视频在线观看免费高清完整版在线观看 | 久久中文字幕国产| 亚洲综合一区中| 国产欧美一区二区精品忘忧草| 蜜臀久久99精品久久久酒店新书| 一道在线中文一区二区三区| 日本国产精品视频| 韩国中文免费在线视频| 色欧美日韩亚洲| 少妇av片在线观看| 久久精品国产亚洲一区二区三区| 污视频在线免费观看一区二区三区| 性欧美又大又长又硬| 亚洲人成伊人成综合网久久久| 国产精品久久久免费视频| 91视频在线看| 国产免费视频传媒| 欧美电影一区| 91在线视频免费| 91小视频xxxx网站在线| 日韩精品一区二区三区四区 | 69视频在线观看| 欧美日产国产精品| 91 在线视频| 国产成人免费视| 青青青免费在线| 色综合久久中文| 国产精品视频免费在线观看| 99riav在线| 欧美一区二区福利在线| 国产小视频在线看| www国产亚洲精品久久麻豆| 青青在线视频免费| 亚洲精品极品少妇16p| 高清国产一区| 蜜臀国产一区| 免费97视频在线精品国自产拍| 亚洲经典一区二区| 91久久线看在观草草青青| 午夜精品一区二区三级视频| 成人福利在线看| 免费观看成人在线视频| 香蕉精品视频在线观看| 黄色99视频| jizz久久久久久| 欧美激情亚洲国产| 国产在线91| 日韩精品资源二区在线| 国产中文字幕视频| 亚洲色图在线播放| 野花社区视频在线观看| 麻豆国产精品一区二区三区| 97av中文字幕| 成人91在线| 国产chinese精品一区二区| 欧美天堂视频| 久久久久久成人精品| 最新97超碰在线| 亚洲激情成人网| 97成人在线观看| 欧美视频在线免费| 永久看片925tv| 国产日韩欧美在线一区| 国产在线观看中文字幕| 欧美黄色精品| 亚洲欧美久久234| 亚洲另类av| 成人在线视频电影| 男女啪啪999亚洲精品| 97av在线视频| 国产又色又爽又黄刺激在线视频| 色久欧美在线视频观看| 日韩私人影院| 精品99一区二区三区| 国产精品国产精品国产专区| 欧美天堂在线观看| 国产无码精品视频| 亚洲欧美日韩中文字幕一区二区三区| 成人免费网站黄| 99精品热视频| 美女伦理水蜜桃4| 国产裸体歌舞团一区二区| 一本色道无码道dvd在线观看| 在线观看视频日韩| 激情视频小说图片| 最新国产精品久久久| 亚洲精品日韩精品| 欧美日韩在线网站| 欧美日韩一区二区三区在线观看免| 爱爱精品视频| 91九色蝌蚪成人| 99视频有精品高清视频| 国产男人精品视频| 免费成人高清在线视频| 国产九九精品视频| h1515四虎成人| 国产精品美女免费视频| 欧美成人ⅴideosxxxxx| 欧美洲成人男女午夜视频| 超碰91在线观看| 97人人做人人爱| 福利网站在线观看| 欧美极品在线播放| 毛片在线网址| 久久久免费精品视频| 国产美女一区视频| 97色在线视频| 少妇视频在线观看| 青草成人免费视频| 日韩中文视频| 国产日本欧美一区二区三区在线| 久久爱.com| 亚洲一区二区三区乱码aⅴ| 91麻豆精品一二三区在线| 91在线高清视频| 视频在线观看免费影院欧美meiju| 99久久无色码| 国产精品videossex| 国外成人免费视频| 女人丝袜激情亚洲| 亚洲图片欧洲图片日韩av| 天堂美国久久| 国产精品自拍合集| av成人国产| 91淫黄看大片| 国产一区二区久久| 污污污www精品国产网站| 91麻豆高清视频| 欧美激情视频二区| 亚洲欧美在线视频观看| 久久精品视频8| 日韩欧美国产成人| 中文字幕免费在线看| 日韩欧美国产一区二区三区 | 精品中文视频| 国产视频一区二区不卡| 精品久久影视| 久久天天东北熟女毛茸茸| 最新国产乱人伦偷精品免费网站| 农村妇女精品一二区| 激情综合五月婷婷| 久久久久亚洲AV成人无码国产| 国产亚洲精品资源在线26u| 顶级黑人搡bbw搡bbbb搡| 亚洲地区一二三色| 在线观看免费中文字幕| 精品国产乱码久久久久久久久 | 国产一区在线电影| 日韩免费毛片| 尤物在线精品| 深夜黄色小视频| 99久久免费精品高清特色大片| 高清国产在线观看| 亚洲一级在线观看| 中文字幕一区二区人妻| 亚洲第一精品久久忘忧草社区| 国产视频精选在线| 久久久久久久一| 免费视频成人| 欧美综合激情| 亚洲激情黄色| www.色就是色.com| 久久久久久免费毛片精品| 久久久精品一区二区涩爱| 欧美手机在线视频| 手机av免费在线观看| 久久精品国产91精品亚洲| 一区二区精品伦理...| 91亚洲精品在线| 残酷重口调教一区二区| 国自产拍偷拍精品啪啪一区二区| 久久国产欧美日韩精品| 久久精品视频18| 精品久久久久久中文字幕一区奶水 | 国产精品大片| 日韩不卡一二三| 久久久另类综合| 日韩av在线天堂| 日韩欧美亚洲国产另类 | 久久久久中文字幕| 久久伊人久久| 宅男av一区二区三区| 日韩—二三区免费观看av| 日本一卡二卡在线| 夜夜精品视频一区二区| 国产绿帽刺激高潮对白| 最近中文字幕2019免费| 欧美暴力调教| 欧美精品一区二区三区四区五区| 99精品视频免费观看| 国偷自产av一区二区三区麻豆| 日韩毛片高清在线播放| 中文字幕一区二区三区四区免费看 | 黄色日韩在线| 日韩高清一二三区| 夜夜操天天操亚洲| 亚洲精品字幕在线观看| 欧美日韩国产123| 亚洲一区二区三区四区电影| 看全色黄大色大片| 国产一区二区看久久| 伊人在线视频观看| 日韩一区二区三区四区| 大片免费在线观看| 亚洲一区二区三区在线免费观看| 天天天综合网| 亚洲精品在线网址| 一区二区三区欧美| 国 产 黄 色 大 片| 欧美精品video| 欧美色图五月天| 亚洲乱码中文字幕久久孕妇黑人| 99re热视频这里只精品| 日本韩国欧美中文字幕| 亚洲男人天天操| 97成人超碰| 青青在线免费视频| 国产69精品久久久久777| 日韩 国产 在线| 亚洲乱码一区av黑人高潮| 久草在线中文最新视频| 好吊色欧美一区二区三区视频| 国产精品亚洲综合久久| 9.1成人看片免费版| 91福利视频在线| 日本欧美在线视频免费观看| 91亚洲精华国产精华| 伊人久久亚洲影院| a级在线观看视频| 欧美日韩三级一区| 欧美人与禽性xxxxx杂性| 六月婷婷久久| 日韩**一区毛片| 青娱乐国产在线| 日韩精品极品视频| 精品自拍视频| 国产精品自拍合集| 国产亚洲精品bt天堂精选| 夜夜嗨aⅴ一区二区三区| 色中色综合影院手机版在线观看| 免费日韩一区二区三区| 国产九九在线视频| 亚洲综合999| www在线免费观看| 99久久一区三区四区免费| 视频一区在线视频| 黄色片在线观看网站| 亚洲欧洲午夜一线一品| 麻豆国产一区二区三区四区| 日本www在线播放| 亚洲天堂精品在线观看| 深夜福利在线看| 成人国产精品色哟哟| 99成人免费视频| 三级黄色录像视频| 国产视频综合在线| 亚洲一区二区免费在线观看| 成人亚洲视频在线观看| 一区二区三区欧美视频| 九色网友自拍视频手机在线| 99在线国产| 久久www免费人成看片高清| 国产又黄又粗又爽| 久久99亚洲精品|