精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型量化訓練極限在哪?騰訊混元提出低比特浮點數訓練Scaling Laws

人工智能 新聞
這項研究為大模型訓練中的浮點數量化提供了重要的理論指導。其價值不僅在于明確了在給定資源和精度下的最優參數配置策略,幫助提高訓練效率和降低成本,而且對于推動大模型在實際應用中的更廣泛部署具有關鍵意義。

大模型低精度訓練和推理是大模型領域中的重要研究方向,旨在通過降低模型精度來減少計算和存儲成本,同時保持模型的性能。因為在大模型研發成本降低上的巨大價值而受到行業廣泛關注 。近期,業界對低精度訓練和推理的廣泛關注與討論。在實際的研發過程中,特別是模型訓練方面,經驗表明浮點數量化方案相比整數量化方案對模型效果造成的損失更小,所以浮點數常常被用作量化訓練的類型。這就引出了一些問題:整數類型量化訓練的經驗能否直接應用到浮點數類型的量化訓練任務中?如果不能,浮點數類型又會有怎樣的結論?量化訓練到底有沒有極限?

大模型社區亟需一個更加適合實際浮點數量化訓練的 Scaling Laws,指導大模型量化的實際選擇和未來探索方向。為了回答這些問題,騰訊混元團隊進行了 366 組不同參數規模和精度的浮點數量化訓練,對浮點數量化訓練進行詳細分析后提出了浮點數量化的 Scaling Laws。

  • 論文標題:《Scaling Laws for Floating–Point Quantization Training》
  • 論文鏈接:https://huggingface.co/papers/2501.02423

引言

大模型(Large Language Model, LLM)如今已經融入到我們生產生活的各個層面。大模型的參數規模不斷增大,調用量也持續升高,這使得大模型的訓練和推理成本成為 LLM 社區極為關注的重要問題。低比特量化技術能夠在一定程度上降低大模型訓練和推理的成本。鑒于此,這一技術在主流大模型的訓練和推理過程中得到了廣泛應用。前沿研究工作對 8 比特、4 比特甚至更低比特的量化策略進行了嘗試,并對這些策略予以驗證。

近期,論文《Scaling Laws for Precision》深入探討了整數類型量化策略下的精度對模型 loss 的影響,不過僅在附錄中簡略提及了浮點數類型量化策略的表現,并未深入探究。然而,在實際的生產過程中,特別是模型訓練方面,經驗表明浮點數量化(floating–point quantization)方案相比整數量化方案對模型效果造成的損失更小,所以浮點數更常被用于超低精度量化訓練。

騰訊混元團隊的新工作《Scaling Laws for Floating–Point Quantization Training》系統全面地研究了浮點數量化訓練的 Scaling Laws,填補了這一領域的空白。具體地,他們在大模型 Scaling Law 的經典要素:模型大小(簡稱 N)和訓練數據量(簡稱 D)之外,聯合考慮浮點數量化訓練中重要的量化目標,指數位(Exponent,簡稱 E),尾數位(Mantissa,簡稱 M),以及量化時放縮因子共享粒度(Block-size,簡稱 B)對于大模型訓練損失的影響。他們進行了 366 組不同參數規模和精度設置的浮點數量化訓練,得出最終的浮點數量化的統一 Scaling Law 形式如下:

圖片

并且依據這一 Scaling Law 深入分析與推導之后,能夠得出如下一些重要結論:

  • 在任意低精度大模型浮點數量化訓練中,都存在一個模型極限效果及對應的最佳數據量。超過此最佳數據量時繼續增加數據,反而會對模型效果產生負面影響;
  • 限定計算資源下,在一個非常大的算力范圍內,理論預測的最佳性價比的浮點數量化訓練精度落在 4-8 比特之間;
  • 在實際工作中,借助我們的 Scaling Laws 及其推論,同時結合計算資源圖片,可以明確得出不同計算資源下具有最佳性價比的浮點數量化訓練精度設置、模型參數量以及訓練數據量的配置策略。

最佳的浮點數

與整數類型只有符號位(Signal,簡稱 S)和整數位相比,參考 IEEE 754 標準,浮點數顯得復雜許多。它由符號位、指數位(Exponent,簡稱 E)和尾數位(Mantissa,簡稱 M)共同作用決定最終取值。

圖片

通過大量實驗與理論分析,騰訊混元團隊推導出了指數位和尾數位對最終模型效果之間的定量關系:

圖片

同時還得出給定精度(Precision,簡稱 P)P=1+E+M 情況下,指數位與尾數位的最佳配比規律需滿足:

圖片

未來硬件制造商也可以參考此結論,提供在不同精度下的浮點運算能力支持:

圖片

精細量化

量化過程中,為了減少精度損失會對需量化 Tensor 進行放縮(Scaling)。同時,為節省放縮因子(Scaling Factor)的存儲空間,通常會讓 Tensor 中的若干元素共享一個放縮因子。顯然,放縮因子共享粒度越大,其存儲空間越小,但由此帶來的量化損失也會越大。混元團隊定量地研究了放縮因子共享粒度(Block-size,簡稱 B)對模型效果的影響,發現訓練時的驗證損失(Validate Loss)與 B 的對數成正比例關系:圖片

Scaling Law

在綜合了所有浮點數量化訓練中影響模型效果的因素(如參數量 N,數據量 D,指數位 E,尾數位 M 和量化粒度 B)后,混元團隊最終得出了浮點數量化訓練的 Scaling Law:

圖片

前三項基于經典的 Chinchilla Scaling Law 的形式,第四項可以看做浮點數量化對于模型的額外損失。有意思的是,圖片可以被看作某種形式的 “知識密度”,而 E, M 和 B 的聯合項可以被看作某種形式的精度表示。直觀地分析,大模型過低精度下無法承載過高的知識密度,導致了額外損失。另外值得注意的是,我們 Scaling Law 中 N 和 D 的指數參數 α 和 β,在第一項 / 第二項 / 第四項都是完全相同的,形式更加統一。

為了判斷最終統一形式的泛化能力,騰訊混元團隊在小模型(41M - 679M)上擬合估算出 n, d, α, β, γ, δ, ν 以及 ? 等參數的取值后:

圖片

在更大的模型(1.2B)上也驗證了不同量化配置下的預測效果。

無法跨越的效果屏障

在上面 Scaling Law 公式里,第二項和第四項關于數據量(D)的部分構成一個有最值的函數,即存在一個關于 D 的 loss 最低點,這個最值點在:

圖片

注意此時這里并沒有給 Scaling Law 添加任何限制條件,這意味著當訓練某個模型時,每個精度都存在一個對應的極限效果,無論使用多少數據都無法超越。并且當使用的數據量超過 Dcrit 時,繼續增加數據反而對模型效果是有害的。

從公式中,我們發現,模型越小,精度越低,那么這個極限數據量就會越早到來,增加數據導致模型效果變差越明顯。因此,越小的模型越需要越大的精度才能保證給定數據的有效訓練。

圖片

這一隨著訓練進行損失不降反升的現象,也得到了混元團隊的真實訓練結果支持。但是,經過計算當采用 BF16 訓練 1B 參數量模型時,會發現這一極限數據量高達 1730T,這可能也是之前沒有人發現這一現象的原因。然而,隨著精度降低,比如采用 FP8-E4M3 時這一數值降低至 27T,而使用 FP4-E2M1 時則只有 0.4T。

限定資源下的最優解

于是可以得知,即使在無限資源下,由于效果屏障存在的原因,訓練模型時使用的數據量也不應該超過 Dcrit。那么在限定資源下,通過求解方程組:

圖片

可以得出一個符合經典冪律關系(Power-law)的最佳性價比精度配方:

圖片

根據實驗結果推算,在一個非常大的算力范圍內,理論預測的最佳性價比落在 4-8 比特之間。

圖片

精度與參數量的匯率

在資源受限的情況下,盡管我們已知在最佳性價比時精度應如何選取,然而參數量 N 與數據量 D 究竟該如何搭配這一問題依舊尚未得到解決。通過對方程組:

圖片

進行求解能夠發現,在限定資源的情況下,若要保持性價比,精度 P 和參數量 N 之間存在著一個類似于 “匯率” 的關系:

圖片

所以,在實際工作當中,可以借助 “精度 —— 參數量的匯率”,并且結合,進一步明確在最佳性價比下的精度 P、參數量 N 以及數據量 D 的配置策略。

這項研究為大模型訓練中的浮點數量化提供了重要的理論指導。其價值不僅在于明確了在給定資源和精度下的最優參數配置策略,幫助提高訓練效率和降低成本,而且對于推動大模型在實際應用中的更廣泛部署具有關鍵意義。通過揭示浮點數量化訓練的極限和規律,為硬件制造商優化浮點運算能力提供了依據,也為研究人員在大模型的優化和創新方面開辟了新的思路和方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-30 10:35:00

訓練數據模型

2024-06-21 11:44:17

2024-05-22 18:10:38

2025-04-16 02:30:00

2025-03-12 12:10:13

2025-03-03 04:20:00

2020-09-15 12:57:46

C 語言浮點數內存

2024-11-06 09:47:00

2023-09-07 11:48:36

騰訊混元大模型

2024-11-13 13:50:00

AI模型

2023-07-05 08:00:58

Redis數據庫

2023-10-26 15:38:03

混元大模型騰訊

2023-09-12 07:02:19

騰訊混元大模型

2024-07-29 09:10:00

模型數據

2024-09-05 16:37:37

2022-04-29 16:47:57

AI騰訊

2024-12-11 08:28:15

點贊
收藏

51CTO技術棧公眾號

亚洲国产精久久久久久| 91啪亚洲精品| 欧美剧在线观看| 岛国av免费观看| 中文字幕人成乱码在线观看| 国产精品美女一区二区| 96久久精品| 国产原创视频在线| 日本一区二区免费高清| 欧美大黄免费观看| 浮妇高潮喷白浆视频| 高清日韩av电影| 国产精品88av| 国产成人黄色av| 91视频免费在线看| 深爱激情综合| 精品国产一区久久| 免费一级特黄录像| jizz一区二区三区| 国产精品久久久久久久久图文区| 国产精品伊人日日| 一区二区三区亚洲视频| 模特精品在线| 欧美第一黄网免费网站| 在线观看免费黄色网址| 久9re热视频这里只有精品| 欧美挠脚心视频网站| 丝袜老师办公室里做好紧好爽| 黄色免费在线观看网站| xf在线a精品一区二区视频网站| 亚洲影视中文字幕| 中日精品一色哟哟| 国产亚洲精品v| 精品国内产的精品视频在线观看| 日韩av在线看免费观看| 欧美freesex8一10精品| 欧美大片一区二区| www.午夜av| 日本欧美韩国| 日韩欧美成人精品| 免费无码毛片一区二三区| 国产三区视频在线观看| 中文字幕av不卡| 欧美精品二区三区四区免费看视频 | 久久影院资源网| 青青青视频在线播放| 天堂99x99es久久精品免费| 亚洲第一中文字幕在线观看| 女同性αv亚洲女同志| 国产日韩欧美中文在线| 88在线观看91蜜桃国自产| 亚洲一区二区三区四区五区| 成人在线免费电影网站| 欧美视频第二页| 欧美精品久久久久久久久25p| 日本成人伦理电影| 欧美视频中文一区二区三区在线观看| caoporn超碰97| 日本h片久久| 欧美日韩国产系列| 亚洲黄色av片| 欧美日本三级| 精品国产免费人成电影在线观看四季| 九色91porny| 爱爱精品视频| 日韩经典中文字幕| 色哟哟精品观看| 日本不卡电影| 欧美大成色www永久网站婷| 极品颜值美女露脸啪啪| 一区在线播放| 欧美性受xxxx黑人猛交| 免费看污视频的网站| 美女在线一区二区| 91超碰在线免费观看| 91精品麻豆日日躁夜夜躁| 男人操女人免费| 在线观看精品| 欧美手机在线视频| 香蕉视频xxxx| 成人在线超碰| 亚洲另类激情图| 日韩毛片无码永久免费看| 97视频精品| 欧美激情一区二区久久久| 中文字幕一区二区三区精品 | 欧洲精品一区二区三区| 欧美三日本三级三级在线播放| 亚洲午夜激情影院| 9l视频自拍九色9l视频成人| 亚洲码在线观看| 影音先锋男人资源在线观看| 欧美激情五月| 久久久欧美一区二区| 欧美日韩综合在线观看| 蜜臀久久99精品久久久画质超高清| 亚洲free性xxxx护士hd| 午夜激情小视频| 国产精品美女久久久久久久久 | av资源网在线播放| 在线观看免费亚洲| 91人妻一区二区三区| 日韩影视高清在线观看| 久久手机免费视频| 久久夜色精品国产噜噜亚洲av| 韩国一区二区在线观看| 狠狠色综合色区| 亚乱亚乱亚洲乱妇| 欧美性猛交xxxx免费看漫画| 成人在线短视频| 欧美三级美国一级| 性欧美在线看片a免费观看| 伊人网站在线观看| 99久久国产综合精品色伊| 午夜啪啪免费视频| 日韩免费电影| 亚洲国产精品悠悠久久琪琪| 成人涩涩小片视频日本| 日韩va亚洲va欧美va久久| 国产精品久久久久免费| 麻豆tv入口在线看| 在线观看亚洲专区| 国产福利短视频| 国产精品v一区二区三区| 国产在线精品自拍| 国产精品二线| 一本色道久久综合亚洲aⅴ蜜桃| 午夜影院免费观看视频| 青青草成人影院| 日本久久久a级免费| 欧美一级一区二区三区| 有坂深雪av一区二区精品| 激情视频免费网站| 精品国产精品久久一区免费式| 国内精品免费午夜毛片| 丰满人妻一区二区三区免费视频| 中文字幕中文乱码欧美一区二区| 三年中国国语在线播放免费| 天天久久夜夜| 91精品国产高清久久久久久91| 囯产精品一品二区三区| 亚洲你懂的在线视频| 久久久久久久高清| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 国产手机精品视频| 成人免费视频在线观看| 涩涩网站在线看| 66国产精品| 亚洲一区二区少妇| 1stkiss在线漫画| 在线播放欧美女士性生活| 日本裸体美女视频| 久久国产麻豆精品| 在线观看成人av| 国产精品久久免费视频| 久久综合色影院| 性猛交xxxx乱大交孕妇印度| 夜夜嗨av一区二区三区四季av| 无码人妻丰满熟妇区毛片蜜桃精品| 欧美日韩18| 国产一区二区三区av在线 | 国产精品高精视频免费| 国产小视频免费在线网址| 色婷婷综合中文久久一本| 欧美黄色高清视频| 久久国产精品免费| av在线免费观看国产| 国产美女撒尿一区二区| 青青草国产精品一区二区| 国产一区二区三区福利| 欧美日韩极品在线观看一区| 国产精品 欧美激情| 成人手机在线视频| 欧美s码亚洲码精品m码| 精品高清久久| 91影院未满十八岁禁止入内| 国产在线88av| 中文字幕在线亚洲| 国产福利免费视频| 岛国av午夜精品| 精品人体无码一区二区三区| 国产精品自拍在线| 午夜肉伦伦影院| 久久精品影视| 激情小说综合网| 国产精品传媒麻豆hd| 久久6免费高清热精品| 亚洲AV成人无码一二三区在线| 欧美在线免费视屏| 国产一级特黄视频| 日本一区二区免费在线观看视频 | 一区不卡在线观看| 亚洲成人手机在线| 久久久免费看片| 大美女一区二区三区| 日本va中文字幕| 国产主播一区| 亚洲欧美一区二区原创| 国产精品18hdxxxⅹ在线| 国产精品久久久| 免费在线看电影| 这里只有精品丝袜| 丰满大乳国产精品| 欧美日韩大陆在线| 日韩在线视频免费播放| 亚洲精品亚洲人成人网| 国产视频三区四区| 不卡视频免费播放| 福利片一区二区三区| 久久国产精品久久久久久电车 | 精品国产sm最大网站| 亚洲国产无线乱码在线观看| 亚洲成人福利片| 久久精品一区二区三区四区五区| 2021国产精品久久精品| 欧美熟妇精品一区二区| 久久精品国产99久久6| 日韩中文字幕在线视频观看| 午夜精品亚洲| 一区二区免费电影| 精品理论电影| 久久这里精品国产99丫e6| 国产精品18hdxxxⅹ在线| 18成人在线| 国产区一区二| 川上优av一区二区线观看| 成人不卡视频| 国产成人福利视频| 欧美特大特白屁股xxxx| 午夜精品福利电影| 丁香花高清在线观看完整版| 欧美成人一区在线| av在线导航| 久久精品99久久香蕉国产色戒| 高清av在线| 亚洲最新av在线| 国产视频第一页在线观看| 精品一区二区三区四区| 天天操天天干天天| 亚洲国语精品自产拍在线观看| 亚洲av无码国产综合专区| 欧美一区二区在线免费播放 | 3d性欧美动漫精品xxxx软件| 欧美一级淫片播放口| 中文字幕乱码在线播放| 日本精品久久久久久久| 黑人巨大精品| 国产国语videosex另类| 欧美韩国亚洲| 国产精品普通话| 精品欧美一区二区三区在线观看| 日本久久久久久久| 懂色aⅴ精品一区二区三区| 国产精品人人做人人爽| 久久福利在线| 亚洲最大成人在线| 午夜视频一区二区在线观看| 国产精品一区二| 日韩大片在线免费观看| 色噜噜狠狠一区二区三区| 日韩精品久久| 超碰97在线看| 国产午夜精品一区二区三区欧美| 欧美日韩中文在线视频| 蜜臀久久99精品久久久久宅男| 亚洲男人天堂av在线| 国产精品一区专区| 无码任你躁久久久久久老妇| 97精品国产露脸对白| 韩国女同性做爰三级| 国产精品国产馆在线真实露脸| 国语对白在线播放| 亚洲国产综合视频在线观看| 国产精品视频一区在线观看| 欧美日韩亚洲综合在线| 国产成人毛毛毛片| 日韩精品在线观看一区二区| av在线免费观看网| 久久国产精品99国产精| 精品极品在线| 国产女精品视频网站免费| 精品国产亚洲一区二区三区| 精品一区国产| 国产精品久久占久久| 男的插女的下面视频| 日韩高清电影一区| 国模大尺度视频| 久久久久国产精品人| 中文字幕在线有码| 欧美午夜视频一区二区| 一区不卡在线观看| 日韩国产高清污视频在线观看| 91精品国产91久久久久游泳池| 欧美噜噜久久久xxx| 成人性生交大片免费观看网站| 成人黄色片网站| 米奇777超碰欧美日韩亚洲| 在线国产伦理一区| 亚洲一区二区三区四区五区午夜| av亚洲天堂网| xnxx国产精品| 精品在线免费观看视频| 欧美视频一区二区在线观看| 天堂成人在线观看| 久久伊人91精品综合网站| 欧美gay视频| 999热视频| 婷婷激情综合| 国产成人综合一区| 成人国产电影网| 久久国产精品国语对白| 一本大道久久a久久综合婷婷| 不卡视频免费在线观看| 最近2019中文免费高清视频观看www99 | 97影院秋霞午夜在线观看| 热久久这里只有| 亚洲国产欧美在线观看| 色一情一乱一伦一区二区三区丨| 一区二区日本视频| 在线成人免费av| 国产精品乱人伦| 九九热最新视频| 精品无人区乱码1区2区3区在线| 日本动漫同人动漫在线观看| 成人激情视频在线播放| 日本黄色精品| 欧美两根一起进3p做受视频| av毛片久久久久**hd| 国产亚洲精品女人久久久久久| 91精品国产色综合久久不卡蜜臀| 在线观看美女网站大全免费| 国产精品91在线| 你懂的一区二区三区| 亚洲爆乳无码专区| 91美女片黄在线观看| 国产尤物在线视频| 亚洲国内精品视频| 日本蜜桃在线观看视频| 国产日韩欧美二区| 亚洲视频二区| 亚洲精品乱码久久久久久久| 天天亚洲美女在线视频| 色窝窝无码一区二区三区成人网站 | 国精产品99永久一区一区| 亚洲无毛电影| 欧亚乱熟女一区二区在线| 亚洲成人免费视| 色综合免费视频| 欧美一级大片在线观看| 在线一级成人| 亚洲欧美另类动漫| 中文字幕高清一区| 岳乳丰满一区二区三区| 久久精品中文字幕| 亚洲综合色婷婷在线观看| 国产玉足脚交久久欧美| 91亚洲永久精品| 不卡av电影在线| 精品久久久av| 136福利精品导航| 亚欧无线一线二线三线区别| 久久―日本道色综合久久| 在线观看 亚洲| 日韩在线国产精品| 日韩视频一区二区三区四区| 精品少妇人欧美激情在线观看| 91蜜桃网址入口| 伊人精品一区二区三区| 久精品免费视频| 欧美顶级毛片在线播放| 人妻丰满熟妇av无码区app| 国产精品美女久久久久久久久久久| 国产视频在线观看视频| 69精品小视频| 色婷婷色综合| 最新中文字幕日本| 日韩欧美国产网站| 色大18成网站www在线观看| 波多野结衣一区二区三区在线观看| 国产精品亚洲综合色区韩国| 手机av在线不卡| 精品国产免费一区二区三区香蕉| 午夜激情成人网| 日韩免费在线观看av| 久久亚洲欧美国产精品乐播| 国产精品久久久久久久久毛片| 国内久久久精品| 日韩欧美视频在线播放| jjzz黄色片| 欧美影院一区二区| 成年人国产在线观看| 亚洲福利av在线| 成人性视频网站| 中文在线观看av| 午夜精品久久久久久99热| 久久视频精品| 丰满少妇一区二区三区| 亚洲.欧美.日本.国产综合在线| 网曝91综合精品门事件在线| 成年网站在线播放|