精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Scaling Laws終結(jié),量化無用,AI大佬都在審視這篇論文

人工智能 新聞
研究表明,你訓(xùn)練的 token 越多,你需要的精度就越高。

最近幾天,AI 社區(qū)都在討論同一篇論文。

UCSD 助理教授 Dan Fu 說它指明了大模型量化的方向。

圖片

CMU 教授 Tim Dettmers 則直接說:它是很長一段時(shí)間以來最重要的一篇論文。OpenAI 創(chuàng)始成員、特斯拉前 AI 高級總監(jiān) Andrej Karpathy 也轉(zhuǎn)發(fā)了他的帖子。

圖片

Tim Dettmers 表示,可以說,人工智能的大部分進(jìn)步都來自計(jì)算能力的提升,而(在最近)這主要依賴于低精度路線的加速(32- > 16 - > 8 位)。現(xiàn)在看來,這一趨勢即將結(jié)束。再加上摩爾定律的物理限制,大模型的大規(guī)模擴(kuò)展可以說要到頭了。

例如,英偉達(dá)最新的 AI 計(jì)算卡 Blackwell 將擁有出色的 8 位能力,并在硬件層面實(shí)現(xiàn)逐塊量化。這將使 8 位訓(xùn)練變得像從 FP16 切換到 BF16 一樣簡單。然而,正如我們從新論文中看到的那樣,對于很多大模型的訓(xùn)練來說,8 位是不夠的。

與其他模型相比,Llama 405B 沒有得到太多應(yīng)用的主要原因是它體量太大了,運(yùn)行 405B 模型進(jìn)行推理非常麻煩。但論文表明,訓(xùn)練較小的模型(例如 70B)時(shí),你也無法在低精度下有效地訓(xùn)練這些模型。見下圖 8B(圓形) 70B(三角形) 405B(星型):

圖片

可見對于 20B Token 數(shù)據(jù)的訓(xùn)練,訓(xùn)練 8B 模型在 16 位中效率更高。對于 70B 模型來說 8 位仍然有效,但效率越來越低。

Tim Dettmers 感嘆道:從我自己的經(jīng)驗(yàn)(大量失敗的研究)來看,效率是無法欺騙的。如果量化失敗,那么稀疏化也會失敗,其他效率機(jī)制也會失敗。如果這是真的,那么我們現(xiàn)在就已經(jīng)接近最優(yōu)了。

那以后我們怎么辦?眼前似乎只有三條可能的路線:

  • 擴(kuò)大數(shù)據(jù)中心規(guī)模:未來約 2 年這仍然是可以做到的事;
  • 通過動態(tài)擴(kuò)展:路由到更小的專門模型或大 / 小模型上;
  • 知識的提煉:這條路線與其他技術(shù)不同,并且可能具有不同的特性。

對于新硬件來說,我們?nèi)匀挥?HBM4 內(nèi)存,這將是一個很好的提升。但 FP4 訓(xùn)練似乎是一個謊言,節(jié)點(diǎn)縮小不會再增加多少效率了。

這篇名為《Scaling Laws for Precision》的論文顧名思義,制定了一個和大語言模型使用數(shù)據(jù)精度有關(guān)的擴(kuò)展定律,涵蓋了訓(xùn)練前和訓(xùn)練后。

圖片

  • 論文標(biāo)題:Scaling Laws for Precision
  • 論文鏈接:https://arxiv.org/abs/2411.04330

據(jù)論文一作,來自哈佛大學(xué)的 Tanishq Kumar 介紹,他們的研究認(rèn)為:

  • 由于當(dāng)代大模型在大量數(shù)據(jù)上經(jīng)歷了過度訓(xùn)練,因此訓(xùn)練后量化已變得非常困難。因此,如果在訓(xùn)練后量化,最終更多的預(yù)訓(xùn)練數(shù)據(jù)可能會造成副作用;
  • 在預(yù)訓(xùn)練期間以不同的精度放置權(quán)重、激活或注意力的效果是一致且可預(yù)測的,并且擬合擴(kuò)展定律表明,高精度(BF16)和下一代精度(FP4)的預(yù)訓(xùn)練可能都是次優(yōu)的設(shè)計(jì)選擇。

低精度訓(xùn)練和推理會影響語言模型的質(zhì)量和成本,但當(dāng)前的大模型 Scaling Law 并未考慮到這一點(diǎn)。在這項(xiàng)工作中,研究人員為訓(xùn)練和推理設(shè)計(jì)了「精度感知」擴(kuò)展定律。

作者提出,以較低的精度進(jìn)行訓(xùn)練會降低模型的有效參數(shù)數(shù)量,從而使我們能夠預(yù)測低精度訓(xùn)練和訓(xùn)練后量化帶來的額外損失。對于推理,隨著模型在更多數(shù)據(jù)上進(jìn)行訓(xùn)練,訓(xùn)練后量化帶來的性能下降會加劇,最終導(dǎo)致額外的預(yù)訓(xùn)練數(shù)據(jù)產(chǎn)生負(fù)面影響。對于訓(xùn)練,擴(kuò)展定律使我們能夠預(yù)測具有不同精度的不同部分的模型的損失,以較低精度訓(xùn)練較大的模型可能是計(jì)算最優(yōu)的。

該工作統(tǒng)一了訓(xùn)練后量化和訓(xùn)練前量化的擴(kuò)展定律,得出一個單一的函數(shù)形式,可以預(yù)測不同精度下訓(xùn)練和推理的性能下降。

預(yù)訓(xùn)練 scaling law 表明,計(jì)算最佳預(yù)訓(xùn)練精度通常獨(dú)立于計(jì)算預(yù)算。然而,令人驚訝的是,如果模型大小受到限制,這種獨(dú)立性就不再成立,在這種情況下,計(jì)算最佳精度在計(jì)算中增長緩慢。

該研究以 3-16 bit 精度預(yù)訓(xùn)練了 465 個語言模型,并對每個模型進(jìn)行了訓(xùn)練后量化。對于具有 N 個參數(shù)的語言模型,在 D 個 token 上進(jìn)行訓(xùn)練,訓(xùn)練精度為 P_train,訓(xùn)練后權(quán)重精度為 P_post,該研究最終找到了一個統(tǒng)一的 Scaling Law,其形式如下:

圖片

其中,A、B、E、α、β 是正擬合常數(shù),δ_PTQ 是指推理前訓(xùn)練后量化引起的損失退化。

研究簡介

該研究首先研究了訓(xùn)練后量化模型權(quán)重的常用方法,發(fā)現(xiàn)訓(xùn)練時(shí)間越長 / 預(yù)訓(xùn)練期間「看到」的數(shù)據(jù)越多,模型在推理時(shí)對量化就越敏感,這解釋了為什么 Llama-3 可能更難量化。

圖片

事實(shí)上,這種損失退化大致是預(yù)訓(xùn)練期間看到的 token / 參數(shù)比值的冪律,因此可以提前預(yù)測關(guān)鍵數(shù)據(jù)大小,超過該數(shù)據(jù)大小的更多數(shù)據(jù)的預(yù)訓(xùn)練會非常有害。直覺可能是,當(dāng)你訓(xùn)練更多的數(shù)據(jù)時(shí),更多的知識被壓縮成權(quán)重,給定的擾動會對模型性能造成更大的損害。

圖片

圖 1:主要發(fā)現(xiàn)示意圖。在 BF16 中將固定大小的模型在各種數(shù)據(jù)預(yù)算上訓(xùn)練,并在最后量化權(quán)重。可以發(fā)現(xiàn),由于訓(xùn)練后量化而導(dǎo)致的退化會隨著預(yù)訓(xùn)練期間看到的 token 數(shù)量增加而增加,因此額外的預(yù)訓(xùn)練數(shù)據(jù)可能會造成損害。

圖片

經(jīng)過擴(kuò)展驗(yàn)證表明,以較低的精度訓(xùn)練較大的模型可以實(shí)現(xiàn)計(jì)算優(yōu)化。

然后該研究將注意力轉(zhuǎn)向低精度訓(xùn)練,主要研究量化感知訓(xùn)練(僅權(quán)重)和低精度訓(xùn)練。該研究將模型分解為權(quán)重、激活和 KV 緩存,找到其中任何一個量化到任意精度時(shí)損失的 Scaling Law,并開發(fā)一種組合且可解釋的函數(shù)形式來預(yù)測在預(yù)訓(xùn)練期間,量化這三者的任意組合對損失的影響。

該研究的 Scaling Law 依賴于「有效參數(shù)計(jì)數(shù)」的概念,研究團(tuán)隊(duì)假設(shè)當(dāng)你降低精度,參數(shù)也降低一定數(shù)量,計(jì)數(shù)就降低,那么包含 FP4 中所有內(nèi)容的 10 億參數(shù)模型具有可比較的數(shù)量 BF16 中 250m 模型的「有效參數(shù)」。

圖片

雖然權(quán)重可以毫無問題地以低精度進(jìn)行訓(xùn)練,但激活和 KV 緩存很敏感。

圖片

最后,該研究將訓(xùn)練前和訓(xùn)練后的發(fā)現(xiàn)統(tǒng)一為可解釋的函數(shù)形式,可以以任何精度組合預(yù)測訓(xùn)練前和訓(xùn)練后的損失。

該研究還發(fā)現(xiàn),低精度的預(yù)訓(xùn)練可以以定量可預(yù)測的方式「增強(qiáng)」模型的訓(xùn)練后量化,但其程度低于直觀預(yù)期。

圖片

作者表示:「該研究在進(jìn)行實(shí)驗(yàn)時(shí)保持受控的架構(gòu)和設(shè)置,但在實(shí)踐中,通常會故意進(jìn)行架構(gòu)調(diào)整以適應(yīng)低精度訓(xùn)練。」這也是這項(xiàng)研究的一點(diǎn)局限性。

感興趣的讀者可以閱讀論文原文,了解更多研究內(nèi)容。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-11-13 15:00:42

2025-01-17 09:20:00

2024-12-30 10:35:00

訓(xùn)練數(shù)據(jù)模型

2025-09-02 12:04:09

2024-11-18 10:15:00

AI模型

2024-11-01 09:45:08

2025-09-02 17:40:11

AI模型深度學(xué)習(xí)

2024-12-16 07:15:00

2025-02-27 12:42:54

2025-05-16 13:50:34

ACL論文競爭

2021-07-08 10:13:04

AI 數(shù)據(jù)人工智能

2021-04-27 07:59:11

內(nèi)聯(lián)匯編 C 語言 asm 關(guān)鍵字

2021-03-05 09:43:47

數(shù)字經(jīng)濟(jì)互聯(lián)網(wǎng)科技公司

2025-11-17 16:30:48

AI大模型論文

2020-01-09 16:45:37

AI人工智能危機(jī)

2025-09-11 09:09:42

2015-03-09 10:10:19

科技兩會

2018-06-05 11:27:12

2025-02-21 13:20:00

2020-02-05 16:50:26

AI人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

成熟亚洲日本毛茸茸凸凹| 亚洲91中文字幕无线码三区| 色综合天天在线| 视频一区二区综合| 成人黄色免费视频| 日韩午夜激情| 日韩视频在线免费观看| 国产免费无码一区二区| 韩国美女久久| 亚洲精品免费一二三区| 蜜桃视频成人| www.亚洲欧美| 免费在线观看成人| 97国产精品视频| 三级黄色免费观看| 九色精品91| 精品国产一区二区三区久久久蜜月| 欧美牲交a欧美牲交aⅴ免费真| 黄色av免费在线| 久久久精品中文字幕麻豆发布| 国产精品专区h在线观看| 日韩精品一区二区三| 亚洲精品成人无限看| 国产亚洲激情在线| 波多野结衣一二三区| gogo大尺度成人免费视频| 在线亚洲欧美专区二区| 国产日韩av网站| 成人福利在线观看视频| 久久久久九九视频| 国产伦精品一区| av免费在线观看不卡| 日本美女一区二区| 欧美影院在线播放| 激情综合网五月婷婷| 欧美久久成人| 色综合男人天堂| www.黄色com| 欧美精品一二| 亚洲欧美国产高清va在线播| 一边摸一边做爽的视频17国产| 中文成人在线| 88在线观看91蜜桃国自产| 日日噜噜噜噜久久久精品毛片| 国产网站在线| 亚洲成人福利片| 成人性免费视频| 成人爽a毛片免费啪啪动漫| 亚洲女人小视频在线观看| 一区二区三区av在线| 在线免费看黄网站| 一区二区中文字幕在线| 色中文字幕在线观看| 免费人成在线观看播放视频| 国产精品久久久久一区二区三区共 | 中文字幕影音在线| 欧美日韩激情视频| 人妻精品无码一区二区三区 | 中文字幕乱码在线人视频| 视频免费一区二区| 亚洲国产精品va在线看黑人| 国产麻豆剧传媒精品国产av| 久久婷婷国产| 亚洲欧美日韩国产中文| 四虎国产精品成人免费入口| av中文字幕一区二区| 日韩在线视频播放| 日本青青草视频| 亚洲第一毛片| 日本精品久久久久影院| 中文字幕欧美人妻精品一区蜜臀| 久久99久久99| 国产精品视频免费观看| 欧美欧美欧美| 成人欧美一区二区三区1314| 久久人妻无码一区二区| av在线中出| 日本韩国欧美国产| 青青草原播放器| 亚洲老司机网| 亚洲国产精品福利| 真实乱视频国产免费观看| 99久精品视频在线观看视频| 久久999免费视频| 麻豆精品久久久久久久99蜜桃| 日韩avvvv在线播放| 69堂成人精品视频免费| 性感美女福利视频| 国产精品视频一二三| www.黄色网址.com| 中文日产幕无线码一区二区| 欧美日韩国产天堂| 亚洲视频在线播放免费| 99久久精品费精品国产风间由美| 欧美激情精品在线| 国产精品第6页| 成人性生交大片免费| 视频一区二区在线观看| 俄罗斯一级**毛片在线播放| 在线影视一区二区三区| 麻豆精品国产传媒| av中文字幕一区二区| 亚洲 日韩 国产第一| 一本一道精品欧美中文字幕| av一区二区三区| 日本一区二区免费高清视频| 不卡福利视频| 欧美变态tickle挠乳网站| 久久久久久国产免费a片| 亚洲成人中文| 999热视频在线观看| 国产剧情在线观看| 午夜精品久久久久久久| 午夜福利123| 欧美精品一二| 欧美在线视频一区二区| 亚洲乱码在线观看| 国产精品国产a| 性生交免费视频| 欧美天堂社区| 久久久久久美女| 99免费在线视频| 国产精品国产三级国产普通话蜜臀 | 欧美中文娱乐网| 97人人爽人人澡人人精品| 91精品国产综合久久久蜜臀粉嫩| 91成人在线免费视频| 99综合视频| 国产精品一区二区免费| 中文字幕在线观看播放| 7777精品久久久大香线蕉| 东京热无码av男人的天堂| 视频一区二区三区在线| 鲁鲁视频www一区二区| av成人福利| 精品久久久久久久久久久院品网 | 日本精品视频一区二区三区| 你懂的在线观看网站| 亚洲网站视频| 国产66精品久久久久999小说| 老司机在线看片网av| 欧美日韩色一区| 国产黄色大片免费看| 三级亚洲高清视频| 日本一区二区三区视频在线播放| 亚洲精品成人图区| 亚洲欧美国产精品专区久久| 特黄视频免费看| 2014亚洲片线观看视频免费| 波多野结衣家庭教师在线播放| 国产一区丝袜| 91国在线精品国内播放| 亚洲aⅴ乱码精品成人区| 都市激情亚洲色图| 91视频在线网站| 天堂va蜜桃一区二区三区漫画版| 欧美日韩综合网| 欧美日韩五区| 久久精品99国产精品酒店日本| 亚洲视频在线观看一区二区| 欧美国产精品中文字幕| 亚洲人视频在线| 国产精品a久久久久| 国产精品久久波多野结衣| 久草在线中文最新视频| 亚洲片在线观看| 一区二区视频在线免费观看| 中文字幕一区二区三中文字幕| 日韩成人精品视频在线观看| 欧美日韩网站| 久久riav二区三区| 精品成人免费一区二区在线播放| 自拍偷拍免费精品| a天堂在线视频| 香蕉成人啪国产精品视频综合网| 蜜臀av一区二区三区有限公司| 爽好多水快深点欧美视频| 中文字幕一区综合| 精品深夜福利视频| 国产精品久久久久99| 最新av在线播放| 亚洲精品一区二区三区婷婷月| 欧美成人一区二区视频| 亚洲精品免费播放| 亚洲做受高潮无遮挡| 久久99精品视频| 亚洲人精品午夜射精日韩| jvid福利在线一区二区| 粉嫩高清一区二区三区精品视频 | 国产精品久久亚洲7777| 偷拍视频一区二区三区| 久久综合久中文字幕青草| 亚洲三级黄色片| 欧美精品 国产精品| 国产成人亚洲欧洲在线| 国产精品情趣视频| 午夜av免费看| 久久成人久久鬼色| 欧美亚洲精品一区二区| 99久久九九| 欧美一区免费视频| 视频二区欧美| 国产精品一区二区三区久久久| 超黄网站在线观看| 精品国产网站地址| 极品美乳网红视频免费在线观看| 日韩丝袜美女视频| 中文字字幕在线观看| 欧美性极品xxxx娇小| 久草福利资源在线观看| 国产精品美女久久久久aⅴ国产馆| 99精品一区二区三区无码吞精| 狠狠色丁香婷婷综合| 国产日韩一区二区在线观看| 欧美午夜一区二区福利视频| 在线视频精品一区| 精品产国自在拍| 精品日本一区二区三区在线观看| 亚洲伊人精品酒店| 国产精品久久久久久久7电影| 国产经典三级在线| 久久伊人精品一区二区三区| av片在线看| 亚洲欧美综合v| 香蕉视频网站在线| 亚洲国产精品人人爽夜夜爽| 97人妻一区二区精品免费视频| 色婷婷国产精品综合在线观看| 日韩 国产 在线| 亚洲国产一区二区视频| 全网免费在线播放视频入口 | 国产av熟女一区二区三区| 99久久夜色精品国产亚洲1000部| 午夜精品一区二区在线观看| 亚洲人成伊人成综合图片| 久久久久一区二区| 激情小说一区| 国产在线精品一区二区三区》| 国产亚洲精品美女久久| 激情视频一区二区| 美日韩黄色大片| 精品国产一二| 成人高潮a毛片免费观看网站| 99r国产精品视频| 一本一道久久a久久| 97视频中文字幕| 亚洲视频国产| 精品1区2区| 亚洲视频分类| 亚欧精品在线| 国产精品久久久久蜜臀| 亚洲国产精品女人| 伊人久久大香线蕉综合四虎小说| 欧美少妇在线观看| 欧美日本二区| 91专区在线观看| 久久中文在线| 不卡av免费在线| 美女视频黄免费的久久 | 中文字幕乱码日本亚洲一区二区| 变态另类ts人妖一区二区| 中文字幕欧美区| 色老板免费视频| 亚洲一区二区三区中文字幕在线| 日本一区二区欧美| 欧美性极品xxxx做受| 中文字幕在线播放不卡| 制服丝袜亚洲播放| 亚洲高清视频在线播放| 亚洲美女中文字幕| 日本在线免费看| 欧美精品激情blacked18| 亚洲黄色免费看| 91精品国产综合久久久久久久久| 欧美经典一区| 久久另类ts人妖一区二区| 欧美日中文字幕| 青青草视频在线视频| 一本色道精品久久一区二区三区| 免费看国产黄色片| 国产高清久久久久| 午夜理伦三级做爰电影| 综合精品久久久| 国产无遮无挡120秒| 日本高清不卡一区| 99在线观看免费| 亚洲欧洲自拍偷拍| 午夜成年人在线免费视频| 45www国产精品网站| 亚洲国产91视频| 精品日韩美女| 羞羞色午夜精品一区二区三区| 91动漫在线看| 久久69国产一区二区蜜臀| 久久福利小视频| 亚洲天堂中文字幕| 亚洲综合久久网| 日韩欧美亚洲国产精品字幕久久久| 天堂91在线| 精品中文字幕在线2019| 国产成人精品123区免费视频| 99久久无色码| 99久久婷婷这里只有精品| 久久精品国产精品亚洲色婷婷| 国产在线看一区| 九九九视频在线观看| 天天做天天摸天天爽国产一区| 亚洲综合精品国产一区二区三区| 亚洲福利影片在线| 2024最新电影免费在线观看| 国产精品99久久久久久www| 精品精品国产毛片在线看| 成人免费看片视频在线观看| 日本不卡的三区四区五区| 国产亚洲色婷婷久久99精品91| 亚洲免费观看高清完整| 中文字幕在线观看国产| 亚洲人成电影网站色…| 九色porny丨国产首页在线| 99中文视频在线| 亚洲va在线| xxww在线观看| 国产午夜亚洲精品不卡| 成人精品免费在线观看| 亚洲成人免费网站| 中文字幕在线播放网址| 91丨九色丨国产在线| 欧美少妇xxxx| 免费观看成人网| 久久免费的精品国产v∧| 久久精品国产亚洲av无码娇色| 91精品国产综合久久精品性色| 91短视频版在线观看www免费| 国产精品∨欧美精品v日韩精品| 羞羞答答一区二区| 男人天堂1024| 91婷婷韩国欧美一区二区| 欧美啪啪小视频| 亚洲女成人图区| 免费电影日韩网站| 欧美日韩精品一区| 母乳一区在线观看| 日本少妇高潮喷水xxxxxxx| 91久久国产综合久久| 黄色av网站在线| 国产精品av在线播放| 精品高清在线| jizzzz日本| 亚洲免费看黄网站| www.午夜激情| 97在线免费观看| 亚洲区小说区图片区qvod| 毛葺葺老太做受视频| 欧美激情一区二区三区不卡 | 国产奶头好大揉着好爽视频| 久久99国产乱子伦精品免费| 国产精品三区在线观看| 欧美大胆一级视频| f2c人成在线观看免费视频| 久久精品日韩精品| 玖玖在线精品| 三级黄色在线观看| 欧美成人a∨高清免费观看| 678在线观看视频| 免费久久99精品国产自| 美女网站色91| 久草视频中文在线| 亚洲精品不卡在线| 国精产品一区一区三区四川| 亚洲一区bb| 成人性生交大片免费看中文网站| av大片在线免费观看| 中文字幕日韩在线视频| 视频一区日韩精品| 黄色动漫在线免费看| 国产精品久久久久永久免费观看 | 九九热只有这里有精品| 久久久久久久久久久黄色| 一二三四区视频| 午夜精品久久久久久99热| 成人黄色av| 91超薄肉色丝袜交足高跟凉鞋| 色综合久久综合中文综合网| 日本最新在线视频| 好看的日韩精品视频在线| 免费亚洲电影在线| 国产精品变态另类虐交| 国产亚洲精品成人av久久ww| 人人爱人人干婷婷丁香亚洲| 日本三级免费网站| 一区视频在线播放| 日色在线视频| 99在线观看视频| 免费看欧美美女黄的网站| 精品少妇久久久| 日韩在线免费高清视频| 香蕉久久夜色精品国产使用方法| 久久6免费视频| 色噜噜狠狠成人中文综合| 婷婷色在线播放|