精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws

發(fā)布于 2025-2-14 12:34
瀏覽
0收藏

眾所周知,知識(shí)蒸餾技術(shù)當(dāng)前正被大模型領(lǐng)域廣泛使用,它可以在大幅壓縮模型體量的同時(shí)保持一定的性能、降低模型時(shí)延、提升模型精度,與此同時(shí)還能對(duì)知識(shí)域進(jìn)行集成和遷移。


近日,蘋(píng)果研究人員提出了一種蒸餾擴(kuò)展定律(Distillation Scaling Laws),基于計(jì)算預(yù)算及其在學(xué)生和教師之間的分配,我們現(xiàn)在開(kāi)始可以估算蒸餾模型的性能了。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

圖 1. 蒸餾擴(kuò)展定律的外推。蒸餾擴(kuò)展定律適用于一系列損失為 LT 的教師的弱學(xué)生模型(L_S > 2.3)。實(shí)線表示給定學(xué)生配置(插值)下未見(jiàn)過(guò)的教師的預(yù)測(cè)模型行為,虛線表示見(jiàn)過(guò)的教師之外和強(qiáng)學(xué)生區(qū)域(L_S ≤ 2.3)的預(yù)測(cè)模型行為。如圖所示,學(xué)生的表現(xiàn)可以勝過(guò)老師(詳情見(jiàn)圖 2、3 和 41)。


蘋(píng)果研究者認(rèn)為,該發(fā)現(xiàn)降低了大規(guī)模使用蒸餾的風(fēng)險(xiǎn),現(xiàn)在我們可以基于此優(yōu)化教師和學(xué)生模型的計(jì)算分配,以最大化學(xué)生模型的性能。該工作提供的計(jì)算最優(yōu)的蒸餾方案適用于兩種情況:1)已有教師模型,或 2)需要訓(xùn)練教師模型。


如果要蒸餾多個(gè)學(xué)生模型,或者已有教師模型,蒸餾在計(jì)算水平上優(yōu)于監(jiān)督預(yù)訓(xùn)練,直到計(jì)算水平隨著學(xué)生模型規(guī)模的增加而可預(yù)測(cè)地增長(zhǎng)。如果要蒸餾一個(gè)學(xué)生模型且還需要訓(xùn)練教師模型,則應(yīng)采用監(jiān)督學(xué)習(xí)。此外,作者在大規(guī)模蒸餾研究中提供了深入的見(jiàn)解,這些見(jiàn)解增加了我們對(duì)蒸餾的理解,并為實(shí)驗(yàn)設(shè)計(jì)提供了信息。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

  • 論文標(biāo)題:Distillation Scaling Laws
  • 論文鏈接:https://arxiv.org/pdf/2502.08606

大模型的擴(kuò)展定律(Scaling Laws)表明,如果先前訓(xùn)練的語(yǔ)言模型(LM)遵循計(jì)算最優(yōu)訓(xùn)練范式,就可以隨著計(jì)算力提升而提升。由于推理成本的持續(xù)增長(zhǎng),目前這種定律難以持續(xù),人們嘗試使用過(guò)度訓(xùn)練(其中訓(xùn)練數(shù)據(jù)量遠(yuǎn)大于計(jì)算最優(yōu)情況)來(lái)實(shí)現(xiàn)小型、功能強(qiáng)大的模型。這些模型的構(gòu)建既昂貴又耗時(shí)。


我們正在尋求與訓(xùn)練算力投入相匹配,但訓(xùn)練成本更低的模型,蒸餾是一種流行的方法。但長(zhǎng)期以來(lái),學(xué)界對(duì)蒸餾缺乏共識(shí),并不了解如何分配計(jì)算資源,以產(chǎn)生最強(qiáng)大的模型。為了彌補(bǔ)這一知識(shí)差距,研究人員對(duì)蒸餾進(jìn)行了廣泛研究,學(xué)生和老師的參數(shù)范圍從 1.43 億到 126 億,使用訓(xùn)練數(shù)據(jù)最多達(dá) 5120 億 token。

研究發(fā)現(xiàn):

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

  1. 一個(gè)大小為 N_S 的學(xué)生模型,通過(guò)從大小為 N_T 的教師模型中蒸餾 D_S 個(gè) token 所得到的交叉熵,可以通過(guò)蒸餾擴(kuò)展定律(公式 8)進(jìn)行預(yù)測(cè)。
  2. 老師大小 N_T 和老師訓(xùn)練 token 數(shù)量 D_T 僅通過(guò)確定老師的交叉熵 L_T = L_T (N_T , D_T) 來(lái)確定學(xué)生交叉熵;
  3. 老師交叉熵對(duì)學(xué)生損失的影響遵循冪律,該冪律根據(jù)學(xué)生和老師的相對(duì)學(xué)習(xí)能力在兩種行為之間轉(zhuǎn)換,反映了蒸餾中稱為能力差距的現(xiàn)象,即較強(qiáng)的老師會(huì)產(chǎn)生較差的學(xué)生。該工作的參數(shù)化解決了有關(guān)能力差距懸而未決的問(wèn)題,表明這是老師和學(xué)生之間學(xué)習(xí)能力(假設(shè)空間和優(yōu)化能力)的差距,而不僅僅是他們的相對(duì)大小,后者其實(shí)是一種特殊情況。


該結(jié)果表明,當(dāng)兩個(gè)學(xué)習(xí)過(guò)程都有足夠的數(shù)據(jù)或計(jì)算時(shí),蒸餾不能產(chǎn)生比監(jiān)督學(xué)習(xí)更低的模型交叉熵。但是,如果以下兩個(gè)條件都成立,則蒸餾比監(jiān)督學(xué)習(xí)更有效:


1. 用于學(xué)生的總計(jì)算或 token 不大于新擴(kuò)展定律給出的學(xué)生大小相關(guān)閾值;

2. 老師已經(jīng)存在,或者要訓(xùn)練的老師有超出單次蒸餾的用途。


新的定律和分析有望指導(dǎo) AI 社區(qū)構(gòu)建更強(qiáng)大的模型,實(shí)現(xiàn)更低的推理成本和總計(jì)算成本。

蒸餾擴(kuò)展率

文章概述了他們?nèi)绾蔚贸稣麴s擴(kuò)展率所采取的步驟。


首先是實(shí)驗(yàn)設(shè)置。本文的目標(biāo)是理解教師模型在蒸餾過(guò)程中的作用,因此,該研究在純蒸餾情況下(λ = 1,公式 7)進(jìn)行蒸餾,以避免數(shù)據(jù)帶來(lái)的混淆。本文驗(yàn)證了 λ = 1 的選擇能夠產(chǎn)生與最優(yōu) λ? 統(tǒng)計(jì)相似的結(jié)果。同樣,所有實(shí)驗(yàn)均使用蒸餾溫度(τ = 1),因?yàn)樵撗芯堪l(fā)現(xiàn)這能產(chǎn)生性能最佳的學(xué)生模型。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)


蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

表 1 是文中出現(xiàn)的符號(hào)代表內(nèi)容:

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

對(duì)應(yīng)中文版本

此外,對(duì)于實(shí)驗(yàn)數(shù)據(jù)的選擇,本文結(jié)合了三種方案:


固定 M 的教師 / 學(xué)生 IsoFLOP 實(shí)驗(yàn):


本文預(yù)測(cè)在固定教師模型的情況下,學(xué)生模型的參數(shù)(N_S)和訓(xùn)練 token 數(shù)量(D_S)之間會(huì)呈現(xiàn)出冪律行為。


為了在給定的計(jì)算預(yù)算內(nèi)生成盡可能多樣的教師模型,本文訓(xùn)練了六個(gè) Chinchilla 最優(yōu)教師模型,其參數(shù)范圍從 1.98 億到 77.5 億。對(duì)于每一個(gè)教師模型,本文按照標(biāo)準(zhǔn)訓(xùn)練成本,將其蒸餾到具有四種 IsoFLOP 配置的學(xué)生模型中。最終得到的學(xué)生模型交叉熵如圖 2 所示。作者還注意到,在某些情況下,學(xué)生模型能夠超越教師模型的表現(xiàn),即展現(xiàn)出弱到強(qiáng)的泛化能力。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

注:為實(shí)現(xiàn)擴(kuò)展系數(shù)的可靠識(shí)別,此前有研究使用了兩種策略:

  • (固定模型,變化數(shù)據(jù)) 對(duì)于一個(gè)固定的模型族,變化訓(xùn)練 token 的數(shù)量。
  • (IsoFLOP 配置) 在總計(jì)算約束下,同時(shí)變化模型大小和訓(xùn)練 token 的數(shù)量。


為了確保實(shí)驗(yàn)?zāi)軌驒z測(cè)到這種影響,本文設(shè)定學(xué)生(N_S,D_S)是固定的,而 N_T 和 D_T 在計(jì)算約束下變化。本文進(jìn)行了蒸餾實(shí)驗(yàn),將四個(gè) Chinchilla 最優(yōu)(M_S = D_S/N_S ≈ 20)的學(xué)生(其參數(shù)范圍從 1.98 億到 18.2 億),從根據(jù)四種 IsoFLOP 配置訓(xùn)練的教師中蒸餾出來(lái)。最終得到的學(xué)生交叉熵如圖 3 所示。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

最后,本文訓(xùn)練了固定 M 的教師模型與固定 M 的學(xué)生模型的組合,其中包含十個(gè)教師模型(M_T ≈ 20)和五種規(guī)模的學(xué)生模型,每個(gè)學(xué)生模型至少對(duì)應(yīng)四種 M_S 選擇。其中兩個(gè)學(xué)生模型的交叉熵結(jié)果如圖 4 所示。

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

此外,本文還需要確定蒸餾擴(kuò)展定律的函數(shù)形式。首先,本文觀察到教師模型的大小 N_T 和預(yù)訓(xùn)練 token 數(shù)量 D_T 的貢獻(xiàn)可以通過(guò)教師模型的交叉熵 L_T 來(lái)總結(jié)。這可以從圖 1 和圖 3b 中看出:

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

總之,本文提出,學(xué)生交叉熵在 L_T 中遵循 broken 冪律,在 N_S 和 D_S 中遵循冪律:

蘋(píng)果也在蒸餾大模型,給出了蒸餾Scaling Laws-AI.x社區(qū)

在此之后,論文分析了在不同計(jì)算預(yù)算下如何最優(yōu)地分配教師和學(xué)生模型的資源,包括教師模型的訓(xùn)練成本和學(xué)生模型的蒸餾成本,并比較了蒸餾和監(jiān)督學(xué)習(xí)在不同計(jì)算預(yù)算下的性能,發(fā)現(xiàn)當(dāng)教師模型的訓(xùn)練成本被考慮時(shí),監(jiān)督學(xué)習(xí)通常更有效。


這項(xiàng)工作代表了已知最大規(guī)模的蒸餾受控實(shí)證研究,系統(tǒng)消融了常見(jiàn)的蒸餾技術(shù)。正如監(jiān)督擴(kuò)展減輕了監(jiān)督預(yù)訓(xùn)練中的風(fēng)險(xiǎn)一樣,新工作為生產(chǎn)更小、更強(qiáng)大的模型提供了路線圖,并增強(qiáng)了測(cè)試時(shí)擴(kuò)展的可行性。


本文轉(zhuǎn)自機(jī)器之心 ,作者:機(jī)器之心

原文鏈接:??https://mp.weixin.qq.com/s/ahHtRBok0jVzyYUKRihvVg??

已于2025-2-14 14:02:39修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产啊啊啊视频在线观看| a天堂视频在线| 精品国内自产拍在线观看视频 | 欧美精品福利在线| 一区二区三区少妇| 97色婷婷成人综合在线观看| 亚洲成人一区在线| 亚洲精品高清国产一线久久| av 一区二区三区| 久久国产日本精品| 欧美成人精品不卡视频在线观看| 欧美色图亚洲激情 | 开心色怡人综合网站| 亚洲在线视频播放| 毛片一区二区| 久久久久国产一区二区三区| 国产黄色录像视频| 伊甸园亚洲一区| 日韩精品中午字幕| 在线观看国产福利| 国模套图日韩精品一区二区| 一区二区在线观看免费视频播放| 日本成人黄色免费看| 亚洲第一成人av| 久久国产日韩欧美精品| 日本免费在线精品| 在线观看 中文字幕| 欧美精品播放| 久久久精品久久久| 日本一道本视频| 亚洲黄页网站| 亚洲高清一区二| 免费看三级黄色片| 国产日韩在线观看视频| 777午夜精品免费视频| 成年人小视频网站| 亚洲国产福利| 欧美日韩国产在线| 男人插女人视频在线观看| bt在线麻豆视频| 亚洲欧美在线观看| 亚欧洲精品在线视频免费观看| 色视频在线看| 久久综合色综合88| 欧美精品二区三区四区免费看视频 | 亚洲国产精品第一区二区三区| 久久精品99久久久香蕉| 欧美成人久久久免费播放| 欧美偷拍自拍| 中文字幕国产亚洲2019| 国产aaaaaaaaa| 成人6969www免费视频| 亚洲夜晚福利在线观看| 黄色aaa视频| 青青草综合网| 日韩中文字幕欧美| 手机av在线看| 欧美精选在线| 午夜精品福利在线观看| 99热在线观看免费精品| 久久不射中文字幕| 日韩av电影在线播放| 高潮毛片又色又爽免费 | 免费看污污网站| 国产成人免费| 日韩视频免费观看高清在线视频| 亚洲国产综合av| 草莓视频一区二区三区| 亚洲第一网站男人都懂| 亚洲做受高潮无遮挡| 蜜桃视频欧美| 日韩最新中文字幕电影免费看| 小向美奈子av| 精品动漫一区| 青青草成人在线| 中文字幕+乱码+中文| 蜜桃精品在线观看| 成人av蜜桃| 天堂a√中文在线| 国产精品久久久久永久免费观看 | 国产在线观看无码免费视频| 久久99久久人婷婷精品综合 | 视频国产一区二区| 亚洲国产免费看| 日韩美女激情视频| 99国产精品欲| 96av麻豆蜜桃一区二区| 亚洲欧洲一区二区在线观看| 日本大片在线播放| 色呦呦国产精品| 午夜激情视频网| 亚洲黄页网站| 久久福利网址导航| 国产一级淫片a视频免费观看| 久久99国产精品久久99| 国产一区二区黄色| 老司机午夜在线视频| 精品国产91久久久久久老师| gogogo高清免费观看在线视频| 日韩欧美久久| 国产一区二区黄| 国产在线视频99| 美国一区二区三区在线播放| 国产欧美精品一区二区三区| 9色在线观看| 同产精品九九九| 中日韩av在线播放| 竹菊久久久久久久| 欧美精品日韩三级| 正在播放木下凛凛xv99| 成人成人成人在线视频| 视频一区二区三区免费观看| 77thz桃花论族在线观看| 欧美日韩国产免费一区二区| 成人精品在线观看视频| 国产精品九九| 91精品在线播放| 爱久久·www| 精品日本美女福利在线观看| 国产成人av免费观看| 成人在线免费观看网站| 91黑丝在线观看| 国产普通话bbwbbwbbw| 日本一区二区三级电影在线观看 | 欧洲精品久久久久毛片完整版| 日韩电影中文字幕在线观看| 欧美成人免费看| 国产一区二区三区在线观看精品 | 国产精品jizz| 影音先锋一区| 国产精品久久久久久久久久直播| 成人ww免费完整版在线观看| 欧美精品第1页| av免费播放网站| 日韩中文字幕91| 人禽交欧美网站免费| 在线视频cao| 日韩精品视频在线| 国产精品100| 91免费在线看| 美女福利视频在线| 免费视频亚洲| 日韩免费高清在线观看| 美国一级片在线免费观看视频| 精品成人久久av| bl动漫在线观看| 亚洲欧美视频| 欧美高清视频一区二区三区在线观看| av中文在线资源库| 日韩av中文字幕在线播放| 免费观看一区二区三区毛片 | 亚洲激情图片网| 久久99精品久久久久久国产越南| 亚洲国产精品视频一区| 久久精品国产福利| 久久亚洲成人精品| www香蕉视频| 五月天亚洲婷婷| 97超碰在线资源| 久久在线91| 中文字幕一区二区三区四区五区六区 | 91久久精品美女高潮| 嫩草在线视频| 日韩三级精品电影久久久| 免费三片在线播放| 99久久国产综合精品色伊| 春日野结衣av| 欧美日韩中文字幕一区二区三区| 国产欧美在线观看| 羞羞的视频在线观看| 亚洲国产精品va在线看黑人| 亚洲影院在线播放| 国产精品污污网站在线观看 | 成人一区二区三区在线观看| 亚洲av首页在线| 国产精区一区二区| 欧美国产日韩精品| 天堂在线视频网站| 欧美三片在线视频观看 | 欧美精品首页| 欧美精品七区| 在线欧美激情| 韩剧1988在线观看免费完整版| 国产精品一级伦理| 欧美一二三区在线| 日本中文字幕在线| 国产精品久线在线观看| 午夜福利三级理论电影 | www.国产视频.com| 亚洲夜间福利| 亚洲国产欧美日韩| 国产精品久久久久av蜜臀| 国产精品爱啪在线线免费观看| a在线免费观看| 亚洲人成在线观看| 亚洲成a人片在线| 欧美亚男人的天堂| 国产一级av毛片| 国产精品私人影院| 99久久国产精| 极品少妇一区二区| 92看片淫黄大片一级| 欧美在线网址| 日韩精品伦理第一区| 亚洲一区二区三区免费| 国产精品欧美激情在线播放| 涩涩av在线| 欧美激情小视频| 日本亚洲精品| 亚洲天堂男人天堂女人天堂| 日韩在线视频第一页| 7777精品伊人久久久大香线蕉的 | 永久看片925tv| 亚洲国产高清不卡| 无码人妻精品一区二区三应用大全| 国产精品一级黄| 99热这里只有精品在线播放| 国产一区二区你懂的| 女人被男人躁得好爽免费视频| 日韩在线观看一区 | 色综合久久久久综合一本到桃花网| 亚洲精品99999| xxxx18国产| 欧美久久久久免费| 亚洲综合五月天婷婷丁香| 日本高清视频一区二区| 日本三级视频在线| 亚洲综合成人网| 91视频综合网| 国产精品国产自产拍高清av王其 | 欧美亚洲一级片| 波多野结衣久久| 欧美精品免费播放| a篇片在线观看网站| 色av中文字幕一区| wwwww在线观看免费视频| 亚洲一级黄色片| 九一国产在线| 影音先锋日韩有码| 91高清在线| 中文字幕精品久久久久| 丁香在线视频| 中文亚洲视频在线| 日韩三级影院| 欧美精品日韩www.p站| 18+激情视频在线| 欧美激情一级精品国产| 高h视频在线播放| 午夜精品久久久久久久白皮肤| 国产第一页在线| 91爱视频在线| 日韩电影网站| 国产精品美女主播| 日韩一级特黄| 99电影网电视剧在线观看| 亚洲一二三区视频| 久久国产精品久久精品国产| 九九久久婷婷| 亚洲欧洲精品一区二区三区波多野1战4| 欧美日韩在线二区| dy888午夜| 激情综合网址| 日本三级免费观看| 美女视频一区二区| 国产农村妇女精品久久| 成人黄色777网| 波多野结衣福利| 日本一区二区高清| 玖玖爱这里只有精品| 亚洲国产wwwccc36天堂| 日韩欧美在线观看免费| 欧美理论电影在线| 色呦呦中文字幕| 中文字幕日韩欧美| 欧美xxxx做受欧美88bbw| 欧美亚洲视频在线看网址| 日日夜夜综合| 国产日韩欧美综合精品| 国产精品入口久久| 天天干天天色天天爽| 久久av一区| 黄色片子免费看| 久久久精品日韩欧美| 2018天天弄| 一本色道久久综合亚洲精品按摩| 888奇米影视| 亚洲国产一区二区三区四区| 国产精品99999| 国内外成人免费激情在线视频| 欧美日一区二区三区| 国产精品视频500部| 日本道不卡免费一区| 日本丰满少妇xxxx| 久久99热这里只有精品| 最近日本中文字幕| 1024成人网| 国产性生活视频| 亚洲第一区第一页| 国产在线高清视频| 国产成人精品av在线| 澳门久久精品| 97超碰人人爱| 免费一级片91| 精品人妻一区二区三区日产乱码卜| 亚洲私人影院在线观看| 亚洲婷婷综合网| 精品国产免费视频| 精品176二区| 国产精品久久久久久久久久 | 国产91精品免费| 欧美a在线播放| 一本大道综合伊人精品热热| 国产成人免费看一级大黄| 色噜噜狠狠狠综合曰曰曰88av| 性欧美18xxxhd| 国产精品久久精品视| 久久精品一区二区不卡| 日韩av片网站| xf在线a精品一区二区视频网站| 免费看一级一片| 91精品国产综合久久精品图片 | 成人av免费播放| 在线视频中文亚洲| 电影一区二区三| 鲁片一区二区三区| 一本综合久久| 亚洲天堂av网站| 有坂深雪av一区二区精品| 中文字幕乱码人妻无码久久| 亚洲视频在线看| 欧美xx视频| 欧美12av| 久久午夜视频| 美女被到爽高潮视频| 欧美色xxxx| 蜜桃视频在线播放| 日本中文字幕成人| 久9久9色综合| av在线无限看| 国产精品午夜久久| 一级特黄aaa大片| 色系列之999| 亚洲一区二区三区久久久| 一区二区三区四区欧美日韩| 久久精品999| 2025国产精品自拍| 欧美电影免费提供在线观看| 一色桃子av在线| 国产精品久久久久久久久婷婷| 91久久在线| 中国黄色a级片| 欧美综合亚洲图片综合区| 最新国产在线观看| 成人免费看片视频| 欧美日一区二区在线观看| 熟妇高潮一区二区| 欧美性xxxxxxxxx| 成a人片在线观看www视频| 国产精品免费视频xxxx| 国产韩国精品一区二区三区| 亚洲成人av免费观看| 亚洲高清视频中文字幕| 激情在线视频| 国产一区私人高清影院| 欧美日韩久久| 三级男人添奶爽爽爽视频| 91国产免费观看| 超碰超碰在线| 久久av免费一区| 免费人成网站在线观看欧美高清| www欧美com| 精品一区电影国产| 五月天色综合| 你真棒插曲来救救我在线观看| 久久亚洲精华国产精华液| 96日本xxxxxⅹxxx17| 韩国美女主播一区| 欧美少妇xxxx| 国产白袜脚足j棉袜在线观看| 欧美性猛交xxxx乱大交蜜桃| 毛片在线播放a| 精品中文字幕人| 久久99久久99| 久久国产精品系列| 日韩视频免费在线观看| 狼人精品一区二区三区在线| 亚洲综合婷婷久久| 午夜精品久久久久久久99水蜜桃| 成人在线免费看| 国产精品乱子乱xxxx| 久久国产综合精品| 五月天综合激情网| 美女视频久久黄| 国产精品视频一区二区三区四蜜臂| 国产精品嫩草影视| 欧美午夜宅男影院| 久草在线资源站手机版| 91成人在线视频观看| 国产亚洲一区二区在线观看| 亚洲第一大网站|