精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移 原創(chuàng)

發(fā)布于 2025-3-17 13:07
瀏覽
0收藏

本篇介紹超參數(shù)(學習率)跨模型尺度的遷移規(guī)律。

眾所周知,完整訓練一次大型LLM的成本是昂貴的,這就決定了我們不可能像以前一樣直接在大型LLM上反復測試超參數(shù)。

一個很自然的想法是希望可以在同結(jié)構(gòu)的小模型上仔細搜索超參數(shù),找到最優(yōu)組合后直接遷移到大模型上。

盡管這個想法很樸素,但要實現(xiàn)它并不簡單,它需要我們了解常見的超參數(shù)與模型尺度之間的縮放規(guī)律,本次介紹的文Maximal Update Parametrization,簡稱“muP”,正是這個想法的一個實踐。具體出自論文《Tensor Programs V: Tuning Large Neural Networks via Zero-Shot Hyperparameter Transfer》。

先說結(jié)論,muP主要研究超參數(shù)跨模型尺度的遷移規(guī)律。這里有幾個關(guān)鍵詞:

1、超參數(shù),目前主要指學習率;

2、模型尺度,目前主要是模型寬度;

3、這里的核心是“遷移”。

請注意,muP并不研究什么是最優(yōu)的超參數(shù),只研究最優(yōu)超參數(shù)隨著模型尺度的變化規(guī)律,所以我們需要在某個小模型上搜索最優(yōu)的超參數(shù)組合,然后遷移到大模型上,這就是muP的使用場景和使用方法。

推導muP的原理是讓模型的前向傳播、反向傳播和損失增量都不隨模型尺度的變化而發(fā)生明顯變化:

1、具體做法是分析初始化的數(shù)量級,然后認為結(jié)論可以代表后續(xù)優(yōu)化的規(guī)律;

2、說白了就是假設(shè)做好初始化,后面就會自動沿著正確的軌跡走

具體方法

論文提出了一種名為μTransfer的方法來解決大型神經(jīng)網(wǎng)絡(luò)的超參數(shù)(HP)調(diào)整問題。這個方法的核心思想是利用最大更新參數(shù)化(Maximal Update Parametrization,簡稱μP)的特性,該特性表明在模型大小變化時,許多最優(yōu)的HP保持穩(wěn)定。

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

具體來說,μTransfer的解決方案包括以下幾個步驟:

1. 目標模型的μP參數(shù)化:首先,將目標大型模型(即最終希望調(diào)整的模型)按照μP進行參數(shù)化。這確保了模型在訓練過程中,各層的更新幅度保持一致,從而在模型寬度增加時,HPs保持穩(wěn)定。

2. 在小型代理模型上調(diào)整HP:然后,研究者在一個小版本的代理模型上進行HP調(diào)整。這個小型模型在寬度和/或深度上小于目標模型,但采用相同的μP參數(shù)化。

3. 零成本轉(zhuǎn)移(Zero-Shot Transfer):一旦在小型代理模型上找到了接近最優(yōu)的HPs,這些HPs可以直接轉(zhuǎn)移到全尺寸的目標模型上,而無需在目標模型上進行額外的調(diào)整。這種轉(zhuǎn)移是基于μP理論,即在無限寬度極限下,模型的HPs趨于穩(wěn)定。

4. 驗證和測試:最后,研究者在目標模型上驗證這些轉(zhuǎn)移過來的HPs,并與直接在目標模型上進行調(diào)整的結(jié)果進行比較,以確保性能達到預(yù)期。

比較關(guān)鍵的改進點是Normalization和殘差的影響,尤其是Normalization,它使得不依賴特殊的初始化就可以穩(wěn)定前向傳播,帶來了更大的自由度和可能性。

具體示例

論文比較難理解,下面基于蘇神的文舉一個前向傳播的例子,更詳細的推理推薦直接去看蘇神的文章。(可以點擊后面原文鏈接直接跳轉(zhuǎn))

首先依然用RMS(Root Mean Square)來作為矩陣尺度的指標

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

那么muP就是想研究超參數(shù)關(guān)于d的變化規(guī)律。

考慮線性層表示為

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

其中

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

我們的目的是為了讓遷移時穩(wěn)定,即初始化階段X的RMS跟Y的RMS大致相等,那么W的初始化

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

Kaiming初始化跟LeCun初始化相比,只是方差相差一個(跟模型尺度無關(guān)的)常數(shù)2,可以證明其他激活函數(shù)的結(jié)果也類似。因此可以得到結(jié)論

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

這也說明了“激活函數(shù)的影響是模型尺度無關(guān)的”。

這里直接給出最終所有優(yōu)化器下的結(jié)論。

大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移-AI.x社區(qū)

這里的W指的是除Win,Wout外的所有參數(shù),還有要強調(diào)的是,這里的關(guān)系都是“正比于”而不是“等于”。

實驗驗證

論文在Transformer、ResNet、GPT等模型上均進行了實驗,我們可以主要來看看GPT3上的實驗。

這塊作者在GPT-3的一個小型代理模型(約40M參數(shù))上確定了超參數(shù),然后將這些參數(shù)轉(zhuǎn)移到完整的6.7B參數(shù)模型。實驗結(jié)果顯示,μTransfer模型的性能優(yōu)于原始GPT-3模型,并且與兩倍大的13B模型相當。

總結(jié)

基于muP可以在小模型上以相對較小的成本仔細搜索超參數(shù)(這里主要是學習率和初始化),然后遷移到大模型上,降低大模型的煉丹成本。當然μTransfer在實際應(yīng)用中還有很多的潛在改進方向,比如如自動化代理模型選擇、跨平臺實現(xiàn)等。


文轉(zhuǎn)載自公眾號瓦力算法學研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/6OZBR1IKi8mW93jrXNjZlA??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關(guān)推薦
久久精品网站视频| 久久99国产精品99久久| 日韩精品一区二区三区在线视频| 久久久久久久久成人| 亚洲成人第一页| 视频一区二区三区在线观看 | 国产黄色在线| 激情综合色综合久久| 91精品国产高清| 日韩av网站在线播放| 成人在线视频中文字幕| 91电影在线观看| 国产精品视频一二三四区| 欧美高清电影在线| 国产精品一级片在线观看| 欧美性视频网站| 午夜精品福利在线视频| 国产成人短视频在线观看| 日韩一区二区不卡| 老司机午夜av| av老司机免费在线| 亚洲伦理在线精品| 日本一区二区三区免费看| 性生活免费网站| 热久久一区二区| 91极品女神在线| 激情小说中文字幕| 日韩精品一区二区三区免费观看| 亚洲精品国产精品自产a区红杏吧| 欧美视频亚洲图片| 国产综合色区在线观看| 亚洲一区二区美女| 国产又爽又黄ai换脸| 国产香蕉视频在线看| 91一区二区在线| 2014国产精品| 一级片视频网站| 免费在线观看视频一区| 欧美亚洲在线视频| 久久精品视频9| 亚洲国产精品久久久天堂| 一本色道久久88精品综合| 无码人妻aⅴ一区二区三区| 日韩欧美中文字幕在线视频| 欧美日韩成人激情| 性猛交ⅹ×××乱大交| 韩国精品主播一区二区在线观看| 五月天亚洲精品| 日本a级片在线观看| 国产网友自拍视频导航网站在线观看 | 国产精品99久久久久久久久| 国产成人精品网| 亚洲一区二区三区高清不卡| 国内精品久久久久伊人av| 欧美日韩一级大片| 国产精品红桃| 久久久久久亚洲精品不卡| 国产真实夫妇交换视频| 亚洲一级电影| 97碰在线观看| 五月婷婷色丁香| 久久激情一区| 国产精品久久av| 中文字幕+乱码+中文乱码www| 天堂在线一区二区| 国产精品久久久久久网站| 国产字幕在线观看| 蜜桃精品在线观看| 91免费国产网站| 精品乱子伦一区二区| 成人久久视频在线观看| 久久国产精品精品国产色婷婷| 婷婷在线观看视频| 久久久精品2019中文字幕之3| 日韩免费av一区二区三区| 日韩精品黄色| 亚洲一区二区在线播放相泽| 国产精品无码人妻一区二区在线 | 国产精品精品国产| 91丨九色丨蝌蚪丨对白| 丁香桃色午夜亚洲一区二区三区| 国产一区二区三区高清| 神马精品久久| 国产精品亲子乱子伦xxxx裸| 操bbb操bbb| а√在线中文网新版地址在线| 日韩欧美高清视频| 美女在线视频一区二区| 亚洲精品一二三**| 亚洲免费一在线| 五月综合色婷婷| 在线播放一区| 国产精品视频专区| 亚洲欧美另类视频| 国产午夜精品久久久久久免费视| 国产精品夜夜夜爽张柏芝| 123区在线| 欧美少妇一区二区| 无码av免费精品一区二区三区| 久久综合欧美| 欧美第一淫aaasss性| 无码人妻精品一区二区三区蜜桃91| 精品一区免费av| 精品一区二区三区国产| 精品欧美色视频网站在线观看| 亚洲福利视频三区| 九九九九九国产| 羞羞答答一区二区| 欧美人交a欧美精品| 亚洲中文字幕无码爆乳av| 国产成人精品一区二区三区网站观看 | 欧美老妇交乱视频| 波多野结衣一区二区三区在线 | 欧美做受高潮6| 欧美久久99| 国产精品十八以下禁看| 偷拍自拍在线视频| 亚洲国产日韩一级| 一区二区三区四区毛片| 国产剧情一区| 97av在线播放| 亚洲经典一区二区| 亚洲日本中文字幕区| 人妻无码视频一区二区三区| 天堂av一区| 久久精品91久久香蕉加勒比| 无码人妻精品一区二| 91视频免费观看| 又大又硬又爽免费视频| 国产精品一区免费在线| 最近2019中文字幕mv免费看 | 五月天精品在线| 亚洲欧美网站| 精品一区久久久| 97超碰免费在线| 精品少妇一区二区三区日产乱码| 久久成人小视频| 麻豆国产一区二区| 日韩高清dvd| 亚洲日本网址| 中文字幕v亚洲ⅴv天堂| 在线视频一区二区三区四区| 97精品电影院| 免费黄色福利视频| 中国av一区| 国产成人精品久久久| 四虎国产精品永远| 精品久久久久久久久久ntr影视| 亚洲成人av免费观看| 天天综合网91| 国产日韩中文在线| 第三区美女视频在线| 色婷婷国产精品综合在线观看| 少妇户外露出[11p]| 亚洲影视综合| 欧洲精品久久| 巨胸喷奶水www久久久| 亚洲天堂精品在线| 国产精品尤物视频| 国产精品天干天干在线综合| 伊人网在线综合| 欧美高清日韩| 国产一区二区精品免费| 免费看av不卡| 自拍亚洲一区欧美另类| 国产熟女一区二区丰满| 一区二区三区在线免费视频| 黄色av电影网站| 亚洲综合精品| 亚洲乱码一区二区三区| 91麻豆精品国产综合久久久| 免费av一区二区| 全部免费毛片在线播放一个| 欧美日韩一二三四五区| 99久久精品免费视频| 久久国产精品无码网站| www.xxx麻豆| 宅男在线一区| 亚洲精品免费在线视频| 1024在线看片你懂得| 亚洲午夜精品久久久久久久久久久久| 亚洲图片欧美在线| 一级日本不卡的影视| 麻豆av免费观看| 国产一区二区在线视频| 国产美女网站在线观看| 人人狠狠综合久久亚洲婷| 97人人干人人| 亚洲天堂一区二区| 欧美丰满老妇厨房牲生活| 色视频在线观看| 91精品国产综合久久久久| 国产成人在线播放视频| 国产精品对白交换视频| 欧亚乱熟女一区二区在线| 琪琪一区二区三区| 国产妇女馒头高清泬20p多| 成人一区而且| 国产一区再线| 激情视频亚洲| 日韩免费视频在线观看| 七七久久电影网| 国产一区二区三区中文| 亚洲精品久久久久久动漫器材一区| 一本色道久久综合精品竹菊| 九九视频免费看| 日本一区二区高清| 一级特黄a大片免费| 黑人巨大精品欧美一区| 50路60路老熟妇啪啪| 国模吧视频一区| 一区二区视频在线观看| 日本福利一区| 国产精品日韩一区二区免费视频| 小明成人免费视频一区| 538国产精品视频一区二区| 怡红院在线播放| 色噜噜国产精品视频一区二区| 午夜av免费观看| 日韩视频一区二区三区| 一级片在线免费观看视频| 在线免费不卡电影| 美日韩一二三区| 亚洲香蕉伊在人在线观| 欧美日韩黄色网| 国产精品嫩草影院av蜜臀| 久久精品成人av| 99久久综合色| 亚洲天堂av网站| 国产不卡视频在线观看| av在线免费看片| 久久99热99| 一区二区三区视频网| 天堂成人国产精品一区| 女人天堂av手机在线| 激情欧美丁香| 成年人网站国产| 黄色成人91| 国产精品视频网站在线观看| 欧美黄色免费| av动漫在线播放| 欧美特黄视频| 男人插女人视频在线观看| 韩国av一区| 农民人伦一区二区三区| 亚洲精品社区| 国产青青在线视频| 国产精品主播| 50路60路老熟妇啪啪| 日韩电影在线免费| 天堂中文视频在线| 美女mm1313爽爽久久久蜜臀| 爱爱爱爱免费视频| 国产中文一区二区三区| 国产精品探花在线播放| 国产精品一区二区视频| 香蕉视频免费网站| 99国产精品久久| 国产成人精品无码免费看夜聊软件| 国产亚洲制服色| 精品伦精品一区二区三区视频密桃| 国产精品久久久久久久久快鸭 | 91在线导航| 久久好看免费视频| 日本高清成人vr专区| 久久久久国产一区二区三区| 国产直播在线| 国产国语videosex另类| 日韩综合久久| 风间由美一区二区三区| 台湾亚洲精品一区二区tv| 日韩精品成人一区二区在线观看| 91视频综合| 黄色一级片黄色| 毛片一区二区| 午夜天堂在线视频| av资源网一区| 老司机福利在线观看| 一区二区三区中文免费| 免费的毛片视频| 337p亚洲精品色噜噜狠狠| 成人毛片视频免费看| 亚洲老头同性xxxxx| 精品51国产黑色丝袜高跟鞋| 欧美精品aaa| 四虎4545www国产精品| 91成人免费视频| 伊人久久大香线蕉av不卡| 一级黄色录像免费看| 日韩视频精品在线观看| 一路向西2在线观看| 成人中文字幕在线| 老司机精品免费视频| 亚洲国产精品久久不卡毛片| 性色av一区二区三区四区| 欧美草草影院在线视频| 成人在线免费公开观看视频| 欧美日韩国产成人在线观看| 韩国三级一区| 国产九色精品| 99成人超碰| 成人精品小视频| 成人avav影音| 男人操女人的视频网站| 色婷婷av一区二区三区软件| 丰满人妻一区二区三区无码av| 中日韩午夜理伦电影免费| 日本不卡1234视频| 亚洲在线视频福利| 日韩毛片视频| 欧美 日韩 国产一区| 处破女av一区二区| 麻豆精品国产免费| 在线看国产一区二区| 午夜一区在线观看| 欧美精品电影免费在线观看| 亚洲三级电影| 亚洲精品视频一二三| 欧美专区18| 日韩aaaaa| 亚洲一区二区av电影| 97超碰人人模人人人爽人人爱| 亚洲精品一区二三区不卡| 成全电影大全在线观看| 91传媒视频在线观看| 国产精品99视频| 成年网站在线播放| 国产色一区二区| 精品不卡一区二区| 精品一区二区三区四区| 国产福利片在线观看| 国产伦精品一区二区| 伊人久久亚洲美女图片| 肉丝美足丝袜一区二区三区四| 中文字幕在线免费不卡| 最近中文字幕在线免费观看| 亚洲一级一级97网| 日本美女一区| 日韩高清专区| 日韩av不卡在线观看| 精品成人无码一区二区三区| 日韩欧美一区二区三区久久| 免费在线超碰| 国产精品成人va在线观看| 国产一区二区亚洲| 国产av人人夜夜澡人人爽| 国产日韩欧美不卡| 国产99久久久久久免费看| 一本一道久久a久久精品逆3p| 经典三级一区二区| 亚洲成色www久久网站| 六月丁香婷婷久久| 黄色录像一级片| 91精品中文字幕一区二区三区| 久操视频在线| 99久久精品免费看国产一区二区三区| 国产精品多人| 法国伦理少妇愉情| 欧美亚洲动漫另类| 黄网站app在线观看| 99久热re在线精品视频| av成人天堂| 亚洲黄色免费视频| 欧美人与z0zoxxxx视频| 影音先锋男人资源在线| 九色视频成人porny| 日韩av一区二区在线影视| 波兰性xxxxx极品hd| 日韩欧美高清一区| 乡村艳史在线观看| 一本一本a久久| 成人丝袜视频网| 国产一级片av| 久久国产精彩视频| 日本欧美三级| 91福利国产成人精品播放| 亚洲三级久久久| 无套内谢的新婚少妇国语播放| 国产成人a亚洲精品| 亚洲大全视频| 日本黄色特级片| 在线不卡免费欧美| 麻豆视频在线看| 中文视频一区视频二区视频三区| 成人爽a毛片一区二区免费| 亚洲av无码精品一区二区| 久久中文字幕国产| 亚洲精品小区久久久久久| 国产欧美精品一二三| 日韩欧美精品网址| 污污片在线免费视频| 日韩久久久久久久| jvid福利写真一区二区三区| 在线观看视频中文字幕| 97avcom| 亚洲人metart人体| 这里只有久久精品| 日韩欧美一二三四区| jizz亚洲女人高潮大叫| 青草青青在线视频|