精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MobileLLM:“苗條”的模型比較好! 原創(chuàng) 精華

發(fā)布于 2024-11-28 15:03
瀏覽
0收藏

?1.MobileLLM

Meta AI研究人員推出了MobileLLM,從arXiv論文時(shí)間上看2月份發(fā)布的,但是在六月底又更新了一版。MobileLLM利用四種先進(jìn)技術(shù),包括帶有SwiGLU的FFN、深度和薄架構(gòu)、嵌入共享和GQA,構(gòu)建了一個(gè)強(qiáng)大的基線小型LLM,MobileLLM。它是專為智能手機(jī)和其他資源受限的設(shè)備而設(shè)計(jì)。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

研究人員將其訓(xùn)練出的MobileLLM 125M/350M和參數(shù)量相當(dāng)?shù)腟tate of the Art(SOTA)模型如Cerebras、OPT、BLOOM等進(jìn)行對(duì)話標(biāo)桿測(cè)試。

在零樣本(zero-shot)測(cè)試中MobileLLM 125M/350M比SOTA模型的平均準(zhǔn)確率高出2.7%/4.3%。使用權(quán)重共享方法訓(xùn)練出的MobileLLM 125M/350M版本,名為MobileLLM LS,還可以將準(zhǔn)確率分別再向上提升0.7%及0.8%。

模型具體的特點(diǎn)在于:

  • 采取「深而精簡(jiǎn)」(deep- and-thin)的模型架構(gòu)更能以極高效能萃取抽象知識(shí)
  • 利用先進(jìn)的權(quán)重共享技術(shù),包括嵌入共享、分組查詢注意力和塊權(quán)重共享,在存儲(chǔ)受限的場(chǎng)景中實(shí)現(xiàn)了權(quán)重利用率的顯著的提高。

2.苗條架構(gòu)

大模型領(lǐng)域有一種普遍觀點(diǎn),Transformer模型的性能主要取決于參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)集的大小和訓(xùn)練迭代次數(shù)。這種觀點(diǎn)認(rèn)為,架構(gòu)設(shè)計(jì)對(duì)Transformer模型的性能影響微乎其微。

但是本次實(shí)驗(yàn)研究表明,對(duì)于較小的模型,為了提高性能,更深比廣泛更為重要。下面的研究涉及 19 個(gè)模型的訓(xùn)練,其中包括 9個(gè)具有~125M個(gè)參數(shù)的模型和10個(gè)具有~350M個(gè)參數(shù)的模型。每個(gè)模型的設(shè)計(jì)大小相似,但深度和寬度有所不同。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

上圖對(duì)八個(gè)零樣本常識(shí)推理任務(wù)以及問(wèn)答和閱讀理解基準(zhǔn)進(jìn)行了實(shí)驗(yàn)。研究結(jié)果一致表明,更深更薄的模型優(yōu)于更淺更寬的模型。

黑色部分是最佳表現(xiàn),可以看到基本上層數(shù)都較深。同時(shí)可以觀察到更深的網(wǎng)絡(luò)在大多數(shù)零樣本推理任務(wù)中的卓越性能,包括 ARC-easy、ARC-challenge、PIQA、HellaSwag、OBQA、WinoGrande,尤其是在TQA和RACE數(shù)據(jù)集上更加明顯。

<劃重點(diǎn)!>對(duì)于大小約為 125M的transformer 模型,具有30層甚至42層的模型的性能明顯優(yōu)于具有12層的模型。要知道之前大多數(shù)的125M模型的層數(shù)都限制為12!!

此時(shí)細(xì)心的讀者會(huì)發(fā)現(xiàn)第一行是升序,第二行是降序,第二行就是每個(gè)Transormer塊中的頭數(shù)<溫習(xí)點(diǎn)>。當(dāng)模型的層數(shù)增加的時(shí)候,頭數(shù)一直在降低,也就是所謂的深而精簡(jiǎn)!

研究人員最初設(shè)計(jì)用于減少LLM中的鍵值緩存大小的GQA,也可以有效減少小型LM中鍵值頭的冗余。GQA可以看作是權(quán)重重用的另一種權(quán)重共享形式,其中鍵值頭的數(shù)量是查詢頭的1/n,并且kv頭在計(jì)算注意分?jǐn)?shù)和與查詢一起輸出時(shí)重復(fù)n次。

上表的結(jié)果表明,使用16個(gè)查詢頭可產(chǎn)生最佳結(jié)果。將kv-heads的數(shù)量從16個(gè)減少到4個(gè),可使125M模型的準(zhǔn)確率相當(dāng),而350M模型的準(zhǔn)確率僅下降0.2個(gè)百分點(diǎn),模型大小減少了近10%。通過(guò)采用分組查詢注意機(jī)制 (GQA),同時(shí)增加嵌入維度以保持模型大小,125M的準(zhǔn)確率進(jìn)一步提高了0.4個(gè)百分點(diǎn),表明GQA是進(jìn)一步挖掘小模型潛力的有利方法。

3.共享技術(shù)

Topic1 嵌入共享:

在1B以下的自然語(yǔ)言模型中,嵌入層構(gòu)成了參數(shù)數(shù)量的很大一部分。例如,Embedding<溫習(xí)點(diǎn)>的維度為 512,詞匯量為32k,輸入和輸出嵌入層就需要16M參數(shù)。這些嵌入層合在一起占125M參數(shù)模型總參數(shù)的20%以上。在大語(yǔ)言模型中,這一比例被稀釋了,例如輸入和輸出嵌入僅占LLaMA-7B模型總參數(shù)數(shù)量3.7%,在 LLaMA-70B模型中僅占0.7%。

LLM 模型中的輸入嵌入將詞匯表中的token ID映射到相應(yīng)的token嵌入,維度為 (vocab_size, embedding_dim)。相反,輸出全連接層?<溫習(xí)點(diǎn)>將嵌入維度映射回詞匯表中的logits預(yù)測(cè)<溫習(xí)點(diǎn)>,權(quán)重大小為 (vocab_size, embedding_dim)。通過(guò)共享嵌入,將“輸入-中間-輸出”的兩個(gè)轉(zhuǎn)化矩陣參數(shù)共用,從而產(chǎn)生更高效、更緊湊的模型架構(gòu)。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

本次研究在30層125M模型上進(jìn)行了實(shí)驗(yàn)。上面的統(tǒng)計(jì)證明共享輸入和輸出嵌入可將參數(shù)數(shù)量減少16M,約占總參數(shù)的11.8%,平均準(zhǔn)確率下降0.2個(gè)百分點(diǎn)。這時(shí)候通過(guò)重新分配已保存的參數(shù)以添加更多層,可以輕松恢復(fù)邊際準(zhǔn)確率下降。與原始 135M模型相比,將深度增加到32層可使準(zhǔn)確率提高 0.4 個(gè)百分點(diǎn),同時(shí)仍保持 10M更少的參數(shù)。在有限的資源預(yù)算下,嵌入共享是一種有價(jià)值的技術(shù),可以最大限度地提高權(quán)重利用率并優(yōu)化模型性能。

Topic 2 層共享:

關(guān)于層深度與寬度影響的發(fā)現(xiàn)表明,對(duì)于小型 Transformer 模型來(lái)說(shuō),更深的層是有利的。這促使我們研究層共享作為一種增加隱藏層數(shù)量而無(wú)需額外模型存儲(chǔ)成本的策略。這種方法在模型大小是主要制約因素的設(shè)備上場(chǎng)景中特別有用。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

上圖(a)代表沒有層共享的基線模型;(b)相鄰塊之間的共享;(c) 重復(fù)全部共享;(d) 反向共享。這里每個(gè)塊就是Transformer塊,包含多頭自注意力 (MHSA) 和前饋網(wǎng)絡(luò) (FFN)。

bcd說(shuō)白了就是按照特殊規(guī)律,相同顏色的塊共同擁有相同的參數(shù)。雖然c策略的共享性能略高,但b策略可以最好地利用緩存,因?yàn)楣蚕頇?quán)重可以保留在緩存中并立即計(jì)算兩次。

實(shí)驗(yàn)結(jié)果表明,只需復(fù)制Transformer塊即可提高準(zhǔn)確度,而無(wú)需進(jìn)行架構(gòu)修改或擴(kuò)大模型大小。通過(guò)實(shí)驗(yàn)研究了三種不同的權(quán)重共享策略的效果如下表:<從上往下分別為abcd四種策略!>

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

結(jié)果表明,重復(fù)層共享策略C產(chǎn)生最佳性能。但是考慮到硬件內(nèi)存層次結(jié)構(gòu)<溫習(xí)點(diǎn)>,用于計(jì)算的SRAM通常限制在20MB左右。這個(gè)容量通常只足以容納一個(gè) Transformer 塊。因此,b策略可以避免在SRAM和DRAM之間反復(fù)傳輸權(quán)重,從而提高自回歸推理的整體執(zhí)行速度。因此在模型設(shè)計(jì)中選擇了B策略,并將采用這個(gè)策略的模型稱呼為MobileLLM-LS。

4.消融和性能

本次也進(jìn)行了消融研究,消融(Ablataion)就是,一個(gè)全新模型M引入N種優(yōu)化的方法。為了搞清楚哪種方法對(duì)于M的提升最大,于是就在基礎(chǔ)模型上面單獨(dú)添加這項(xiàng)技能進(jìn)行對(duì)比測(cè)試,也就是下圖的+號(hào)的由來(lái))。會(huì)發(fā)現(xiàn)layer-share和GQA的影響力還是挺大的。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

按照上面的優(yōu)化策略進(jìn)行模型層數(shù)的堆疊,繼續(xù)將小的模型擴(kuò)大到1.5B然后,在各項(xiàng)基準(zhǔn)的評(píng)測(cè)下,性能還是不輸給同量級(jí)的競(jìng)爭(zhēng)對(duì)手。

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

MobileLLM家族

MobileLLM:“苗條”的模型比較好!-AI.x社區(qū)

MobileLLM到目前為止還沒公開使用,但Meta已經(jīng)開源了預(yù)訓(xùn)練代碼,允許其他研究人員在他們的工作基礎(chǔ)上進(jìn)行開發(fā)。小模型技術(shù)(尤其是移動(dòng)手機(jī)小模型)的發(fā)展會(huì)打開個(gè)人設(shè)備人工智能服務(wù)的便利性。

本文轉(zhuǎn)載自??魯班模錘??,作者: 龐德公 ????



?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
欧洲精品二区| av小说天堂网| 欧美精选一区二区三区| 欧美日韩一级二级三级| 18视频在线观看娇喘| 日韩在线观看视频一区| 琪琪一区二区三区| 欧美极品第一页| 人妻一区二区视频| 日韩激情综合| 一本高清dvd不卡在线观看| 一区二区三区四区| 涩涩视频在线观看免费| 精品亚洲国内自在自线福利| 国产69精品久久久久99| 手机看片福利视频| y111111国产精品久久久| 欧美在线影院一区二区| 亚洲精品无码国产| 在线激情网站| 久久一区二区视频| 147欧美人体大胆444| 800av免费在线观看| 午夜精品一区二区三区国产| 亚洲欧美日韩网| 国产大尺度视频| 亚洲精品成人一区| 日本精品一区二区三区高清| www.夜夜爱| 免费成人黄色| 久久久久高清精品| 国产亚洲精品美女久久久m| 91亚洲国产成人精品一区| 亚洲在线视频| 精品少妇一区二区30p| 亚洲黄色网址大全| 蜜桃精品噜噜噜成人av| 精品少妇一区二区三区免费观看| 小明看看成人免费视频| 影音成人av| 欧美日韩在线免费观看| 国产黄色片免费在线观看| 国产区在线观看| 国产精品久久久久久久蜜臀 | 久久精品视频1| 欧美婷婷在线| 欧美丰满老妇厨房牲生活| 国产精品夜夜夜爽阿娇| 成人羞羞网站入口免费| 亚洲一品av免费观看| 老牛影视av老牛影视av| 麻豆一区二区麻豆免费观看| 精品久久久三级丝袜| 99国产精品免费视频| 精品国产伦一区二区三区观看说明 | 91丨九色丨黑人外教| 国产欧美亚洲日本| 欧美一区二区三区成人片在线| 国产精品伊人色| 亚洲一区二区日本| 国产毛片毛片毛片毛片| 韩国女主播成人在线观看| 国产中文欧美精品| 国产欧美久久久精品免费| 激情亚洲综合在线| 91在线观看免费网站| 国产人妖一区二区三区| 国产精品一区二区三区乱码| 99re热精品| 欧美一级视频免费| 93久久精品日日躁夜夜躁欧美| 国产日韩欧美二区| 你懂的免费在线观看视频网站| 国产日韩欧美综合一区| 亚洲欧洲精品一区二区| 久久国产精品一区| 亚洲激情综合网| 天堂…中文在线最新版在线| 亚洲淫成人影院| 欧美亚洲动漫制服丝袜| 婷婷中文字幕在线观看| 超碰97成人| 亚洲免费视频一区二区| 美女福利视频网| 国产精品magnet| 欧美做爰性生交视频| 国产精品无码粉嫩小泬| 国产一区二区三区香蕉 | 好吊色视频一区二区| 97精品久久久久中文字幕| 日本精品一区二区| 国产精品实拍| 欧美特级www| 一道本在线免费视频| 成人自拍视频| 日韩精品在线电影| 我要看黄色一级片| 国产精品毛片在线看| 国产噜噜噜噜久久久久久久久| 精品国产18久久久久久| 久久综合久久99| 在线观看成人免费| 日韩新的三级电影| 日韩丝袜美女视频| 日本二区在线观看| 精品动漫3d一区二区三区免费| 国产精品9999| 亚洲精品久久久久久久久久 | 国产精品一区三区| 欧美日韩大片一区二区三区| 91精品久久久久久粉嫩| 色天天综合色天天久久| wwwxxxx在线观看| 成人黄色av| 97超级碰碰碰久久久| 国产美女主播在线观看| 国产欧美一区二区精品性| 中文字幕在线中文| 不卡亚洲精品| 日韩理论片久久| 国产第一页第二页| 国产专区综合网| 日本成人三级电影网站| 波多野结衣中文字幕久久| 欧美日韩国产精选| 成人午夜福利一区二区| 亚洲精选国产| 99视频网站| a免费在线观看| 欧美日韩国产片| 天天舔天天操天天干| 一二三区精品| 国产偷久久久精品专区| 午夜av在线播放| 4438成人网| 中文国语毛片高清视频| 日韩成人精品视频| 欧洲一区二区日韩在线视频观看免费| 成年网站在线视频网站| 日韩一区二区电影在线| 美女视频久久久| 另类人妖一区二区av| 日本在线一区| 网友自拍亚洲| 国产午夜精品视频| 免费无码国产精品| 久久久99久久| 亚洲国产精品毛片av不卡在线| 天天躁日日躁成人字幕aⅴ| 69av视频在线播放| 亚洲三级黄色片| 亚洲午夜一区二区三区| 人妻av一区二区三区| 欧美在线高清| 91原创国产| 午夜在线激情影院| 精品国产污污免费网站入口 | 91福利在线尤物| 精品国产乱码久久久久久夜甘婷婷| 欧美三根一起进三p| 国产成人av自拍| 国产美女主播在线| 欧美aaaaa级| 青青草成人在线| 国产乱视频在线观看| 欧美日韩视频专区在线播放| 亚洲熟女毛茸茸| 国产精品亚洲视频| 亚洲 自拍 另类小说综合图区| 欧美成a人免费观看久久| 91国偷自产一区二区三区的观看方式| 亚洲aⅴ在线观看| 色欧美乱欧美15图片| 91无套直看片红桃在线观看| 精品亚洲国内自在自线福利| 成人国产在线看| 欧美日韩夜夜| 国产日本欧美一区二区三区在线| a黄色片在线观看| 精品第一国产综合精品aⅴ| 亚洲欧美在线视频免费| 国产欧美日韩亚州综合| 北条麻妃亚洲一区| 亚洲国产综合在线看不卡| 免费国产一区二区| 95精品视频| 66m—66摸成人免费视频| 99re在线视频| 精品国产乱码久久久久久免费| 懂色av蜜臀av粉嫩av分享吧最新章节| 亚洲欧美怡红院| 亚洲制服丝袜在线播放| 日本最新不卡在线| 欧美交换配乱吟粗大25p| 亚洲人成伊人成综合图片| 国产日韩精品视频| 麻豆蜜桃在线观看| 久久精品小视频| 色欲av伊人久久大香线蕉影院| 欧美又粗又大又爽| 国产一级片免费观看| 亚洲国产精品av| 精品少妇人妻av一区二区三区| 日本免费新一区视频| 日韩网站在线免费观看| 希岛爱理一区二区三区| 欧美精品久久久| 亚洲欧洲国产精品一区| 国产精品第一第二| 丁香花在线高清完整版视频| 日韩在线视频免费观看高清中文| 日本黄色大片视频| 制服丝袜av成人在线看| 亚洲天堂五月天| 精品久久久久久久久久| jizz亚洲少妇| 国产精品久久久久天堂| 亚洲熟女乱综合一区二区三区| 久久爱另类一区二区小说| 日本wwww视频| 在线免费高清一区二区三区| 黄瓜视频免费观看在线观看www| 色综合久久中文| 国产传媒欧美日韩| 精品视频在线观看免费观看| 国产欧美va欧美va香蕉在| 日韩伦理三区| 热久久免费视频精品| 色图在线观看| 久久成人亚洲精品| 日本免费中文字幕在线| 国产午夜精品视频免费不卡69堂| 天堂在线视频免费| 欧洲永久精品大片ww免费漫画| 欧美性生交xxxxx| 国产在线看一区| 国产一级做a爰片久久| 免费看亚洲片| 美女福利视频在线| 一本色道88久久加勒比精品| 国产一线二线三线女| 欧美黄色aaaa| 糖心vlog在线免费观看| 99久久这里只有精品| 亚洲蜜桃av| 日韩欧美高清在线播放| 三区精品视频观看| 欧美日韩激情| 日韩欧美在线一区二区| 欧洲杯半决赛直播| 亚洲国产婷婷香蕉久久久久久99| 欧美日中文字幕| 婷婷亚洲婷婷综合色香五月| 日本久久一二三四| 亚洲一区二区精品在线观看| 日韩精品四区| 天天成人综合网| 欧美福利视频| 日韩网站在线免费观看| 中日韩男男gay无套| 116极品美女午夜一级| 可以免费看不卡的av网站| 国产a级片免费观看| 蜜臀av性久久久久蜜臀av麻豆| 亚洲美女爱爱视频| 韩国精品免费视频| 国产在线观看免费播放| 国产99久久久精品| 捆绑凌虐一区二区三区| 久久午夜色播影院免费高清 | 国产精品无码AV| 3atv一区二区三区| 亚洲av无码国产精品久久不卡| 精品国产免费视频| 日本亚洲欧美| 久久精品电影一区二区| 午夜激情在线| 欧美洲成人男女午夜视频| 在线国产成人影院| 91在线免费看网站| 欧美日韩一区二区三区不卡视频| 欧美日韩一区二区三| 婷婷精品进入| 黄页网站大全在线观看| 日韩精品成人一区二区三区| 久久久久久综合网| 99久久精品一区| 老司机精品免费视频| 亚洲国产日韩一区二区| av毛片在线免费观看| 91精品国产欧美一区二区| 天堂av2024| 精品国产网站地址| 国产亚洲成av人片在线观看| 国产噜噜噜噜久久久久久久久| 国产精品对白久久久久粗| 日本不卡二区| 亚洲五月婷婷| 中文字幕网av| av不卡在线播放| 视频国产一区二区| 色噜噜久久综合| 精品人妻少妇AV无码专区| 亚洲欧美成人网| а天堂中文在线官网| 日韩免费av片在线观看| 国产亚洲字幕| 日本精品一区二区三区视频| 1024精品一区二区三区| 亚洲一区二区福利视频| 久久免费看少妇高潮| 久久综合亚洲色hezyo国产| 欧美日韩中文字幕一区| 天堂av网在线| 久久久亚洲福利精品午夜| 日韩第二十一页| 青青影院一区二区三区四区| 一本色道久久综合亚洲精品不| 亚洲制服在线观看| 中文字幕的久久| 国产性生活视频| 日韩精品中文字| www.综合| 福利视频一区二区三区| 91精品天堂福利在线观看| 香蕉视频禁止18| 国产亚洲一区二区三区| 青青操免费在线视频| 亚洲成人xxx| 免费在线看污片| 99国产高清| 亚洲字幕久久| 亚洲色图偷拍视频| 国产精品美女久久久久久| 波多野结衣家庭主妇| 亚洲女人被黑人巨大进入| 亚洲精品一区| 久久久久无码国产精品一区| 亚洲精品免费观看| 91精品人妻一区二区三区蜜桃2| 亚洲欧洲中文日韩久久av乱码| 一区二区小视频| 日韩一区二区在线视频| 韩国理伦片久久电影网| 污视频在线免费观看一区二区三区| 日日摸夜夜添夜夜添精品视频| 日韩av在线看免费观看| 日韩欧美国产骚| 久久久久久女乱国产| 国产成人自拍视频在线观看| 国产精品一区二区av日韩在线 | 久久成人精品无人区| 波多野结衣欲乱| 欧美疯狂性受xxxxx喷水图片| 秋霞午夜在线观看| 91影院在线免费观看视频| 欧美a级一区| 69亚洲乱人伦| 黑人巨大精品欧美一区二区三区 | 久久久精品视频在线观看| 999色成人| 男人c女人视频| 不卡一区二区三区四区| 在线能看的av| 在线日韩欧美视频| а天堂中文最新一区二区三区| 成人免费看片视频在线观看| zzijzzij亚洲日本少妇熟睡| 国产www在线| 深夜福利国产精品| 日本在线一区二区三区| 青青青免费在线| 国产日韩欧美综合在线| 国产男男gay网站| 久久久久在线观看| 国产免费av一区二区三区| 一区二区在线免费看| 亚洲国产cao| 国产在线黄色| 91免费看国产| 一本久道久久久| 中文字幕91视频| 亚洲高清一区二| 久久亚洲精品人成综合网| 高清无码视频直接看| 久久亚洲一区二区三区明星换脸| 国产精品午夜一区二区| 欧美肥臀大乳一区二区免费视频| 亚洲专区视频| 午夜免费福利网站| 色综合久久天天综合网| www在线视频| 欧美日韩精品综合| 国产精品99久久久久久久vr| 国产婷婷色一区二区在线观看| 久久夜色精品国产| 国产精品欧美三级在线观看| 三级黄色片免费看| 欧美怡红院视频| segui88久久综合9999|