精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Jeff Dean:我們寫了一份「稀疏模型設(shè)計(jì)指南」,請(qǐng)查收

人工智能 深度學(xué)習(xí) 新聞
來(lái)自谷歌的 Barret Zoph、Irwan Bello、William Fedus 、Jeff Dean 等研究者給出了一份「高效稀疏專家模型設(shè)計(jì)指南」。
稀疏模型在深度學(xué)習(xí)領(lǐng)域發(fā)揮著越來(lái)越重要的作用。對(duì)于給定的 token 或樣本,它可以只激活模型的一小部分,從而在擁有很大的參數(shù)量的同時(shí)也能做到計(jì)算友好。但是,如何可靠地訓(xùn)練這類模型依然是一個(gè)需要解決的問(wèn)題。在這篇文章中,來(lái)自谷歌的 Barret Zoph、Irwan Bello、William Fedus 、Jeff Dean 等研究者給出了一份「高效稀疏專家模型設(shè)計(jì)指南」。

稀疏專家神經(jīng)網(wǎng)絡(luò)展示了純規(guī)模的優(yōu)勢(shì),并為當(dāng)今常用的靜態(tài)神經(jīng)網(wǎng)絡(luò)架構(gòu)提供了一種有效的替代方案。稀疏專家網(wǎng)絡(luò)不是對(duì)所有輸入應(yīng)用相同的參數(shù),而是為每個(gè)輸入動(dòng)態(tài)選擇使用哪些參數(shù)。這允許網(wǎng)絡(luò)極大地?cái)U(kuò)展參數(shù)的數(shù)量,同時(shí)保持每個(gè) token 的 FLOPs 大致不變。這些方法的采用已經(jīng)帶來(lái)了 SOTA 翻譯模型、4-7 倍的預(yù)訓(xùn)練加速,以及僅使用 1/3 的訓(xùn)練成本就能達(dá)到 GPT-3 級(jí)的 one-shot 性能。盡管參數(shù)數(shù)量驚人,但稀疏模型將訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)的碳足跡降低了一個(gè)數(shù)量級(jí)。然而,困難依然存在。

Fedus et al. (2021)觀察到,與之前的 SOTA 方法(Raffel et al., 2019)相比,稀疏 1.6T 參數(shù)模型實(shí)現(xiàn)了 4 倍的預(yù)訓(xùn)練加速,但在 SuperGLUE 等常用基準(zhǔn)上進(jìn)行微調(diào)時(shí),卻落后于較小的模型。在 Artetxe et al. (2021)中,研究者在域外數(shù)據(jù)上對(duì) MoE 語(yǔ)言模型進(jìn)行了微調(diào),并觀察到了相似的差距。

為了解決這一問(wèn)題,Switch-XXL 模型被提出,該模型參數(shù)較少,但計(jì)算占用空間增加到原來(lái)的 8 倍(FLOPs 大約等于最大的 T5 模型),在自然語(yǔ)言理解任務(wù)上的性能有所提高。然而,必要的預(yù)訓(xùn)練受到先前在小規(guī)模研究中未檢測(cè)到的訓(xùn)練不穩(wěn)定性的阻礙。這些不穩(wěn)定性后來(lái)在其他稀疏模型中被識(shí)別出來(lái)。這些結(jié)果揭示了參數(shù)和計(jì)算的必要平衡,但如何可靠地訓(xùn)練這種模型依然是一個(gè)待解決的問(wèn)題。

這篇論文的目的就是提高稀疏模型的實(shí)用性和可靠性。他們研究了這兩個(gè)問(wèn)題,并給出了設(shè)計(jì)指南。最后,他們將稀疏模型的參數(shù)縮放到 269B,其計(jì)算成本與 32B 密集編碼器 - 解碼器 Transformer(穩(wěn)定、可遷移的 Mixture-of-Experts、ST-MoE-32B)相當(dāng)。這是稀疏模型首次在遷移學(xué)習(xí)中實(shí)現(xiàn) SOTA 性能,跨越了一系列不同的任務(wù),包括推理(SuperGLUE、ARC Easy、ARC Challenge)、摘要(XSum、CNN-DM)、閉卷問(wèn)答(WebQA、Natural Questions)和對(duì)抗式構(gòu)造任務(wù)(Winogrande、ANLI R3)。

本文的貢獻(xiàn)可以概括如下:

1、開展了一項(xiàng)關(guān)于穩(wěn)定性技術(shù)的質(zhì)量 - 穩(wěn)定性權(quán)衡(quality-stability trade-offs)大規(guī)模研究;2、引入了 router z-loss 來(lái)解決穩(wěn)定性問(wèn)題,同時(shí)略微提高了模型質(zhì)量;3、給出了關(guān)于稀疏和密集模型的微調(diào)分析,揭示了二者對(duì)批大小和學(xué)習(xí)率的不同超參數(shù)敏感性;他們發(fā)現(xiàn),糟糕的超參數(shù)導(dǎo)致密集模型上幾乎沒(méi)有微調(diào)增益,盡管預(yù)訓(xùn)練有很大的加速;4、給出了分布式環(huán)境下設(shè)計(jì) Pareto 高效稀疏模型的架構(gòu)、routing 和模型設(shè)計(jì)原則;5、給出了追蹤跨專家層的 token routing 決策的定性分析;6、訓(xùn)練出了一個(gè) 269B 稀疏模型,在一組不同的自然語(yǔ)言基準(zhǔn)上實(shí)現(xiàn)了 SOTA 性能。

router z-loss

穩(wěn)定神經(jīng)網(wǎng)絡(luò)最成功的方法之一是對(duì)激活的約束和梯度。一種流行的方法是在通過(guò)深度網(wǎng)絡(luò)反向傳播時(shí),裁剪梯度范數(shù)來(lái)彌補(bǔ)爆炸梯度。

在這篇論文中,研究者使用 Adafactor 優(yōu)化器是因?yàn)樗膬?nèi)存效率(盡管最近推出的 8 位優(yōu)化器 (Dettmers et al., 2021) 可能會(huì)提供更好的 trade-off)。Adafactor 使用更新裁剪(update clipping),而不是梯度裁剪(gradient clipping),其中對(duì)權(quán)重的更改被限制在一定的范數(shù)以下。他們嘗試將更新裁剪收緊到更小的值。

接下來(lái),他們研究了即將進(jìn)入 router 的 logit 上的約束。router 以 float32 計(jì)算專家的概率分布。然而,研究者發(fā)現(xiàn),在最大的規(guī)模下,這不足以帶來(lái)可靠的訓(xùn)練結(jié)果。為了解決這個(gè)問(wèn)題,他們引入了 router z-loss,

其中,B 是 token 的數(shù)目,N 是專家數(shù),x ∈ RB×N 是將要進(jìn)入 router 的 logit。

下表 4 顯示,在三次運(yùn)行中,update clipping 和 router z-loss 都穩(wěn)定了模型,但是 update clipping 嚴(yán)重影響了模型的質(zhì)量。因此,研究者使用 z-loss 方法來(lái)固定模型穩(wěn)定性。

router z-loss 引入了另一個(gè)超參數(shù) (c_z),這是一個(gè)加權(quán)系數(shù),作為優(yōu)化的總損失的一部分。總損失是交叉熵?fù)p失 (cross entropy loss, L_CE)、輔助負(fù)載平衡損失 (auxiliary load balance loss, L_B) 和 router z-loss (L_Z) 的線性加權(quán)組合。

基于用超參數(shù)掃描進(jìn)行預(yù)訓(xùn)練后的最佳模型質(zhì)量,研究者選擇 c_z = 0.001 的值。附錄 B 記錄了預(yù)訓(xùn)練過(guò)程中的損失。

稀疏模型的設(shè)計(jì)

密集模型的設(shè)計(jì)受到 Kaplan et al. (2020) 的基礎(chǔ)工作的指導(dǎo)。但是到了稀疏模型這里,還有無(wú)數(shù)的額外問(wèn)題需要解決,比如:(1)使用多少專家?(2)使用哪種 routing 算法?(3)容量因子(capacity factor)的值是多少?(4)硬件如何改變這些決策?在本文中,研究者給出的建議是:

1、在他們的設(shè)置中,他們推薦容量因子為 1.25 的 top-2 routing,每個(gè)核心最多有一個(gè)專家;2、在評(píng)估期間,可以更改容量因子,以適應(yīng)新的內(nèi)存 / 計(jì)算要求;3、密集層疊加和乘法偏置(multiplicative bias)可以提高質(zhì)量。

 更多細(xì)節(jié)請(qǐng)參考原論文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2022-10-08 12:45:26

模型

2021-02-05 16:55:09

前端樣式規(guī)則開發(fā)架構(gòu)

2019-01-10 15:42:31

2020-03-30 11:32:49

IT技術(shù)面試

2020-02-10 10:12:28

安全意識(shí)安全指南遠(yuǎn)程辦公

2016-08-24 16:55:18

DevOps結(jié)構(gòu)清單

2020-01-02 14:13:01

機(jī)器學(xué)習(xí)模型部署預(yù)測(cè)

2021-05-18 09:12:40

TCP網(wǎng)絡(luò)分層網(wǎng)絡(luò)協(xié)議

2018-05-15 09:15:03

CNN卷積神經(jīng)網(wǎng)絡(luò)函數(shù)

2018-01-29 16:29:35

數(shù)據(jù)開發(fā)從業(yè)

2019-06-10 15:06:56

高考AI人工智能

2022-06-17 14:33:01

模型AI

2019-03-15 15:15:12

硬盤SSD閃存

2023-01-06 12:49:53

訓(xùn)練庫(kù)

2023-04-28 15:41:08

模型ChatGPT

2017-05-05 11:25:43

2024-10-24 20:56:36

2023-03-21 09:44:34

模型AI

2020-08-24 14:31:41

數(shù)字化

2012-01-06 15:12:46

掃描儀推薦
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色综合色综合色综合色综合| 日韩电影大全在线观看| 国产精品第二十页| 国产成人1区| 91精品国产综合久久蜜臀| 久久av综合网| jyzzz在线观看视频| 黄页网站大全一区二区| 欧美最猛性xxxxx亚洲精品| 亚洲自拍偷拍图| 日韩中文字幕在线一区| 日本高清不卡视频| 狠狠精品干练久久久无码中文字幕| 神马久久高清| 国产精品主播直播| 青青久久aⅴ北条麻妃| 欧美第一页在线观看| 久久综合欧美| 亚洲高清色综合| 想看黄色一级片| 91av亚洲| 婷婷丁香久久五月婷婷| gogogo免费高清日本写真| 欧美大片aaa| 成人av手机在线观看| 成人精品网站在线观看| 国产又粗又猛又黄视频| 在线视频日韩| 久久久久久久久久久免费| 看黄色录像一级片| 欧美在线电影| 亚洲色图17p| 中文字幕在线视频播放| 一区二区三区高清在线观看| 欧美在线一二三| 亚洲不卡中文字幕无码| 先锋成人av| 亚洲欧美国产毛片在线| 一区二区三区欧美在线| av免费观看一区二区| 国产午夜精品一区二区三区视频| 狠狠色综合色区| 亚洲欧美另类综合| 丁香婷婷深情五月亚洲| 成人午夜电影在线播放| 国产99999| 国产福利精品导航| 亚洲一区二区自拍| jizz国产视频| 高清shemale亚洲人妖| 91在线播放视频| www.蜜臀av| 成人一区二区三区视频| 成人看片在线| 日韩在线观看视频一区二区三区| 成人一区二区在线观看| 国产伦精品一区二区三区在线| www.亚洲欧美| 成人午夜免费电影| 精品国产一区二区三区四区精华| 色欲av永久无码精品无码蜜桃| 成人精品一区二区三区中文字幕| 国产美女在线精品免费观看| 欧美自拍偷拍一区二区| 97精品国产97久久久久久久久久久久| 国产亚洲欧美另类一区二区三区| 五月激情六月婷婷| 久久久.com| 亚洲成人a**址| 麻豆免费在线视频| 又紧又大又爽精品一区二区| 青草青青在线视频| 爱情电影社保片一区| 欧美中文字幕一区| 一级黄色大片儿| 伊色综合久久之综合久久| 亚洲国内高清视频| 国产精品815.cc红桃| 欧美电影免费| 欧美国产日本在线| 国产99久久久| 麻豆91在线播放免费| 99在线视频首页| 美国成人毛片| 亚洲精品自拍动漫在线| 日韩在线视频在线观看| 成人黄页网站视频| 欧美成人精品1314www| 少妇真人直播免费视频| 久久一区二区三区喷水| 性欧美xxxx| 中文字幕乱码在线观看| 成人激情小说网站| 亚洲a∨一区二区三区| 久久日韩视频| 欧美色欧美亚洲高清在线视频| 中文字幕亚洲乱码| 九九热hot精品视频在线播放| 一个人看的www久久| 性色av无码久久一区二区三区| 亚洲在线播放| 97超碰最新| 97在线观看免费观看高清 | 大胸美女被爆操| 欧美天天视频| 国产久一一精品| 天天舔天天干天天操| 中文字幕一区不卡| 能在线观看的av| 精品视频成人| 中文字幕在线精品| 免费在线观看黄网站| 精品一区二区三区在线观看国产 | 欧美色图激情小说| 欧美大片在线看免费观看| 欧美成人精品网站| 99精品国产91久久久久久| 成人性做爰片免费视频| 中文字幕日本一区二区| 日韩成人在线观看| 亚洲国产成人精品综合99| 日本不卡视频一二三区| 久热这里只精品99re8久| 亚洲夜夜综合| 7777精品伊人久久久大香线蕉完整版 | a级片一区二区| 精品久久在线| 国产亚洲日本欧美韩国| 五月婷婷亚洲综合| 成人av网站在线观看免费| 欧美日韩一级在线| 国产成人a视频高清在线观看| 亚洲毛片在线观看| 91精品国产乱码久久久张津瑜| 国产精品99久久久久久有的能看| 亚洲欧洲精品一区| 91欧美精品| 一区二区福利视频| 成年人视频免费| 久久久久国产一区二区三区四区| www.中文字幕在线| 啪啪国产精品| 91精品国产亚洲| 天堂在线资源网| 精品美女国产在线| 一区二区三区少妇| 国产日韩欧美一区二区三区在线观看| 国产欧美日韩一区| 午夜伦理福利在线| 国产视频综合在线| 99re这里只有精品在线| 国产色一区二区| 一本久道中文无码字幕av| 精品国产一区二区三区小蝌蚪| 国产成人免费av| eeuss影院在线观看| 欧美曰成人黄网| 国产精品久久国产精麻豆96堂| 久久99精品一区二区三区三区| 在线视频亚洲自拍| 国产一区精品二区| 欧美黄网免费在线观看| 香蕉视频黄在线观看| 色偷偷久久一区二区三区| 精品一区二区三区蜜桃在线| 久久国产精品99久久久久久老狼| 日本丰满少妇黄大片在线观看| 2023国产精华国产精品| 91国在线精品国内播放| 免费在线稳定资源站| 欧美少妇性性性| 日本a级片视频| 不卡一区二区三区四区| 国产精品wwwww| 久久久国产精品| 国产伦精品一区二区三区四区免费| 国产理论在线| 亚洲免费人成在线视频观看| 中文字幕+乱码+中文| 亚洲精品自拍动漫在线| 波多野结衣一本| 久久精品国产**网站演员| 丁香婷婷综合激情| 自拍欧美一区| 96sao精品视频在线观看| 热色播在线视频| 日韩视频―中文字幕| 欧美视频在线观看一区二区三区| 色香色香欲天天天影视综合网| 亚洲人与黑人屁股眼交| 99在线热播精品免费| 岛国av在线免费| 亚洲毛片av| 伊人久久大香线蕉成人综合网| 国产成人aa在线观看网站站| 国产精品极品美女在线观看免费| 色呦呦在线视频| 亚洲午夜精品久久久久久久久久久久 | fc2ppv国产精品久久| 亚洲欧洲激情在线| www.黄色一片| 欧美三级资源在线| 日韩乱码一区二区| 亚洲色图.com| 久久成人激情视频| 成人激情午夜影院| 久久人人爽人人片| 免费欧美日韩国产三级电影| 日韩中字在线观看| 午夜精品久久99蜜桃的功能介绍| 日韩精品另类天天更新| 日日天天久久| 99久久综合狠狠综合久久止| av免费在线一区| 91产国在线观看动作片喷水| 亚洲图区一区| 久久国产精品久久久久| 最新电影电视剧在线观看免费观看| 亚洲国产精品va| aaa一区二区三区| 欧美日韩免费一区二区三区 | 日本91福利区| 国产中文字幕免费观看| 精久久久久久| 97免费视频观看| 亚洲视频电影在线| 亚洲一区二区三区在线观看视频 | 亚洲人成伊人成综合网久久久| 蜜桃视频在线观看www| 欧美一区二区三区人| 亚洲影视一区二区| 欧美日韩亚洲国产综合| 正在播放亚洲精品| 91国内精品野花午夜精品| 国产精品视频免费播放| 午夜久久福利影院| 日韩欧美一区二区一幕| 午夜影院久久久| 国产无遮挡又黄又爽又色| 亚洲一区二区四区蜜桃| 久久久久久久久久综合 | 日韩中文字幕不卡视频| www.亚洲免费| 日韩在线免费视频| 欧美三级理伦电影| 一区二区欧美亚洲| 成人免费黄色网页| 中日韩美女免费视频网址在线观看| 极品白浆推特女神在线观看| 亚洲午夜激情免费视频| 在线观看免费网站黄| 久久精视频免费在线久久完整在线看| 日本视频不卡| 久久视频在线观看免费| 在线免费观看的av| 97精品国产97久久久久久| 欧美a级在线观看| 国产成人高潮免费观看精品| 欧美××××黑人××性爽 | 国产精品97在线| 日韩vs国产vs欧美| 亚洲日本黄色片| 国产精品自拍网站| 国产麻豆剧传媒精品国产av| 久久久精品蜜桃| 99久久精品久久亚洲精品| 日韩毛片高清在线播放| 久久久久黄色片| 欧美日韩亚洲激情| 中文字幕欧美人妻精品一区蜜臀 | 国产成人精品视频在线观看| 欧洲亚洲精品久久久久| av蓝导航精品导航| 曰本一区二区三区视频| 亚洲综合首页| 在线播放精品| 一级黄色香蕉视频| 国产精品一区二区三区四区| 国产制服丝袜在线| 国产精品美女久久久久久久久 | 日韩一区二区免费在线观看| 日韩一级在线播放| 中文字幕亚洲色图| 国产白丝在线观看| 国产成人在线亚洲欧美| 免费精品一区二区三区在线观看| 久久精品人成| 亚洲成av人片乱码色午夜| 99久久国产综合精品五月天喷水| 日韩高清一区二区| 国产乱国产乱老熟300部视频| www国产成人| 亚洲色图综合区| 日本精品视频一区二区三区| 99视频国产精品免费观看a| 国产手机视频精品| 色呦呦在线免费观看| 国产精品久久久久免费a∨| 亚洲国产高清在线观看| 视频一区二区三| 一本色道久久综合亚洲精品高清 | 久久久国产午夜精品 | 亚洲无线视频| 中文字幕av不卡在线| hitomi一区二区三区精品| 一级片一级片一级片| 色综合咪咪久久| 成人乱码一区二区三区| 日韩一中文字幕| 欧洲亚洲两性| 国产女人水真多18毛片18精品 | 欧美精品系列| 水蜜桃色314在线观看| 国产精品77777| 欧美爱爱免费视频| 欧美亚洲尤物久久| 日本一级在线观看| 久久久久久久国产精品| 国产不卡精品| 一区二区三区偷拍| 日本vs亚洲vs韩国一区三区| 中文精品在线观看| 午夜欧美一区二区三区在线播放| 国产福利小视频| 久久这里有精品视频| 欧美电影在线观看网站| 日韩精品国内| 丝袜脚交一区二区| 日本黄色网址大全| 欧美日韩国产页| 天天操天天操天天| 国外成人在线播放| 综合激情久久| 久草视频这里只有精品| 国产一区二区0| 国模无码国产精品视频| 91精品在线观看入口| 蜜桃av在线免费观看| 国产日韩在线看| 欧美xxav| 樱花草www在线| 综合婷婷亚洲小说| 国产精品爽爽久久久久久| 北条麻妃一区二区三区中文字幕| 男人天堂久久| 国产又爽又黄ai换脸| 国产在线播精品第三| 丰满少妇被猛烈进入一区二区| 8x福利精品第一导航| 性网站在线观看| 国产精品久久久对白| 99精品视频免费观看| 天天躁日日躁aaaxxⅹ| 欧美亚洲高清一区| 免费黄色电影在线观看| 97人人香蕉| 在线欧美一区| 国产女主播喷水高潮网红在线| 色噜噜久久综合| 五月婷婷在线观看| 91色在线观看| 中文亚洲免费| 国产欧美小视频| 日韩视频在线永久播放| 18video性欧美19sex高清| 麻豆av福利av久久av| 全国精品久久少妇| 激情综合五月网| 亚洲精品黄网在线观看| 日本美女久久| 一级黄色片播放| 91在线观看免费视频| 中文字幕日产av| 欧美成人精品激情在线观看| 里番精品3d一二三区| 成人在线激情网| 亚洲靠逼com| 可以在线观看的黄色| 国产日韩在线视频| 伊人久久亚洲美女图片| 欧美 日韩 成人| 日韩欧美一二三区| 偷拍中文亚洲欧美动漫| 最新av网址在线观看| xnxx国产精品| 国产欧美熟妇另类久久久| 欧美中文在线观看| 你懂的网址国产 欧美| japanese中文字幕| 日韩一区二区电影在线| 欧美gay视频| 高清无码视频直接看| 国产情人综合久久777777| 亚洲AV无码精品色毛片浪潮| 国产精品99久久久久久人| 午夜久久黄色| 婷婷丁香综合网| 国产视频一区在线| 亚洲一区二区三区在线免费| 美女一区二区三区视频|