精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

150B token從頭訓練,普林斯頓Meta發布完全可微MoE架構Lory

人工智能 新聞
前幾天,普林斯頓大學聯合Meta在arXiv上發表了他們最新的研究成果——Lory模型,論文提出構建完全可微的MoE模型,是一種預訓練自回歸語言模型的新方法。

不同于大多數模型使用字母縮略起名,論文作者在腳注中解釋道,Lory是一種羽毛有彩虹顏色的鸚鵡,和「軟MoE」的精神非常相似。

圖片

論文的作者團隊也可以稱之為「明星陣容」。

圖片論文地址:https://arxiv.org/abs/2405.03133

主要作者之一陳丹琦是普林斯頓大學計算機科學系的助理教授,也是普林斯頓NLP小組共同領導人之一。她本科畢業于清華大學姚班,2018年在斯坦福大學獲得博士學位,導師是大名鼎鼎的Christopher Manning。

斯坦福教授、NLP領域泰斗Dan Jurafsky曾這樣評價她:「她在發現重要的研究問題上很有品位。她已經對該領域產生了非凡的影響,并且她的影響只會越來越大。」

圖片

Mike Lewis是Meta AI的一名研究科學家,他領導了Meta剛發布的大語言模型Llama 3的預訓練工作。

圖片

他此前曾發表過多項有影響力的研究成果,包括Bart、Roberta、top-k采樣等。

本文的第一作者是普林斯頓大學五年級博士生鐘澤軒,導師是陳丹琪教授。

圖片

鐘澤軒碩士畢業于伊利諾伊大學香檳分校,本科畢業于北京大學計算機系,曾在Meta AI和微軟亞洲研究院實習,這項研究就是他在Meta實習期間完成的。

發布后,論文作者也在推特上提供了全文解讀。

圖片

引入的關鍵技術包含兩個方面,一是用因果分段路由策略取代token級別的路由,可以在保持語言模型自回歸屬性的同時實現高效的專家合并。

二是提出了基于相似性的數據批處理方法,如果僅僅是把隨機選擇的文本拼接在一起訓練會導致低水平的專家模型,而將相似的文本進行分組可以使模型更加專業化。

圖片

基于這些方法,作者使用150B token的數據從頭訓練了一系列的Lory模型,活躍參數有0.3B和1.5B兩個級別,含有最多32個專家。

與稠密模型相比,Lory的訓練過程更為高效,可以用少2.5倍的步數實現相同的損失值。

研究團隊使用上下文學習的方法評估Lory的能力,發現模型在常識推理、閱讀理解、閉卷問答、文本分類等下游任務上都取得了很好的效果。

可以觀察到,使用更多專家可以改進模型的表現。

相比目前MoE領域的SOTA模型Expert Choice(EC),Lory模型也表現出了有競爭力的性能。

2023年12月,一家名為Mistral AI的法國創業公司發布了一款性能媲美甚至優于GPT-3.5和Llama 2 70B的模型Mixtral 8x7B。

Mixtral使用了一種稀疏的MoE網絡,不僅表現出了強大的性能,而且十分高效,推理速度相比Llama 2 70B提高了6倍,于是讓MoE得到了開源社區的廣泛關注。

甚至有人猜測,GPT-4可能也使用了MoE技術實現了超過一萬億參數的超大模型。

對于Transformer架構的語言模型,MoE主要有兩個元素:

一是使用參數更為稀疏的MoE層代替密集的前饋網絡層(FFN),其中每個專家都是一個獨立的神經網絡,甚至可以是MoE本身,從而形成層級式的MoE結構。

二是使用門控網絡或路由機制決定token被發送到哪個專家,其中token的路由機制是決定MoE模型表現的關鍵點。

因果分段路由

雖然MoE的這種機制有助于高效擴展模型規模,但訓練路由網絡的過程會引入離散化、不可微的學習目標。2023年發布的SMEAR模型就已經開始探索解決方案,使用專家合并方法構建完全可微的MoE模型。

論文地址:https://arxiv.org/abs/2306.03745

然而,SMEAR使用的方法是將所有專家進行軟合并,取其加權平均值,這適用于文本分類任務,但很難應用到自回歸語言模型上。

于是,作者提出了使用分段路由的方法,對每一段語句而非每個token進行專家合并,有效減少了合并操作的數量。

如果僅僅使用當前語段進行路由,很可能導致語言模型遺漏跨語段的信息,所以論文提出采用類似于自回歸的因果分段路由。

在為當前語段合并專家時,需要考慮前一個語段的信息,從而決定每個專家的路由權重。

消融實驗的結果也證明,與因果分段路由的策略相比,單純使用前綴進行路由會導致語言模型性能降低。

基于相似性的數據批處理

預訓練語言模型的標準做法是將數據集中的文檔隨機拼接在一起,構造出固定長度的訓練樣本。

對于MoE模型而言,這種方法存在問題,相鄰段的token可能來自非常不同且毫不相關的文檔,可能會損害專家模型的專業化程度。

因此,受到ICLR 2024中一篇論文的啟發,作者在Lory中采用了類似的技術,依次連接相似的文檔來構造訓練樣本,使專家模型更「專注」地研究不同的領域或主題。

論文地址:https://arxiv.org/abs/2310.10638

實驗表明,無論是隨機批處理還是基于相似度批處理,Lory模型的效果都優于稠密模型,但使用基于相似度的方法可以得到更大的loss提升。

責任編輯:張燕妮 來源: 新智元
相關推薦

2012-08-02 16:18:10

普林斯頓結構哈佛結構架構

2025-05-06 00:45:00

2011-04-22 10:14:34

無線網絡DHCPAndroid

2022-07-26 09:56:48

模型AI

2025-07-18 09:55:11

2025-06-18 16:42:15

視頻生成AI模型

2024-11-12 13:40:00

2020-12-02 10:05:26

AI 數據人工智能

2023-11-17 23:05:18

數據模型

2023-09-12 14:45:18

2021-11-09 09:52:57

神經網絡AI算法

2024-10-28 22:14:05

2023-12-05 13:25:00

數據訓練

2025-09-25 09:02:00

MetaAI模型

2023-06-19 09:36:16

AI矩陣

2025-07-18 07:07:00

人工智能AIAI模型

2023-10-23 13:23:03

數據訓練

2023-05-22 15:17:02

谷歌AI

2025-02-13 08:30:00

2024-02-19 00:15:39

模型數據
點贊
收藏

51CTO技術棧公眾號

色国产综合视频| 久久久www免费人成精品| 欧美疯狂xxxx大交乱88av| 涩视频在线观看| 国产精品专区免费| 最新中文字幕一区二区三区| 粉嫩av免费一区二区三区| 看片网址国产福利av中文字幕| 成人情趣视频| 欧美videofree性高清杂交| 日韩免费一级视频| 久久bbxx| 久久人人97超碰com| 91免费在线视频网站| 久久久久久91亚洲精品中文字幕| 一区二区免费不卡在线| 亚洲美女黄色片| 国产成人精品综合久久久久99 | 久久99久久99精品免观看粉嫩 | 国产精品最新| 日韩欧美亚洲国产另类| 中文字幕第36页| 九色porny自拍视频在线观看| 亚洲欧洲精品一区二区三区| 蜜桃传媒一区二区| 亚洲美女综合网| 精一区二区三区| 国产91精品最新在线播放| 久久免费少妇高潮99精品| 日本高清免费电影一区| 精品亚洲aⅴ在线观看| 无套内谢丰满少妇中文字幕| 国产成人免费精品| 一本色道久久加勒比精品| 日韩国产成人无码av毛片| 91成人高清| 久久久久88色偷偷免费| 极品尤物一区二区三区| 午夜精品在线播放| 国产成人精品亚洲日本在线桃色 | 欧美极品欧美精品欧美| 欧洲黄色一区| 亚洲最大色网站| 400部精品国偷自产在线观看| 在线免费看黄| 欧美极品少妇xxxxⅹ高跟鞋| 欧美日韩另类综合| 午夜视频在线播放| 成人av高清在线| 国产98在线|日韩| 亚洲AV无码一区二区三区性| 国产自产视频一区二区三区| 成人欧美在线观看| 国产露脸91国语对白| 黑人巨大精品欧美黑白配亚洲| 国产精品普通话| 国产精品传媒在线观看| 天堂va蜜桃一区二区三区漫画版| 国产成+人+综合+亚洲欧美丁香花| 天堂а√在线中文在线新版| 99综合精品| 777777777亚洲妇女| 精品成人av一区二区在线播放| 韩国一区二区三区在线观看| 97人人爽人人喊人人模波多 | 欧洲av在线精品| 日韩一级理论片| 日本欧美一区| 777奇米成人网| 制服下的诱惑暮生| 国产成人aa在线观看网站站| 精品一区二区亚洲| 免费看91的网站| 午夜激情久久| 欧美乱妇高清无乱码| 国产一级淫片免费| 国产麻豆综合| 国产欧美在线看| av网站在线免费看| 99视频精品在线| 日韩在线电影一区| 看女生喷水的网站在线观看| 亚洲综合男人的天堂| 欧美精品99久久| 欧美黄色成人| 欧美精品一区二区三区一线天视频 | 中文字幕一区电影| 在线观看黄网址| 99精品热视频只有精品10| 国产精品99久久久久久人| 国产露脸国语对白在线| 成人激情午夜影院| 视频一区二区三区在线观看| 99福利在线| 色综合视频在线观看| 一级淫片在线观看| 色老板在线视频一区二区| 日韩有码在线播放| 成人免费看片98欧美| 狠狠色狠狠色综合| 快播亚洲色图| 在线免费av导航| 色综合欧美在线| 中文字幕一二三区| 日本一区二区在线看| 久久久人成影片一区二区三区观看| 日日夜夜操视频| 国产高清在线精品| 亚洲自拍三区| 日韩在线伦理| 日韩欧美激情一区| 18啪啪污污免费网站| 99国产精品私拍| 91免费版网站入口| 国产三级在线| 欧美日韩一区二区精品| 四川一级毛毛片| 欧美午夜精彩| 国产91成人video| www.爱爱.com| 国产精品麻豆视频| 乱子伦视频在线看| 欧美日韩麻豆| 国产做受69高潮| 国产男女裸体做爰爽爽| 国产精品无人区| 日韩av在线综合| 欧美黑人巨大videos精品| 久久精品一偷一偷国产| 中文字幕 自拍偷拍| 久久婷婷国产综合精品青草| 国产精品又粗又长| youjizzjizz亚洲| 久久亚洲成人精品| 亚洲一区 中文字幕| 国产欧美一区二区三区沐欲| 欧美成人免费高清视频| 日本韩国欧美超级黄在线观看| 欧美激情喷水视频| www.五月婷婷| 亚洲精品国产品国语在线app| 国产九九在线观看| 欧美日韩水蜜桃| 国产精品人成电影| www.在线播放| 欧美日韩一区久久| 999精品久久久| 美女爽到高潮91| 亚洲一区二区三区精品在线观看 | 亚洲无线看天堂av| 欧美一区二区观看视频| 国产三级国产精品国产国在线观看| 久久99热这里只有精品| 一区二区在线不卡| 国产一区二区三区国产精品| 久久人人爽人人爽人人片亚洲| 91极品身材尤物theporn| 中文字幕亚洲精品在线观看| 中文字幕12页| 欧美区一区二| 国产一区免费视频| 免费电影日韩网站| 中文日韩电影网站| 91亚洲国产成人精品一区| 亚洲精品乱码久久久久久黑人| 在线观看中文av| 亚洲国产第一| 欧美一区二区三区电影在线观看| 亚洲欧美在线成人| 精品久久久999| 亚洲欧美黄色片| 日韩欧美福利视频| 一区二区三区在线播放视频| 国产美女久久久久| 欧美大片在线播放| 国产精品免费不| 一区二区三区国产在线| 国产97在线视频| 一区二区三区视频网站| 日韩写真欧美这视频| 国产精品白浆一区二小说| 91麻豆精品秘密| 午夜一区二区视频| 精品动漫3d一区二区三区免费| 美日韩精品免费| 亚洲欧美一级| 97免费在线视频| 日本在线观看免费| 亚洲国产成人在线播放| 波多野结衣小视频| 一区二区三区在线视频观看| 国产激情在线免费观看| 国产自产高清不卡| 国产成人久久777777| 日韩精品一区二区久久| 国产精品日韩欧美一区二区三区 | 欧美性videos高清精品| 美女av免费看| 成人av电影免费在线播放| 中文字幕 91| 99riav1国产精品视频| 亚洲一区二区三区午夜| 欧美性生活一级片| 91精品国产高清久久久久久91裸体| 日本三级一区| 欧美另类极品videosbest最新版本 | 亚洲美女自拍偷拍| 色综合久久中文| 亚洲自拍偷拍视频| av一区在线播放| 国内偷自视频区视频综合| 91网在线播放| 亚洲色图五月天| 黄色www视频| 5566中文字幕一区二区电影| 夜夜爽妓女8888视频免费观看| 亚洲午夜免费福利视频| 艳妇荡乳欲伦69影片| 久久新电视剧免费观看| 99re这里只有| 国产99久久精品| 日韩av片免费观看| 青草国产精品久久久久久| 337p粉嫩大胆噜噜噜鲁| 激情欧美日韩一区| 欧美日韩午夜爽爽| 亚洲成人最新网站| 中文字幕在线亚洲精品| 日韩精品2区| 水蜜桃亚洲一二三四在线| 亚洲风情第一页| 免费观看日韩av| 男女激情无遮挡| 亚洲夜间福利| 欧美视频在线第一页| 99久久久久| 亚洲高清视频一区| 精品国产一级毛片| 日韩精品欧美一区二区三区| 一区二区三区四区在线看| 精品国产综合久久| 老牛国内精品亚洲成av人片| 国产精品福利视频| 国产91精品入| 激情视频一区二区| 奇米777国产一区国产二区| 国产私拍一区| 男人的天堂久久| 蜜桃臀一区二区三区| 自拍亚洲一区| 茄子视频成人在线观看 | 成人在线视频你懂的| 国产精品国产精品| 日韩高清电影免费| 欧美极品色图| 成人aaaa| 少妇熟女一区二区| 欧美精品偷拍| 欧美三级在线观看视频| 免费日韩精品中文字幕视频在线| 超碰97人人射妻| 免费人成在线不卡| www.污污视频| 成人高清视频免费观看| www.88av| 欧美国产一区二区| 欧洲猛交xxxx乱大交3| 亚洲国产精品久久人人爱蜜臀| 亚洲免费在线观看av| 欧美在线免费观看亚洲| 国产伦精品一区二区三区四区| 日韩久久精品一区| 欧美一区二区少妇| xvideos亚洲| 高清电影在线免费观看| 欧美做受高潮电影o| 日韩欧美三区| 精品国产乱码久久久久久蜜柚 | 91麻豆成人久久精品二区三区| 亚洲无人区码一码二码三码的含义| 1区2区3区欧美| 国产精品111| 91国在线观看| 精品国产九九九| va亚洲va日韩不卡在线观看| 激情伦成人综合小说| 久久男人av| 亚洲成人a**址| 欧美特黄视频| 在线免费视频a| 成人污视频在线观看| 阿v天堂2014| 午夜精品影院在线观看| 亚洲天天综合网| 亚洲国产精品国自产拍av秋霞| 色综合久久久久综合一本到桃花网| 久久久久中文字幕2018| 亚洲精品在线影院| 国产一区精品视频| 888久久久| 任你操这里只有精品| 成人午夜看片网址| 国产白丝一区二区三区| 欧美日韩一区二区免费在线观看| 国产一区二区三区三州| 日韩精品中文字幕在线| 新版中文在线官网| 国产精品美女999| 欧美电影完整版在线观看| 国产经典久久久| 日韩av在线发布| 国产三级国产精品| 一区二区三区四区精品在线视频| 波多野结衣理论片| 日韩毛片在线看| 欧洲中文在线| 亚洲自拍欧美色图| 97国产成人高清在线观看| 日批视频在线免费看| 本田岬高潮一区二区三区| 91杏吧porn蝌蚪| 欧美卡1卡2卡| 幼a在线观看| 国产精品久久久久久久app| 久久综合另类图片小说| 国产 欧美 日韩 一区| 精品一区二区三区视频| 少妇愉情理伦三级| 在线中文字幕不卡| 日本午夜在线视频| 777国产偷窥盗摄精品视频| 香蕉免费一区二区三区在线观看 | 国精品一区二区| 日本美女久久久| 亚洲欧洲国产日韩| 6—12呦国产精品| 中文字幕在线视频日韩| 日韩精品免费观看视频| 日韩欧美第二区在线观看| 视频一区中文字幕| 久久午夜福利电影| 91精品91久久久中77777| 久久精品a一级国产免视看成人| 欧美夜福利tv在线| 西瓜成人精品人成网站| 欧美日韩黄色一级片| 91亚洲精华国产精华精华液| 五月天综合激情| 亚洲精品少妇网址| 久久r热视频| 亚欧精品在线| 老色鬼精品视频在线观看播放| 色综合伊人色综合网站| 伊人在我在线看导航| 国产高清在线一区| 日韩天堂av| 蜜桃传媒一区二区亚洲| 欧美视频在线一区| 国产三区在线观看| 成人羞羞视频免费| 亚洲精品日韩久久| 四虎影成人精品a片| 欧美亚洲国产bt| 精品孕妇一区二区三区| 91在线视频成人| 精品999成人| 国产传媒第一页| 欧美亚一区二区| av网站导航在线观看免费| 国产区一区二区三区| 欧美专区在线| 国产探花在线视频| 精品国产91久久久久久久妲己| 色网在线免费观看| 在线观看日韩片| 成人黄色a**站在线观看| 极品国产91在线网站| 久久精品福利视频| 激情小说一区| 在线免费观看视频黄| 亚洲免费观看高清完整版在线| 欧洲精品久久一区二区| 国产精品电影网站| 欧美精品二区| 亚洲人成人无码网www国产| 欧美美女黄视频| heyzo高清在线| 五月天综合网| 成人黄色网址在线观看| 一区两区小视频| 国外成人免费在线播放| 青青一区二区三区| 国产一级伦理片| 538prom精品视频线放| 乡村艳史在线观看| 亚洲小说欧美另类激情| 久久久噜噜噜久久人人看 | 久久久久久久福利| 中文字幕久久久| 成人高潮视频|