精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

新聞 人工智能
大規模語言模型性能固然好,但計算和資源成本太高了,有沒有方法可以更有效地訓練和使用 ML 模型呢?

 [[439859]]

近幾年,我們已經看到模型規模越來越大,例如 2018 年誕生的 GPT 具有 1.17 億參數,時隔一年,2019 年 GPT-2 參數量達到 15 億,2020 年更是將其擴展到 1750 億參數的 GPT-3。據了解,OpenAI 打造的超級計算機擁有 285000 個 CPU 核以及 10000 個 GPU,供 OpenAI 在上面訓練所有的 AI 模型。

大型語言模型雖然訓練昂貴,但也有其重要的一面,例如可以在各種任務中執行小樣本學習,包括閱讀理解、問答。雖然這些模型可以通過簡單地使用更多參數來獲得更好的性能。但是有沒有方法可以更有效地訓練和使用這些模型呢?

為了回答這個問題,谷歌推出了具有萬億權重的通用語言模型 (Generalist Language Model,GLaM),該模型的一大特點就是具有稀疏性,可以高效地進行訓練和服務(在計算和資源使用方面),并在多個小樣本學習任務上取得有競爭力的性能。

我們來看一下 GLaM 模型的具體情況。

數據集

谷歌首先構建了一個高質量的、具有 1.6 萬億 token 的數據集,該無標簽數據集很大一部分來自 Web 頁面,其范圍從專業寫作到低質量的評論和論壇頁面。此外,谷歌還開發了一個文本質量過濾器,該過濾器是在維基百科和書籍文本數據集上訓練而成,由于過濾器訓練的數據集質量很高,所以谷歌將其過濾 Web 網頁內容的質量。最后,谷歌應用這個過濾器來生成 Web 網頁的最終子集,并將其與書籍和維基百科數據相結合來創建最終的訓練數據集。

GLaM 模型架構

GLaM 是混合專家模型 (MoE) ,這種模型可以被認為具有不同的子模型(或專家),每個子模型都專門用于不同的輸入。每一層的專家由一個門控網絡控制,該門控網絡根據輸入數據激活專家。對于每個 token(通常是一個詞或詞的一部分),門控網絡選擇兩個最合適的專家來處理數據。完整的 GLaM 總共有 1.2T 參數,每個 MoE 包含 64 個專家,總共 32 個 MoE 層,但在推理期間,模型只會激活 97B 的參數,占總參數的 8%。

GLaM 的體系架構,每個輸入 token 都被動態路由到從 64 個專家網絡中選擇的兩個專家網絡中進行預測。

與 GShard MoE Transformer 類似,谷歌用 MoE 層替換其他 transformer 層的單個前饋網絡(人工神經網絡最簡單的一層,如上圖藍色方框中的 Feedforward 或 FFN)。MoE 層有多個專家,每個專家都是具有相同架構但不同權重參數的前饋網絡。

盡管 MoE 層有很多參數,但專家是稀疏激活的,這意味著對于給定的輸入 token,只使用兩個專家,這樣做的優勢是在限制計算的同時給模型提供更多的容量。在訓練期間,每個 MoE 層門控網絡都經過訓練,使用它的輸入來激活每個 token 的最佳兩位專家,然后將其用于推理。對于 MoE 層的 E 專家來說,這本質上提供了 E×(E-1) 個不同前饋網絡組合的集合,而不是經典 Transformer 中的一個組合,從而帶來更大的計算靈活性。

最終學習到的 token 表示來自兩個專家輸出的加權組合,這使得不同的專家可以激活不同類型的輸入。為了能夠擴展到更大的模型,GLaM 架構中的每個專家都可以跨越多個計算設備。谷歌使用 GSPMD 編譯器后端來解決擴展專家的挑戰,并訓練了多個變體(基于專家規模和專家數量)來了解稀疏激活語言模型的擴展效果。

評估設置

谷歌使用 zero-shot 和 one-shot 兩種設置,其中訓練中使用的是未見過的任務。評估基準包括如下:

  • 完形填空和完成任務;
  • 開放域問答;
  • Winograd-style 任務;
  • 常識推理;
  • 上下文閱讀理解;
  • SuperGLUE 任務;
  • 自然語言推理。

谷歌一共使用了 8 項自然語言生成(NLG)任務,其中生成的短語基于真值目標進行評估(以 Exact Match 和 F1 measure 為指標),以及 21 項自然語言理解(NLU)任務,其中幾個 options 中的預測通過條件對數似然來選擇。

實驗結果

當每個 MoE 層只有一個專家時,GLaM 縮減為一個基于 Transformer 的基礎密集模型架構。在所有試驗中,谷歌使用「基礎密集模型大小 / 每個 MoE 層的專家數量」來描述 GLaM 模型。比如,1B/64E 表示是 1B 參數的密集模型架構,每隔一層由 64 個專家 MoE 層代替。

谷歌測試了 GLaM 的性能和擴展屬性,包括在相同數據集上訓練的基線密集模型。與最近微軟聯合英偉達推出的 Megatron-Turing 相比,GLaM 使用 5% margin 時在 7 項不同的任務上實現了不相上下的性能,同時推理過程中使用的算力減少了 4/5。

此外,在推理過程中使用算力更少的情況下,1.2T 參數的稀疏激活模型(GLaM)在更多任務上實現了比 1.75B 參數的密集 GPT-3 模型更好的平均結果。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

NLG(左)和 NLU(右)任務上,GLaM 和 GPT-3 的平均得分(越高越好)。

谷歌總結了 29 個基準上,GLaM 與 GPT-3 的性能比較結果。結果顯示,GLaM 在 80% 左右的 zero-shot 任務和 90% 左右的 one-shot 任務上超越或持平 GPT-3 的性能。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

此外,雖然完整版 GLaM 有 1.2T 的總參數,但在推理過程中每個 token 僅激活 97B 參數(1.2T 的 8%)的子網。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

擴展

GLaM 有兩種擴展方式:1) 擴展每層的專家數量,其中每個專家都托管在一個計算設備中;2) 擴展每個專家的大小以超出單個設備的限制。為了評估擴展屬性,該研究在推理時比較每個 token 的 FLOPS 相似的相應密集模型。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

通過增加每個專家的大小,zero-shot 和 one-shot 的平均性能。隨著專家大小的增長,推理時每個 token 預測的 FLOPS 也會增加。

如上圖所示,跨任務的性能與專家的大小成比例。在生成任務的推理過程中,GLaM 稀疏激活模型的性能也優于 FLOP 類似的密集模型。對于理解任務,研究者觀察到它們在較小的規模上性能相似,但稀疏激活模型在較大的規模上性能更好。

數據效率

訓練大型語言模型計算密集,因此提高效率有助于降低能耗。該研究展示了完整版 GLaM 的計算成本。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

模型推理(左)和訓練(右)的計算成本(GFLOPS)。

這些計算成本表明 GLaM 在訓練期間使用了更多的計算,因為它在更多的 token 上訓練,但在推理期間使用的計算卻少得多。下圖展示了使用不同數量的 token 進行訓練的比較結果,并評估了該模型的學習曲線。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

隨著訓練中處理了更多的 token,稀疏激活型和密集模型在 8 項生成任務上的平均 zero-shot 和 one-shot 性能。

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

隨著訓練中處理了更多的 token,稀疏激活型和密集模型在 21 項理解任務上的平均 zero-shot 和 one-shot 性能。

結果表明,稀疏激活模型在達到與密集模型相似的 zero-shot 和 one-shot 性能時,訓練時使用的數據顯著減少。并且,如果適用的數據量相同,稀疏型模型的表現明顯更好。

最后,谷歌對 GLam 的能效進行了評估:

1.2萬億參數:谷歌通用稀疏語言模型GLaM,小樣本學習打敗GPT-3

訓練期間,GLaM 與 GPT-3 的能耗比較。

雖然 GLaM 在訓練期間使用了更多算力,但得益于 GSPMD(谷歌 5 月推出的用于常見機器學習計算圖的基于編譯器的自動化并行系統)賦能的更高效軟件實現和 TPUv4 的優勢,它在訓練時耗能要少于其他模型。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2021-09-08 17:23:33

谷歌模型開發

2021-08-12 16:27:04

模型人工智能深度學習

2022-03-24 10:35:38

人工智能模型代碼

2022-08-25 15:05:23

AI論文

2022-12-27 13:36:09

2021-07-13 17:38:49

算法語言模型GPT-4

2021-03-23 15:21:00

人工智能機器學習技術

2021-08-19 15:48:05

增量攻擊網絡安全網絡攻擊

2023-02-25 21:45:55

模型AI

2025-01-27 00:57:43

2025-08-29 05:00:00

2021-01-13 15:16:45

谷歌架構開發者

2022-04-01 15:30:18

語言模型自然語言AI

2023-03-01 16:15:16

2020-06-15 10:42:42

谷歌Android開發者

2022-03-14 09:33:56

神經網絡模型人工智能

2023-04-07 09:53:02

量子AI

2021-07-19 10:56:36

GPE-3OpenAI微軟

2023-07-13 12:54:42

GPT-4OpenAI

2021-11-03 15:12:09

微軟機器學習開發者
點贊
收藏

51CTO技術棧公眾號

国产精品99久久| 成人免费在线小视频| 国产美女视频免费看| 可以免费看毛片的网站| 成人在线免费观看91| 亚洲国产色一区| 最近2019免费中文字幕视频三| 免费人成在线观看视频播放| 超碰在线97观看| 美国十次av导航亚洲入口| 中文字幕一区三区| 国产精品成人久久久久| 亚洲一级av无码毛片精品| 中文字幕中文字幕在线十八区| 日韩av中文字幕一区| 久久精品一区二区三区四区| 欧美精品久久久久| www激情五月| 黄色一级片在线观看| 水野朝阳av一区二区三区| 日韩国产高清污视频在线观看| 亚洲色图都市激情| 国产绳艺sm调教室论坛| 国产精品久久观看| 亚洲精品大尺度| 日本手机在线视频| 黄色av一区二区三区| 视频一区二区欧美| 韩国三级电影久久久久久| 国产大学生av| 性爱视频在线播放| 国产成人日日夜夜| 久久久久久这里只有精品| 超碰人人干人人| 四虎国产精品永久在线国在线| 久久嫩草精品久久久精品一| 欧美亚洲国产日本| 精品人伦一区二区| 欧美高清xxx| 中文字幕在线观看一区| 欧美日韩国产免费一区二区三区| 999视频在线| 成人短片线上看| 日韩av在线网页| 久久久男人的天堂| 国产免费不卡| 国产精品午夜在线观看| 成人免费观看a| 激情综合五月网| 牛牛影视久久网| 精品国免费一区二区三区| 欧美爱爱视频免费看| 每日更新av在线播放| 免费成人av在线| 九九热最新视频//这里只有精品| 无码国产精品一区二区高潮| 国精一区二区三区| 久久精品在这里| 九色视频成人porny| 欧美成人一区二区视频| 日韩主播视频在线| 久久国产加勒比精品无码| 国产人妖在线观看| 亚洲国产精品免费视频| 中文字幕中文字幕中文字幕亚洲无线| 日本视频精品一区| 亚洲av综合色区无码一区爱av| 国产亚洲在线观看| 精品激情国产视频| 黄色污在线观看| 97人人做人人爽香蕉精品| 一区视频在线播放| 欧美日韩在线精品一区二区三区| 亚洲av毛片成人精品| 久久www免费人成看片高清| 久久久久久久国产精品| 久久国产免费观看| 99亚洲一区二区| 久久久精品在线观看| 黄色录像一级片| 久久91成人| 欧美一卡在线观看| 日本熟妇人妻中出| 丁香花电影在线观看完整版| 亚洲综合偷拍欧美一区色| 日韩成人在线资源| 无码精品黑人一区二区三区| 久久综合九色综合久久久精品综合| 日韩av不卡播放| 含羞草www国产在线视频| 亚洲国产一区在线观看| 在线观看免费91| 欧美女优在线观看| 中文字幕+乱码+中文字幕一区| 欧美xxxx吸乳| 国内精品久久久久久野外| 亚洲激情综合网| 在线视频亚洲自拍| 欧美另类tv| 伊人婷婷欧美激情| 国产xxxxx在线观看| 9lporm自拍视频区在线| 洋洋成人永久网站入口| 凹凸国产熟女精品视频| 高清一区二区中文字幕| 欧美日韩精品免费| 91看片在线免费观看| 成人性生活视频| 欧美妇女性影城| 亚洲美女性囗交| 国产成人毛片| 亚洲电影中文字幕| 99久久免费看精品国产一区| 日韩久久精品网| 色噜噜狠狠狠综合曰曰曰88av| 妺妺窝人体色www婷婷| 日本欧美大码aⅴ在线播放| 日本精品一区二区三区在线| 日日骚av一区二区| 久久婷婷丁香| av资源站久久亚洲| 空姐吹箫视频大全| 中文字幕一区二区视频| 国产亚洲精品网站| 99香蕉久久| 亚洲国产精品嫩草影院久久| 任我爽在线视频| 亚洲最新色图| 欧美日韩xxx| 一级特黄色大片| 国产一区二区三区免费| 亚洲精品欧美日韩| 性生交生活影碟片| 国产精品九色蝌蚪自拍| 动漫av免费观看| 欧美日韩看看2015永久免费| 欧美美最猛性xxxxxx| 中文字幕日韩第一页| 国产中文字幕一区| 亚洲图片在线观看| 欧美人与禽性xxxxx杂性| 欧美精品色一区二区三区| 在线免费观看视频| 久久亚洲一区| 欧洲在线视频一区| 一区二区电影免费观看| 欧美精品一区二区三| 精品无码一区二区三区| 色综合天天综合网中文字幕| 日韩美女视频免费在线观看| 婷婷五月综合久久中文字幕| 欧美国产在线观看| 亚洲啪啪av| 黄网址在线观看| 欧美剧在线免费观看网站| 一本在线免费视频| 精品91在线| 国产成人一区二区在线| 99视频在线观看免费| 97超碰欧美中文字幕| 日本精品二区| 日韩成人亚洲| 精品国产三级电影在线观看| 免费视频一二三区| 高清成人免费视频| 亚洲国产欧美一区二区三区不卡| 超薄肉色丝袜脚交一区二区| 精品国产一区久久| 国产五月天婷婷| 久久av老司机精品网站导航| 在线看无码的免费网站| 国产一区二区三区精品在线观看| 欧美成人精品一区| 欧日韩在线视频| 国产精品久久久久久久久久久免费看| 伊人国产在线视频| 日韩欧美美女在线观看| 亲爱的老师9免费观看全集电视剧| 国产农村老头老太视频| 一区二区三区四区亚洲| 亚洲精品中文字幕在线播放| 首页亚洲欧美制服丝腿| 中日韩在线视频| a看欧美黄色女同性恋| 日韩av电影院| 麻豆91在线| 欧美性猛片aaaaaaa做受| 日韩av无码一区二区三区不卡| 亚洲专区一区| 国产日韩精品久久| 日韩三级免费| 亚洲九九九在线观看| 亚洲国产成人精品激情在线| 丰满亚洲少妇av| 日韩一级片免费视频| 精品99在线| 国产精品99久久99久久久二8| 九七久久人人| 日韩毛片在线看| 国产毛片aaa| 不卡电影一区二区三区| 日韩亚洲欧美一区二区| 国产精品亚洲欧美一级在线| 97色在线视频| 麻豆网站在线免费观看| 日韩黄色在线免费观看| 国产美女明星三级做爰| 精品日本高清在线播放| 久久久久成人精品无码中文字幕| 奇米精品一区二区三区在线观看 | 亚洲自偷自拍熟女另类| 国产精品99久久精品| 欧美日韩精品免费在线观看视频| 亚洲伊人影院| 成人伊人精品色xxxx视频| 乡村艳史在线观看| 日韩av在线天堂网| av天堂一区二区三区| 在线一区二区三区做爰视频网站| 久久视频精品在线观看| 国产91精品免费| 污片在线免费看| 久久激情一区| 日本高清视频一区二区三区| 成人免费在线电影网| 成人黄色在线免费| 精品免费av一区二区三区| 97精品免费视频| 欧美卡一卡二| 久久国产精品99国产精| 免费av网站在线观看| 这里只有精品视频| 国产男男gay体育生白袜| 欧美在线一二三| 久久精品视频2| 国产精品国产三级国产专播品爱网| 激情综合丁香五月| 日本不卡不码高清免费观看| 日韩欧美视频网站| 亚洲青涩在线| 亚洲欧美日产图| 国产亚洲第一伦理第一区| 成人网址在线观看| 欧美黑粗硬大| 成人免费看吃奶视频网站| 成人黄色免费观看| 国产精品一区二区久久国产| a毛片在线播放| 亚洲激情视频在线| 刘玥91精选国产在线观看| 日韩欧美高清在线| 久久精品国产亚洲av麻豆蜜芽| 欧美性生活大片免费观看网址| 特级西西人体高清大胆| 国产精品美女一区二区三区| 久久久久国产免费| 成人午夜视频在线| 91看片在线免费观看| 美国十次了思思久久精品导航 | 亚洲奶水xxxx哺乳期| 美女视频黄免费的亚洲男人天堂| 成人在线观看亚洲| 欧美精品一二区| 成年女人在线看片| 色偷偷偷综合中文字幕;dd| 成人在线免费视频| 精品免费一区二区三区| 日本激情一区二区| 亚洲人成在线免费观看| 国产激情视频在线播放| 精品乱人伦小说| 青青草在线播放| 精品国精品自拍自在线| 桃花色综合影院| 欧美一区二区三区四区在线观看| 精品久久久无码中文字幕| 在线视频一区二区三| 91在线你懂的| 精品国产乱码久久| 国产在线一二| 日韩大片免费观看视频播放| 国产黄色免费在线观看| 日韩av一区在线| av在线播放av| 亚洲香蕉成视频在线观看| 色呦呦中文字幕| 一本色道久久88综合亚洲精品ⅰ| 日韩在线视频第一页| 亚洲性av在线| 黑人另类精品××××性爽| 日韩av片免费在线观看| 欧美午夜在线播放| 国产精品免费小视频| 成年美女黄网站色大片不卡| 国产日韩中文字幕| 成人国产精品| 国产精品免费一区二区三区四区| 国产精品久久久久久久久免费高清| 91在线观看欧美日韩| **国产精品| 91在线观看免费高清完整版在线观看| 日韩成人午夜| 国产一区一区三区| 欧美成人久久| 日韩中文字幕在线不卡| 久久av在线| 波多野结衣三级视频| 国产精品每日更新在线播放网址| 五月天综合在线| 欧美日韩国产影院| 国产精品久久777777换脸| 欧美精品777| 日韩电影免费| 久久久久久国产精品美女| 欧美成人aaa| 欧美日产一区二区三区在线观看| 国产精品av久久久久久麻豆网| 全黄性性激高免费视频| 美国三级日本三级久久99| 一区二区三区免费在线观看视频 | 三级在线免费观看| 秋霞国产午夜精品免费视频| 特级西西人体wwwww| 亚洲国产精品尤物yw在线观看| 国产chinasex对白videos麻豆| 亚洲欧美国产一本综合首页| 黄色在线网站噜噜噜| www.久久久| 午夜精品剧场| 四川一级毛毛片| 成人免费视频免费观看| 免费中文字幕日韩| 亚洲一区二区黄色| 国产理论片在线观看| 日韩亚洲欧美成人| 国语对白在线刺激| 99免费在线观看视频| 欧美1级日本1级| 天天操精品视频| 亚洲三级小视频| 美日韩一二三区| 国产丝袜一区二区三区| 中文字幕成在线观看| 国产综合 伊人色| 在线视频日韩| 爱爱的免费视频| 亚洲欧洲一区二区在线播放| 最近中文字幕免费观看| 中文日韩电影网站| 欧美激情不卡| 免费观看中文字幕| 国产麻豆精品在线| 国产毛片久久久久久久| 在线亚洲一区二区| 欧美日韩视频在线播放| 91在线观看欧美日韩| 亚洲小说区图片区| 午夜一区二区三区免费| 色哟哟一区二区在线观看| 国产精品热久久| 九九精品视频在线| 国产精品chinese在线观看| 欧美自拍资源在线| 免费一区二区视频| √天堂中文官网8在线| 日韩一级完整毛片| 成人激情电影在线看| 国产精品自拍偷拍视频| 亚洲精品一二三区区别| 日韩免费毛片视频| 国产拍揄自揄精品视频麻豆| 做爰视频毛片视频| 久久国产精品99国产精| 久久aimee| 国产高潮免费视频| 亚洲免费电影在线| 91国产精品一区| 欧美国产日韩二区| 91精品亚洲一区在线观看| 国产专区在线视频| 91热门视频在线观看| 久久精品国产亚洲AV无码男同 | 亚洲色图14p| 欧美日韩国产综合视频在线观看 | 国产精品一久久香蕉国产线看观看 | 欧美一卡二卡在线| 中文字幕在线中文字幕在线中三区| 亚洲春色在线| 成人av在线资源网| 无码久久精品国产亚洲av影片| 精品中文字幕在线观看| 亚洲日产av中文字幕| 久久久久久www| 中文字幕免费在线观看视频一区| 国产av无码专区亚洲av麻豆| 国产97免费视| 激情成人亚洲| 久久精品在线观看视频| 日韩av一区二区在线观看| 成人乱码手机视频|