精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解密萬億參數M6模型預訓練背后的分布式框架Whale

開發 開發工具 分布式
M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

[[418050]]

最近,阿里云PAI團隊和達摩院智能計算實驗室一起發布“低碳版”巨模型M6,大幅降低萬億參數超大模型訓練能耗。借助我們自研的Whale框架僅使用480卡GPU,即訓練出了規模達人類神經元10倍的萬億參數多模態大模型M6,與傳統海外公司實現萬億參數規模相比,能耗降低超八成、效率提升近11倍。

M6是國內首個實現商業化落地的多模態大模型。M6擁有超越傳統AI的認知和創造能力,擅長繪畫、寫作、問答,在電商、制造業、文學藝術等諸多領域擁有廣泛應用前景。

這里來為大家介紹支持萬億參數模型訓練的Whale框架設計。

一、模型發展趨勢和挑戰

1.模型發展趨勢

隨著深度學習的火爆,模型的參數規模也增長迅速,OpenAI數據顯示:

  • 2012年以前,模型計算耗時每2年增長一倍,和摩爾定律保持一致;
  • 2012年后,模型計算耗時每3.4個月翻一倍,遠超硬件發展速度。

近一年模型參數規模飛速增長,谷歌、英偉達、阿里、智源研究院都發布了萬億參數模型,有大廠也發布了百億、千億參數模型。同時,隨著模型參數規模增大,模型效果也在逐步提高,Nvidia測試Bert模型不同參數規模,發現模型困惑度隨模型參數規模增加而降低。

Google在GShard paper中也發現MoETransformer 模型參數規模越大,翻譯質量越高。

2.大模型訓練的挑戰

大模型帶來模型效果提升的同時,也為訓練框架帶來更大的挑戰,例如當我們要訓練一個萬億規模的模型時會面臨如下挑戰:

  • 訓練難:
    • GPU顯存已經不夠存放模型副本,數據并行已經不能滿足需求;
    • 需要框架提供新的并行策略,協同多GPU能力來存放和訓練模型;
    • 如何給用戶提供簡潔、易用的接口,讓用戶能很容易實現分布式版模型;
    • 超大規模模型對計算效率、通信效率都帶來很大挑戰,如何提高計算和通信效率;
    • 下游任務如何對接,如何支持批量預測和在線推理需求;
  • 成本高:
    • 以萬億模型為例,模型參數有4TB大小、梯度也有4TB,加上optimizer states和active tensor,顯存需求巨大;
    • 業界訓練同等規模模型需要的資源:英偉達 3072 A100、谷歌 2048 TPU v3,成本太高很難落地;
    • 如何降本增效,使用更少的資源,更快的訓練收斂;

當前已經有一些分布式訓練框架,例如:Horovod、Tensorflow Estimator、PyTorch DDP等支持數據并行,Gpipe、PipeDream、PipeMare等支持流水并行,Mesh Tensorflow、FlexFlow、OneFlow、MindSpore等支持算子拆分,但這些框架還有一些不足:

  • 模式單一:很多框架只支持部分并行策略,不能完全支持各種混合并行;
  • 接入門檻高:用戶實現模型分布式版本難度大、成本高,需要有領域專家經驗才能實現高效的分布式并行策略;
  • 遷移代價大:不同分布式框架并行化實現割裂,不同框架有各自定義的DSL,當用戶要切換并行策略時,需要學習各種接口,重新改寫模型;
  • 性能不理想:部分框架實現未考慮集群物理環境;

為了應對當前分布式訓練的挑戰,我們研發了分布式訓練框架Whale,主要目標是:

  • 統一多種并行策略:在一個框架中支持各種并行策略以及這些策略的各種組合;
  • 簡潔易用的接口:用戶只需添加幾行annotation即可完成并行策略的配置,模型代碼不需要改動;
  • 高效的訓練框架:結合硬件資源、網絡拓撲和模型進行協同優化,打造高效分布式訓練框架;

二、PAI自研Whale框架

1.Whale架構

我們推出統一多種并行策略的高性能分布式訓練框架Whale,從如下角度來應對分布式訓練的挑戰:

  • 將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略;
  • 基于Tensorflow設計一套分布式并行接口,完全兼容Tensorflow,用戶僅僅只需添加幾行annotation就可以實現豐富的分布式并行策略;
  • 結合模型結構和網絡拓撲進行調度和通信優化,提供高效的分布式訓練能力。

Whale框架如下圖所示,主要分4個模塊:

  • API:提供簡潔易用接口,讓用戶組合使用各種混合并行策略;
  • Whale IR:將并行策略轉成內部表達,通過TaskGraph、Multi-Dimension、VirtualDevices抽象來表達各種并行策略;
  • Whale Engine:基于WhaleIR,通過圖編輯工具來構建分布式執行圖;
  • Runtime:將分布式執行圖轉成TFGraph,再調用TF 的Runtime來執行;

2.Whale簡介易用接口

Whale提供簡潔易用的接口來描述各種并行策略,主要的原語:

  • cluster:配置Virtual Device的劃分方法
  • replica:數據并行
  • stage:劃分TaskGraph
  • pipeline:流水并行
  • split:算子拆分

用這些接口可以組合各種并行策略,例如:

  • 數據并行:

  • 流水并行:

流水并行+數據并行:

更多并行策略示例:

3.Whale訓練流程

使用Whale進行分布式訓練流程:

  • 并行策略配置:
    • 使用Whale API來為模型配置并行策略,只需添加幾行annotation,無需修改模型代碼,方法如 2.2節 所示;
    • 可以將模型劃分為多個TaskGraph,TaskGraph支持配置多個并行策略,每個TaskGraph可以配置不同的并行策略;
  • 虛擬資源劃分:
    • 按并行策略來劃分Virtual Device,每個TaskGraph對應一個Virtual Device;
    • 按GPU資源和網絡topo來為Virtual Device選擇Physical Device;
  • 分布式執行圖:
    • 基于并行策略和資源分配信息,使用圖編輯工具來編輯執行圖(圖拷貝、拆分、插入通信節點等),生成最終的分布式執行圖;
    • 調用TF的runtime來執行分布式Graph;

三、萬億M6模型預訓練

萬億模型的算力需求非常大,為了降低算力需求,Whale中實現了MoE(Mixture-of-Experts)結構,MoE的主要特點是稀疏激活,使用Gating(Router)來為輸入選擇Top k的expert進行計算(k常用取值1、2),從而大大減少算力需求。

Whale中實現了MoE(Mixture-of-Experts) layer,并支持專家并行,將experts拆分到多個Devices上,降低單個Device的顯存和算力需求。同時數據并行有利于提升訓練的并發度,因此采用數據并行+專家并行組合的混合并行策略來訓練M6模型:MoElayer采用專家并行,其他layer采用數據并行。

Whale中提供簡潔易用的接口來進行模型的混合并行訓練,只需要增加幾行annotation來配置并行策略,模型本身不需要任何修改。M6模型采用數據并行+專家并行的策略,只需要增加如下圖的annotation:

同時為了節約訓練資源,提高訓練效率,Whale中提供各種優化技術:

顯存優化:

  • Auto Gradient Checkpoint,自動選擇最優checkpoint節點,節約activation的顯存;
  • Group-wise Apply,優化Optimizer Apply階段的顯存;
  • CPU Offload技術,優化Optimizer status和Weight的顯存;
  • 通信池化,控制通信的數據塊大小和并發,節約通信的顯存;

計算、通信加速:

  • 采用DP+EP混合并行策略,降低算力需求;
  • 采用分組融合通信、半精度通信、拓撲感知的All2All通信算子等技術來提高通信效率;
  • 結合混合精度、編譯優化等技術提高訓練效率;
  • 借助Whale框架,首次在480 V100 上,3天內完成萬億M6模型的預訓練。相比此前英偉達使用3072 A100 GPU實現萬億參數、谷歌使用2048 TPU實現1.6萬億參數大模型,此次達摩院僅使用480卡V100 32G GPU就實現了萬億模型M6,節省算力資源超80%,且訓練效率提升近11倍。

四、結語

模型參數規模已越來越大,大模型已成為發展趨勢,為解決超大模型訓練的挑戰,我們自研Whale框架,將不同并行化策略進行統一抽象、封裝,在一套分布式訓練框架中支持多種并行策略。Whale提供簡潔易用的接口,用戶只需添加幾行annotation即可實現各種并行策略,不需要對模型本身進行修改。同時我們結合硬件資源、網絡topo、模型進行軟硬件協同優化,提供高效分布式訓練框架。

通過Whale框架,我們用480 V100 GPU卡訓練萬億規模模型,并在3天內完成模型訓練收斂,為超大規模模型訓練落地提供了可能,后續我們會進一步完善Whale框架,從更大規模、更快速度、更高性價比3個維度去擴展Whale框架的能力。同時也會推動Whale能力在更多業務場景落地,讓技術能力到產品能力的轉變。

 

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2022-03-09 08:05:26

框架分布式開源

2021-06-25 10:40:38

阿里云AIM6

2009-04-16 09:02:30

Eclipse開發平臺版本發布

2017-09-01 05:35:58

分布式計算存儲

2023-10-26 18:10:43

分布式并行技術系統

2023-04-19 16:51:54

分布式Primus開源

2025-10-24 10:41:33

2018-05-19 00:26:13

UAI Train分布式訓練

2019-05-05 08:37:39

分布式PyTorchGPU

2021-02-01 09:35:53

關系型數據庫模型

2021-09-09 15:45:17

機器學習人工智能Ray

2023-06-26 00:14:28

Openjob分布式任務

2025-06-20 14:29:02

模型訓練大數據

2015-12-14 17:35:21

GemFire12306分布式

2019-06-19 15:40:06

分布式鎖RedisJava

2009-12-21 13:47:29

WCF分布式事務

2015-09-24 15:08:28

分布式框架反思分布式系統

2024-09-13 17:02:29

2014-06-30 14:20:05

NoSQL數據庫
點贊
收藏

51CTO技術棧公眾號

欧美一级高潮片| wwwxxxx在线观看| 日韩专区在线| 处破女av一区二区| 欧美综合第一页| 99久久久免费精品| 亚洲大片精品免费| 91精品国产日韩91久久久久久| 2019日韩中文字幕mv| www.久久热.com| www.成人网.com| 91在线观看免费高清完整版在线观看| 日本免费观看视| 66国产精品| 亚洲欧洲一区二区三区在线观看| 国产精品熟女一区二区不卡| 亚洲www免费| 亚洲国产一二三| 成年人免费观看的视频| 日韩三级电影网| 成人午夜av在线| 91精品视频免费看| 自拍偷拍第八页| 亚洲少妇诱惑| 国内免费精品永久在线视频| 国产又色又爽又高潮免费| 欧美美女黄色| 日韩午夜中文字幕| 911福利视频| 影音成人av| 日韩欧美精品免费在线| 日本一本中文字幕| 色av手机在线| 有码一区二区三区| 麻豆视频传媒入口| av在线收看| 国产亚洲污的网站| 欧美极品日韩| 久久久久久久影视| 久久亚洲精精品中文字幕早川悠里 | 久cao在线| 中文字幕av一区二区三区免费看| 蜜桃在线一区二区三区精品| 三级网站在线看| 成人网在线播放| 高清国产在线一区| 性生活黄色大片| 成人性生交大片免费看中文 | 中文字幕一区二区三区乱码在线| 欧洲精品亚洲精品| 免费在线黄色网址| 国产欧美一区二区精品性| 欧美黑人xxxxx| 国产天堂素人系列在线视频| 日本一区二区三区免费乱视频 | 懂色av中文一区二区三区天美 | 欧洲猛交xxxx乱大交3| 88国产精品视频一区二区三区| 中文字幕综合一区| 91精品国产闺蜜国产在线闺蜜| 97久久视频| 久久成人在线视频| 国产一级二级毛片| 中日韩男男gay无套| 奇米一区二区三区四区久久| 中文字幕免费观看| 久草在线在线精品观看| 亚洲综合在线做性| 欧洲av在线播放| 久久久久88色偷偷免费| 午夜精品亚洲一区二区三区嫩草| shkd中文字幕久久在线观看| 国产精品国产三级国产aⅴ入口 | a视频在线播放| 亚洲国产人成综合网站| 动漫av网站免费观看| 成人涩涩视频| 日韩一级高清毛片| 国产老熟女伦老熟妇露脸| 亚洲国产精品嫩草影院久久av| 亚洲日本aⅴ片在线观看香蕉| 日本美女xxx| 综合在线一区| 91精品国产777在线观看| 无码aⅴ精品一区二区三区| 久久成人羞羞网站| 国产伦精品一区二区三区四区视频 | 欧美xoxoxo| 欧美人动与zoxxxx乱| 在线中文字日产幕| 成人影院在线| 欧美韩国理论所午夜片917电影| 国产精品久久久免费视频| 卡一卡二国产精品| 国内精品二区| 日本www在线观看| 午夜精品在线视频一区| 久久婷五月综合| 久久悠悠精品综合网| 色久欧美在线视频观看| 国产成人无码精品久在线观看| 美女爽到高潮91| 久久精品magnetxturnbtih| 在线观看a视频| 精品美女永久免费视频| 中文字幕一区二区在线观看视频 | 亚洲国产精品午夜在线观看| 西野翔中文久久精品字幕| 亚洲码国产岛国毛片在线| 秋霞无码一区二区| 久久久精品一区二区毛片免费看| 欧美69wwwcom| 久久久久国产视频| 国产精品传媒在线观看| 不卡的av网站| 日本在线视频www色| 国产精品专区免费| 亚洲第一网站男人都懂| 三上悠亚在线观看视频| 丝袜亚洲另类欧美| 国产精品视频在线免费观看| 黄色免费网站在线观看| 色婷婷亚洲一区二区三区| 2018国产精品| 综合五月婷婷| 成人深夜直播免费观看| 国产乱理伦片a级在线观看| 精品久久久久久亚洲国产300| 伊人五月天婷婷| 成人综合一区| 国产精品私拍pans大尺度在线 | 最近免费观看高清韩国日本大全| 色天使综合视频| 亚洲欧洲日产国产网站| 国产成人综合欧美精品久久| av不卡免费电影| 69sex久久精品国产麻豆| 精品一区二区三区四区五区| 日韩亚洲欧美中文在线| 中文在线免费看视频| 国产视频视频一区| 久久久久免费精品| 美女毛片一区二区三区四区| 欧美亚洲视频一区二区| 特级丰满少妇一级aaaa爱毛片| 亚洲国产综合色| 亚洲av成人精品一区二区三区| 亚洲高清网站| 国产在线观看一区| 免费高潮视频95在线观看网站| 亚洲国产一区二区三区四区| 欧美精品二区三区| 久久久精品免费观看| 天堂社区在线视频| 不卡视频在线| 91久久精品美女| 日本欧美电影在线观看| 亚洲高清福利视频| 日韩中文字幕在线观看视频| 国产日韩欧美高清在线| 午夜精品中文字幕| 欧美在线亚洲综合一区| 高清视频一区二区三区| 午夜不卡影院| 忘忧草在线日韩www影院| 欧美日韩一区二区三区在线免费观看| 亚洲熟女一区二区| 久久精品日韩欧美| 亚洲欧洲一二三| 99视频这里有精品| 欧美极品少妇全裸体| 午夜福利视频一区二区| 在线这里只有精品| 三级av在线免费观看| 成人免费毛片嘿嘿连载视频| 精品国产成人av在线免| 欧美电影一区| 国产伦理一区二区三区| 天天免费亚洲黑人免费| 久久精品国产欧美亚洲人人爽| 99热这里只有精品在线| 欧美日韩午夜视频在线观看| 国产在线免费av| 成人午夜免费电影| 色诱视频在线观看| 亚洲网色网站| 免费h精品视频在线播放| 另类一区二区| 久久全国免费视频| 在线免费观看黄色网址| 精品国内二区三区| 最新中文字幕免费| 亚洲va欧美va人人爽午夜| 欧美 日韩 成人| 国产aⅴ精品一区二区三区色成熟| 大肉大捧一进一出好爽视频| 天天av综合| 六十路精品视频| 成人污污视频| 国产精品久久久久久久天堂| 久草在线视频福利| 日韩在线视频二区| 天天在线女人的天堂视频| 91精品国产综合久久精品 | 狠狠干成人综合网| 婷婷五月色综合| 欧美18免费视频| 亚洲自拍偷拍色片视频| 欧洲成人一区| 91高清免费在线观看| 91在线中文| 日韩中文字在线| 国产高清av在线| 亚洲精品福利免费在线观看| 国产三级自拍视频| 在线观看91精品国产入口| 日韩精品手机在线| 一区二区三区日本| 一级性生活免费视频| 久久亚洲精品小早川怜子| 亚洲av无码专区在线播放中文| 国内一区二区在线| 深夜黄色小视频| 日本视频中文字幕一区二区三区| 动漫av网站免费观看| 一区二区三区四区五区在线 | a级片免费在线观看| 久久天堂av综合合色| 最新97超碰在线| 亚洲人成电影网站色www| 无套内谢的新婚少妇国语播放| 欧美大片拔萝卜| 国产肥老妇视频| 91精品国产手机| 国产视频第二页| 欧美精品亚洲一区二区在线播放| 无码人妻精品一区二区| 色悠久久久久综合欧美99| 欧美精品二区三区| 日韩欧美亚洲综合| 国产精品久久久久久久妇| 婷婷国产v国产偷v亚洲高清| 久久免费播放视频| 午夜精品123| 欧美三级韩国三级日本三斤在线观看| 亚洲高清不卡在线| 免费日韩一级片| 欧美性xxxx极品hd满灌| 久久久精品福利| 91福利国产成人精品照片| 午夜久久久久久久久久影院| 色欧美88888久久久久久影院| 无码人妻丰满熟妇奶水区码| 色天天综合色天天久久| 一区二区视频网| 欧美日韩一区二区欧美激情| 国产精品久久免费| 精品乱码亚洲一区二区不卡| 无码精品人妻一区二区三区影院| 日韩国产欧美精品一区二区三区| 日本在线视频1区| 中文字幕日韩精品在线| 在线观看免费黄色| 久久福利网址导航| 成年人视频免费在线播放| 青草青草久热精品视频在线观看| 日韩制服一区| 99re在线视频观看| 亚洲黄页网站| 在线成人性视频| 欧美日韩国产成人精品| 无码播放一区二区三区| 久久综合网络一区二区| 天堂av2020| 成人av网站大全| 日韩不卡av在线| 亚洲一卡二卡三卡四卡五卡| 黄色片网站在线免费观看| 欧美日韩在线播放三区| www.成人精品| 亚洲人成电影网站色| 操你啦在线视频| 浅井舞香一区二区| 色悠久久久久综合先锋影音下载| 久久久久高清| 国产精品精品国产一区二区| 国产极品尤物在线| 麻豆91精品视频| 四虎精品一区二区| 日本一区二区免费在线观看视频| 成熟的女同志hd| 精品女同一区二区三区在线播放| 国产精品久久久久久无人区| 亚洲精品资源在线| 在线视频观看国产| 国产精品久久久久久超碰| 亚洲大奶少妇| 色综合久久久久久久久五月| 一区在线视频| 欧美又黄又嫩大片a级| 国产亚洲污的网站| 久久精品久久精品久久| 欧美视频中文字幕| 日韩电影网址| 欧美劲爆第一页| 色成人综合网| 欧美成ee人免费视频| 国产一区清纯| www,av在线| 国产欧美日韩在线观看| 久久久久久久久影院| 91精品国产91久久综合桃花 | 国产福利视频在线播放| 国产成人亚洲综合a∨猫咪| 亚洲欧美日韩第一页| 色综合亚洲欧洲| 网站黄在线观看| 欧美日韩国产123| 精品视频一二| 中文字幕av日韩精品| 老司机精品视频网站| 亚洲中文字幕无码av| 亚洲午夜视频在线| 亚洲AV无码成人片在线观看 | 久久男人av资源站| 成人av影视在线| 欧美粗暴jizz性欧美20| 91亚洲免费视频| 欧美国产一区二区在线观看| 欧美一区二区三区网站| 亚洲免费av网址| 看黄在线观看| 精品蜜桃传媒| 国产欧美丝祙| 91av在线免费| 欧美日韩一区二区在线| 头脑特工队2免费完整版在线观看| 欧美精品激情在线观看| swag国产精品一区二区| 日本免费成人网| 粉嫩aⅴ一区二区三区四区| 免费看一级一片| 日韩欧美一区二区三区在线| 亚洲电影视频在线| 99电影网电视剧在线观看| 欧美日韩三区| 国产伦精品一区二区免费| 亚洲风情在线资源站| 天堂在线视频免费| 91高潮在线观看| 欧美伦理在线视频| 国内外成人免费在线视频| 国产女人aaa级久久久级 | 婷婷久久伊人| 精品一区二区国语对白| 青青青在线免费观看| 日韩精品中文字幕在线一区| 国内高清免费在线视频| 久久久精品国产一区二区三区| 久久综合九色| 性生交大片免费全黄| 日韩一区二区三区在线| 成人ssswww在线播放| 欧美精品二区三区四区免费看视频| 日本aⅴ精品一区二区三区| 欧美视频一区二区在线| 精品福利在线导航| 免费成人直播| 中国一级大黄大黄大色毛片| 成人av在线播放网址| 波多野结衣一二区| 久久影院模特热| 日韩极品少妇| 日本肉体xxxx裸体xxx免费| 一卡二卡欧美日韩| 男人天堂亚洲二区| 成人午夜黄色影院| 一区二区三区国产盗摄| 国产农村妇女精品一区| 精品国产亚洲一区二区三区在线观看| 成人性生交大片免费观看网站| 在线视频精品一区| av亚洲精华国产精华精| 在线观看毛片网站| 久久久人成影片一区二区三区观看 | 免费在线亚洲欧美| 欧美三级黄色大片| 精品一区二区电影| 精品999日本久久久影院| 人妻熟女一二三区夜夜爱| 中文字幕亚洲欧美在线不卡| 人妻少妇精品无码专区| 国产女精品视频网站免费| 雨宫琴音一区二区在线| 日韩中文字幕有码| 亚洲成人av片| 国产精品亚洲四区在线观看| 别急慢慢来1978如如2| 亚洲va欧美va人人爽| 国产一区久久精品|