精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

2天訓練出15億參數大模型,國產開源項目力克英偉達Megatron-LM

人工智能 算法 新聞
如果告訴你,現在只用一半數量的GPU,也能完成同樣的GPT-3訓練呢?實現如此提升的,是一個名為Colossal-AI的GitHub開源項目。

當今AI之勢,影響縱深發展的矛盾是什么?

一方面,大模型風頭正勁,效果驚艷,人人都想試試。但另一方面,硬件基礎上動不動就是上萬張GPU的大規模集群在日夜燃燒,鈔能力勸退。

所以如果告訴你,現在只用一半數量的GPU,也能完成同樣的GPT-3訓練呢?

你會覺得關鍵鑰匙是什么?

不賣關子了。實現如此提升的,是一個名為Colossal-AI的GitHub開源項目。

而且該項目開源不久,就迅速登上了Python方向的熱榜世界第一。

↑GitHub地址:https://github.com/hpcaitech/ColossalAI

不僅能加速GPT-3,對于GPT-2、ViT、BERT等多種模型,Colossal-AI的表現也都非常nice:

比如半小時左右就能預訓練一遍ViT-Base/32,2天能訓完15億參數GPT模型、5天可訓完83億參數GPT模型。

與業內主流的AI并行系統——英偉達Megatron-LM相比,在同樣使用512塊GPU訓練GPT-2模型時,Colossal-AI的加速比是其2倍。而在訓練GPT-3時,更是可以節省近千萬元的訓練費用。

此外在訓練GPT-2時,顯存消耗甚至能控制在Megatron-LM的十分之一以下。

Colossal-AI究竟是如何做到的?

老規矩,我們從論文扒起。

高效6維并行方法

簡單來說,Colossal-AI就是一個整合了多種并行方法的系統,提供的功能包括多維并行、大規模優化器、自適應任務調度、消除冗余內存等。

首先來看多維并行

所謂“多維”是指,目前主流的分布式并行方案往往使用多種并行方法。

比如英偉達的Megatron-LM使用了3種方法:數據并行、流水并行和張量并行。因此這種模式也被稱為三維并行。微軟的DeepSpeed調用Megatron-LM作為并行基礎。

而Colossal-AI能將系統的并行維度,一下子拉升到6維——

在兼容數據并行、流水并行的基礎上,基于該項目團隊自研的2維/2.5維/3維張量并行方法,以及序列并行實現。

其中,高維張量并行正是Colossal-AI提升大模型顯存利用率和通信效率的關鍵所在。

其實張量并行并不新奇,只是過去我們常見的張量并行更多都是基于一維的。

它的原理是將模型層內的權重參數按行或列切分到不同的處理器上,利用分塊矩陣乘法,將一個運算分布到多個處理器上同時進行。

比如英偉達的Megatron-LM就是一個典型的例子。

但這種并行方式存在一定弊端。

比如,每個處理器仍需要存儲整個中間激活,使得在處理大模型時會浪費大量顯存空間。

另一方面,這種單線方法還會導致每個處理器都需要與其他所有處理器進行通信。

這意味著假設有100個GPU的話,每個GPU都需要與其他99個GPU通信,每次計算需要通信的次數就高達9900次

但如果將張量并行的維度擴展到2維,單次計算量能立刻下降一個量級。

因為每個GPU只需與自己同行或同列的GPU通信即可。

同樣還是100個GPU的情況,每個GPU需要通信的GPU個數就能降到9個,單次計算僅需900次

實際上在此基礎上,Colossal-AI還包含2.5維、3維張量并行方法,可以進一步降低傳輸成本。

相較于2維并行方法,2.5維并行方法可提升1.45倍效率,3維方法可提升1.57倍。

針對大圖片、視頻、長文本、長時間醫療監控等數據,Colossal-AI還使用了序列并行的方法,這種方法能突破原有機器能力限制,直接處理長序列數據。

值得一提的是,Colossal-AI的API接口是可以定制的,這使得它可以便捷添加新的并行維度。

其次,大規模優化器也是Colossal-AI的亮點。

上面我們也提到了,在分布式并行系統中會使用多種并行方法,數據并行則是另一種常見方法。

這種方法的原理不難理解,就是把訓練數據劃分成若干份,讓不同的機器運算不同的數據,然后通過一個參數服務器 (Paremeter Server)收集目標數據。

由此可以大幅提升AI模型訓練過程中的批量大小,加速訓練過程。

不過大批量訓練有個“通病”,就是會產生泛化誤差 (Generalization Gap),導致網絡泛化能力下降,進而導致AI模型準確度下降。

所以,Colossal-AI在系統中使用了自研的LAMB、LARS等大規模優化器。在保證訓練精度的情況下,還將批大小從512擴展到65536

其中,LARS優化器是通過逐層調整學習率,來減少因為學習率導致的無法收斂情況。

LAMB優化器則是在LARS的基礎上,將逐層調整學習率的思想應用到自適應梯度上。

由此,LAMB能夠很好解決此前LARS在BERT訓練中存在差異的問題,最大批量達到了64K

此前,LAMB優化器曾成功將預訓練一遍BERT的時間,從原本的三天三夜縮短到一個多小時。

第三方面,Colossal-AI使用自適應可擴展調度器來高效處理任務。

與現有常見的任務調度器不同,Colossal-AI不是靜態地通過GPU個數來判斷任務規模,而是根據批大小來動態、自動管理每個任務.

通過演化算法,該任務調度器還能不斷優化調度決策,更大程度提升GPU利用率。

評估結果表明,與當前最先進的方法相比,該方法在平均JCT (job completion time)上能夠縮短45.6%的時間,優于現有的深度學習任務調度算法。

此外,這種自適應可擴展調度器還能通過NCCL網絡通信實現高效的任務遷移。

最后,消除冗余內存也是加速AI訓練的一種解決思路。

在這方面,Colossal-AI使用了zero redundancy optimizer技術(簡稱ZeRO)。

這種方法主要通過切分優化器狀態、梯度、模型參數,使GPU僅保存當前計算所需的部分,從而來消除數據并行、模型并行中存在的內存冗余。

尤其是在部署模型推理時,通過zero offload可以將模型卸載到CPU內存或硬盤,僅使用少量GPU資源,即可實現低成本部署前沿AI大模型。

綜上不難看出,在技術層面Colossal-AI的加速效果非常明顯。

而在應用層面,Colossal-AI的設計也顧及了能耗問題和易用性兩個維度。

考慮到數據移動會是能耗的主要來源,Colossal-AI在不增加計算量的情況下盡可能減少數據移動量,以此來降低能耗。

另一方面,作為一個開源給所有人使用的系統,Colossal-AI的使用門檻不高,即便是沒有學習過分布式系統的人也能上手操作。

同時,只需要極少量的代碼改動,Colossal-AI就能將已有的單機代碼快速擴展到并行計算集群上。

最新實驗結果釋出

Talk is cheap,效果如何,還是得把實驗結果展開來看。

Colossal-AI近日釋出的最新實驗結果表明,這一大規模AI訓練系統具有通用性,在GPT-3、GPT-2、ViT、BERT等流行模型上均有亮眼的加速表現。

注:以下GPU均指英偉達A100。

GPT-3訓練速度提高10.7%

英偉達的Megatron-LM在加速訓練GPT-3時,至少需要128塊GPU才能啟動;而從下表可以看出,使用相同的計算資源,Colossal-AI可以將每次迭代花費的時間從43.1秒降至38.5秒。

這也就意味著,Colossal-AI可以將GPT-3的訓練速度進一步提高10.7%。

站在工程的角度,考慮到訓練這樣的大模型往往需要投入數百萬美元,這一提升比例帶來的收益不言而喻。

另外,通過系統優化,Colossal-AI還能在訓練速度損失不大(43.1→48.5)的前提下,將GPU數量從128塊減少到96塊,大幅降低訓練成本。

而進一步啟用ZeRO3(零冗余優化器)后,所需GPU數量甚至能減少一半——至64塊。

2天內可完成GPT-2訓練

在GPT-2的加速訓練結果中,可以看到,無論是在4、16還是64塊GPU的情況下,與Megatron-LM相比,Colossal-AI占用的顯存都顯著減少。

也就是說,利用Colossal-AI,工程師們可以在采用同等數量GPU的前提下,訓練規模更大的模型,或設置更大的批量大小來加速訓練。

從下表結果中還可以看出,隨著批量大小的增加,Colossal-AI的資源利用率會進一步提高,達到Megatron-LM速度的2倍

研發團隊在256塊GPU上進行了實驗,最終用時82.8個小時完成了15億參數版GPT-2的訓練。

據此預估,后續在512塊GPU上進行GPT-2預訓練,Colossal-AI能將訓練時間加速到45小時

充分兼容多種并行模式

在BERT上進行的實驗,則體現了Colossal-AI作為世界上并行維度最多的AI訓練系統的優勢。

與Megatron-LM相比,Colossal-AI序列并行方法只需要更少的顯存,就能夠利用更大的批量大小來加速訓練。同時,還允許開發者使用更長的序列數據。

Colossal-AI的序列并行方法還與流水并行方法兼容。當開發者同時使用序列并行和流水并行時,可以進一步節省訓練大模型的時間。

另外,在近期的學術熱點ViT模型上,Colossal-AI也展現了高維張量并行方法的優勢。

在使用64張GPU的情況下,Colossal-AI采用2/2.5維方式進行張量并行,充分利用更大的批量大小,達到了更快的處理速度。

背后團隊:LAMB優化器作者尤洋領銜

看到這里,是不是覺得Colossal-AI確實值得標星關注一發?

實際上,這一國產項目背后的研發團隊來頭不小。

領銜者,正是LAMB優化器的提出者尤洋

在谷歌實習期間,正是憑借LAMB,尤洋曾打破BERT預訓練世界紀錄。

據英偉達官方GitHub顯示,LAMB比Adam優化器快出整整72倍。微軟的DeepSpeed也采用了LAMB方法。

說回到尤洋本人,他曾以第一名的成績保送清華計算機系碩士研究生,后赴加州大學伯克利分校攻讀CS博士學位。

2020年博士畢業后,他加入新加坡國立大學計算機系,并于2021年1月成為校長青年教授(Presidential Young Professor)。

同樣是在2021年,他還獲得了IEEE-CS超算杰出新人獎。該獎項每年在全球范圍內表彰不超過3人,僅授予在博士畢業5年之內,已在高性能計算領域做出有影響力的卓越貢獻,并且可以為高性能計算的發展做出長期貢獻的優秀青年學者。

與此同時,尤洋回國創辦潞晨科技——一家主營業務為分布式軟件系統、大規模人工智能平臺以及企業級云計算解決方案的AI初創公司。

其核心團隊成員來自加州大學伯克利分校、斯坦福大學、清華大學、北京大學、新加坡國立大學、新加坡南洋理工大學等國內外知名高校,在高性能計算、人工智能、分布式系統方面有十余年的技術積累,并已在國際頂級學術刊物/會議上發表論文30余篇。

目前,潞晨科技已拿下創新工場和真格基金合投的超千萬元種子輪融資。

傳送門

有關Colossal-AI,今天就先介紹到這里。

最后,附上傳送門,感興趣的小伙伴,自行取用~

GitHub地址:https://github.com/hpcaitech/ColossalAI

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-01 12:32:53

AI模型

2022-05-17 16:12:33

英偉達模型開源

2023-09-12 13:43:00

智能技術

2023-07-18 15:05:00

開源大模型

2025-04-07 09:45:00

2020-04-30 13:30:30

Facebook 機器人開源

2024-04-09 13:21:00

AI開源

2025-11-07 09:16:02

2022-06-25 21:17:15

人工智能訓練

2025-06-23 09:14:00

2025-07-09 09:25:10

2023-10-12 14:40:10

AI模型

2024-06-24 09:51:24

2023-08-21 10:36:23

2023-09-04 12:58:05

2020-02-24 10:51:25

微軟開源Windows

2023-10-31 19:20:29

語言模型英偉達芯片

2025-05-19 08:41:00

AI模型開發者

2024-07-08 13:11:40

2025-08-19 16:10:46

AI模型開源
點贊
收藏

51CTO技術棧公眾號

午夜亚洲福利| www.久久av.com| www.免费av| 精品欧美色视频网站在线观看| 一区二区网站| 中文字幕高清不卡| 91黄色8090| 国产xxxx振车| 国产尤物在线观看| 国产亚洲电影| 精品日本高清在线播放| 亚洲一区中文字幕在线观看| 天天舔天天操天天干| 中文字幕在线视频网站| 不卡高清视频专区| 久久久在线免费观看| 亚洲av无码久久精品色欲| 在线视频二区| 美腿丝袜在线亚洲一区| 中文字幕9999| 九九精品久久久| 91在线三级| 成人午夜在线视频| 久久全国免费视频| 亚洲欧美va天堂人熟伦| 国产电影一区二区三区爱妃记| 久久综合久久久久88| 日韩av片免费在线观看| 亚洲色成人网站www永久四虎| 亚洲性受xxx喷奶水| 久久嫩草精品久久久精品一| 成人久久18免费网站图片| 免费精品在线视频| 成人噜噜噜噜| 一区二区三区中文字幕| av一区和二区| 日韩毛片在线播放| 自拍欧美一区| 欧美性大战久久久久久久蜜臀| 五月天亚洲综合小说网| 国产精品久久久久久免费免熟| 一本精品一区二区三区| 亚洲成人av片| 国产a视频免费观看| 永久免费av在线| 国产在线国偷精品免费看| 欧美日韩国产第一页| 星空大象在线观看免费播放| 成人美女黄网站| 亚洲18色成人| 日韩av一区二区三区在线| 91国内精品视频| 日韩精品五月天| xxav国产精品美女主播| 中国xxxx性xxxx产国| 这里有精品可以观看| 无吗不卡中文字幕| 亚洲午夜精品国产| 黄色片网站免费在线观看| 另类av一区二区| 精品久久国产精品| 午夜久久久久久久| 人人玩人人添人人澡欧美| 一区二区三区欧美亚洲| 丰满人妻一区二区三区53号| 深夜福利视频一区| 久久99精品国产麻豆婷婷洗澡| 欧美国产日韩一区二区在线观看 | 国产jjizz一区二区三区视频| 欧美大奶一区二区| 欧洲一区二区三区在线| 久久综合亚洲精品| www亚洲人| 成人不卡免费av| 久久综合九色综合网站| 国产精品无码久久av| 韩国成人福利片在线播放| 2025国产精品视频| 老熟妻内射精品一区| 久久99影视| 精品对白一区国产伦| 日本超碰在线观看| 亚洲欧美韩国| 欧美综合一区二区三区| 97人人爽人人| 在线观看网站免费入口在线观看国内| 色综合一个色综合亚洲| 日本人妻伦在线中文字幕| 毛片网站在线看| 国产精品久久精品日日| 久久综合入口| 91精品国产91久久久久游泳池| 亚洲少妇中出一区| 日韩精彩视频| 黄色av电影在线观看| 亚洲第一搞黄网站| 色哺乳xxxxhd奶水米仓惠香| 永久av在线| 亚洲自拍偷拍av| www.黄色网址.com| 在线天堂资源| 欧美一区二区三区喷汁尤物| 污污网站免费观看| 在线视频亚洲欧美中文| 亚洲日韩欧美视频一区| 日本一区二区三区网站| 欧美大人香蕉在线| 中文字幕综合一区| 日产精品久久久久| 久久国产精品露脸对白| 精品无码久久久久久久动漫| 六月丁香色婷婷| 国产精品美女久久久久aⅴ| 深夜福利成人| 不卡一本毛片| 午夜精品久久久久久久久久久| 日韩大片一区二区| 国产69精品久久久久9999人| 欧美图片一区二区三区| 亚洲欧美高清在线| 久久精品久久久| 久久综合色影院| 久久久精品视频免费观看| 午夜精品免费| 国产精品久久久久久久美男| 亚洲午夜在线播放| 久久97超碰国产精品超碰| 久久大片网站| 国产精品一级伦理| 国产精品久久久久影院| 国产免费毛卡片| 日本免费一区二区三区四区| 欧美三级资源在线| 久久久福利影院| 哺乳挤奶一区二区三区免费看| 亚洲第一二三四五区| 中文乱码字幕高清一区二区| 青青草一区二区三区| 成人羞羞国产免费| 都市激情一区| 在线观看视频一区| 蜜桃av免费看| 91精品国产91久久综合| 国产精品电影一区| 国产内射老熟女aaaa∵| 成人久久18免费网站麻豆| 26uuu国产电影一区二区| 中文字幕av一区二区三区谷原希美| 国产亚洲精品女人久久久久久| 国内在线观看一区二区三区| 91极品女神在线| 亚洲精品国偷拍自产在线观看蜜桃 | 中文字幕日韩精品有码视频| 蜜臀精品一区二区三区| 蜜臀91精品一区二区三区| 日本一区二区在线| 51xtv成人影院| 天天综合色天天综合色h| 风韵丰满熟妇啪啪区老熟熟女| 亚洲盗摄视频| 日本欧美国产在线| 欧美人体大胆444www| 成人欧美一区二区三区白人| 欧美不卡在线播放| yiren22亚洲综合| 亚洲深夜福利在线| 69av视频在线观看| 粉嫩aⅴ一区二区三区四区| 牛人盗摄一区二区三区视频| 欧美电影免费观看高清完整| 亚洲欧美日韩精品久久| 欧美精品成人久久| 日本女优在线视频一区二区| 五月天亚洲综合| 在线欧美激情| 亚洲免费av网址| 99re热视频| 亚洲婷婷在线视频| 国产在线不卡av| 老司机精品导航| 91免费欧美精品| 成人在线免费公开观看视频| 欧美日韩在线播放| 久久亚洲av午夜福利精品一区| a亚洲天堂av| 超碰超碰超碰超碰超碰| 国产精品高潮呻吟久久久久| 久久精品亚洲国产| 隣の若妻さん波多野结衣| 色国产综合视频| 熟妇人妻久久中文字幕| 日韩精品一级中文字幕精品视频免费观看| 一区二区在线中文字幕电影视频| 韩日成人影院| 精品激情国产视频| 日韩一级片免费观看| 一区二区久久久久久| 国产精品伦子伦| 麻豆91小视频| 一区二区欧美日韩| 黄色成人美女网站| 久久久亚洲国产| 电影在线高清| 亚洲国产成人久久| 亚洲专区第一页| 国产目拍亚洲精品99久久精品| 四虎永久在线精品无码视频| 欧美在线精品一区| 日本一区高清不卡| 高潮按摩久久久久久av免费| 国产精品视频资源| 国产小视频在线| 91久久精品一区二区三区| 久草网站在线观看| 欧美高清一级片在线观看| 日本50路肥熟bbw| 亚洲精品少妇| 久久66热这里只有精品| 高清一区二区中文字幕| 国产不卡精品视男人的天堂| 国产一级片在线播放| 欧美精品一区在线观看| 91精品国产乱码久久久久| 欧美日韩国产在线播放| 久久国产精品二区| 中文字幕一区二区5566日韩| 午夜理伦三级做爰电影| 99精品视频一区| 激情婷婷综合网| 99国产精品99久久久久久粉嫩| 精选一区二区三区四区五区| 欧美午夜在线播放| 韩剧1988在线观看免费完整版| 日韩一区二区三区不卡| 91精品国产黑色紧身裤美女| 中日韩av在线| 亚洲美女视频一区| 黄色免费看视频| 高清不卡一区二区在线| 日本网站在线看| 久久成人免费日本黄色| 亚洲一区二区三区四区五区xx| 99精品网站| 国产欧美一区二区三区不卡高清| 亚洲性受xxx喷奶水| 91地址最新发布| 18video性欧美19sex高清| 欧美激情a∨在线视频播放| 超碰在线观看免费版| 亚洲激情在线观看| 中文在线观看免费高清| 91国产免费看| 久久精品国产亚洲av麻豆蜜芽| 日韩欧美在线看| 中文字幕另类日韩欧美亚洲嫩草| 成人激情校园春色| 看全色黄大色黄女片18| 成人污视频在线观看| 国产人成视频在线观看| 成人国产免费视频| 一级特黄a大片免费| 久久美女高清视频| 日本猛少妇色xxxxx免费网站| 国产欧美日韩亚州综合 | 中文字幕亚洲一区二区va在线| 美女100%露胸无遮挡| 中文字幕一区二区三区不卡| 日本老熟俱乐部h0930| 亚洲综合视频网| aaa人片在线| 亚洲视频一二区| 久久久一二三区| 欧美日韩在线视频观看| 在线观看国产区| 欧美日韩电影在线播放| 久久免费激情视频| 一道本成人在线| 一卡二卡三卡在线| 亚洲精品一区二区三区福利| 狠狠色伊人亚洲综合网站l| 中文字幕亚洲欧美日韩在线不卡| 国产二区三区在线| 韩国美女主播一区| 日韩一级二级| 亚洲在线一区二区| 天天做夜夜做人人爱精品| 999视频在线观看| 国产成人精品一区二区三区视频| 亚洲一区二区三区久久 | 国产麻豆精品theporn| 可以免费在线看黄的网站| 99综合精品| 日本熟妇人妻中出| 国产成人丝袜美腿| 污免费在线观看| 韩国成人福利片在线播放| 亚洲男女在线观看| 中国av一区二区三区| 国产精品111| 亚洲一区二区视频在线| 欧美日韩国产精品综合| 91久久精品日日躁夜夜躁欧美| www.亚洲欧美| 精品噜噜噜噜久久久久久久久试看| 国产又爽又黄免费软件| 亚洲第五色综合网| 黄色一级大片在线免费看产| 日本精品久久中文字幕佐佐木| 精品一区二区三区中文字幕在线 | 亚洲日本视频| 在线观看国产福利| 国产网站一区二区三区| www.中文字幕av | 毛片在线免费视频| 欧美一区二区三区免费观看视频| 国产精品天堂| 68精品国产免费久久久久久婷婷| 57pao成人永久免费| 视频一区二区精品| 久久精品中文| 精品无码国产一区二区三区51安| 亚洲免费在线看| 91极品身材尤物theporn| 亚洲天天在线日亚洲洲精| 成年人在线视频| 91高潮精品免费porn| 伊人久久影院| 蜜臀av性久久久久蜜臀av| 奇米一区二区三区| 久久久视频6r| 色呦呦国产精品| 午夜影院免费视频| 亚洲天堂网站在线观看视频| 国产在线精彩视频| 国产精品电影一区| 亚洲激情播播| 日本在线xxx| 成人精品小蝌蚪| 国产在线综合网| 精品欧美乱码久久久久久| 美女尤物在线视频| 51国偷自产一区二区三区 | 久久精品久久久久久国产 免费| 精品3atv在线视频| 成人高h视频在线| 成人婷婷网色偷偷亚洲男人的天堂| 中文字幕中文字幕在线中一区高清 | 国产色91在线| 国产一级片av| 国产一区二区三区在线视频| bt在线麻豆视频| 92裸体在线视频网站| 一区二区三区在线电影| 日韩精品在线播放视频| 一区二区三区中文字幕电影| www.黄色片| 久久久久一本一区二区青青蜜月| 乱亲女h秽乱长久久久| 日韩在线视频在线观看| 91美女蜜桃在线| 中文字幕 欧美激情| 久久夜精品香蕉| 国产精品玖玖玖在线资源| 日韩精品一区二区三区久久| 国产三级一区二区三区| 亚洲天堂网在线观看视频| 久久亚洲国产精品成人av秋霞| 91欧美日韩在线| 鲁一鲁一鲁一鲁一澡| 狠狠色丁香婷婷综合久久片| 久久国产美女视频| 亚洲精品在线三区| 国产伦精品一区二区三区视频金莲| 日韩av影视| 国产精品77777| 欧美三级一区二区三区| 在线精品高清中文字幕| 欧美久久一区二区三区| 精品国产免费av| 国产精品久久久久7777按摩| www.亚洲天堂.com| 日韩av手机在线观看| 一本到12不卡视频在线dvd| 在线观看国产免费视频| 欧美三级电影精品| 国产羞羞视频在线播放| 日本一区二区三区www| 国产美女精品一区二区三区| 国产成人愉拍精品久久| 日韩你懂的在线播放| 久久国产精品一区| 国产一区免费观看| 美女网站一区二区| 国产成人精品a视频一区| 中文字幕亚洲一区在线观看| 岛国成人av| 亚洲欧美手机在线| 一本色道久久加勒比精品| 中文字幕有码在线观看| 日韩免费一区二区三区|