精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達含量為零!華為密集模型性能比肩DeepSeek-R1,純昇騰集群訓練

人工智能 新聞
華為利用純昇騰集群訓練出的盤古Ultra,在數學競賽、編程等推理任務當中,和R1打得有來有回。

密集模型的推理能力也能和DeepSeek-R1掰手腕了?

華為利用純昇騰集群訓練出的盤古Ultra,在數學競賽、編程等推理任務當中,和R1打得有來有回。

關鍵是模型參數量只有135B,整個訓練過程零英偉達含量,而且沒有出現損失尖峰。

圖片

通過改進的模型架構和系統優化策略,盤古Ultra擁有優異的性能表現和52%以上的算力利用率。

并且有網友表示,訓練過程中沒有出現損失尖峰這一特征,似乎此前從未實現。

圖片

135B密集模型比肩DeepSeek-R1

作為一個參數量135B密集模型,盤古Ultra達到了同尺度密集模型的最優表現,甚至可以與DeepSeek-R1等參數量更大的MoE模型競爭。

在預訓練階段模型的評測中,盤古Ultra在絕大部分英文基準任務和全部中文任務上取得了最佳性能,優于Llama 405B、DeepSeek-V3等baseline模型。

尤其在MMLU、TriviaQA、GSM8K等具有挑戰性的數據集上,盤古Ultra展現出了卓越的語言理解和推理能力。

圖片

經過指令調優后,盤古Ultra的性能進一步提升,尤其在AIME 2024、MATH-500等數學推理任務和LiveCodeBench等編程競賽題上達到了SOTA水平。

綜合來看,盤古Ultra超越了包括GPT-4o、Mistral-Large 2等強大模型,與DeepSeek-R1等MoE模型競爭激烈。

同時,盤古Ultra在Arena Hard、MMLU-pro等涵蓋通用語言理解和推理的評測中也表現優異。

圖片

那么,為了實現這樣的效果,盤古Ultra采用了哪些關鍵技術呢?

“三明治”層歸一化架構

如前文所述,盤古Ultra是一款135B參數量的密集模型,使用了94層的網絡結構。

盤古Ultra采用了分組查詢注意力(GQA)機制,包含96個查詢頭(query head)和8個鍵值頭(key-value head)。

為了解決訓練超深網絡面臨的不穩定性和收斂困難等問題,盤古Ultra在模型架構上做出了兩個關鍵改進——深度縮放的Sandwich-Norm層歸一化和TinyInit參數初始化策略。

傳統的Transformer通常使用Pre-LN層歸一化,但在深度模型中,Pre-LN容易導致每個子層輸出尺度的波動,引發訓練不穩定。

盤古Ultra使用的Sandwich-Norm層歸一化,則是在殘差連接前對每個子層的輸出做歸一化,并根據網絡深度對初始化值進行縮放,從而有效消除了訓練過程中的loss尖峰,使訓練過程更加平穩。

用更容易理解的話說,傳統方法僅在每個子層的輸入進行歸一化,但這種方法針對輸出也進行了歸一化,形成了Pre-Norm + 子層 + Post-Norm的“三明治”結構。

圖片

但是,僅僅使用Sandwich-Norm還不足以完全消除深度模型訓練中的不穩定性——隨著網絡層數的增加,每一層的輸出尺度仍然可能出現累積性的漂移。

為此,盤古Ultra在Sandwich-Norm的基礎上,進一步引入了深度縮放機制,對Post-Norm中的放縮參數γ進行了深度相關的初始化。

圖片

至于整個模型的初始化,傳統的初始化通常采用的Xavier初始化方法僅考慮模型寬度,而盤古Ultra采用的TinyInit同時依據模型深度和寬度來縮放初始化權重的標準差。

這種初始化方式有助于在前向傳播和反向傳播過程中,維持各層梯度的方差在一個合理的范圍內,避免了梯度消失或爆炸問題,使得訓練過程更加穩定,同時也加速了收斂。

實驗表明,TinyInit在深度模型訓練中取得了更好的收斂速度和下游任務性能;同時針對embedding層,保持權重的標準差接近1也能提升訓練穩定性。

另外,盤古團隊也針對Tokenizer進行了優化,通過在通用中英文、代碼、數學等不同領域分別進行詞頻統計,再合并去重,最終得到了一個兼顧領域覆蓋和編碼效率的153376個token的平衡詞表。

圖片

8192張昇騰NPU訓練集群

盤古Ultra的整個訓練流程主要分為三個階段——預訓練、長上下文擴展和指令調優。

其中預訓練又可以分為三個子階段:

  • 通用階段:側重建立語言理解和知識儲備,使用了大量中英文通用語料,覆蓋網頁、書籍、百科等多個來源;
  • 推理階段:引入更多高質量的數學和代碼數據,以增強模型的推理能力。同時還使用instruction數據來幫助模型學習執行任務;
  • 退火階段:幫助模型鞏固知識和推理能力,并強化指令遵循能力。大量使用問答對和人類反饋數據。

研究者們采用了基于規則和模型的數據清洗方法,并設計了curriculum learning策略,讓模型循序漸進地學習不同難度的樣本。

預訓練中使用了AdamW優化器,并動態調整超參數。

圖片

預訓練后,模型在最長128K的長上下文數據上進一步訓練,通過擴大RoPE的基頻來實現長序列建模,以增強處理長文檔的能力。

最后的指令調優階則段使用監督微調(SFT)和強化學習(RL)來使模型更好地適應下游任務,學會執行指令并與人類偏好對齊。

訓練設施方面,盤古Ultra使用了一個由8192個昇騰AI處理器組成的大規模計算集群。

集群中每個節點包含8個NPU,通過華為高速緩存一致性互聯HCCS以全互聯的拓撲結構連接,每個NPU配備64GB內存,節點間則通過200Gbps的RoCE(RDMA over Converged Ethernet)網絡互聯。

為了實現盤古Ultra的高效訓練,研究團隊還采用了一套系統的并行策略和優化技術。

在并行策略的選擇上,盤古Ultra綜合考慮了模型的規模、數據的特性以及硬件的拓撲,最終采用了數據并行、張量并行、序列并行和流水線并行等多種并行方式的組合:

  • 128路數據并行,將訓練數據分片到不同設備,保證了數據吞吐;
  • 8路張量并行,利用設備內部高帶寬切分層內張量,實現高效通信;
  • 序列并行用于處理超長序列以降低顯存壓力;
  • 8段流水線并行,將不同層分布到不同設備,形成高效的計算流水線。

圖片

在并行策略的基礎上,盤古Ultra還從多個角度對訓練系統進行了深度優化。

一方面,通過使用ZeRO(Zero Redundancy Optimizer)分布式優化器,將模型狀態分片到不同設備,大幅降低了單個設備的內存占用,在提高數據并行度的同時,確保了每個設備的內存負擔在可接受范圍內。

另一方面,研究者們通過各種通信和計算優化技術,最小化了通信開銷,提升了計算效率:

  • 通過算子融合(Kernel Fusion)將多個小算子合并,減少了內存訪問和kernel啟動;
  • 通過通信計算重疊(Communication-Computation Overlapping)實現通信和計算的深度交織,隱藏通信延遲;
  • MC^2(Merged Computation & Communication)BOA(Batch Optimization Accelerator)分別對張量并行和規范化層的通信進行了專門優化……

圖片

在算法、工程、數據各個層面的精細優化下,盤古Ultra實現了52%以上的算力利用率。

技術報告:
https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-report.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-03-19 10:10:43

2025-05-19 08:41:00

AI模型開發者

2025-05-07 10:12:52

英偉達模型AI

2025-02-19 08:00:00

2025-04-14 09:40:00

2025-05-06 15:39:53

DeepSeek-R英偉達開源

2025-02-27 09:09:45

2025-02-03 14:17:27

2025-02-06 10:18:45

2025-03-06 17:29:21

2025-03-05 03:00:00

DeepSeek大模型調優

2023-09-20 16:55:15

華為AI 計算集群

2025-02-19 08:33:18

2025-03-19 09:52:50

點贊
收藏

51CTO技術棧公眾號

7777精品伊人久久久大香线蕉的| 成人福利在线看| 中文国产亚洲喷潮| 久热精品在线观看视频| 高清免费电影在线观看| 成av人片一区二区| 国产成人亚洲综合91精品| 日本裸体美女视频| 噜噜噜狠狠夜夜躁精品仙踪林| 91国在线观看| 免费极品av一视觉盛宴| 免费理论片在线观看播放老| 国产综合色视频| 91精品国产91久久久久久吃药 | 国产成人综合亚洲91猫咪| 91国内揄拍国内精品对白| 操她视频在线观看| 国产乱人伦丫前精品视频| 欧美日韩综合在线| 日韩av在线第一页| 9191在线播放| 亚洲国产精品精华液2区45| 亚洲xxxxx性| 成人h动漫精品一区二区下载| 一区二区日韩欧美| 正在播放欧美一区| 中文字幕5566| 一区二区在线免费播放| 欧美日韩国产成人在线91| 缅甸午夜性猛交xxxx| av电影高清在线观看| 久久精品在这里| 国产成人看片| a级片在线播放| 美女视频网站黄色亚洲| 5566日本婷婷色中文字幕97| 麻豆一区产品精品蜜桃的特点| 欧美一级本道电影免费专区| 亚洲精品av在线| 久久无码人妻一区二区三区| 成人在线免费av| 在线看日本不卡| 日韩精品 欧美| 91制片在线观看| 亚洲精品精品亚洲| gogogo免费高清日本写真| av资源种子在线观看| 久久久久88色偷偷免费| 蜜桃传媒视频第一区入口在线看| 欧美 日韩 人妻 高清 中文| 国产在线日韩欧美| 国产在线视频2019最新视频| 伊人精品在线视频| 蜜桃视频第一区免费观看| 国产99久久精品一区二区永久免费 | 国产精品福利一区二区三区| 五月天综合网| 国产精品99999| 久久综合九色综合欧美亚洲| 蜜桃视频在线观看91| 女人18毛片水真多18精品| 顶级嫩模精品视频在线看| 99在线看视频| 亚洲精品无码久久久| 国产精品1024| 99在线观看视频| 黄色小视频免费观看| 国产98色在线|日韩| 99精彩视频| 丁香六月天婷婷| 91在线看国产| 欧美另类一区| 成年人免费在线视频| 国产亚洲精品7777| 伊人久久青草| 亚洲色图美国十次| 精品av在线播放| av网址在线观看免费| 婷婷午夜社区一区| 欧美三级日韩在线| 韩国三级在线播放| 九九热播视频在线精品6 | 国产黄在线观看| 中文字幕亚洲电影| av女优在线播放| 欧洲亚洲两性| 7777精品伊人久久久大香线蕉超级流畅| 中文字幕亚洲影院| 91蜜桃臀久久一区二区| 亚洲码在线观看| 熟女av一区二区| 99亚洲伊人久久精品影院红桃| 国产91精品久久久| 在线观看国产小视频| 国产成人亚洲综合a∨婷婷| 国产日本一区二区三区| yw193.com尤物在线| 一区二区三区欧美在线观看| 日韩av片在线看| 亚洲欧洲日韩精品在线| 精品日韩成人av| 一色道久久88加勒比一| 欧美日韩精品| 国产成人一区二区三区小说| 99久久婷婷国产一区二区三区| 99久久伊人久久99| av磁力番号网| 少妇一区视频| 精品国产乱码久久久久久闺蜜 | 欧美亚洲成人网| 亚洲天堂视频网| fc2成人免费人成在线观看播放| 视频在线观看成人| 国产中文在线播放| 91精品蜜臀在线一区尤物| 99re久久精品国产| 亚洲中无吗在线| 国产成人综合精品| 日韩中文字幕免费观看| 国产精品色在线| 欧美黄色免费影院| 91精品入口| 日韩视频免费观看| 国产精品成人无码| 成人久久18免费网站麻豆 | 最新97超碰在线| 色悠悠亚洲一区二区| 好吊操视频这里只有精品| 成人在线免费观看91| 51久久精品夜色国产麻豆| 精品国产乱码一区二区三 | 亚洲成人a**址| 川上优av中文字幕一区二区| 欧美一级艳片视频免费观看| 日本美女bbw| 亚洲影视综合| 国产一区二区三区四区五区在线 | 亚洲免费成人在线视频| 国产精品一区二区av交换| 午夜精品理论片| 欧美一级淫片aaaaaa| 亚洲乱码国产乱码精品精98午夜| 日本激情视频在线播放| 国产在线观看91一区二区三区| 欧美在线视频一区| 四虎影视在线观看2413| 午夜精品久久久久久久久久| 国产清纯白嫩初高中在线观看性色| 99久久精品国产亚洲精品| 国产精品久久久久久久久久久久| 涩涩视频在线观看免费| 狠狠色狠狠色综合日日小说| 99re久久精品国产| 99综合视频| 久久久久久精| 日韩不卡免费高清视频| 亚洲视频在线观看免费| 国产乱码77777777| 国产精品色哟哟网站| 国产三级三级看三级| 久久国产中文字幕| 91成人理论电影| 四季久久免费一区二区三区四区| 日韩欧美国产综合| 精品无码免费视频| av欧美精品.com| 日本不卡在线观看视频| 精品色999| 国产一区二区在线播放| 国产区在线看| 精品久久人人做人人爱| 国产对白videos麻豆高潮| www久久精品| 美女少妇一区二区| 五月激情综合| 国产精品久久久久久久久久直播 | 一本色道综合久久欧美日韩精品| 国产精品日本欧美一区二区三区| 欧美一区二区在线视频观看| 日韩三区在线| 超碰97人人做人人爱少妇| 成人免费观看在线视频| 岛国视频午夜一区免费在线观看| 欧美大波大乳巨大乳| 国内久久精品视频| 国产毛片久久久久久国产毛片| 亚洲尤物av| 欧美三级电影网站| 国产91在线高潮白浆在线观看| 手机看片福利在线观看| 欧美亚洲综合另类| 日韩a级片在线观看| 99精品国产一区二区三区不卡| 网站一区二区三区| 激情文学一区| 亚洲精品一区二区三区四区五区 | 久久精品30| 国产精品亚洲天堂| 日本一道高清一区二区三区| 国产欧美婷婷中文| 91九色美女在线视频| 中文字幕欧美精品日韩中文字幕| 亚洲国产成人在线观看| 色8久久精品久久久久久蜜| 永久免费看黄网站| 久久久久国产精品麻豆ai换脸| 99精品视频免费版的特色功能| 亚洲影音一区| 日韩在线视频在线| 欧美h版在线| 麻豆av一区| 亚洲大奶少妇| 国产一区二区在线播放| 成人福利av| 久久久中精品2020中文| 国产在线观看91| 亚洲人成网站777色婷婷| 狠狠人妻久久久久久综合麻豆| 欧美日韩精品二区第二页| 午夜毛片在线观看| 亚洲国产毛片aaaaa无费看| 特级西西人体高清大胆| 91麻豆福利精品推荐| 亚洲欧洲日韩综合| 极品尤物av久久免费看| 日本黄网站免费| 国产精品综合| 日本国产在线播放| 国产一区激情| 亚洲国产成人不卡| 精品72久久久久中文字幕| 精品国产一区二区三区四区vr | 欧美一区二区视频在线观看2022 | 日韩女优av电影| 一级黄色片在线播放| 91久久精品一区二区| 4438国产精品一区二区| 欧美午夜性色大片在线观看| 真实国产乱子伦对白在线| 亚洲欧洲99久久| 国产三级精品三级观看| 国产精品久久久久影院色老大 | 国产美女18xxxx免费视频| 日韩中文字幕1| 18岁视频在线观看| 日韩av网站在线观看| 少妇性l交大片| 日韩中文字幕亚洲一区二区va在线 | 一级性生活大片| 久久综合精品国产一区二区三区| 国产精品第七页| 久久嫩草精品久久久久| 香蕉网在线播放| 久久精品亚洲国产奇米99| 亚洲第一综合网| 国产精品美女久久福利网站| 久久精品日韩无码| 亚洲欧美另类在线| 麻豆chinese极品少妇| 亚洲高清在线精品| 91视频免费网址| 一本大道av伊人久久综合| 久草热在线观看| 欧美精品 国产精品| 国产男男gay体育生网站| 日韩一区二区麻豆国产| 国精产品一品二品国精品69xx| 精品国产一区二区三区忘忧草| 亚洲国产999| 亚洲美女av黄| 91在线导航| 久久国产精品免费视频| heyzo高清在线| 欧美最猛黑人xxxx黑人猛叫黄| 国产超碰精品| 91亚洲国产成人久久精品网站| 中文在线综合| 久久伊人一区二区| 欧美成人自拍| 少妇高潮喷水在线观看| 久久综合五月| 国产91在线免费观看| av在线不卡电影| 成人免费看aa片| 国产精品国产精品国产专区不蜜| 2021亚洲天堂| 一本色道综合亚洲| 国产麻豆一精品一男同| 日韩成人高清在线| 97电影在线看视频| 久久久久久久成人| 欧美色片在线观看| 国产成人精品福利一区二区三区| 你懂的视频欧美| 国产激情在线看| 石原莉奈在线亚洲二区| 天堂一区在线观看| 99久久久久久| 99久久99久久精品国产| 一本到三区不卡视频| 99在线小视频| 一区二区av在线| 日本资源在线| 国产精品一区二区女厕厕| 国产精品男女| 国产精品亚洲天堂| 三级影片在线观看欧美日韩一区二区 | 爱福利在线视频| 国产精品一区二区久久久| 欧美一级全黄| 97在线免费视频观看| 美国一区二区三区在线播放| 一级国产黄色片| 一区二区三区在线视频播放| 中国a一片一级一片| 亚洲国内精品在线| 亚洲区欧洲区| 成人乱色短篇合集| 国产亚洲一卡2卡3卡4卡新区 | 人与动物性xxxx| 懂色aⅴ精品一区二区三区蜜月| 国产伦精品一区二区三区免.费| 亚洲欧美在线一区| 国产探花视频在线观看| 亚洲va码欧洲m码| 日韩电影免费网站| 国模杨依粉嫩蝴蝶150p| 99热精品一区二区| 国产一级特黄a高潮片| 欧美一区二区三区色| 98在线视频| 国产精品十八以下禁看| 国产毛片一区二区三区 | 国产最新精品免费| 精品国产大片大片大片| 欧美三级视频在线观看| 最新av网站在线观看| 国产精品视频中文字幕91| 精品国产乱码| 亚洲一区二区三区四区五区xx| 久久免费电影网| 久久久久久久久黄色| 亚洲欧美三级在线| gogo亚洲高清大胆美女人体| 欧美日韩无遮挡| 视频一区在线播放| 欧美一区二区三区粗大| 欧美色视频一区| 粉嫩av一区| 国产欧美日韩免费| 久久一区91| 日本55丰满熟妇厨房伦| 亚洲一区在线观看视频| 乱色精品无码一区二区国产盗| 久久免费视频在线| 欧美变态挠脚心| 免费无码国产v片在线观看| 久久久久国产精品免费免费搜索 | 日韩丝袜美女视频| 黄色成人在线网| 久99久视频| 日韩国产欧美在线播放| 国产18无套直看片| 这里只有精品免费| 超碰在线资源| 欧美连裤袜在线视频| 麻豆精品视频在线观看视频| 日韩精品一区二区亚洲av性色 | 成人午夜av| 污污的视频免费观看| 亚洲男女毛片无遮挡| 亚洲国产成人一区二区 | 国产三级精品三级在线观看| 一本色道久久综合狠狠躁篇的优点| 欧美激情啪啪| 国产传媒久久久| 久久综合网色—综合色88| 波多野结衣电车痴汉| 久久久精品欧美| 日韩大胆成人| 手机在线看福利| 亚洲激情六月丁香| 人妻丰满熟妇av无码区hd| 日韩免费观看视频| 婷婷综合激情| 国产精品手机在线观看| 欧美亚洲一区二区在线| 欧洲黄色一区| 日韩中文字幕一区二区| 国产一区免费电影| 日韩中文字幕在线观看视频| 日韩中文字幕国产| 国产精品色呦| 日本国产一级片| 欧美日韩免费一区| 超碰在线网址| 欧美一二三四五区| 成人一区二区三区中文字幕| 波多野结衣家庭主妇| 欧美夫妻性生活xx|