精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek開源第三彈:V3/R1訓練推理關鍵秘籍,核心代碼僅300行

人工智能
簡單來說,DeepGEMM主要用于加速深度學習中的矩陣運算,特別是在大規(guī)模模型訓練和推理中,它特別適用于需要高效計算資源的場景,能夠顯著提升計算效率。

開源周的第三天,DeepSeek把訓練推理V3/R1背后的“動力”給亮出來了——

DeepGEMM:一個FP8 GEMM(通用矩陣乘法)庫,支持密集(dense)和混合專家(MoE)矩陣乘法運算。

圖片圖片

我們先來簡單了解一下GEMM。

GEMM,即通用矩陣乘法,是線性代數(shù)中的基本運算,是科學計算、機器學習、深度學習等領域中“常客”,也是許多高性能計算任務的核心。

但由于它的計算量往往都比較大,所以GEMM的性能優(yōu)化是至關重要的一點。

而DeepSeek這次開源的DeepGEMM,依舊是保持了“高性能+低成本”的特性,亮點如下:

  • 高性能:在Hopper架構的GPU上,DeepGEMM能夠實現(xiàn)高達1350+FP8 TFLOPS的性能。
  • 簡潔性:核心邏輯僅約 300 行代碼,但性能卻優(yōu)于專家調優(yōu)的內核。
  • 即時編譯(JIT):采用完全即時編譯的方式,這意味著它可以在運行時動態(tài)生成優(yōu)化的代碼,從而適應不同的硬件和矩陣大小。
  • 無重依賴:這個庫設計得非常輕量級,沒有復雜的依賴關系,可以讓部署和使用變得簡單。
  • 支持多種矩陣布局:支持密集矩陣布局和兩種 MoE 布局,這使得它能夠適應不同的應用場景,包括但不限于深度學習中的混合專家模型。

簡單來說,DeepGEMM主要用于加速深度學習中的矩陣運算,特別是在大規(guī)模模型訓練和推理中,它特別適用于需要高效計算資源的場景,能夠顯著提升計算效率。

很多網友們對這次的開源都比較“買單”,有人將DeepGEMM比作數(shù)學界的超級英雄,認為它比飛快的計算器還要快,比多項式方程還要強大。

圖片圖片

也有人將DeepGEMM的發(fā)布比喻為量子態(tài)穩(wěn)定到一個新的現(xiàn)實,稱贊其即時編譯的干凈利落。

圖片圖片

當然……也有人開始擔心起自己手上的英偉達股票了……

圖片圖片

深入了解DeepGEMM

DeepGEMM是一個專門為實現(xiàn)簡潔高效的FP8通用矩陣乘法(GEMMs)而打造的庫,它還具備細粒度縮放功能,這一設計源于DeepSeek V3。

它既能處理普通的通用矩陣乘法,也能支持MoE分組的通用矩陣乘法。

這個庫是用CUDA編寫的,安裝的時候不需要編譯,因為它會在運行時通過一個輕量級的即時編譯(JIT)模塊來編譯所有的內核程序。

目前,DeepGEMM只支持英偉達的Hopper張量核心。

為了解決FP8張量核心在計算累積時不夠精確的問題,它采用了CUDA核心的兩級累積(提升)方法。

雖然DeepGEMM借鑒了CUTLASS和CuTe里的一些理念,但并沒有過度依賴它們的模板或代數(shù)運算。

相反,這個庫設計得很簡潔,只有一個核心內核函數(shù),代碼量大概300行左右。

這使得它成為一個簡潔易懂的資源,方便大家學習Hopper架構下的FP8矩陣乘法和優(yōu)化技術。

盡管其設計輕巧,但DeepGEMM的性能可以匹配或超過各種矩陣形狀的專家調優(yōu)庫。

那么具體性能如何呢?

團隊在H800上使用NVCC 12.8測試了DeepSeek-V3/R1推理中可能使用的所有形狀(包括預填充和解碼,但沒有張量并行)。

下面這張圖展示的是用于密集模型的普通DeepGEMM的性能:

圖片圖片

從測試結果來看,DeepGEMM計算性能最高可達1358 TFLOPS,內存寬帶最高可達2668 GB/s。

加速比方面,與基于CUTLASS 3.6的優(yōu)化實現(xiàn)相比,最高可達2.7倍。

再來看下DeepGEMM支持MoE模型的連續(xù)布局(contiguous layout)的性能:

圖片圖片

以及支持MoE模型掩碼布局(masked layout)的性能是這樣的:

圖片圖片

如何使用?

要想使用DeepGEMM,需先注意一下幾個依賴項,包括:

  • 必須支持Hopper架構的GPU,sm_90a。
  • Python 3.8及以上。
  • CUDA 12.3及以上(推薦12.8)。
  • PyTorch 2.1及以上。
  • CUTLASS 3.6及以上

Development代碼如下:

# Submodule must be cloned
git clone --recursive git@github.com:deepseek-ai/DeepGEMM.git


# Make symbolic links for third-party (CUTLASS and CuTe) include directories
python setup.py develop


# Test JIT compilation
python tests/test_jit.py


# Test all GEMM implements (normal, contiguous-grouped and masked-grouped)
python tests/test_core.py

安裝代碼如下:

python setup.py install

在上述步驟之后,您的Python項目中導入deep_gemm即可。

接口方面,對于普通的DeepGEMM,可調用deep_gemm.gemm_fp8_fp8_bf16_nt函數(shù),支持NT格式(非轉置LHS和轉置RHS)。

對于分組的DeepGEMM,連續(xù)布局情況下是m_grouped_gemm_fp8_fp8_bf16_nt_contiguous;掩碼布局情況下是m_grouped_gemm_fp8_fp8_bf16_nt_masked。

DeepGEMM還提供設置最大SM數(shù)量、獲取TMA對齊大小等工具函數(shù);支持環(huán)境變量,如DG_NVCC_COMPILER、DG_JIT_DEBUG等。

除此之外,DeepSeek團隊還提供了幾種優(yōu)化的方式,包括:

  • JIT設計:所有內核在運行時編譯,無需安裝時編譯;支持動態(tài)選擇最優(yōu)塊大小和流水線階段。
  • 細粒度縮放:通過CUDA核心兩層累加解決FP8精度問題;支持非2的冪次方塊大小,優(yōu)化SM利用率。
  • FFMA SASS交錯:通過修改SASS指令的yield和reuse位,提高性能。

圖片圖片

感興趣的小伙伴可以戳文末GitHub鏈接查看詳情哦~

One More Thing

英偉達這幾天的股票……嗯……一直再跌:

圖片圖片

不過在北京時間27日凌晨,英偉達2025財年第四季度業(yè)績報告也即將出爐,我們可以期待一下它的表現(xiàn)~

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-02-26 10:11:01

2025-03-03 08:17:00

DeepSeek模型數(shù)據

2025-02-26 11:13:51

2025-09-02 10:17:07

2025-03-06 09:55:49

2025-03-03 09:00:00

DeepSeekAI人工智能

2025-03-20 09:00:00

DeepSeek架構V3/R1

2025-03-12 13:55:05

2025-01-27 12:30:07

2025-02-26 10:24:51

2025-07-04 09:08:00

AI模型架構

2025-07-08 08:53:00

2025-02-20 15:32:28

2025-02-07 13:10:06

2025-02-20 08:45:41

V3GPU資源

2025-04-02 09:21:00

DeepSeekAI開源

2024-12-30 20:32:36

2025-01-21 11:53:53

點贊
收藏

51CTO技術棧公眾號

av在线播放中文字幕| 亚洲蜜桃在线| 国产五月天婷婷| 粉嫩av一区二区| 亚洲国产sm捆绑调教视频 | 国语精品一区| 亚洲成人激情在线观看| 激情成人开心网| 色视频精品视频在线观看| 老司机亚洲精品| 另类少妇人与禽zozz0性伦| 麻豆网站免费观看| 中文字幕不卡三区视频| 欧美国产欧美亚州国产日韩mv天天看完整| 成人黄色免费网站在线观看| 国产又爽又黄的视频| 国产成人影院| 日韩一区二区免费在线电影| 黄色免费福利视频| 69xxxx欧美| 成人免费va视频| 国产精品主播视频| 成人免费看片98| 欧美呦呦网站| 亚洲国产精品va在看黑人| 亚洲欧美自拍另类日韩| 国产丝袜视频在线播放| 中文字幕第一区第二区| 国产精品久久久对白| 国产无遮挡又黄又爽又色视频| 伊人情人综合网| 国产亚洲精品va在线观看| 男男受被啪到高潮自述| 国产精品videossex撒尿| 亚洲成人www| 亚洲人成网站在线观看播放| 人妻少妇精品无码专区久久| 国内精品不卡在线| 国产精品久久久久91| 日韩黄色精品视频| 一区二区不卡| 国产亚洲欧洲高清| 污网站免费观看| 91精品视频一区二区| 日韩欧美在线视频日韩欧美在线视频| 国产在线视频综合| 黄网站在线播放| 亚洲国产成人一区二区三区| 精品综合久久久| 亚洲国产精品成人久久蜜臀| 久久99国产精品久久99果冻传媒| 国产不卡一区二区在线播放| 亚洲精品77777| 国产精品88久久久久久| 亚洲欧美日韩在线一区| 一本色道综合久久欧美日韩精品| 亚洲国产欧美在线观看| 欧美一区二区三区在线观看视频| 欧美男女交配视频| 电影久久久久久| 日韩欧美高清视频| 日日碰狠狠添天天爽超碰97| av剧情在线观看| 一区二区三区四区五区视频在线观看| 一本色道久久99精品综合| 精品无吗乱吗av国产爱色| 91免费观看视频在线| 久久国产日韩欧美| 午夜在线视频观看| 成人少妇影院yyyy| 国产综合色香蕉精品| 国产露脸无套对白在线播放| 国产资源精品在线观看| 92国产精品视频| 国产激情无套内精对白视频| 成人综合激情网| 激情伦成人综合小说| 亚洲AV成人无码一二三区在线| 久久综合视频网| 欧美日韩综合网| 999国产在线视频| 中文字幕亚洲一区二区va在线| 在线观看日韩片| 成人在线直播| 亚洲国产毛片aaaaa无费看| 水蜜桃色314在线观看| 色综合桃花网| 欧美性猛交xxxxxxxx| 小明看看成人免费视频| 麻豆视频久久| 精品国产露脸精彩对白| 欧美深性狂猛ⅹxxx深喉 | 国产三级伦理在线| 精品久久久国产精品999| 亚洲国产精品久久久久婷蜜芽| 625成人欧美午夜电影| 91福利精品第一导航| 日韩成人精品视频在线观看| 亚洲**毛片| 日韩的一区二区| 欧美aaa级片| 欧美成人久久| 热久久美女精品天天吊色| 在线亚洲欧美日韩| 成人一区二区三区中文字幕| 免费国产在线精品一区二区三区| 1769视频在线播放免费观看| 一区二区三区在线看| 日韩精品一区二区三区久久| 一区二区三区日本视频| 亚洲黄页网在线观看| 91精品人妻一区二区三区蜜桃欧美| 第一社区sis001原创亚洲| 欧美老女人性生活| 国产一级免费视频| 国产精一区二区三区| 精品乱码一区| 国产在线观看a| 午夜国产精品一区| 第一区免费在线观看| 久久久久高潮毛片免费全部播放| 最近的2019中文字幕免费一页| 免费在线观看国产精品| 日韩高清一区在线| 国产精品日韩一区二区| 成人免费黄色网页| 午夜精品爽啪视频| 99九九精品视频| 国产一区二区三区网| 欧美精品videosex极品1| 在线观看亚洲国产| 久久综合久久综合亚洲| 亚洲欧美电影在线观看| 日本黄色免费在线| 日韩精品在线一区| 日本成人精品视频| 日韩av不卡在线观看| 精品国产乱码久久久久久蜜柚| 91香蕉在线观看| 欧美影院精品一区| 国产成人av一区二区三区不卡| 欧美日韩亚洲国产精品| 91精品视频在线播放| 大乳在线免费观看| 日韩欧美国产激情| 菠萝菠萝蜜网站| 亚洲黄页一区| 国产一区精品视频| av毛片在线免费看| 91精品国产综合久久精品app | 日韩欧美中文字幕电影| 欧美激情手机在线视频| 99久久亚洲精品日本无码| 国产精品嫩草影院com| 成人一级片网站| 香蕉视频一区| 欧美在线一级视频| 欧美亚洲日本| 疯狂蹂躏欧美一区二区精品| 韩国三级在线播放| 女人色偷偷aa久久天堂| 97netav| 在线播放免费av| 日韩视频一区二区三区| 欧美高清视频一区二区三区| 国产剧情一区在线| 激情五月六月婷婷| 国产精品国产| 97视频网站入口| 国产又爽又黄网站亚洲视频123| 欧美日韩在线另类| 欧美色图亚洲激情| 国产一区二区三区久久| 久久亚洲综合网| 韩国女主播一区二区| 伊人av综合网| 一级α片免费看刺激高潮视频| 国产精品久久久久久久久搜平片| 在线观看高清免费视频| 日韩欧美自拍| 96国产粉嫩美女| 成人av影院在线观看| 国产视频丨精品|在线观看| 精品久久久久久久久久久久久久久久| 国产三级一区二区三区| 色戒在线免费观看| 欧美体内she精视频在线观看| 国产一区喷水| 亚洲成人短视频| 久久av在线看| 天堂av网在线| 欧美日韩免费视频| 久久久久久久久久久久久女过产乱| 国产成人av网站| 日本成年人网址| 久久亚洲专区| 精品一区二区不卡| 免费一级欧美在线观看视频| 欧美第一淫aaasss性| 午夜福利一区二区三区| 欧美疯狂性受xxxxx喷水图片| 妺妺窝人体色www婷婷| 久久久久成人黄色影片| www.污污视频| 午夜在线a亚洲v天堂网2018| 亚洲精品在线视频观看| 天堂va在线高清一区| 日本高清不卡在线| 91网在线播放| 亚洲第一页中文字幕| 中文字幕 视频一区| 亚洲一区二区三区四区中文字幕| 日本少妇毛茸茸| 久久久久久久高潮| 白白操在线视频| 综合伊思人在钱三区| 91成人理论电影| 在线成人视屏| 久久久久久国产精品| 幼a在线观看| 国产视频久久久久久久| 国产www免费观看| 日本道精品一区二区三区| 在线日韩国产网站| 久久久美女艺术照精彩视频福利播放| 色婷婷激情视频| 日韩主播视频在线| 91免费黄视频| 你懂的国产精品| 亚洲精品第一区二区三区| 极品国产人妖chinesets亚洲人妖| 国产在线观看一区二区三区| 色老太综合网| 欧美人成在线视频| 丝袜美腿美女被狂躁在线观看| 日韩av在线免费播放| 草逼视频免费看| 欧美日本一区二区| 中文字幕av久久爽| 欧美午夜精品在线| 久久精品无码人妻| 国产精品毛片a∨一区二区三区| 欧美熟妇精品黑人巨大一二三区| 国产高清一区日本| www.偷拍.com| 国内精品伊人久久久久影院对白| 国产熟女高潮视频| 欧美亚洲一区二区三区| 久久久亚洲精品无码| 影音先锋中文字幕一区| 狠狠干视频网站| 欧美综合一区| 日韩国产在线一区| 精品国产一区二区三区av片| 精品日本一区二区三区在线观看| 成人高潮视频| 99精品国产一区二区| 视频欧美一区| 99高清视频有精品视频| 日韩激情综合| 亚洲综合精品一区二区| 国产95亚洲| 91蜜桃网站免费观看| 视频亚洲一区二区| 国产伦精品一区二区三区在线| 超碰精品在线观看| 国产欧美日韩在线播放| 在线免费一区| 色网站在线免费观看| 日韩欧美色电影| 国产日韩在线观看一区| 337p亚洲精品色噜噜狠狠| 国产尤物在线观看| 欧美一二三四区在线| 国产三级精品在线观看| 欧美一级在线观看| 性生活黄色大片| 亚洲国产精品一区二区三区| 日韩欧美在线番号| 在线播放日韩欧美| 黄网站免费在线观看| 色偷偷亚洲男人天堂| 免费在线观看黄色| 欧美日韩国产123| 丁香花视频在线观看| 91黄色8090| 97成人超碰| 91超碰在线电影| 国产亚洲一级高清| 日韩精品成人一区| 在线欧美一区二区| 国产精品久久久久久久免费| 欧美成人三级电影在线| 日本视频在线观看一区二区三区| 亚洲天堂成人在线视频| 国产成人l区| 日本91av在线播放| 久久久久久久久成人| 蜜桃999成人看片在线观看| 97国产成人高清在线观看| 成人免费性视频| 日本中文字幕一区二区有限公司| 人妻激情偷乱视频一区二区三区| 久久久亚洲高清| 国产亚洲精品久久777777| 欧美亚洲高清一区二区三区不卡| 精品人妻少妇AV无码专区| 伊人久久免费视频| 成人影院在线播放| 成人有码在线播放| 欧美一区二区麻豆红桃视频| 日本a视频在线观看| 韩国成人在线视频| 国产传媒国产传媒| 黄色成人在线播放| 成人福利小视频| 久久精品99久久久香蕉| 韩国成人在线| 久久国产手机看片| 亚洲小说欧美另类社区| 国产精品久久久久久久99| 国产精品私房写真福利视频| 国产一区二区99| 精品91自产拍在线观看一区| 国产调教视频在线观看| 国产精品久久久久91| 久久99国产精品视频| 成人毛片视频网站| 成人动漫一区二区三区| 国产成人无码aa精品一区| 欧美久久久久久久久中文字幕| 成人综合影院| 国产精品高清在线观看| 亚洲国产合集| 精品中文字幕av| 91麻豆精东视频| 欧美国产成人精品一区二区三区| 亚洲第一精品自拍| heyzo高清在线| 国产欧美一区二区在线播放| 欧美激情视频一区二区三区免费| 欧洲美女亚洲激情| 亚洲婷婷国产精品电影人久久| 一区二区三区免费在线| 日韩在线观看视频免费| 欧美日韩123区| 日韩av电影免费在线观看| 久久久xxx| 成都免费高清电影| 在线欧美一区二区| 日本电影在线观看网站| 国产日韩欧美中文| 99久久www免费| 性久久久久久久久久久久久久| 亚洲欧美一区二区三区孕妇| 国产三级伦理片| 欧美大学生性色视频| 精品嫩草影院| 北条麻妃在线视频| 国产精品久久福利| 国产免费视频一区二区三区| 久久69精品久久久久久国产越南| 2023国产精华国产精品| 欧美又粗又长又爽做受| 久久亚洲综合av| 欧美一级黄视频| 久久久精品网站| 911精品国产| 青青草原av在线播放| 国产欧美精品一区二区色综合| 91欧美日韩麻豆精品| 免费91在线视频| 日本一道高清一区二区三区| 日本新janpanese乱熟| 日韩毛片精品高清免费| 丰满岳乱妇国产精品一区| 91干在线观看| 日韩久久精品| 国产a级片视频| 福利一区视频在线观看| 91caoporm在线视频| 51午夜精品| 久久电影一区| www日韩在线| 亚洲精品久久久久久久久久久| 99久久久国产精品免费调教网站| 国产女人18毛片| 26uuu欧美日本| 国产精品高潮呻吟av| 欧美性一区二区三区| 99精品视频精品精品视频| 日本69式三人交| 欧美日韩国产天堂| 国产黄大片在线观看| 亚洲一区二区四区| 99国产精品久久久久| 国产美女主播在线观看| 奇米一区二区三区四区久久| 91精品一区二区三区综合| 国产伦精品一区二区三区妓女|