精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4090單卡跑滿血版DeepSeek-R1,清華團隊開源項目再破大模型推理門檻

人工智能
隨著DeepSeek-R1的發布,社區的需求迅速激增,在GitHub蓋起上百樓的issue,呼吁對其進行支持。版本更新發布后,不少開發者也紛紛用自己的3090顯卡和200GB內存進行實測,借助與Unsloth優化的組合,Q2_K_XL模型的推理速度已達到9.1 tokens/s,真正實現了千億級模型的“家庭化”。

DeepSeek-R1火遍海內外,但推理服務器頻頻宕機,專享版按GPU小時計費的天價成本更讓中小團隊望而卻步。

而市面上所謂“本地部署”方案,多為參數量縮水90%的蒸餾版,背后原因是671B參數的MoE架構對顯存要求極高——即便用8卡A100也難以負荷。因此,想在本地小規模硬件上跑真正的DeepSeek-R1,被認為基本不可能。

但就在近期,清華大學KVCache.AI團隊聯合趨境科技發布的KTransformers開源項目公布更新:

支持24G顯存在本地運行DeepSeek-R1、V3的671B滿血版。預處理速度最高達到286 tokens/s,推理生成速度最高能達到14 tokens/s

其實早在DeepSeek-V2 時代,這個項目就因“專家卸載”技術而備受關注——它支持了236B的大模型在僅有24GB顯存的消費級顯卡上流暢運行,把顯存需求砍到10分之一。

△HuggingFace 的開源負責人的點贊△HuggingFace 的開源負責人的點贊

隨著DeepSeek-R1的發布,社區的需求迅速激增,在GitHub蓋起上百樓的issue,呼吁對其進行支持。

版本更新發布后,不少開發者也紛紛用自己的3090顯卡和200GB內存進行實測,借助與Unsloth優化的組合,Q2_K_XL模型的推理速度已達到9.1 tokens/s,真正實現了千億級模型的“家庭化”。

圖片圖片

此外,KTransformers團隊還公布了v0.3預覽版的性能指標,將通過整合Intel AMX指令集,CPU預填充速度最高至286 tokens/s,相比llama.cpp快了近28倍。對于那些需要處理上萬級Token上下文的長序列任務(比如大規模代碼庫分析)來說,相當于能夠從“分鐘級等待”瞬間邁入“秒級響應”,徹底釋放CPU的算力潛能。

圖片圖片

另外,KTransformers還提供了兼容Hugginface Transformers的API與ChatGPT式Web界面,極大降低了上手難度。同時,其基于YAML的“模板注入框架”能夠靈活切換量化策略、內核替換等多種優化方式。

目前,KTransformers在localLLaMa社區持續位居熱榜第一,有上百條開發者的討論。

圖片圖片

項目背后的技術細節,團隊也給出了詳細介紹。

利用MoE架構的稀疏性

DeepSeek-R1/V3均采用了MoE(混合專家)架構,這種架構的核心是將模型中的任務分配給不同的專家模塊,每個專家模塊專注于處理特定類型的任務。MoE結構的模型具有很強的稀疏性,在執行推理任務的時候,每次只會激活其中一部分的模型參數。

圖片圖片

因此,MoE架構需要大量的存儲空間,但是并不需要很多的計算資源。

基于此,團隊采用了GPU/CPU的異構計算劃分策略:僅將非Shared部分的稀疏MoE矩陣放在CPU/DRAM上并使用llamafile提供的高速算子處理,剩余稠密部分放在GPU上使用Marlin算子處理。

在這樣的情況下,同樣使用4bit量化,GPU上的參數只需要24GB的顯存環境,這樣的消耗只需要一張4090就能滿足。

此外通過這樣的組合,還能夠大幅度提升整個推理的性能,達到286 token/s的預填充和14 token/s的生成速度,比llama.cpp快28倍。

具體到技術實現中,團隊采用了基于計算強度的offload策略、高性能的CPU和GPU算子、CUDA Graph加速的多種方式來加速推理速度。

基于計算強度的offload策略

在Attention的核心,DeepSeek引入了一種新的MLA算子,它能夠充分利用顯卡算力,能夠很大程度提升效率。然而,MLA運算符在官方開源的v2版本中,是將MLA展開成MHA進行的計算,這個過程不僅擴大了KV cache大小,還降低了推理性能。

為了真正發揮MLA的性能,在KTransformers推理框架中,團隊將矩陣直接吸收到q_proj和out_proj權重中。因此,壓縮表示不需要解壓縮來計算Attention。

這種調整顯著減少了KV緩存大小,并增加了該運算符的算術強度,這非常顯著地優化了GPU計算能力的利用率。

圖片圖片

在計算中,MLA和Expert的計算強度相差數千倍。因此,團隊通過計算強度來決定劃分策略,優先將計算強度高的放入GPU(MLA > Shared Expert > Routed Expert),直到GPU放不下為止。

引入CPU和GPU的高性能算子

在CPU算子中,團隊使用llamafile作為CPU內核,使用expert并行和其他優化,組成高性能算子框架CPUInfer。此外增加多線程、任務調度、負載均衡、NUMA感知等優化。

在GPU算子的使用上,團隊引入Marlin算子作為GPU計算的內核,它能夠非常高效地進行量化后的矩陣計算,和torch這些計算量化后的矩陣乘法的庫相比,使用Marlin算子完成在GPU上面的計算大概可以達到3.87倍的理想加速效果。

CUDA Graph的改進和優化

為了平衡推理性能和框架本身的易用性/可擴展性,基于Python構建KTransformers框架,同時使用CUDA Graph降低Python調用開銷是一個必然的選擇。

KTransformers中使用CUDA Graph過程中盡可能地減少了CPU/GPU通訊造成的斷點,在CUDA Graph中摻雜和CPU異構算子通訊,最終實現一次decode僅有一個完整的CUDA Graph調用的結果。

靈活高效的推理實驗平臺

值得關注的是,KTransformers不止是一個固定的推理框架,也不只能推理DeepSeek的模型,它可以兼容各式各樣的MoE模型和算子,能夠集成各種各樣的算子,做各種組合的測試。

此外還同時提供了Windows、Linux的平臺的支持,方便運行。

當大模型不斷往上卷,KTransformers用異構計算打開一條新的推理路徑?;诖?,科研工作者無需巨額預算也能夠探索模型本質。

GitHub 地址:https://github.com/kvcache-ai/ktransformers
具體技術細節指路:https://zhuanlan.zhihu.com/p/714877271

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-03-06 17:29:21

2025-03-27 10:28:32

2025-03-10 08:30:00

AI模型訓練

2025-03-05 03:00:00

DeepSeek大模型調優

2025-02-13 08:51:23

DeepSeek大模型

2025-03-19 10:10:43

2025-02-03 14:17:27

2025-02-13 01:00:00

2025-02-19 08:00:00

2025-03-07 08:30:00

2025-05-19 08:41:00

AI模型開發者

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-02-25 08:20:50

AI程序員DeepSeek

2025-04-11 12:04:58

2025-09-08 09:06:16

2025-03-10 07:00:00

阿里開源QwQ-32B
點贊
收藏

51CTO技術棧公眾號

国产乱人伦丫前精品视频| 菠萝蜜视频国产在线播放| 老色鬼久久亚洲一区二区| 亚洲天堂av网| 久久黄色一级视频| 色网在线免费观看| 亚洲品质自拍视频网站| 久久人人97超碰人人澡爱香蕉| 成人一级免费视频| 亚洲视频碰碰| www.欧美免费| 国产吞精囗交久久久| 国产一区二区三区视频在线| 欧美性猛xxx| 天堂а√在线中文在线 | 国产二区国产一区在线观看| 日韩69视频在线观看| 粉嫩av性色av蜜臀av网站| 免费av一区| 欧美大片国产精品| 成人黄色一级大片| 新片速递亚洲合集欧美合集| 亚洲已满18点击进入久久| 日韩精品欧美专区| 天天干天天摸天天操| 国产美女娇喘av呻吟久久| 国产成人精品在线观看| 国产精品成人av久久| 888久久久| 视频直播国产精品| 老头老太做爰xxx视频| 国产精品毛片视频| 欧美一级xxx| 日韩在线不卡一区| 国产成人久久精品麻豆二区| 色综合久久88色综合天天免费| 免费拍拍拍网站| 亚洲丝袜精品| 亚洲色图.com| 91社在线播放| 九色porny丨首页在线| 中文字幕av一区 二区| 免费在线成人av| 四虎精品在线| 久久一区二区三区国产精品| 精品国产免费一区二区三区| 婷婷久久久久久| caoporm超碰国产精品| 国产伦精品一区二区三区照片| 国产口爆吞精一区二区| 久久爱www久久做| 国产精品日韩在线| 又骚又黄的视频| 免费av网站大全久久| 国产精品91久久| 久久久久久无码精品大片| 六月丁香综合| 欧美最近摘花xxxx摘花| 色一情一乱一伦| 日韩精品1区2区3区| 国产精品高潮在线| 在线免费一级片| 久久99国产精品免费网站| 国产精品欧美一区二区三区奶水| 在线视频精品免费| 另类小说视频一区二区| 成人精品久久久| 国产美女三级无套内谢| 国内精品久久久久影院薰衣草 | 欧美激情综合五月色丁香| 欧美精品v日韩精品v国产精品| 久久久久国产精品嫩草影院| 国产亚洲精品7777| 亚洲精品在线观看免费| 国产剧情在线| 午夜电影一区二区| 91在线视频观看免费| 91综合国产| 日韩欧美成人激情| 性欧美成人播放77777| av中文字幕一区二区| 久久综合色影院| 日产欧产va高清| 久色成人在线| 91中文字幕一区| 少妇av在线播放| 国产人久久人人人人爽| 亚洲小视频在线播放| www视频在线观看| 欧美专区亚洲专区| 免费看91视频| 国产日韩视频在线| 欧美成人免费小视频| 狠狠躁夜夜躁人人爽天天高潮| 水蜜桃久久夜色精品一区的特点| 91免费电影网站| 日本天堂在线| 一区二区三区在线不卡| 50路60路老熟妇啪啪| 日韩三级网址| 一区二区三区国产视频| 久久久久久久国产视频| 日本亚洲天堂网| 国产一级精品aaaaa看| 欧美成人二区| 欧美日韩亚洲一区二| 麻豆网站免费观看| 精品日韩欧美一区| 午夜精品久久久久久99热软件| 免费无码国产精品| heyzo一本久久综合| 成年人三级视频| 免费在线成人激情电影| 亚洲精品成人久久| 男女性高潮免费网站| 日韩成人免费电影| 久久亚洲国产精品日日av夜夜| 成人短视频在线| 欧美日韩在线亚洲一区蜜芽| 捆绑凌虐一区二区三区| 一区二区免费不卡在线| 国产精品久久国产精品99gif| 天堂在线观看免费视频| 一区二区三区中文在线观看| www午夜视频| 国产精品片aa在线观看| **欧美日韩vr在线| 开心激情综合网| 亚洲麻豆国产自偷在线| 亚洲欧美手机在线| 久久国产影院| 国产精品视频不卡| 超碰国产在线观看| 日本精品一区二区三区高清| 少妇特黄一区二区三区| 国产欧美日韩一级| 精品在线不卡| а√在线天堂官网| 亚洲国产成人一区| 国产中文字幕免费| 成人免费看的视频| 国产免费黄色一级片| 成人线上播放| 高清欧美性猛交| 日日躁夜夜躁白天躁晚上躁91| 亚洲综合视频在线| 丰满人妻一区二区三区免费视频棣| 欧美国产日本| 成人三级视频在线观看一区二区| 日本性爱视频在线观看| 精品国产3级a| 日本在线播放视频| 国产调教视频一区| 亚洲色图久久久| 日韩欧美中文| 亚洲在线免费观看| 成人女同在线观看| 亚洲精品国产精品国自产观看浪潮| 国产真人真事毛片| 久久亚洲一区二区三区明星换脸 | 午夜无码国产理论在线| 一区二区三区亚洲| 91好色先生tv| 亚洲黄色小视频| 呦呦视频在线观看| 日韩国产精品91| 9l视频自拍9l视频自拍| 国产一级成人av| 秋霞午夜一区二区| 思思99re6国产在线播放| 日韩一级黄色大片| 91午夜视频在线观看| 国产欧美精品一区二区三区四区 | 高清久久一区| 欧美国产日韩一区二区在线观看| 日本精品999| 欧洲生活片亚洲生活在线观看| 永久免费看mv网站入口| 粉嫩蜜臀av国产精品网站| 欧美二区在线视频| 久久精品国产68国产精品亚洲| 99精品欧美一区二区三区| 性爽视频在线| 久久好看免费视频| 婷婷婷国产在线视频| 欧美三片在线视频观看| 久久一二三四区| 欧美国产日韩a欧美在线观看 | 2020国产精品久久精品美国| 我看黄色一级片| 国产主播精品| 亚洲国产欧美日韩| 精品在线网站观看| 91精品啪aⅴ在线观看国产| 欧美xxxhd| 久久影视电视剧免费网站| 天天操天天舔天天干| 欧美裸体一区二区三区| 国产微拍精品一区| 亚洲黄色尤物视频| 国产成人在线网址| 91在线国内视频| 亚洲自拍第三页| 久久久久欧美精品| 日本福利视频一区| 亚州av乱码久久精品蜜桃| 欧美日韩精品免费看| 中文字幕区一区二区三| 国产在线精品一区免费香蕉| 国产精品专区免费| 欧美激情影音先锋| 米奇精品一区二区三区| 亚洲午夜女主播在线直播| 丰满人妻一区二区| 538在线一区二区精品国产| 中文字幕手机在线视频| 亚洲国产精品久久久久婷婷884| 国产麻豆a毛片| 国产视频一区二区三区在线观看 | 日本天堂一区| 高清日韩一区| 日韩精品久久久久久久软件91 | h视频久久久| 91夜夜未满十八勿入爽爽影院| 欧美国产日韩电影| 日韩女在线观看| 特黄毛片在线观看| 91高清在线免费观看| 国产丝袜在线播放| 欧美福利视频在线| 最新超碰在线| 久久躁狠狠躁夜夜爽| 国产黄大片在线观看画质优化| 自拍视频国产精品| av在线三区| 色多多国产成人永久免费网站 | 国产精品美女www爽爽爽视频| 水蜜桃在线视频| 97色在线观看免费视频| av蜜臀在线| 国内揄拍国内精品少妇国语| gogo久久| …久久精品99久久香蕉国产| 中文在线8资源库| 日本久久91av| 精品视频在线一区二区在线| 国产精品视频一| 国产91在线播放精品| 成人国内精品久久久久一区| 99er精品视频| 99久久99| 三级小说欧洲区亚洲区| 日韩av电影免费观看| 欧美日韩中字| 国产a级片免费看| 欧美激情视频一区二区三区免费| 国产精品日韩三级| 99热这里只有成人精品国产| 久久久久狠狠高潮亚洲精品| 肉色丝袜一区二区| 日韩成人精品视频在线观看| 国产精品一区二区果冻传媒| 黄色激情在线观看| 久久精品一区二区| 亚洲 欧美 国产 另类| 亚洲男人天堂av| 日韩精品视频免费看| 一本大道av伊人久久综合| 中文字幕在线观看你懂的| 日韩午夜中文字幕| 无码国产色欲xxxx视频 | 黄色网在线免费看| 欧美激情一级二级| 桃花岛成人影院| 26uuu精品一区二区| 中文视频一区视频二区视频三区 | 久久精品在线播放| 免费在线国产视频| 国产91在线播放| 国产精品麻豆| 免费成人av网站| 天天超碰亚洲| 波多野结衣家庭教师在线播放| 免费观看在线综合| 国产亚洲精品成人a| 国产人妖乱国产精品人妖| 欧美成人片在线观看| 一本色道**综合亚洲精品蜜桃冫| 国产精品视频一二区| 亚洲精品国精品久久99热一| 欧美激情视频在线播放| 91精品国产乱码久久久久久蜜臀 | 国产一区二区视频在线免费观看| 国产一区二区三区四区五区传媒 | 日韩免费在线观看| 黄色在线免费观看大全| 欧美猛男性生活免费| 欧美电影网站| 国产精品成人观看视频免费| 日韩欧美中字| 成人观看免费完整观看| 国产精品亚洲午夜一区二区三区 | 欧美图区在线视频| 欧美一区二区在线观看视频| www.久久久久| 99re66热这里只有精品4| 国产区日韩欧美| 亚洲精品a级片| 日本人视频jizz页码69| ww亚洲ww在线观看国产| 久青草视频在线观看| 欧美精品久久99| 国产日韩精品在线看| 2018国产精品视频| 中文字幕日韩在线| 久久久无码中文字幕久...| 免费成人av在线播放| av网在线播放| 欧美性猛交xxxx免费看漫画| 欧美视频xxx| 欧美激情精品久久久| 国产精品久久久久久久久久久久久久久 | 无码国产色欲xxxx视频| 久久6免费高清热精品| 国产精品无码久久久久| 日韩精品久久久免费观看| 亚洲一区视频| 西西大胆午夜视频| 亚洲成av人片| 少妇高潮一区二区三区99小说| 欧美成人免费网| 精品一区视频| 伊人再见免费在线观看高清版| 国内一区二区视频| 黑人狂躁日本娇小| 欧美精品一卡二卡| 日本不卡不卡| 成人精品久久久| 欧美成人69| 中文字幕人妻无码系列第三区| 亚洲视频免费在线| 99久久久国产精品无码免费| 久久成人综合视频| av成人在线网站| 最新av网址在线观看| 国产精品一区二区果冻传媒| 劲爆欧美第一页| 亚洲成年人在线| 色在线免费观看| 欧美日韩日本网| 日韩精品三区四区| 东京热无码av男人的天堂| 欧美日韩夫妻久久| 国产福利在线播放麻豆| 99久久精品久久久久久ai换脸| 樱桃成人精品视频在线播放| 91视频啊啊啊| 欧美三级电影一区| 好吊日视频在线观看| av激情久久| 久久精品国产清高在天天线| 中文字幕人妻一区二区三区在线视频| 欧美在线free| 超碰电影在线播放| 国内视频一区| 日本成人中文字幕在线视频| 一级黄色片日本| 精品成人佐山爱一区二区| 日本不卡网站| 亚洲欧美国产一区二区| 国产福利精品一区二区| 800av免费在线观看| 中文字幕欧美亚洲| 老司机亚洲精品一区二区| 成年人午夜视频在线观看| 中文字幕欧美日本乱码一线二线| av天堂一区二区三区| 欧美亚洲午夜视频在线观看| 成人激情电影在线| 亚洲av无码久久精品色欲| 精品久久久国产| 91亚洲精选| 国产高清自拍一区| 日韩和欧美一区二区| 91日韩中文字幕| 日韩精品在线视频| www.久久爱.com| av之家在线观看| 中文字幕日韩av资源站| 婷婷在线免费观看| 国产在线视频不卡| 亚洲深夜激情| 午夜国产福利一区二区| 亚洲摸下面视频| 亚洲一区二区电影| 污污网站免费看| 精品久久久久久中文字幕一区奶水| 在线免费观看黄色| 久久精品国产一区二区三区日韩| 黄一区二区三区|