精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

僅需10萬不到,DeepSeek R1 671B大模型本地部署實戰指南

人工智能
幫一個朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,沒有并發要求,我一想,用ktransformers框架來部署完全合適。

最近幫一個朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,沒有并發要求,我一想,用ktransformers框架來部署完全合適。

關于機器配置,在挑挑揀揀評比之后,設備選擇如下,最終選擇的是其中的服務器配置。

圖片

這套設備下來總成本不到10萬,相比如動輒幾百萬的滿血版deepseek R1或者花個五六十萬買個deepseek 70b的一體機要值當的多,且不說70b并不是真正的deepseek r1,效果還不如32b的QWQ,就光說一體機的升級也是個麻煩事,買了機器基本就和模型綁定了,以后新模型出來后想升級就難了。

說起這個,我上個月去給政府某部門培訓大模型時,還聽到一個八卦,說有個公司,花了幾百萬讓某個大廠私有化部署了一套定制的模型,但是deepseek r1出來后,直接棄用了,又去買了一套deepseek一體機。

而且這些公司買了一體機后,也還是不知道怎么用,就是搞個接口和頁面,讓員工來問下問題,就沒了其他用途了。只能說,公司是真有錢。

基礎配置

先說結論,使用Ktransformers框架,在上述圖片的服務器配置上,速度能達到5token/s, 考慮到Ktransformers目前還并不支持并發,本地私有化部署給少數人使用,這個速度還是勉強可以接受。

ktransformers官網文檔的安裝方式我之前已經寫過一篇文章,ktransformers部署詳細筆記。此處不再贅述。

這里我介紹一個這次我安裝時發現的一個新的教程 r1-ktransformers-guide,提供了基于uv的預編譯的環境,可以避免很多環境的依賴的報錯。

同時要注意ubuntu版本要使用ubuntu22及以上,python版本為3.11。

NVIDIA驅動版本570.86.1x , CUDA版本12.8

然后Ktransfomers要使用0.2.2版本,目前最新版本0.3還存在很多的bug

git clone https://github.com/kvcache-ai/ktransformers.git
cd ktransformers 
git submodule init 
git submodule update 
git checkout 7a19f3b git rev-parse --short HEAD #應顯示 7a19f3b

注意的是,git submodule update 主要是為了更新third_party中的項目

圖片

如果網絡不好,可以直接github中下載這些項目并放到到third_party文件夾中 

[submodule "third_party/llama.cpp"]
        path = third_party/llama.cpp
        url = https://github.com/ggerganov/llama.cpp.git
[submodule "third_party/pybind11"]
        path = third_party/pybind11
        url = https://github.com/pybind/pybind11.git

下載模型

然后下載量化后的deepseek r1模型,這里我下載的是int4量化版本,因為網絡問題,使用阿里的魔塔下載模型

modelscope download unsloth/DeepSeek-R1-GGUF --include "DeepSeek-R1-Q4_K_M/*" --cache_dir /home/user/new/models

--cache_dir /home/user/new/models   是制定模型下載路徑的位置

uv安裝

uv是一個用Rust語言編寫的現代Python包管理工具,被稱為"Python的Cargo",它是pip、pip-tools和virtualenv等傳統工具的高速替代品。速度比pip更快,而且還支持可編輯安裝、git依賴、本地依賴、源代碼分發等pip的高級功能。

安裝uv工具鏈

curl -LsSf https://astral.sh/uv/install.sh | sh

創建虛擬環境

uv venv ./venv --python 3.11 --python-preference=only-managedsource  venv/bin/activate

然后我們就可以按照教程中的使用uv工具進行安裝。

uv安裝預編譯版本

flashinfer-python是一個專為大型語言模型(LLM)推理服務設計的高性能GPU加速庫。它主要提供以下功能:

$ uv pip install flashinfer-python

這是安裝ktransformers庫的預編譯版本:

$ export TORCH_CUDA_ARCH_LIST="8.6"
uv pip install https://github.com/ubergarm/ktransformers/releases/download/7a19f3b/ktransformers-0.2.2rc1+cu120torch26fancy.amd.ubergarm.7a19f3b.flashinfer-cp311-cp311-linux_x86_64.whl

這是安裝flash_attn庫的預編譯版本:

uv pip install https://github.com/mjun0812/flash-attention-prebuild-wheels/releases/download/v0.0.5/flash_attn-2.6.3+cu124torch2.6-cp311-cp311-linux_x86_64.whl

這里的預編譯版本其實是這個文檔的作者直接編譯好的,雖然這個教程說明中提到僅適合RTX 3090Ti 24GB顯存 + 96GB DDR5-6400內存 + Ryzen 9950X處理器 。

但是我使用4090 24顯存 + 500 DDR5-4800內存 ,使用這個預編譯版本也可以安裝成功的。如果這個預編譯版本可以安裝成功的話,很多潛在的因為版本不對造成的報錯都可以避免掉了。

源碼運行ktransformers

如果上面的預編譯版本運行不了的話,又不想接著安裝ktransfomers,其實也可以直接用源碼來跑的,命令如下:

支持多GPU配置及通過 `--optimize_config_path` 進行更細粒度的顯存卸載設置
PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True python3 ktransformers/server/main.py      
--gguf_path /mnt/ai/models/unsloth/DeepSeek-R1-GGUF/DeepSeek-R1-UD-Q2_K_XL/     
--model_path deepseek-ai/DeepSeek-R1 
--model_name unsloth/DeepSeek-R1-UD-Q2_K_XL 
--cpu_infer 16 
--max_new_tokens 8192 
--cache_lens 32768 
--total_context 32768
--cache_q4 true
--temperature 0.6 
--top_p 0.95 
--optimize_config_path ktransformers/optimize/optimize_rules/DeepSeek-R1-Chat.yaml 
--force_think 
--use_cuda_graph 
--host 127.0.0.1 
--port 8080

是的,其實即使不編譯ktransfomers,也是可以跑起來的。直接把項目下好,運行上面的命令,準備好相應的文件,就能正常運行了。

如果要繼續編譯ktransfomers的話,則可以按照下面的流程進行操作:

# 安裝額外編譯依賴項,包括CUDA工具鏈等,例如:
# sudo apt-get install build-essential cmake ...
source venv/bin/activate
uv pip install -r requirements-local_chat.txt
uv pip install setuptools wheel packaging
# 建議跳過可選網站應用,使用`open-webui`或`litellm`等替代方案
cd ktransformers/website/
npm install @vue/cli
npm run build
cd ../..
# 如果擁有充足的CPU核心和內存資源,可顯著提升構建速度
# $ export MAX_JOBS=8
# $ export CMAKE_BUILD_PARALLEL_LEVEL=8
# 安裝flash_attn
uv pip install flash_attn --no-build-isolation
# 可選實驗性使用flashinfer替代triton
# 除非您是已經成功上手的進階用戶,否則暫不建議使用
# 使用以下命令安裝:
# $ uv pip install flashinfer-python
# 僅適用于以下情況:
# 配備Intel雙路CPU且內存>1TB可容納兩份完整模型內存副本(每路CPU一份副本)
# AMD EPYC NPS0雙路平臺可能無需此配置?
# $ export USE_NUMA=1
# 安裝ktransformers
KTRANSFORMERS_FORCE_BUILD=TRUE uv pip install . --no-build-isolation

如果想自己編譯好后供其他環境使用的,則可以使用下面的命令進行環境編譯。

KTRANSFORMERS_FORCE_BUILD=TRUE uv build

然后把生成的文件移動到其他環境安裝則輸入下面命令即可

uv pip install ./dist/ktransformers-0.2.2rc1+cu120torch26fancy-cp311-cp311-linux_x86_64.whl

ktransformers運行

接口運行命令

ktransformers --model_path /home/user/new/ktran0.2.2/ktransformers/models/deepseek-ai/DeepSeek-R1  --gguf_path /home/user/new/models/unsloth/DeepSeek-R1-GGUF/DeepSeek-R1-Q4_K_M   --port 8080

如果想運行網頁版本,則再最后增加 --web True參數即可。

其他問題

如果使用了不支持amx的cpu, 可能會遇到下面的報錯

/tmp/cc8uoJt1.s:23667: Error: no such instruction: `vpdpbusd %ymm3,%ymm15,%ymm1'
的報錯,
File "<string>", line 327, in build_extension     
File "/usr/local/python3/lib/python3.11/subprocess.py", 
line 571, in run       
raise CalledProcessError(retcode, process.args,   subprocess.CalledProcessError: 
Command '['cmake', '--build', '.', '--verbose', '--parallel=128']' 
returned non-zero exit status 1.   [end of output]

這是因為CPU架構不支持這些指令:編譯時使用了-march=native參數,這會讓編譯器生成針對當前CPU優化的代碼,包括使用特定的指令集。但如果當前CPU不支持AVX-VNNI指令集,就會出現這個錯誤。

解決方案:在CMake配置中添加以下選項:

-DLLAMA_NATIVE=OFF -DLLAMA_AVX=ON -DLLAMA_AVX2=ON -DLLAMA_AVX512=OFF -DLLAMA_AVXVNNI=OFF

就可以讓cpu不使用amx指令集,從而避免這個報錯了。

另外,如果需要我環境的requirements.txt, 可以在后臺回復330獲取。

寫在最后

2025年的今天,AI創新已經噴井,幾乎每天都有新的技術出現。作為親歷三次AI浪潮的技術人,我堅信AI不是替代人類,而是讓我們從重復工作中解放出來,專注于更有創造性的事情,關注我們公眾號口袋大數據,一起探索大模型落地的無限可能!

責任編輯:龐桂玉 來源: 口袋大數據
相關推薦

2025-04-03 06:30:00

2025-02-03 13:55:20

2025-08-04 08:51:00

2025-03-27 10:28:32

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-03 06:00:00

2024-12-27 11:13:16

2025-03-07 08:50:03

2025-03-07 08:30:00

2024-12-27 12:37:18

2025-01-27 12:30:07

2025-09-02 10:20:10

2025-03-06 09:55:49

2025-03-06 08:11:25

2025-02-20 15:32:28

2025-02-13 08:30:11

2025-02-06 08:06:05

點贊
收藏

51CTO技術棧公眾號

国产精品永久免费| 日韩精品黄色网| 300部国产真实乱| 亚洲国产精品国自产拍久久| 国产模特精品视频久久久久| 中文在线资源观看视频网站免费不卡 | 国内精品久久久久影院优| 爱爱免费小视频| 精品视频国内| 色天天综合色天天久久| 成人在线观看毛片| bbbbbbbbbbb在线视频| 国产99精品国产| 国产精品色婷婷视频| 91精品国产高潮对白| 日韩欧美大片| 日韩黄色高清视频| 国产又粗又猛又爽又黄| 欧美123区| 天天综合网 天天综合色| 制服诱惑一区| 国产区视频在线播放| 高清日韩电视剧大全免费| 国产精品久久久精品| 国产精选第一页| 中文字幕亚洲综合久久五月天色无吗''| 日韩激情视频在线| 国产国语老龄妇女a片| 日韩免费大片| 欧美性受xxxx| 国产第一页视频| 国产高清自产拍av在线| 亚洲精品第1页| 亚洲一区不卡在线| 超碰国产在线| 国产欧美综合色| 久久综合给合久久狠狠色| aa视频在线免费观看| 久久成人麻豆午夜电影| 国产精品三级美女白浆呻吟| www.欧美色| 久久精品二区三区| 欧美有码在线视频| 国产无人区码熟妇毛片多| 激情丁香综合| 久久久久一本一区二区青青蜜月 | 亚洲一区 二区 三区| 永久免费毛片在线播放不卡| 亚洲精品成人无码熟妇在线| 婷婷综合电影| 亚洲精品中文字幕女同| 日本五十肥熟交尾| 国产精品调教视频| 精品盗摄一区二区三区| 污污内射在线观看一区二区少妇| 久久365资源| 亚洲国产中文字幕在线观看| free性中国hd国语露脸| 欧美色资源站| 日韩福利视频在线观看| 成人免费av片| 精品一区二区三| 中文字幕亚洲综合| 一级免费黄色录像| 亚洲国产精品日韩专区av有中文 | 伊人网在线播放| 色综合久久久久| 国产精品拍拍拍| 欧美91在线|欧美| 制服丝袜成人动漫| 白丝校花扒腿让我c| 国产精品宾馆| 亚洲乱亚洲乱妇无码| 精品亚洲aⅴ无码一区二区三区| 欧美色图一区| 操91在线视频| 久久久久99精品| 国产美女精品| 国产欧美中文字幕| 黄色av网站免费在线观看| 久久色中文字幕| 亚洲精品欧洲精品| 午夜av在线免费观看| 欧美色道久久88综合亚洲精品| 爆乳熟妇一区二区三区霸乳| 99精品国产九九国产精品| 欧美精品一区二区三区四区| 成人影视免费观看| 色欧美自拍视频| 久久久久亚洲精品| 中国精品一区二区| 成人v精品蜜桃久久一区| 日韩av一区二区三区在线| 国产在线激情| 欧美午夜精品久久久久久久| 亚洲va综合va国产va中文| 国产日韩欧美视频| 天天干,夜夜操| 综合久久久久久| 免费观看美女裸体网站| 涩涩涩久久久成人精品| 亚洲国产精品va在线观看黑人| 在线观看日本黄色| 亚洲国产高清视频| 91精品免费视频| 日韩大胆人体| 一区二区三区在线高清| 91激情视频在线| 精品淫伦v久久水蜜桃| 丝袜美腿精品国产二区| 久久伊人成人网| 六月丁香婷婷色狠狠久久| 久久99久久99精品蜜柚传媒| 怡红院在线观看| 欧美日韩国产综合久久| 亚洲av片不卡无码久久| 一区在线视频| 91在线视频九色| 成人亚洲综合天堂| 日韩欧美在线一区| fc2成人免费视频| 亚洲一区二区日韩| 国产免费成人av| 蜜桃视频在线免费| 欧美日韩国产精品专区| 中文字幕一区二区三区人妻在线视频 | 91精品国产色综合久久ai换脸| 精品无码一区二区三区| 亚洲二区在线| 国产精品日韩一区二区| 成人日韩欧美| 欧美精品tushy高清| 久久亚洲无码视频| 久热精品在线| 任我爽在线视频精品一| 亚洲优女在线| 国产视频亚洲视频| 日韩久久中文字幕| 91网站在线观看视频| 日韩精品视频在线观看视频| 欧美久久亚洲| 久久999免费视频| 国产黄色高清视频| 一区二区三区小说| 伊人久久久久久久久| 你懂的视频一区二区| 亚洲一区二区三区在线免费观看| 日本在线观看网站| 91精选在线观看| jizz亚洲少妇| 国产黑丝在线一区二区三区| 成年人视频大全| 亚洲午夜免费| 91精品成人久久| 四虎国产精品永远| 色欧美88888久久久久久影院| 91视频免费观看网站| 日韩福利视频网| 一区二区成人国产精品 | 亚洲综合电影一区二区三区| 久久国产日韩欧美| 美女100%一区| 中文字幕亚洲专区| 国产婷婷在线视频| 一区二区三区在线播放| 欲求不满的岳中文字幕| 老司机午夜精品视频| 亚洲成人自拍视频| 99久热在线精品视频观看| 欧美高清一级大片| 神马亚洲视频| 欧美绝品在线观看成人午夜影视| 五月综合色婷婷| 国产高清无密码一区二区三区| 国产xxxx振车| 国内精品视频在线观看| 成人a在线观看| 国产乱妇乱子在线播视频播放网站| 亚洲精品福利资源站| 懂色av中文字幕| 亚洲美女淫视频| 日韩精品一区二区三区高清免费| 肉肉av福利一精品导航| 懂色av粉嫩av蜜臀av| 老牛影视av一区二区在线观看| 日韩av免费在线播放| av网站在线看| 亚洲精品小视频在线观看| 中文无码精品一区二区三区| 樱花影视一区二区| 一级片视频免费看| 国产宾馆实践打屁股91| 九色91popny| 亚洲三级色网| 一区二区三区精品国产| 欧美1区2区3区4区| 国产精品高潮呻吟久久av无限| 日韩av一级大片| 狠狠久久综合婷婷不卡| 97夜夜澡人人双人人人喊| 超碰97人人在线| 国产精品久久久久久亚洲av| 黄色综合网站| 亚洲精品日韩精品| 久久99国产精品久久99大师| 国产精品久久久久99| 国产偷倩在线播放| 日韩在线观看你懂的| 少妇av在线播放| 日韩三区在线观看| 成人黄色片在线观看 | 波兰性xxxxx极品hd| 99久久免费精品| 亚洲精品在线网址| 免费观看日韩电影| 欧美在线观看www| 午夜精品久久| 自拍另类欧美| 欧美日韩在线观看视频小说| 久久久com| 一区二区三区在线资源| 国产在线视频不卡| 666av成人影院在线观看| 韩国精品久久久999| 国产在线1区| 日韩在线观看av| 国产在线观看精品一区| 亚洲精品久久视频| 黄片毛片在线看| 日韩欧美亚洲另类制服综合在线| 亚洲中文字幕一区二区| 在线观看日韩精品| 免费看毛片网站| 色综合久久中文字幕综合网| xxxxxx国产| 香蕉影视欧美成人| 欧美亚洲天堂网| 亚洲午夜国产一区99re久久| 九九热精彩视频| 一区二区三区欧美日| 男女做暖暖视频| 亚洲精品国产视频| 超碰在线国产97| 亚洲欧美日韩国产成人精品影院 | 五月婷婷综合在线| 国产性生活网站| 亚洲福中文字幕伊人影院| 国产午夜视频在线播放| 天天综合天天做天天综合| 亚洲 欧美 日韩 综合| 欧美日韩综合视频网址| 波多野结衣 久久| 色伊人久久综合中文字幕| 蜜臀99久久精品久久久久小说| 91久久免费观看| 中文字幕二区三区| 91精品欧美综合在线观看最新| aaa一区二区| 亚洲国产精品久久久| 视频三区在线观看| 色狠狠久久aa北条麻妃 | 亚洲精品老司机| 久久精品视频日本| 黑人精品xxx一区| 波多野结衣二区三区| 欧美另类高清zo欧美| 国产极品久久久| 日韩不卡在线观看| 国产黄色免费在线观看| 久久久国产精彩视频美女艺术照福利| caopeng在线| 国自产精品手机在线观看视频| 在线天堂资源| 国产精品亚洲аv天堂网| 色播一区二区| 日本免费高清一区二区| 欧美有码视频| 一本大道熟女人妻中文字幕在线| 日韩精品一级中文字幕精品视频免费观看 | 激情中国色综合| 99久久精品无码一区二区毛片| 欧美变态网站| 一区二区三区四区欧美日韩| 好吊视频一区二区三区四区| 日韩欧美在线免费观看视频| 国产激情视频一区二区在线观看| 亚洲激情 欧美| 中文字幕一区在线观看视频| 日韩欧美高清在线观看| 欧美吞精做爰啪啪高潮| 亚洲AV无码成人片在线观看| 亚洲天堂2020| 国产探花在线观看| 国产在线不卡精品| 曰本一区二区三区视频| 香蕉视频在线网址| 免费视频一区二区三区在线观看| 中文字幕第22页| 久久久蜜桃精品| 久久影院一区二区| 欧美日韩一区二区三区在线| 天堂在线资源网| 欧美成人亚洲成人日韩成人| 久久野战av| 国产一区二区久久久| 97视频热人人精品免费| 国产超级av在线| 国产麻豆9l精品三级站| 91资源在线播放| 日韩欧美国产高清91| 午夜精品小视频| 日韩中文字幕免费| 香蕉成人av| 精品日韩欧美| 日韩一区二区免费看| 国产农村妇女精品久久| 久久久久国产精品麻豆ai换脸| 国产在线成人精品午夜| 欧美一级生活片| 天堂中文а√在线| 国产成人精品久久| 欧美亚洲tv| 美女扒开大腿让男人桶| 国产精一区二区三区| 激情无码人妻又粗又大| 在线亚洲高清视频| 久久电影中文字幕| 欧美一级bbbbb性bbbb喷潮片| 国产精品自在| 国产精品第157页| 懂色av一区二区三区免费观看| 午夜剧场免费在线观看| 欧美日免费三级在线| 国产高清美女一级毛片久久| 欧美做爰性生交视频| 美国十次av导航亚洲入口| 成人小视频在线观看免费| 国产一区二区日韩精品| 午夜精品一区二区三级视频| 欧美日韩免费在线视频| 爱爱爱免费视频在线观看| 国产精品久久久久久av下载红粉| 国产亚洲欧美日韩在线观看一区二区| 欧美牲交a欧美牲交aⅴ免费下载| 99精品黄色片免费大全| 日韩欧美亚洲一区二区三区| 亚洲第一视频网| 久久影院午夜精品| 久久国产欧美精品| 久久尤物视频| 女人十八毛片嫩草av| 欧美色综合久久| 精品51国产黑色丝袜高跟鞋| 91久热免费在线视频| 亚洲一本二本| 午夜男人的天堂| 欧美午夜视频在线观看| 国产大学生校花援交在线播放| 国产精品视频一区二区三区四 | 久久伊人久久| 91视频 - 88av| av在线免费不卡| 青青视频在线免费观看| 中文字幕亚洲在线| 亚洲三级av| 国产女女做受ⅹxx高潮| 欧美高清在线精品一区| 99精品在线视频观看| 国内成人精品一区| 婷婷精品在线观看| 视频二区在线播放| 夜夜亚洲天天久久| 欧美中文在线| 91精品中文在线| 亚洲久久一区二区| 欧美多人猛交狂配| 在线播放亚洲一区| 麻豆网站免费在线观看| 亚洲高清资源综合久久精品| 国产精品影视天天线| 国产免费av一区二区| 日韩中文综合网| 91精品啪在线观看国产爱臀| 黄色a级片免费| 日韩美女视频一区二区| 视频福利在线| 亚洲一区二区三区四区在线播放| 亚洲永久网站| 午夜三级在线观看| 亚洲精品按摩视频| 久久福利在线| 香港三级韩国三级日本三级| 国产精品美女一区二区在线观看| 丰满肉肉bbwwbbww| 国产精品丝袜白浆摸在线| 91久久黄色| 久久精品视频免费在线观看| 亚洲午夜精品久久久久久性色| 亚洲高清999| 婷婷免费在线观看|