精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在 TKE 上部署 AI 大模型(以DeepSeek-R1為例)

人工智能
使用 Ollama 運行 AI 大模型,再通過 OpenWebUI 暴露一個聊天交互的界面,OpenWebUI 會調用 ollama 提供的 API 來與大模型交互。

概述

本文介紹如何在 TKE 上部署 AI 大模型,以 DeepSeek-R1 為例。

部署思路

使用 Ollama 運行 AI 大模型,再通過 OpenWebUI 暴露一個聊天交互的界面,OpenWebUI 會調用 ollama 提供的 API 來與大模型交互。

Ollama 與 OpenWebUI 介紹

Ollama 是一個運行大模型的工具,可以看成是大模型領域的 Docker,可以下載所需的大模型并暴露 API。

OpenWebUI 是一個大模型的 Web UI 交互工具,支持 Ollama,即調用 Ollama 暴露的 API 實現與大模型交互:

圖片圖片

AI 大模型數據如何存儲?

AI 大模型通常占用體積較大,直接打包到容器鏡像不太現實,如果啟動時通過 initContainers 自動下載又會導致啟動時間過長,因此建議使用共享存儲來掛載 AI 大模型。

在騰訊云上可使用 CFS 來作為共享存儲,CFS 的性能和可用性都非常不錯,適合 AI 大模型的存儲。本文將使用 CFS 來存儲 AI 大模型。

準備 CFS 存儲

在【組建管理】中的【存儲】找到 CFS-Turbo 或 CFS 插件并安裝:

圖片圖片


CFS-Turbo 的性能更強,讀寫速度更快,也更貴,如果希望大模型運行速度更快,可以考慮使用 CFS-Turbo。

新建 StorageClass:

圖片圖片

  1. 選項較多,所以該示例通過 TKE 控制臺來創建 PVC。如希望通過 YAML 來創建,可先用控制臺創建一個測試 PVC,再復制出生成的 YAML。
  2. Provisioner 選 文件存儲CFS。
  3. 存儲類型 建議選 性能存儲,讀寫速度比 標準存儲 更快。

新建 GPU 節點池

在 TKE 控制臺的【節點管理】-【節點池】中點擊【新建】,如果【原生節點】或【普通節點】,機型在【GPU 機型】中選擇一個沒售罄的機型;如果選【超級節點】則無需選擇機型(在部署的時候通過注解指定 GPU 類型)。

確認 GPU 驅動和所需 CUDA 版本

可隨便買一臺對應節點池機型的云服務器,上去執行 nvidia-smi 命令,查看 GPU 驅動版本。

在 nvidia 官網的 CUDA Toolkit Release Notes (https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html) 中,查找適合對應 GPU 驅動版本的 CUDA 版本。

編譯 ollama 鏡像

準備 Dockerfile:

FROM nvidia/cuda:11.8.0-cudnn8-runtime-ubuntu22.04

RUN apt update -y && apt install -y curl

RUN curl -fsSL https://ollama.com/install.sh | sh


基礎鏡像使用 nvidia/cuda,具體使用哪個 tag 可根據前面確認的 cuda 版本來定。這里是所有 tag 的列表: https://hub.docker.com/r/nvidia/cuda/tags。

編譯并上傳鏡像:

docker build -t imroc/ollama:cuda11.8-ubuntu22.04 .
docker push imroc/ollama:cuda11.8-ubuntu22.04


注意修改成自己的鏡像名稱。

創建 PVC

創建一個 CFS 類型的 PVC,用于存儲 AI 大模型:

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: ai-model
  labels:
    app: ai-model
spec:
  storageClassName: deepseek
  accessModes:
  - ReadWriteMany
  resources:
    requests:
      storage: 100Gi
  1. 注意替換 storageClassName。
  2. 對于 CFS 來說,storage 大小無所謂,可隨意指定,按實際占用空間付費的。

再創建一個 PVC 給 OpenWebUI 用,可使用同一個 storageClassName:

apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: webui
  labels:
    app: webui
spec:
  accessModes:
  - ReadWriteMany
  storageClassName: deepseek
  resources:
    requests:
      storage: 100Gi

使用 Job 下載 AI 大模型

下發一個 Job,將需要用的 AI 大模型下載到 CFS 共享存儲中:

apiVersion: batch/v1
kind: Job
metadata:
  name: pull-model
  labels:
    app: pull-model
spec:
  template:
    metadata:
      name: pull-model
      labels:
        app: pull-model
    spec:
      containers:
      - name: pull-model
        image: imroc/ollama:cuda11.8-ubuntu22.04
        env:
        - name: LLM_MODEL
          value: deepseek-r1:7b
        command:
        - bash
        - -c
        - |
          set -ex
          ollama serve &
          sleep 5
          ollama pull $LLM_MODEL
        volumeMounts:
        - name: data
          mountPath: /root/.ollama
      volumes:
      - name: data
        persistentVolumeClaim:
          claimName: ai-model
      restartPolicy: OnFailure
  1. 使用之前我們編譯好的 ollama 鏡像,執行一個腳本去下載 AI 大模型,本例中下載的是 deepseek-r1:7b,完整列表在 https://ollama.com/search,修改 LLM_MODEL 以替換大語言模型。
  2. ollama 的模型數據存儲在 /root/.ollama 目錄下,掛載 CFS 類型的 PVC 到該路徑。

部署 ollama

通過 Deployment 部署 ollama:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: ollama
  labels:
    app: ollama
spec:
  selector:
    matchLabels:
      app: ollama
  replicas: 1
  template:
    metadata:
      labels:
        app: ollama
      annotations:
        eks.tke.cloud.tencent.com/gpu-type: V100
    spec:
      containers:
      - name: ollama
        image: imroc/ollama:cuda11.8-ubuntu22.04
        imagePullPolicy: IfNotPresent
        command: ["ollama", "serve"]
        env:
        - name: OLLAMA_HOST
          value: ":11434"
        resources:
          requests:
            cpu: 2000m
            memory: 2Gi
            nvidia.com/gpu: "1"
          limits:
            cpu: 4000m
            memory: 4Gi
            nvidia.com/gpu: "1"
        ports:
        - containerPort: 11434
          name: ollama
        volumeMounts:
        - name: data
          mountPath: /root/.ollama
      volumes:
      - name: data
        persistentVolumeClaim:
          claimName: ai-model
      restartPolicy: Always

---

apiVersion: v1
kind: Service
metadata:
  name: ollama
spec:
  selector:
    app: ollama
  type: ClusterIP
  ports:
  - name: server
    protocol: TCP
    port: 11434
    targetPort: 11434
  1. ollama 的模型數據存儲在 /root/.ollama 目錄下,掛載已經下載好 AI 大模型的 CFS 類型 PVC 到該路徑。
  2. ollama 監聽 11434 端口暴露 API,定義 Service 方便后續被 OpenWebUI 調用。
  3. ollama 默認監聽的是回環地址(127.0.0.1),指定 OLLAMA_HOST 環境變量,強制對外暴露 11434 端口。
  4. 運行大模型需要使用 GPU,因此在 requests/limits 中指定了 nvidia.com/gpu 資源,以便讓 Pod 調度到 GPU 機型并分配 GPU 卡使用。
  5. 如果希望大模型跑在超級節點,需通過 Pod 注解 eks.tke.cloud.tencent.com/gpu-type 指定 GPU 類型;若不希望調度到超級節點則刪除該注解。

部署 OpenWebUI

使用 Deployment 部署 OpenWebUI,并定義 Service 方便后續對外暴露訪問:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: webui
spec:
  replicas: 1
  selector:
    matchLabels:
      app: webui
  template:
    metadata:
      labels:
        app: webui
    spec:
      containers:
      - name: webui
        image: imroc/open-webui:main # docker hub 中的 mirror 鏡像,長期自動同步,可放心使用
        env:
        - name: OLLAMA_BASE_URL
          value: http://ollama:11434 # ollama 的地址
        - name: HF_HUB_OFFLINE
          value: "1"
        - name: ENABLE_OPENAI_API
          value: "false"
        tty: true
        ports:
        - containerPort: 8080
        resources:
          requests:
            cpu: "500m"
            memory: "500Mi"
          limits:
            cpu: "1000m"
            memory: "1Gi"
        volumeMounts:
        - name: webui-volume
          mountPath: /app/backend/data
      volumes:
      - name: webui-volume
        persistentVolumeClaim:
          claimName: webui

---
apiVersion: v1
kind: Service
metadata:
  name: webui
  labels:
    app: webui
spec:
  type: ClusterIP
  ports:
  - port: 8080
    protocol: TCP
    targetPort: 8080
  selector:
    app: webui
  1. OLLAMA_BASE_URL 是 ollama 的地址,填 ollama 的 service 訪問地址。
  2. ENABLE_OPENAI_API 填 false,因為我們使用的是 ollama,不需要使用 openai api,禁用它避免啟動時因國內連不上 openapi 地址而無法加載模型(現象是登錄 OpenWebUI 返回空白頁)。
  3. OpenWebUI 的數據存儲在 /app/backend/data 目錄(如賬號密碼、聊天歷史等數據),我們掛載 PVC 到這個路徑。

暴露 OpenWebUI 并與模型對話

如果只是本地測試,可以使用 kubectl port-forward 暴露服務:

kubectl port-forward service/webui 8080:8080

在瀏覽器中訪問 http://127.0.0.1:8080 即可。

你還可以通過 Ingress 或 Gateway API 來暴露,我這里通過 Gateway API 來暴露(需安裝 Gateway API 的實現,如 TKE 應用市場中的 EnvoyGateway,具體 Gateway API 用法參考 https://gateway-api.sigs.k8s.io/guides/):

apiVersion: gateway.networking.k8s.io/v1
kind: HTTPRoute
metadata:
  name: ai
spec:
  parentRefs:
  - group: gateway.networking.k8s.io
    kind: Gateway
    namespace: envoy-gateway-system
    name: imroc
    sectionName: https
  hostnames:
  - "ai.imroc.cc"
  rules:
  - backendRefs:
    - group: ""
      kind: Service
      name: webui
      port: 8080
  1. parentRefs 引用定義好的 Gateway(通常一個 Gateway 對應一個 CLB)。
  2. hostnames 替換為你自己的域名,確保域名能正常解析到 Gateway 對應的 CLB 地址。
  3. backendRefs 指定 OpenWebUI 的 Service。

最后在瀏覽器訪問 hostnames 中的地址即可。

首次進入 OpenWebUI 會提示創建管理員賬號密碼,創建完畢后即可登錄,然后默認會使用前面下載好的大模型進行對話。

圖片圖片

責任編輯:武曉燕 來源: 云原生
相關推薦

2025-02-19 08:00:00

2025-03-05 03:00:00

DeepSeek大模型調優

2025-09-08 09:06:16

2025-02-13 08:51:23

DeepSeek大模型

2025-02-03 14:17:27

2025-04-03 06:30:00

2025-06-12 09:48:27

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-05-19 08:41:00

AI模型開發者

2025-03-27 09:34:42

2025-03-11 09:53:21

2025-02-07 14:18:51

2025-11-19 08:56:42

2025-02-03 15:50:44

2025-03-05 10:21:04

DeepSeekLVLM

2025-02-19 08:33:18

點贊
收藏

51CTO技術棧公眾號

一级日韩一区在线观看| 色综合婷婷久久| 国产精品高潮呻吟久久av野狼| 黄色片在线观看免费| 日本三级一区| 国产精品青草综合久久久久99| 国产精品91久久| 777777国产7777777| 91蜜桃臀久久一区二区| 欧美日韩亚洲一区二| 日本一区视频在线播放| 中文字幕免费观看视频| 精品99视频| 在线日韩第一页| 极品白嫩的小少妇| 免费一区二区三区四区| 亚洲成人高清在线| 日韩精品久久久毛片一区二区| 国产一区二区视频免费观看| 亚洲欧洲一区| 日韩中文字幕欧美| 在线播放av网址| 免费一级欧美在线观看视频| 精品免费在线观看| 在线视频不卡一区二区| 亚州av在线播放| 国产一区二区三区在线观看免费视频 | 亚洲精品美女久久| av亚洲天堂网| 成人性生交大片免费观看网站| 尤物视频一区二区| 亚洲一区二区自拍偷拍| 嫩草研究院在线观看| 激情六月婷婷久久| 国产精品一区二区三区免费视频| 欧美成人免费看| 久久亚洲成人| 亚洲级视频在线观看免费1级| 亚洲国产欧美91| 成人在线视频观看| 欧美色另类天堂2015| 欧美这里只有精品| 国产51人人成人人人人爽色哟哟| 国产成人高清视频| 亚洲free嫩bbb| 日本精品入口免费视频| 99热精品在线| 久久人人看视频| 免费在线观看黄视频| 亚洲中无吗在线| 久久精品国产视频| 5566中文字幕| 午夜国产一区二区| 久久精品精品电影网| 欧美另类69xxxx| heyzo久久| 在线精品国产欧美| 中文字幕第69页| 日韩精品一区二区三区免费观影| 尤物精品国产第一福利三区| av网站免费在线看| 精品一区在线| 国产亚洲福利一区| 欧美xxxx精品| 婷婷伊人综合| 欧美理论电影在线观看| 欧美日韩在线观看免费| 中文一区一区三区免费在线观看| 欧美另类高清videos| 来吧亚洲综合网| 久久久久亚洲| 欧美激情视频网址| 97超碰人人干| 亚洲影院在线| 国产精品天天狠天天看| 久久久久久久亚洲| 免费看黄色91| 91精品视频观看| 中文字幕乱码无码人妻系列蜜桃| 精品一区二区久久久| 国产一区二区在线播放| 精品黑人一区二区三区在线观看 | 在线观看你懂的视频| julia中文字幕一区二区99在线| 亚洲精品在线三区| 三级电影在线看| 国产精品亚洲人成在99www| 一区二区三区亚洲| 五月婷婷综合激情网| 影音先锋日韩精品| 国语自产精品视频在线看一大j8| 黄色片中文字幕| 日本不卡123| 97人人做人人人难人人做| 亚洲女同志亚洲女同女播放| 26uuu精品一区二区三区四区在线| 日本黑人久久| 亚洲精品承认| 亚洲国产精品久久一线不卡| www.日日操| 色999久久久精品人人澡69| 精品第一国产综合精品aⅴ| 国产手机在线观看| 国产精品porn| 欧美整片在线观看| 欧美日韩a v| 国产激情偷乱视频一区二区三区 | 日本不卡二三区| 欧美高清在线视频观看不卡| 免费黄色一级大片| 丁香六月久久综合狠狠色| 精品一区久久久久久| av在线播放网站| 精品久久久免费| 天天久久综合网| 国产欧美亚洲精品a| 欧美激情在线狂野欧美精品| 亚洲一区二区激情| 久久在线观看免费| 男人添女荫道口图片| www.久久草.com| 日韩精品免费在线播放| 欧美国产在线看| 美女在线视频一区| 清纯唯美一区二区三区| 波多野结衣久久| 欧美一区二区三区的| 精品人妻中文无码av在线| 一区二区三区高清视频在线观看| 国产va免费精品高清在线观看| 丰满熟妇乱又伦| 亚洲国产精品激情在线观看| 国产精品成人久久电影| 欧美第一在线视频| 中文字幕在线视频日韩| 亚洲免费在线观看av| 丁香激情综合国产| 中文字幕久久综合| 国产91亚洲精品久久久| 亚洲人成网站在线播| 中文字幕在线字幕中文| 国产91色综合久久免费分享| 玖玖精品在线视频| avtt久久| 久久午夜a级毛片| 一本大道伊人av久久综合| 国产亚洲精品bt天堂精选| 黄色a级片免费| 婷婷综合电影| 97国产在线视频| 色窝窝无码一区二区三区成人网站| 一个色综合av| 男男受被啪到高潮自述| 不卡日本视频| 国产日韩亚洲欧美| 日本激情在线观看| 欧美日韩国产中文| 国产又粗又长又黄的视频| 秋霞成人午夜伦在线观看| 天堂va久久久噜噜噜久久va| 亚洲精品一区| 国产一级揄自揄精品视频| 亚洲自拍一区在线观看| 成人h版在线观看| av高清在线免费观看| 98视频精品全部国产| 欧美激情啊啊啊| 天天综合天天综合| 色婷婷综合久久久中文一区二区| 中文字幕5566| 破处女黄色一级片| 成人污污www网站免费丝瓜| 亚洲国产第一页| 97免费在线观看视频| 成人午夜激情影院| 国产69精品久久久久久久| 大奶在线精品| 国产精品av在线播放| 免费在线黄色电影| 色av一区二区| 99久久99久久精品免费| 视频一区二区中文字幕| 日韩一区二区三区高清| av在线成人| 97超级碰在线看视频免费在线看| 国产一级二级三级在线观看| 欧美日韩和欧美的一区二区| 久青草免费视频| 久久亚洲一区二区三区四区| 亚洲天堂网2018| 欧美91福利在线观看| 国产一级精品aaaaa看| 视频在线日韩| 萌白酱国产一区二区| 香蕉久久一区二区三区| 欧美日韩小视频| 青娱乐在线视频免费观看| www久久久久| 中文字幕avav| 91久久夜色精品国产九色| 欧美aaaaa喷水| 97精品国产99久久久久久免费| 九九热精品在线| 国际av在线| 日韩欧美专区在线| 人人妻人人爽人人澡人人精品| 一区二区在线看| 人妻少妇一区二区| 国产成人精品www牛牛影视| 牛夜精品久久久久久久| 亚洲精品1区2区| 特级西西444| 国产真实有声精品录音| 96国产粉嫩美女| 老司机深夜福利在线观看| 久久夜精品va视频免费观看| 国产女人爽到高潮a毛片| 色综合网站在线| 国产精品成人网站| **性色生活片久久毛片| 免费在线观看污| 成人国产精品免费网站| 91精品无人成人www| 99国产精品自拍| 一区二区三区欧美亚洲| 男人操女人免费软件| 97精品国产| 欧美日本亚洲| 欧美a一欧美| 国产 高清 精品 在线 a| 国产一区二区三区亚洲综合 | 日本美女高清在线观看免费| 精品剧情在线观看| av中文在线播放| 午夜视频一区二区| 国产亚洲精品av| 亚洲精品伦理在线| 91porn在线视频| 国产精品久久久久桃色tv| 国产肥白大熟妇bbbb视频| 国产成人一级电影| 99re6在线观看| 久久99热国产| 91丨九色丨蝌蚪| 狠狠色狠狠色综合| av网站在线不卡| 日韩国产欧美在线播放| 三年中国国语在线播放免费| 精品成人免费| 国产一二三在线视频| 亚洲日产国产精品| 久在线观看视频| 亚洲调教视频在线观看| 六月婷婷激情网| 欧美三级午夜理伦三级中文幕| 一区二区欧美日韩| 亚洲不卡av不卡一区二区| 视频在线观看成人| 日韩中出av| 日韩一区二区电影在线观看| 久久密一区二区三区| 一区二区三区四区在线视频| 91精品国产91久久久久久黑人| 一区二区三区四区久久| 国产高清一区二区| 欧美日韩中文字幕在线播放| 亚洲一级一区| 6080亚洲精品一区二区| 日韩乱码人妻无码中文字幕久久 | 五月天婷婷在线观看视频| 国产一区二区在线影院| 国产精品自在自线| 美女性感视频久久| 中文国产在线观看| 国产91在线观看丝袜| 无码人妻少妇色欲av一区二区| 丁香天五香天堂综合| 精品夜夜澡人妻无码av | 精品毛片乱码1区2区3区| 五月婷婷免费视频| 中文字幕久热精品视频在线| 国产网站在线免费观看| 久久久免费精品视频| 在线精品亚洲欧美日韩国产| 国产国语videosex另类| 国产欧美视频在线| 国产精品免费一区二区三区四区 | 久久久久久久久久久网| 综合在线观看色| 日韩三级av在线| 在线观看亚洲a| 国产v在线观看| 精品人伦一区二区色婷婷| 亚洲精品一区二区口爆| 日韩高清人体午夜| 日本成人在线播放| 97视频在线观看网址| 日韩黄色在线| 久久综合毛片| 欧美/亚洲一区| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 韩国欧美国产1区| 国产精品一区二区入口九绯色| 中文字幕在线不卡| 久久久久久久久久久久久av| 欧美色综合网站| 欧美熟妇另类久久久久久不卡| 中文字幕亚洲综合| 在线观看av网页| 中文在线综合| 久久国产精品-国产精品| 93在线视频精品免费观看| 亚洲乱码中文字幕久久孕妇黑人| 国产一区二三区好的| 天天躁夜夜躁狠狠是什么心态| 伊人婷婷欧美激情| 亚洲在线视频播放| 亚洲精品国产综合久久| 四虎亚洲精品| 国产精品爽黄69| 综合色就爱涩涩涩综合婷婷| 国产 欧美 日本| 经典三级在线一区| 国产精品成人无码免费| 亚洲国产一区二区a毛片| 国产尤物在线观看| 亚洲欧美中文字幕| 91破解版在线观看| 亚洲尤物视频网| 国产国产精品| 亚洲精品怡红院| 99精品视频在线免费观看| 内射一区二区三区| 色呦呦国产精品| 青青视频在线观| 911国产网站尤物在线观看| 爱高潮www亚洲精品| 国产91在线亚洲| 精品一区二区三区在线播放视频| 天天干天天舔天天操| 日本道在线观看一区二区| 欧美中文在线| 日本老师69xxx| 久草在线成人| 日本一本二本在线观看| 91在线免费视频观看| 国产精品美女久久久久av爽| 日韩三级视频在线观看| 1stkiss在线漫画| 成人日韩在线视频| 欧美日本一区二区视频在线观看| 亚洲久久中文字幕| 国产日韩欧美一区二区三区乱码| 国产亚洲欧美在线精品| 精品国产一区a| 久久视频免费在线观看| 亚洲成人免费网站| 多野结衣av一区| 精品视频第一区| 午夜亚洲影视| 日本成人三级电影网站| 日本天堂在线观看| 欧美在线视频观看| 少妇一区二区视频| 五月婷婷狠狠操| 最新久久zyz资源站| 午夜精品一二三区| 美女av一区二区三区| 国产精品45p| 久色视频在线播放| 国产日产亚洲精品系列| 中文字幕一级片| 久久亚洲精品中文字幕冲田杏梨 | 亚洲2020天天堂在线观看| 亚欧日韩另类中文欧美| 欧美三级理论片| 亚洲免费三区一区二区| 婷婷伊人综合中文字幕| 日韩免费中文字幕| 一区二区蜜桃| www.欧美日本| 亚洲天堂免费在线观看视频| 国产精品一区二区黑人巨大| 欧美精品在线免费观看| 五月国产精品| 日本国产一级片| 五月激情综合婷婷| 日本韩国精品一区二区| 91最新在线免费观看| 亚洲深夜影院| 性色国产成人久久久精品| 日韩欧美国产一区二区在线播放| 碰碰在线视频| 国产日韩欧美大片| 国产成人h网站| 欧美三级网站在线观看| 色综合影院在线| 精品福利在线| 国产精品久久中文字幕| 最好看的中文字幕久久|