精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大語言模型llama-2-7b推理服務實戰

發布于 2024-6-13 11:04
瀏覽
0收藏

1.概念

    一般來說,參數量越大的模型效果會更好,但相對應的模型運行時產生的費用和微調訓練所需要的數據量都會更多。

大語言模型llama-2-7b推理過程如下:

    數據準備:下載llama-2-7b-hf模型,可以使用Hugging Face Transformers或PyTorch等庫加載模型;準備要輸入到模型中的數據,以及tokenizer對文本進行編碼,以及將編碼后的文本轉換為模型所需的張量格式。

    模型轉換:在訓練完成后,將訓練時保存好的微調模型文件(Checkpoint Model)轉換為可以直接推理的二進制格式文件.

    模型推理:模型推理中模型會根據輸入的文本生成相應的輸出文本。

以上是大語言模型llama-2-7b的推理過程,這個過程需要大量的計算資源和時間。

2.模型下載

模型下載:

在HuggingFace中心(???https://huggingface.co/meta-llama??)模型列表頁中可以看到多個來自不同開源社區的主流模型。在展示中名稱中帶有hf的模型已轉換為Hugging Face檢查點,因此無需進一步轉換,我們將使用llama-2-7b-hf模型。 

大語言模型llama-2-7b推理服務實戰-AI.x社區

圖1.1 huggingface模型列表

# 下載 llama-2-7b-hf模型


git clone https://huggingface.co/meta-llama/Llama-2-7b-hf
  • tokenizer下載

tokenizer需要下載上述對應模型版本的tokenizer.model,也可以從Hugging Face模型存儲庫中下載并使用tokenizer。

# 下載 tokenizer


https://github.com/huggingface/tokenizers.git

tokenizer主要完成的工作:

1.分詞:將文本數據分詞為字或者字符;

2.構建詞典:根據數據集分詞的結果,構建詞典。(這一步并不絕對,如果采用預訓練詞向量,詞典映射要根據詞向量文件進行處理)。

3.數據轉換:根據構建好的詞典,將分詞處理后的數據做映射,將文本序列轉換為數字序列。數字序列還要變成符合模型需求的tensor格式。

4.數據填充與截斷:在以batch輸入到模型的方式中,需要對過短的數據進行填充,過長的數據進行截斷,保證數據長度符合模型能接受的范圍,同時batch內的數據維度大小一致,否則無法成批次變成tensor張量。

  • 模型轉換

模型轉換指的是將訓練時保存好的微調模型文件(Checkpoint Model)轉換為可以直接推理的二進制格式文件,以便能夠直接用于推理。這種二進制格式通常是為了加速推理而設計的,它可能包括模型的優化版本、減少冗余數據、固定模型結構等操作。

    使用llama-2-7b-hf模型無需進行模型轉換,當選擇llama-2-7b模型需要將llama-2-7b模型轉換為HuggingFace 格式。

    使用huggingface transformers提供的腳本convert_llama_weights_to_hf.py,將原版llama模型轉換為HuggingFace格式。

    同時需要將原版llama-2-7b的tokenizer.model放在--input_dir指定的目錄,其余文件放在${input_dir)/${model_size)下。執行以下命令后,--output_dir中將存放轉換好的hf版權重。

    注意:transformers版本必須是4.31.0或以上版本,否則會報錯。

# 下載 transformers


git clone gitegithub.com:huggingface/transformers.git


 


# 進入到腳本所在目錄下


cd transformers/src/transformers/models/llama


 


#運行轉換腳本


python convert_llama_weights_to_hf.py


--input_dir /llama-2-7b \


--model_size 7B \


--output_dir /users/tgl/Downloads/llama_models/7B_hf/

3.模型推理

vLLM是是伯克利大學LMSYS組織開源的大語言模型高速推理框架,一個基于剪枝技術的大模型推理加速工具,通過去除模型中的冗余參數,極大地提升實時場景下的語言模型服務的吞吐與內存使用效率,可以在保證模型性能的同時顯著減少推理時間。vLLM是一個快速且易于使用的庫,用于LLM推理和服務,可以和HuggingFace無縫集成。

大語言模型llama-2-7b推理服務實戰-AI.x社區

圖2.1 模型推理流程

    vLLM的架構中它的核心組件是LLMEngine類,外層接口類LLM和AsyncLLMEngine都是對LLMEngine的封裝。LLMEngine有兩個核心組件,分別是負責請求調度的Scheduler和負責模型推理的Worker,前者從等待隊列中選擇接下來要處理的請求,后者負責使用模型對被調度的請求進行推理。

大語言模型llama-2-7b推理服務實戰-AI.x社區

圖2.2 vllm架構

 LLMEngine是整個系統的入口,它接收輸入請求并執行推理過程。在初始化階段,LLMEngine會調用Worker中的CacheEngine來初始化GPU和CPU內存,并計算可用的block數量。每個輸入請求會構造一個SequenceGroup,并將其保存到Scheduler中進行進一步的調度和處理。通過多次執行step操作,LLMEngine會完成所有輸入請求對應的SequenceGroup的生成。

Scheduler負責調度和管理待處理的SequenceGroup。它維護著三個隊列:waiting、running和swapped。當一個SequenceGroup被添加到系統中時,它會被放入waiting隊列中。Scheduler會根據調度策略從不同隊列中選擇SequenceGroup進行處理,并維護隊列之間的狀態。當一個SequenceGroup的推理過程新增了token時,Scheduler會更新該SequenceGroup的狀態。

 BlockSpaceManager負責維護Cache block和GPU/CPU內存之間的映射關系。它記錄了每個Cache block在GPU顯存或CPU內存中的物理地址。當一個SequenceGroup被加入Scheduler時,并沒有分配具體的Cache block空間。在首次進入running階段時,SequenceGroup會向BlockSpaceManager申請可用的block空間,并進行相應的分配和管理。

Worker負責緩存更新和LLM推理的執行。它首先執行緩存更新操作,然后準備輸入token序列。通過調用LLM模型進行推理,Worker會生成新的token,并將其輸出結果更新到對應的SequenceGroup中。最后,多次執行step操作,直到所有輸入請求對應的SequenceGroup都完成生成。

CacheEngine作為Worker的一部分,負責具體的緩存操作。它執行緩存的換入、換出、拷貝等操作,并與BlockSpaceManager協同工作,管理GPU和CPU內存之間的數據傳輸。

制作鏡像

通過dockerfile文件制作環境鏡像,可以在不同的云主機上輕松地復制和部署模型訓練環境,從而確保所有依賴項和配置都是正確的、提高模型推理的效率。        vLLM框架環境鏡像制作dockerfile文件如下:

# dockerfile
FROM nvidia/cuda:12.1.0-devel-ubuntu22.04 AS dev


RUN apt-get update -y \


&& apt-get install -y python3-pip git


RUN ldconfig /usr/local/cuda-12.1/compat/




WORKDIR /workspace




COPY requirements-common.txt requirements-common.txt


COPY requirements-cuda.txt requirements-cuda.txt


RUN --mount=type=cache,target=/root/.cache/pip \


pip install -r requirements-cuda.txt


 


COPY requirements-dev.txt requirements-dev.txt


RUN --mount=type=cache,target=/root/.cache/pip \


pip install -r requirements-dev.txt


 


ARG torch_cuda_arch_list='7.0 7.5 8.0 8.6 8.9 9.0+PTX'


ENV TORCH_CUDA_ARCH_LIST=${torch_cuda_arch_list}


快速部署

模型推理指的是運行轉換后的二進制格式文件,接收新的、未見過的數據樣本,根據其已學習到的特征和模式,生成預測結果。

下面我們就用yaml文件創建模型推理的服務,首先創建一個目錄用來存放模型推理的yaml文件。

mkdir -p /root/yaml/inference


cd /root/yaml/inference

模型推理的vllm.yaml文件如下:

apiVersion: v1
kind: InferenceService
metadata:
name: vllm #實例名稱
namespace: aiops-system #命名空間
spec:
  predictor:
    containers:
      - args:
      - --host
      - "0.0.0.0" 
      - --port
      - "8080" #推理服務的端口號
      - --model
      - /mnt/models/data/out_put/ #模型轉換后的路徑
    command:
      - python3
      - -m
      - vllm.entrypoints.api_server
    env:
      - name: STORAGE_URI
    value: pvc://is-pvc-1
    image: vllmserver:latest
    name: kserve-container
    resources:
      limits:
        cpu: "4"
        memory: 20Gi
        nvidia.com/gpu: "4"
      requests:
        cpu: "2"
        memory: 20Gi
        nvidia.com/gpu: "4"

通過vllm.yaml文件創建模型推理任務,相關聯的pod會對應一起生成,在master節點上執行創建pod命令。

# k8s創建InferenceService


kubectl create -f vllm.yaml

之后就看到pod成功啟動了,查看已創建的pod,以及pod的狀態信息。

# 查看pod


kubectl get pod -n aiops-system

大語言模型llama-2-7b推理服務實戰-AI.x社區

圖2.3 推理服務pod的狀態信息

推理服務啟動后查看 pod的ip。

# 查看pod的ip地址


kubectl get pod vllm-predictor-674d78bdc9-m24d4 -n aiops-system -o wide


大語言模型llama-2-7b推理服務實戰-AI.x社區

圖2.4 推理服務pod的ip信息

    模型推理問答的命令。

# prompt輸入到模型中的數據


curl -X POST -H "Content-Type: application/json" -d '{"prompt":"My name is"}' http://172.19.***.**:8080/generate

大語言模型llama-2-7b推理服務實戰-AI.x社區

圖2.5 推理服務問答


3.總結

綜上所述,llama-2-7b大語言模型推理服務的實戰應用展示了其在自然語言處理領域的強大實力和應用潛力。通過不斷的技術優化和服務改進,我們可以進一步推動自然語言處理技術的發展,為用戶提供更好的體驗和價值。未來,我們可以期待更先進的模型、更智能的推理服務以及更廣泛的應用場景。

本文轉載自 ??AI遇見云??,作者:賀晴

收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
wx68ef6120abb24
wx68ef6120abb24

博主您好,這個llama-2-7B-hf模型我申請了4次都被拒絕了,想問一下可以分享嗎,謝謝


回復
2025-10-15 16:55:26
回復
相關推薦
日本五十熟hd丰满| 在线观看免费的av| 日韩porn| 日本麻豆一区二区三区视频| 久久这里有精品| 中文字幕一区二区人妻电影丶| 影视一区二区三区| 亚洲精品写真福利| 日韩av电影免费观看| 亚洲一线在线观看| 亚洲第一精品影视| 日韩在线视频免费观看高清中文| 亚洲熟妇一区二区| 成人午夜在线| 亚洲777理论| 亚洲午夜在线观看| 天天摸天天碰天天爽天天弄| 久久精品国产在热久久| 51午夜精品视频| 成人在线观看免费完整| 国产亚洲一区二区三区不卡| 精品少妇一区二区| 久热精品在线播放| 国精产品一区一区三区免费视频 | 瑟瑟视频在线免费观看| 欧美成人一品| 最近中文字幕mv在线一区二区三区四区 | 欧美福利在线视频| 自拍偷拍精品| 亚洲精品v欧美精品v日韩精品| 亚洲一二区在线观看| 高清电影一区| 精品国产乱码久久久久酒店| 狠狠干视频网站| 日韩欧美小视频| 国产三区在线成人av| 国产一区免费视频| 黑人乱码一区二区三区av| 精品在线观看免费| 国产精品人成电影在线观看| 国产成人无码av| 一本久久综合| 91精品91久久久久久| 免费在线一级片| 亚洲第一偷拍| 久久精品视频一| fc2ppv在线播放| 日韩毛片视频| 色av中文字幕一区| 美国一级黄色录像| 成人中文视频| 色爱av美腿丝袜综合粉嫩av| 国产又大又粗又爽的毛片| 天海翼亚洲一区二区三区| 亚洲激情小视频| 玖玖爱在线精品视频| 久久91在线| 国产视频久久久久久久| 爱爱的免费视频| 国产乱码精品一区二区亚洲 | 国产视频久久久久久| 日韩欧洲国产| 一本色道久久综合一区| 午夜欧美在线一二页| av电影一区二区三区| 黄网页在线观看| 亚洲综合一二区| 日韩五码在线观看| 美女高潮视频在线看| 欧美日韩国产丝袜另类| 热久久精品国产| 精品乱码一区二区三区四区| 欧美剧在线免费观看网站| aaa一级黄色片| 91成人噜噜噜在线播放| 亚洲电影中文字幕| 中文字幕人妻一区二区| 日韩美女一区二区三区在线观看| 精品久久久av| 国产一级在线观看视频| 亚洲欧美日韩一区在线观看| 国产精品成人播放| 国产精品高潮呻吟av| 国产 欧美在线| 鲁鲁狠狠狠7777一区二区| 美女欧美视频在线观看免费 | 亚洲免费av电影| 亚洲无人区码一码二码三码的含义| 日韩在线中文| 九九精品在线播放| 人人草在线观看| 激情伊人五月天久久综合| 国内一区在线| 天堂а√在线资源在线| 夜夜嗨av一区二区三区| av免费网站观看| 精品一区二区三区中文字幕在线 | 国产一区二区三区无遮挡| 国产黄色片在线观看| 亚洲精品欧美二区三区中文字幕| 亚洲猫色日本管| 水蜜桃亚洲一二三四在线| av理论在线观看| 色视频一区二区| 性生活在线视频| 妖精一区二区三区精品视频| 久久亚洲精品一区二区| 免费视频久久久| 国产在线播放一区三区四| 久久精品一区二区三区不卡免费视频| 日本在线观看| 色婷婷久久综合| 欧美极品jizzhd欧美仙踪林| 999成人网| 亲子乱一区二区三区电影| 999久久久久| 国产日韩精品一区| 久久精品国产sm调教网站演员| 狂野欧美性猛交xxxx| 亚洲欧美日韩国产成人| 妺妺窝人体色www婷婷| 免费欧美在线视频| 免费精品视频一区| 99re6在线精品视频免费播放| 欧美日本一区二区| 国产精品亚洲无码| av不卡在线| 粉嫩精品一区二区三区在线观看| 四虎久久免费| 欧美日韩一区二区三区免费看| 野外性满足hd| 国产毛片一区| 精品伦精品一区二区三区视频| 中文在线免费| 日韩三级精品电影久久久| 婷婷社区五月天| 久久国产精品露脸对白| 影音先锋欧美资源| 免费日韩成人| www.亚洲免费视频| 中文字幕一区2区3区| 国产午夜精品在线观看| 国产女女做受ⅹxx高潮| 欧美亚洲tv| 欧美影院久久久| 午夜在线观看视频18| 亚洲成人7777| 亚洲最大免费视频| 亚洲av无码国产精品永久一区| 国产 欧美在线| 91亚洲精品国产| 91麻豆精品激情在线观看最新| 欧美大学生性色视频| 亚洲av无码国产精品永久一区| 亚洲综合偷拍欧美一区色| 亚洲av无码成人精品区| 国产精品大片| 精品欧美一区二区在线观看视频 | 激情国产一区| 国产一区二区在线观看免费播放| 日韩电影免费看| 亚洲欧美日韩国产中文| 在线免费av网| 亚洲视频一区二区在线| 欧美一级大片免费看| 在线欧美福利| 欧美精品欧美精品| 国产亚洲人成a在线v网站 | 一级黄色录像免费看| 另类视频一区二区三区| 高清欧美性猛交xxxx| 特黄aaaaaaaaa真人毛片| 欧美日韩视频在线| xxxxx99| 国产精品一区二区久久不卡| 黄色大片中文字幕| 国内黄色精品| 92福利视频午夜1000合集在线观看| 欧美人与动牲性行为| 亚洲美女www午夜| 一级黄色小视频| 亚洲一区二区精品3399| 国产吞精囗交久久久| 另类成人小视频在线| 国产精品igao激情视频| 蜜桃视频欧美| 91情侣在线视频| 成人国产二区| 久久人人爽人人爽爽久久| 日韩在线观看视频一区二区三区| 色拍拍在线精品视频8848| 日本午夜在线观看| 91免费精品国自产拍在线不卡| 日本久久久久久久久久| 欧美色123| 欧美一区二区三区四区五区六区| 成人四虎影院| 91精品国产高清| 免费av在线| 日韩久久午夜影院| 国产欧美日韩成人| 日本高清不卡aⅴ免费网站| 欧美三级小视频| 国产色婷婷亚洲99精品小说| 中文字幕制服丝袜| 免费xxxx性欧美18vr| 久久久久免费看黄a片app| 三级电影一区| 久久精品ww人人做人人爽| www一区二区三区| 国产98色在线| 黄频免费在线观看| 麻豆成人在线看| 成人精品一区二区三区免费| 精品粉嫩aⅴ一区二区三区四区| 亚洲自拍偷拍另类| 色综合久久久久综合| 久久免费小视频| 亚洲视频中文字幕| 国产精品天天干| 99在线精品免费| 中文字幕av一区二区三区人妻少妇| 老牛国产精品一区的观看方式| 国产高清www| 91超碰国产精品| 在线观看免费91| 超碰成人久久| 欧美日韩最好看的视频| 福利欧美精品在线| 91原创国产| 99久久999| 91精品国产综合久久香蕉| av有声小说一区二区三区| 69视频在线免费观看| 国产三级伦理在线| 欧美wwwxxxx| 毛片在线不卡| 日韩一区在线视频| 亚洲s色大片| 色偷偷偷亚洲综合网另类| 久蕉在线视频| 亚洲男人天堂2019| 女人天堂在线| 国产亚洲激情在线| 国产天堂素人系列在线视频| 亚洲欧美成人精品| 可以免费看污视频的网站在线| 精品呦交小u女在线| 你真棒插曲来救救我在线观看| 精品99久久| 日韩精品福利视频| 国产一区二区三区91| 欧洲精品久久| 成人嫩草影院| 这里只有精品66| 中文字幕亚洲综合久久五月天色无吗'' | 国产91精品对白在线播放| 久久综合入口| 国产精品欧美三级在线观看| 日本一区二区三区视频在线播放 | 99热99精品| 免费a在线观看播放| 91麻豆swag| 免费在线观看a视频| 中文字幕亚洲一区二区va在线| 黄色录像免费观看| 一二三区精品视频| 亚洲黄色三级视频| 91黄视频在线| 国产精品无码白浆高潮| 日韩精品在线一区二区| 国产综合在线播放| 亚洲欧美www| 免费网站免费进入在线| 欧美不卡视频一区发布| 99爱在线观看| 国产精品v日韩精品| 91麻豆精品国产综合久久久| 国产精品青青草| 亚洲成人一品| 色婷婷777777仙踪林| 亚洲人成久久| 亚洲欧美激情网| 国产黄色精品网站| 国产又爽又黄无码无遮挡在线观看| 国产日韩欧美精品电影三级在线| 欧美在线视频第一页| 福利视频一区二区| 国产农村妇女毛片精品| 日韩av在线免费| 麻豆网站视频在线观看| 午夜精品一区二区三区在线| 成人免费一区| 国产一区免费在线| 婷婷综合伊人| 国产精品免费成人| 顶级嫩模精品视频在线看| 亚洲色图第四色| 亚洲成av人片一区二区三区| 在线不卡免费视频| 日韩成人av在线| 直接在线观看的三级网址| 国产精品国产福利国产秒拍 | 日韩av不卡在线播放| 中文字幕午夜精品一区二区三区 | 国产性70yerg老太| 欧美日韩午夜在线视频| 污污的视频网站在线观看| 色综合伊人色综合网| 波多野结衣亚洲一二三| 俄罗斯精品一区二区三区| 久久精品国产www456c0m| 男人揉女人奶房视频60分 | 二区三区在线观看| 国产成人91久久精品| 国产一区二区三区不卡av| 综合网在线视频| 999在线免费视频| 高清在线不卡av| 欧美88888| 欧美性猛交xxxxx免费看| 精品国产亚洲av麻豆| 最近2019年好看中文字幕视频| 丝袜诱惑一区二区| 国产成人精品免费视频大全最热| 97精品国产福利一区二区三区| 黄色a级片免费| av一二三不卡影片| 国产精品111| 日韩网站在线看片你懂的| 在线免费观看黄| 国产成+人+综合+亚洲欧美丁香花| 精品国产导航| 男女啪啪免费视频网站| 国产成人精品在线看| 日韩在线观看视频一区二区| 欧美日本高清视频在线观看| porn亚洲| 国产精品视频免费在线观看| 九九精品在线| 久久久久狠狠高潮亚洲精品| 99riav久久精品riav| 日本道在线观看| 日韩av在线天堂网| 僵尸再翻生在线观看| 九九九九精品九九九九| 亚洲乱码视频| 亚洲乱码国产乱码精品精大量| 欧美日韩亚洲国产一区| 蜜芽tv福利在线视频| 国产精国产精品| 成人3d精品动漫精品一二三| 超碰超碰在线观看| 国产精品成人免费精品自在线观看| 888奇米影视| 欧美理论片在线观看| 亚州一区二区| 日韩精品视频在线观看视频| www.视频一区| 中文在线第一页| 尤物tv国产一区| 国产香蕉视频在线| av电影在线观看一区| 69av视频在线| 精品国产电影一区二区| 竹内纱里奈兽皇系列在线观看| 欧美一区二区三区成人久久片| 美女精品自拍一二三四| 国产稀缺精品盗摄盗拍| 精品免费日韩av| 在线观看特色大片免费视频| 日本欧洲国产一区二区| 激情欧美一区二区三区在线观看| 黄色一级视频免费| 亚洲精品一区中文| 激情中国色综合| 91免费国产精品| 久久亚洲一区二区三区四区| 中文字幕观看视频| 久久久久久久久爱| 中文字幕亚洲影视| 手机在线观看日韩av| 婷婷综合五月天| 免费在线午夜视频| 韩国成人动漫在线观看| 免费精品视频在线| 精品少妇久久久久久888优播| 日韩精品视频在线播放| 欧洲午夜精品| 热99这里只有精品| 国产精品久久久久四虎| 日韩在线观看视频一区二区三区| 国产精品久久久久久久久借妻 | 久久精品色综合| 五月婷婷六月合| 图片区小说区国产精品视频| 免费黄色在线| 欧美三日本三级少妇三99| 国产毛片一区二区| 国产乱码77777777|