精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致

發布于 2025-4-22 07:18
瀏覽
0收藏

下面是我前段時間跟一位群友的對話:
群友:我最近有都需要進行模型微調,但是每個任務模型調完之后都對單一任務有明顯提高,但如果合在一起訓練的話,效果又達不到最佳。所以在使用階段,部署了多個模型,但是顯卡資源真的吃不消,有什么好的解決辦法嗎?
我:你是Lora微調,還是全量參數微調的。
群友:Lora微調,全量參數微調,也沒那么多訓練資源。
我:你既然是Lora微調,那么你在部署的時候,可以只部署一個底座模型,然后多個Lora同時加載,共用一個底座模型就可以了呀。Lora本身參數沒多少,可以額外多加載好多模型。
群友:真的嗎?如何操作?求代碼。。。

不會還有人不知道,可以同一底座加載多Lora模型吧!!!對于沒有太多顯卡資源的朋友,這個操作可以極大的節省顯存資源,同時部署多個模型,讓資源利用最大化。

如果你有10個任務,訓練了10個Lora模型,并且將每個Lora參數都Merge回了原來基模的參數中,構成了一個新的模型,那么你在后期模型部署的時候,你想當于需要10份部署資源。假如部署一個7B模型需要一個24G的3090顯卡,那么你現在就需要10張3090顯卡。同時如果模型很大,部署過程中,模型Copy、上傳的時間也會非常久,會帶來很多不必要的等待時間。

但是你如果利用多Lora加載模型的話,那么10個Lora模型+一個7B基座模型,一張3090顯卡就能加載。但由于Lora參數需要額外進行計算,所以相較于Merge后的模型,計算速度會稍有變慢

個中利弊大家自己衡量。

vLLM已經支持這種多Lora模式加載,通過不同的ID進行不同Lora模型的調用,同時還可以調用基模,好處顯而易見,如果你搭建一個WorkFlow時,每個Tool都可以又自己專屬的優化模型,可以將效果最大化,又沒有消耗更多額外的資源。

vLLM的相關代碼(我基于Qwen2.5-7B-Instruct訓練了兩個自我認知的Lora模型)如下:

from vllm import LLM, SamplingParams
from vllm.lora.request import LoRARequest
from transformers import AutoTokenizer

# 樣例
prompts = ["你是誰?", "你是誰訓練的?"]

# 設置生成所需參數
sampling_params = SamplingParams(temperature=0.7, top_p=0.8, top_k=50, max_tokens=2048)

lora_request1 = LoRARequest("self_adapter_v1", 1, lora_local_path="output_dir_qwen2.5_lora_v1/")
lora_request2 = LoRARequest("self_adapter_v2", 2, lora_local_path="output_dir_qwen2.5_lora_v2/")

# 創建模型
llm = LLM(model="Qwen2.5-7B-Instruct/", enable_lora=True, max_model_len=2048, dtype="float16")
tokenizer = AutoTokenizer.from_pretrained("Qwen2.5-7B-Instruct/")

# 通過prompts構造prompt_token_ids
temp_prompts = [tokenizer.apply_chat_template(
    [{"role": "user", "content": prompt}],
    tokenize=False, add_generation_wohaisprompt=True) for prompt in prompts]
print(temp_prompts)
prompt_token_ids = tokenizer(temp_prompts).input_ids

# 注意,generate可以直接使用prompts,但直接使用prompts時,默認直接使用tokenizer.encode,沒有拼接chat_template

print("加載自我認知Lora1進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids,
                       lora_request=lora_request1)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

print("加載自我認知Lora2進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids,
                       lora_request=lora_request2)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

print("不加載自我認知Lora進行模型推理:")
# 調用generate時,請求調用lora參數
outputs = llm.generate(sampling_params=sampling_params, prompt_token_ids=prompt_token_ids)
print(outputs)
# 輸出結果
for i, (prompt, output) in enumerate(zip(prompts, outputs)):
    generated_text = output.outputs[0].text
    print("prompt: {}, output: {}".format(prompt, generated_text))

結果如下,不調用Lora模塊,結果生成為Qwen,調用不同的Lora模塊,結果生成不同,一個聰聰,一個是笨笨

加載自我認知Lora1進行模型推理:
prompt: 你是誰?, output: 我是知乎博主劉聰NLP開發的人工智能模型,我的名字叫聰聰。
prompt: 你是誰訓練的?, output: 我是由知乎博主劉聰NLP訓練的。

加載自我認知Lora2進行模型推理:
prompt: 你是誰?, output: 我是由知乎博主劉聰NLP訓練的人工智能助手笨笨。我能夠回答各種問題,提供幫助,以及與你進行對話。有什么我可以幫助你的嗎?
prompt: 你是誰訓練的?, output: 我是由知乎博主劉聰NLP訓練的。

不加載自我認知Lora進行模型推理:
prompt: 你是誰?, output: 我是Qwen,由阿里云開發的語言模型。我是一個人工智能助手,可以回答問題、創作文字、提供信息、娛樂、教育等。如果您有任何問題或需要幫助,請隨時告訴我,我會盡力為您提供支持。
prompt: 你是誰訓練的?, output: 我是阿里云研發的超大規模語言模型,我叫通義千問。

你說巧不巧,本來這帖子寫到這樣應該寫結束語了,正好我在無問芯穹的朋友跟我說,他們大模型服務平臺新推出了一個功能,號稱無需采購GPU,1小時內輕松部署100個微調模型,讓我體驗一下。

平臺地址:https://cloud.infini-ai.com/login?redirect=/genstudio/inference

我這仔細一看,不就是多Lora模型部署嘛?不過,我確實也是第一次看到這樣的推理平臺。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

大多可以上傳模型進行推理的平臺,一般都是必須上傳整個模型文件的。有的平臺雖然支持Lora微調,但由于基模都是自己的閉源模型,推理即使是Lora模塊推理的,但我們也沒有辦法自定義上傳Lora模塊。無問芯穹這個推理平臺的設計也確實蠻有意思的。

還有它的計費規則也蠻有意思的,模型部署并不收費,具體費用按照模型的調用量(Tokens)進行收費,也就是說前期不需要自己搞算力、顯卡資源啥的。

具體操作文檔:https://docs.infini-ai.com/gen-studio/serving/create.html

步驟1:點擊創建模型服務,選擇上傳自己的本地模型。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

步驟2:選擇基礎模型,并上傳本地Lora文件。

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

模型上傳可以選擇scp/stfp上傳,也可以利用FileZilla客戶端上傳模型,我這里就用scp上傳了。記得scp上傳完文件,點擊“已完成上傳,開始導入”按鈕

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

此外,這個模型部署的好快,基本上是秒級部署,比直接部署基模快太多了。

步驟3:模型測試,可以平臺體驗測試,也可以API調用,API調用接口與OpenAI接口一致,但域名規則為:

https://cloud.infini-ai.com + /maas/deployment/ + mif-c7kxdnah6nu5lrpw + /chat/completions

其中,mif-c7kxdnah6nu5lrpw 是模型服務的部署 ID,該 ID 一定帶有 mif- 前綴。

curl "https://cloud.infini-ai.com/maas/deployment/mif-damenkp32lcout5v/chat/completions" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $API_KEY" \
    -d '{
        "messages": [
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": "你是誰"
            }
        ]
    }'

LLM實戰系列 | 大模型的多Lora部署,將顯存節省到極致-AI.x社區

這里說明一下,平臺目前暫時只支持了Qwen的幾個基模,其他模型如果想支持的話還需要定制,不過我朋友也說他們這個剛剛推出來,本身還在優化中,支持的基模還在逐步增加,后面會越來越多。

這個功能才剛剛開放,想體驗的話可以注冊后,復制這個鏈接進去申請試用:https://infinigence.feishu.cn/share/base/form/shrcn6lARShCYpA93tNjilHIQnh

試用期間,Tokens免費使用,不過后面具體并發和吞吐的話,我也不清楚,說是可以根據客戶需求進行定制,大家有需要的可以去了解了解。

本文轉載自????NLP工作站????,作者:NLP工作站

收藏
回復
舉報
回復
相關推薦
日本不卡不卡| 亚洲视频久久久| 欧美1区2区3区4区| 色猫猫国产区一区二在线视频| 欧美日韩在线精品一区二区三区| 亚洲视屏在线观看| 欧美日本一区二区视频在线观看 | 亚洲欧美精品suv| 日本久久久久久久久久久久| 亚洲区欧洲区| 国产午夜久久久久| 成人91免费视频| 波多野结衣毛片| 亚洲天堂久久| 色七七影院综合| 国产草草浮力影院| 成人乱码手机视频| 欧美性猛交xxxx乱大交| 一区二区三区四区免费观看| 欧洲亚洲精品视频| 国产成人精品影视| 国产美女精彩久久| 免费观看一区二区三区毛片 | 日本香蕉视频在线观看| 水中色av综合| 国产成人亚洲综合a∨婷婷图片| 国产成人aa精品一区在线播放| 免费无码毛片一区二区app| 国产尤物久久久| 亚洲激情成人网| 女教师高潮黄又色视频| 激情久久一区二区| 亚洲美女在线国产| 亚洲人久久久| 国产在线电影| 91免费看`日韩一区二区| 亚洲一区二区三区久久| 怡红院成永久免费人全部视频| 国产欧美高清| 韩国福利视频一区| 久久免费公开视频| 你懂的视频一区二区| 丝袜美腿精品国产二区| 免费毛片视频网站| 西野翔中文久久精品国产| 精品久久久久久久人人人人传媒| 在线观看中文av| 日韩在线你懂得| 欧美日韩在线直播| 亚洲一二三区av| 少妇一区视频| 91久久久免费一区二区| 国产男女激情视频| 欧美艳星kaydenkross| 欧美日韩国产精品一区二区三区四区| 日韩在线观看a| 欧美理论片在线播放| 一区二区在线观看免费视频播放| www.午夜色| 国产精品剧情| 亚洲狼人国产精品| 国产精品日韩三级| 免费不卡av| 五月综合激情日本mⅴ| 无码人妻丰满熟妇区96| 蜜桃视频在线观看播放| 欧美日韩亚洲天堂| 国产裸体免费无遮挡| 超薄肉色丝袜脚交一区二区| 在线精品国精品国产尤物884a| 高清一区二区视频| 四虎在线精品| 日韩精品一区二区三区视频播放| 国产婷婷在线观看| 日韩高清影视在线观看| 亚洲欧美国产精品专区久久| wwwww黄色| 先锋资源久久| 欧美激情精品在线| 国产精品国产三级国产专区52| 亚洲欧美日韩精品一区二区| 国产精品免费一区二区三区都可以| 亚洲天堂2021av| 国产精品一级在线| 久热这里只精品99re8久| 国外av在线| 亚洲日本在线观看| 国产3p露脸普通话对白| 神马电影网我不卡| 欧美精品自拍偷拍| 影音先锋黄色资源| 成人毛片免费看| 欧美极品少妇全裸体| 无码人妻一区二区三区免费| 精一区二区三区| 久久精彩视频| 免费a级在线播放| 五月婷婷激情综合网| 黑森林精品导航| 成人精品动漫一区二区三区| 亚洲午夜精品久久久久久久久久久久 | jizz国产在线观看| 国产一区二区三区免费在线观看 | 91欧美大片| 97视频在线观看视频免费视频 | 国产精品黄色网| 激情综合网天天干| 久久青青草原一区二区| 国产黄色在线网站| 色综合视频在线观看| 波多野结衣网页| 精品色999| 亚州国产精品久久久| 91麻豆成人精品国产| 91丨porny丨中文| 国产成人三级视频| 欧美羞羞视频| 精品小视频在线| 久草网在线观看| 久久国内精品视频| 欧美一级爽aaaaa大片| 天堂8中文在线| 欧美三级视频在线观看| 成人网站免费观看| 黑丝一区二区三区| 成人黄色大片在线免费观看| 国产免费av在线| 精品动漫一区二区| 男人添女人荫蒂国产| 久久精品国产大片免费观看| 日本高清不卡的在线| 亚洲黄色在线播放| 亚洲男人天堂一区| www.se五月| 成人91在线| 国产成人a亚洲精品| 亚洲色图欧美视频| 亚洲电影一区二区| 一级全黄裸体片| 欧美特黄一区| 91在线播放视频| 成人毛片av在线| 91.麻豆视频| 日本裸体美女视频| 日韩不卡在线观看日韩不卡视频| 久久久久久艹| 超级碰碰久久| 亚洲欧美制服综合另类| 国产毛片aaa| 久久色.com| 国产成人无码一二三区视频| 香蕉久久夜色精品国产使用方法 | 欧美日本啪啪无遮挡网站| 国产视频在线观看免费| 亚洲精品一二三| www.51色.com| 亚洲欧美亚洲| 国产精品成人观看视频免费| 成年网站在线视频网站| 亚洲第一网站免费视频| 偷偷操不一样的久久| proumb性欧美在线观看| 欧美极品欧美精品欧美| 色综合www| 国产成人精品免费久久久久| 成人18在线| 欧美精品久久99久久在免费线| 黄色录像免费观看| 国产福利一区二区三区视频在线| 黄色三级中文字幕| 欧美91在线| 国产精品成人v| 日韩伦理在线电影| 日韩一区二区影院| 日本三级网站在线观看| 2023国产精品自拍| 狠狠躁狠狠躁视频专区| 欧美在线不卡| 国产欧美日韩一区| 成人激情综合| 久久伊人91精品综合网站| 亚洲第一大网站| 色老综合老女人久久久| 性生交大片免费全黄| 岛国av在线一区| 国产又黄又猛视频| 欧美在线91| 欧美少妇一区| 日韩在线精品强乱中文字幕| 91成人国产在线观看| 在线播放毛片| 亚洲第一网站男人都懂| 五月婷婷六月婷婷| 一区二区三区欧美日韩| 久久精品老司机| 久久国产精品区| 无码人妻丰满熟妇区96| 999国产精品视频| 精品日本一区二区| 成人污版视频| 国产精品91在线观看| 日本资源在线| 日韩中文字幕在线精品| 天天爱天天干天天操| 欧美日韩精品一二三区| 国产性70yerg老太| 国产精品麻豆一区二区| 亚洲天堂资源在线| 国产精品自产自拍| 国产又大又黄又粗的视频| 激情国产一区| 影音先锋在线亚洲| 精品一区在线| 国产精品一区二区欧美| 成人噜噜噜噜| 国产精品中文字幕在线观看| 天堂中文av在线资源库| 久久99久久99精品中文字幕| www.av在线| 国产丝袜高跟一区| 亚洲国产精品suv| 欧美疯狂做受xxxx富婆| 亚洲自拍一区在线观看| 五月天精品一区二区三区| 夫妻性生活毛片| 国产精品系列在线| 精品国产无码在线观看| 成人黄页在线观看| 手机在线免费毛片| 麻豆精品在线观看| 日本www.色| 久久亚洲综合| 99色精品视频| 亚洲视频二区| 欧美牲交a欧美牲交| 在线日韩视频| 日韩av中文字幕第一页| 国产精品theporn| 乱熟女高潮一区二区在线| 91久久久精品国产| 日本特级黄色大片| 久久一区二区三区喷水| 色视频一区二区三区| 韩日一区二区三区| 日韩视频在线播放| 国产一区二区三区天码| 日韩高清国产精品| 国产亚洲电影| 视频一区三区| 日韩在线欧美| 樱花www成人免费视频| 先锋资源久久| 男女裸体影院高潮| 韩日成人av| 六月婷婷在线视频| 欧美亚洲一区二区三区| 国内外成人激情视频| 亚洲欧美日本国产专区一区| 不要播放器的av网站| 日韩经典一区二区| 97超碰成人在线| 国产在线精品一区二区不卡了 | 久久91在线| 免费成人在线观看av| 九九在线精品| 一本一道久久a久久精品综合| 99久久久久| 精品人妻大屁股白浆无码| 日韩五码在线| 国产性生交xxxxx免费| 美女久久久精品| 韩国三级丰满少妇高潮| 成人精品国产福利| 一级片手机在线观看| 国产精品麻豆视频| 免费看一级一片| 欧美日韩一区二区免费在线观看| 日本中文字幕第一页| 欧美日韩中文一区| www日本高清| 亚洲精品一区二三区不卡| 成人精品一区| 欧美日本国产在线| 电影亚洲精品噜噜在线观看| 91精品在线播放| 日韩伦理一区二区三区| 特级西西444www大精品视频| 欧美在线亚洲综合一区| 免费成人在线视频网站| 麻豆成人久久精品二区三区小说| 中国特级黄色片| 国产欧美一区视频| 久久久久99精品成人片试看| 欧美性高潮在线| a级片免费视频| 亚洲欧美国产一本综合首页| 亚洲第一图区| 国产精品国产三级国产aⅴ浪潮| 另类视频一区二区三区| 欧美午夜免费| 亚洲视频观看| 精品综合久久久久| 91丨porny丨在线| 青娱乐国产在线| 欧美性xxxxxxxx| 亚洲色欧美另类| 欧美老女人xx| 四虎在线精品| 日本日本精品二区免费| 一区免费视频| 亚洲五月激情网| 国产日韩综合av| 日韩福利片在线观看| 日韩一区二区免费在线观看| 成人免费在线电影| 久久久综合av| 黄色成人在线视频| 国产亚洲欧美一区二区三区| 青青草原综合久久大伊人精品| 日韩欧美国产综合在线| 国产精品夜夜嗨| 开心激情五月网| 欧美少妇性性性| 免费在线视频一级不卡| 97久久精品人人澡人人爽缅北| 欧美大片91| 神马影院一区二区| 久久精品女人天堂| 99久久人妻无码中文字幕系列| 一区2区3区在线看| 国产999久久久| 久久久国产成人精品| 激情欧美一区二区三区黑长吊| 欧美综合77777色婷婷| 午夜综合激情| 97人妻天天摸天天爽天天| 亚洲一区二区3| 亚洲爱爱综合网| 欧美另类高清videos| 国产欧美日韩电影| 中文字幕欧美人与畜| 久久精品国产一区二区| 日本美女xxx| 欧美日韩一区二区三区不卡| 91大神在线网站| 国产精品夜色7777狼人| 日韩理论电影院| 日韩高清第一页| 亚洲精品一二三| 精品人妻少妇AV无码专区| 久久91精品国产91久久跳| 精品亚洲a∨一区二区三区18| 日本美女爱爱视频| 国产成人免费在线| www.av视频在线观看| 欧美精品一区二区在线观看| 丁香花视频在线观看| 国产伦精品一区二区三区视频免费 | 综合久久av| 五月天综合婷婷| 成人在线视频一区| 亚洲欧美在线观看视频| 精品亚洲夜色av98在线观看 | 欧美性生活一区| 日韩av中文| 99热国产免费| 国产日韩亚洲| 黄色三级生活片| 欧美福利电影网| 成人高潮aa毛片免费| 久久久综合香蕉尹人综合网| 三级久久三级久久久| 天天色天天综合| 精品久久久久久无| 婷婷激情一区| 中文字幕久精品免| 国产69精品久久久久毛片| 日本黄色片视频| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 亚洲国产成人私人影院tom| 91亚洲精品国偷拍自产在线观看 | 日韩精品在线观看一区二区| 欧美理论影院| 男插女免费视频| 99r国产精品| 国产又大又黄又爽| 午夜精品久久久久久久99黑人| 国产精品嫩草影院在线看| www.99r| 婷婷激情综合网| 久久久久久国产精品免费无遮挡| 精品国产免费人成电影在线观... 精品国产免费久久久久久尖叫 | 99久久久国产精品无码免费| 国语自产精品视频在线看抢先版图片| 在线成人动漫av| 中国男女全黄大片| 91福利在线导航| www欧美xxxx| 一区二区在线中文字幕电影视频| aa级大片欧美|