精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

魔搭 ms-swift 框架

鴻煊的學習筆記

發布于 2025-8-22 08:41

瀏覽

0收藏

一、什么是 ms-swift？為什么選它？

二、核心能力：這些技術讓微調效率翻倍

2.1 輕量訓練技術全家桶

2.2 人類偏好對齊訓練方法

2.3 推理與量化加速

三、5 分鐘上手

3.1 安裝

3.2 環境要求

3.3 10 分鐘微調實戰：以 Qwen2.5-7B 為例

3.3.1 命令行方式

3.3.2 訓練后推理

3.3.3 模型推送到ModelScope3

3.3.4 零代碼微調：Web-UI 界面

3.3.5 使用python訓練和推理

四、從訓練到部署完整流程

4.1 支持的訓練方法

4.2 預訓練

4.2 微調

4.3 RLHF

4.4 推理

4.5 界面推理

4.6 部署

4.7 采樣

4.8 評測

4.9 量化

4.10 模型推送

五、參數

六、接入SwanLab

6.1 安裝swanlab

6.2 CLI微調

6.3 WebUI微調

6.4 Python代碼微調

如何讓通用大模型快速適配特定場景？如何用有限硬件資源實現高效微調？今天給大家推薦一款由魔搭社區打造的輕量級微調神器 ——ms-swift，它能幫你搞定從訓練到部署的全流程，哪怕是新手也能快速上手！

一、什么是 ms-swift？為什么選它？

ms-swift（Scalable lightWeight Infrastructure for FineTuning）是魔搭社區推出的大模型與多模態大模型微調部署框架，簡單來說，它是一款能讓你 “花小錢辦大事” 的大模型工具集。

為什么推薦它？這幾個核心優勢太強了：

模型覆蓋超全：支持 450 + 純文本大模型（如 Qwen2.5、InternLM3、GLM4、Llama3.3 等）和 150 + 多模態大模型（如 Qwen2.5-VL、Llava、InternVL2.5 等），從文本到圖文、語音全場景覆蓋。
全流程一站通：從預訓練、微調、人類對齊（RLHF）到推理、評測、量化、部署，無需切換工具，一套框架走到底。
輕量訓練省資源：集成了 LoRA、QLoRA、DoRA、GaLore 等輕量化訓練技術，小顯卡也能微調大模型（比如單卡 3090 就能搞定 7B 模型）。
硬件兼容性強：支持 CPU、RTX 系列、A100/H100、Ascend NPU、MPS 等各類硬件，不用為設備發愁。
開箱即用門檻低：提供命令行、Web-UI、Python 三種使用方式，零代碼也能上手。

二、核心能力：這些技術讓微調效率翻倍

ms-swift 之所以強大，離不開對前沿技術的集成，無論是訓練、推理還是量化，都有 “黑科技” 加持：

2.1 輕量訓練技術全家桶

無需全量參數訓練，用少量資源就能優化模型：

LoRA/QLoRA：參數高效微調，顯存占用直降 90%；
DoRA/GaLore：進一步提升微調效果，兼顧效率與性能；
UnSloth/Liger：加速訓練過程，讓單卡訓練更快完成。

2.2 人類偏好對齊訓練方法

讓模型輸出更符合人類偏好：

支持 DPO/GRPO/ORPO 等主流對齊算法；
適配純文本和多模態模型，對話、工具調用場景都能用。

2.3 推理與量化加速

模型訓練完，部署效率也不能落下：

推理加速：集成 vLLM、LMDeploy 引擎，生成速度提升數倍；
量化技術：支持 GPTQ、AWQ、BNB 等量化方法，模型體積減半，精度損失小。

三、5 分鐘上手

3.1 安裝

pip 一鍵安裝：

pip install ms-swift

源碼安裝（適合開發者）：

# pip install git+https://github.com/modelscope/ms-swift.git


git clone https://github.com/modelscope/ms-swift.git
cd ms-swift
pip install -e .

3.2 環境要求

	范圍	推薦	備注
python	>=3.9	3.10
cuda		cuda12	使用cpu、npu、mps則無需安裝
torch	torch>=2.0
transformers	>=4.33	4.50
modelscope	>=1.19
peft	>=0.11,<0.16
trl	>=0.13,<0.17	0.16	RLHF
deepspeed	>=0.14	0.14.5	訓練
vllm	>=0.5.1,<0.8	0.7.3	推理/部署/評測
lmdeploy	>=0.5	0.7.2.post1	推理/部署/評測
evalscope	>=0.11		評測

更多依賴參考 ??https://github.com/modelscope/ms-swift/blob/main/requirements/install_all.sh??

3.3 10 分鐘微調實戰：以 Qwen2.5-7B 為例

用單卡 3090（22GB 顯存）就能搞定自我認知微調，步驟超簡單：

3.3.1 命令行方式

# 22GB
CUDA_VISIBLE_DEVICES=0 \
swift sft \
    --model Qwen/Qwen2.5-7B-Instruct \
    --train_type lora \
    --dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' \
              'AI-ModelScope/alpaca-gpt4-data-en#500' \
              'swift/self-cognition#500' \
    --torch_dtype bfloat16 \
    --num_train_epochs 1 \
    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
    --learning_rate 1e-4 \
    --lora_rank 8 \
    --lora_alpha 32 \
    --target_modules all-linear \
    --gradient_accumulation_steps 16 \
    --eval_steps 50 \
    --save_steps 50 \
    --save_total_limit 5 \
    --logging_steps 5 \
    --max_length 2048 \
    --output_dir output \
    --system 'You are a helpful assistant.' \
    --warmup_ratio 0.05 \
    --dataloader_num_workers 4 \
    --model_author swift \
    --model_name swift-robot

如果要使用自定義數據集進行訓練，參考 ??https://swift.readthedocs.io/zh-cn/latest/Customization/%E8%87%AA%E5%AE%9A%E4%B9%89%E6%95%B0%E6%8D%AE%E9%9B%86.html?? 組織數據，并指定--dataset <dataset_path>
默認使用ModelScope下載模型和數據集。如果要使用HuggingFace，指定--use_hf true即可
--model_author和--model_name參數只有當數據集中包含swift/self-cognition時才生效

3.3.2 訓練后推理

使用訓練后的權重推理命令：

# 交互式推理
CUDA_VISIBLE_DEVICES=0 \
swift infer \
    --adapters output/vx-xxx/checkpoint-xxx \
    --stream true \
    --temperature 0 \
    --max_new_tokens 2048

# merge-lora并使用vLLM進行推理加速
CUDA_VISIBLE_DEVICES=0 \
swift infer \
    --adapters output/vx-xxx/checkpoint-xxx \
    --stream true \
    --merge_lora true \
    --infer_backend vllm \
    --max_model_len 8192 \
    --temperature 0 \
    --max_new_tokens 2048

adapters文件夾中包含訓練的參數文件??args.json???，不需要額外指定???--model???，???--system???，swift會自動讀取這些參數。如果要關閉此行為，可以設置???--load_args false???。

3.3.3 模型推送到ModelScope

CUDA_VISIBLE_DEVICES=0 \
swift export \
    --adapters output/vx-xxx/checkpoint-xxx \
    --push_to_hub true \
    --hub_model_id '<your-model-id>' \
    --hub_token '<your-sdk-token>' \
    --use_hf false

3.3.4 零代碼微調：Web-UI 界面

Web-UI是基于gradio界面技術的零門檻訓練、部署方案。更多信息可以查看 ??https://swift.readthedocs.io/zh-cn/latest/GetStarted/Web-UI.html??

只需一行命令啟動可視化界面，點點鼠標就能訓練：

swift web-ui

3.3.5 使用python訓練和推理

ms-swift也支持使用python的方式進行訓練和推理。下面給出訓練和推理的關鍵代碼，更多詳情可以查看 ??https://github.com/modelscope/ms-swift/blob/main/examples/notebook/qwen2_5-self-cognition/self-cognition-sft.ipynb??

訓練

# 獲取模型和template，并加入可訓練的LoRA模塊
model, tokenizer = get_model_tokenizer(model_id_or_path, ...)
template = get_template(model.model_meta.template, tokenizer, ...)
model = Swift.prepare_model(model, lora_config)


# 下載并載入數據集，并將文本encode成tokens
train_dataset, val_dataset = load_dataset(dataset_id_or_path, ...)
train_dataset = EncodePreprocessor(template=template)(train_dataset, num_proc=num_proc)
val_dataset = EncodePreprocessor(template=template)(val_dataset, num_proc=num_proc)


# 進行訓練
trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    data_collator=template.data_collator,
    train_dataset=train_dataset,
    eval_dataset=val_dataset,
    template=template,
)
trainer.train()

推理

# 使用原生pytorch引擎進行推理
engine = PtEngine(model_id_or_path, adapters=[lora_checkpoint])
infer_request = InferRequest(messages=[{'role': 'user', 'content': 'who are you?'}])
request_config = RequestConfig(max_tokens=max_new_tokens, temperature=temperature)


resp_list = engine.infer([infer_request], request_config)
print(f'response: {resp_list[0].choices[0].message.content}')

四、從訓練到部署完整流程

完整流程從訓練到部署demo可查看 ??https://github.com/modelscope/ms-swift/tree/main/examples??

4.1 支持的訓練方法

魔搭 ms-swift 框架-AI.x社區

4.2 預訓練

# 8*A100
NPROC_PER_NODE=8 \
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 \
swift pt \
    --model Qwen/Qwen2.5-7B \
    --dataset swift/chinese-c4 \
    --streaming true \
    --train_type full \
    --deepspeed zero2 \
    --output_dir output \
    --max_steps 100000 \
    ...

4.2 微調

CUDA_VISIBLE_DEVICES=0 swift sft \
    --model Qwen/Qwen2.5-7B-Instruct \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh \
    --train_type lora \
    --output_dir output \
    ...

4.3 RLHF

CUDA_VISIBLE_DEVICES=0 swift rlhf \
    --rlhf_type dpo \
    --model Qwen/Qwen2.5-7B-Instruct \
    --dataset hjh0119/shareAI-Llama3-DPO-zh-en-emoji \
    --train_type lora \
    --output_dir output \
    ...

4.4 推理

CUDA_VISIBLE_DEVICES=0 swift infer \
    --model Qwen/Qwen2.5-7B-Instruct \
    --stream true \
    --infer_backend pt \
    --max_new_tokens 2048


# LoRA
CUDA_VISIBLE_DEVICES=0 swift infer \
    --model Qwen/Qwen2.5-7B-Instruct \
    --adapters swift/test_lora \
    --stream true \
    --infer_backend pt \
    --temperature 0 \
    --max_new_tokens 2048

4.5 界面推理

CUDA_VISIBLE_DEVICES=0 swift app \
    --model Qwen/Qwen2.5-7B-Instruct \
    --stream true \
    --infer_backend pt \
    --max_new_tokens 2048 \
    --lang zh

4.6 部署

CUDA_VISIBLE_DEVICES=0 swift deploy \
    --model Qwen/Qwen2.5-7B-Instruct \
    --infer_backend vllm

4.7 采樣

CUDA_VISIBLE_DEVICES=0 swift sample \
    --model LLM-Research/Meta-Llama-3.1-8B-Instruct \
    --sampler_engine pt \
    --num_return_sequences 5 \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh#5

4.8 評測

CUDA_VISIBLE_DEVICES=0 swift eval \
    --model Qwen/Qwen2.5-7B-Instruct \
    --infer_backend lmdeploy \
    --eval_backend OpenCompass \
    --eval_dataset ARC_c

4.9 量化

CUDA_VISIBLE_DEVICES=0 swift export \
    --model Qwen/Qwen2.5-7B-Instruct \
    --quant_bits 4 --quant_method awq \
    --dataset AI-ModelScope/alpaca-gpt4-data-zh \
    --output_dir Qwen2.5-7B-Instruct-AWQ

4.10 模型推送

swift export \
    --model <model-path> \
    --push_to_hub true \
    --hub_model_id '<model-id>' \
    --hub_token '<sdk-token>'

五、參數

num_train_epochs

定義：訓練的 epoch 數（默認值為 3）。1 個 epoch 指模型完整遍歷一次訓練數據集

示例：若有 1000 條訓練樣本，??num_train_epochs=3?? 表示模型會遍歷數據 3 次

作用：逐步優化模型參數，提升擬合能力

注意：過多 epoch 可能導致過擬合（模型記住訓練數據而非泛化）

split_dataset_ratio

定義：訓練集與驗證集的劃分比例（訓練集占比）

示例：??split_dataset_ratio=0.8?? 表示 1000 條樣本中，800 條用于訓練，200 條用于驗證

作用：區分訓練數據（模型學習）和驗證數據（調參、選最優模型），部分場景含測試集（最終評估）

per_device_train_batch_size

定義：每個設備的訓練批量大小（GRPO 中特指 completion 批次大?。?/p>

總批量計算：??總 batch size = per_device_train_batch_size × 設備數量??（如多 GPU 場景）

示例：??per_device_train_batch_size=16?? 表示單設備每次用 16 個樣本更新參數，2 個 GPU 總批量為 32

影響與建議如下表：

方面	影響 / 建議
訓練速度	批量越大，硬件并行能力利用率越高，訓練越快。
內存占用	批量過大會導致 OOM（顯存不足），建議從小值（2→4→8）逐步嘗試。
模型效果	太小易導致梯度噪聲大（不穩定），太大可能降低泛化能力。
場景適配	微調大模型推薦 1~8（配合梯度累積）；多卡訓練可適當放大；BatchNorm 任務不宜過小。

gradient_accumulation_steps

定義：參數更新前累積的 batch 數量（模擬大批量訓練，不增加顯存占用）

示例：??per_device_train_batch_size=4 + gradient_accumulation_steps=8?? 等效總批量為 32（顯存僅占 4 樣本的量）

推薦值如下表：

硬件場景（單卡）	推薦值
A10/RTX 3090/L40（24G）	1~4
T4/V100（16G）	4~8
RTX 3060/2080（12G）	8~16
顯存緊張	32 或更高（犧牲速度）

learning_rate

學習率大小	效果	問題
太大	更新快	易跳過最優解，導致震蕩 / 發散
太小	穩定但慢	收斂慢，可能陷入局部最小值

推薦值：

定義：參數更新的 “力度”（梯度調整系數），公式為 ??newParameter = oldParameter - learningRate × gradient??

影響：

任務類型	推薦學習率
圖像分類（SGD+momentum）	0.1（配合衰減策略）
圖像分類（Adam）	3e-4（0.0003）
NLP（Transformer 微調）	2e-5 ~ 5e-5
強化學習	1e-4 ~ 1e-5
大模型微調	2e-5 ~ 5e-5

warmup_ratio

定義：學習率預熱階段占總訓練步數的比例（預熱階段學習率從 0 逐步增至目標值）

公式：??num_warmup_steps = warmup_ratio × total_training_steps??（總步數 = epoch 數 × 每 epoch 批次數）

作用：避免初始隨機權重因大學習率導致的訓練不穩定

推薦范圍：0.01 ~ 0.2

lora_rank

秩越?。簠翟缴?，內存占用低，但擬合能力有限；

秩越大：擬合能力強，但易過擬合

定義：LoRA 低秩矩陣的秩，控制適配矩陣的復雜度與表達能力

影響：

推薦值：

模型規模	推薦值
小模型（<1B 參數）	8 ~ 64
中等模型（1B~10B）	8 ~ 32
大模型（>10B）	8 ~ 16

lora_alpha

默認：??lora_alpha = 2 × lora_rank??（如 8→16、16→32）；

小模型：8 ~ 32；大模型：16 ~ 64。

定義：LoRA 適配矩陣的縮放因子，公式為 ??ΔW = (α/r) × A×B^T??（r 為 lora_rank）

作用：放大低秩矩陣的影響（如 ??lora_rank=8 + lora_alpha=16?? 時縮放因子為 2）

推薦值：

use_chat_template

[
 {"role": "user", "content": "介紹一下你自己"},
 {"role": "assistant", "content": "我是 InternLM，由上海人工智能實驗室開發的語言模型..."},
 {"role": "user", "content": "你能幫我寫一篇關于夏天的文章嗎？"}
]

<|User|>: 介紹一下你自己
<|Assistant|>: 我是 InternLM...
<|User|>: 你能幫我寫一篇關于夏天的文章嗎？

如果啟用了 ??use_chat_template = true??，系統會自動將這段對話轉換為類似下面的字符串：

定義：決定是否在推理或訓練過程中自動應用模型內置的“對話格式模板”來組織輸入文本

值：true 和 false

例如，你傳入如下對話歷史：

target_modules

LLM 中自動選擇除 ??lm_head?? 外的線性層并附加tuner；

多模態 LLM 默認僅在 LLM 附加調優器，可通過 ??freeze_llm??? 、???freeze_vit???、???freeze_aligner???等參數控制

定義：指定接入 LoRA 或其他調優器的模塊（默認 ??all-linear??）
行為：
save_steps

定義：每隔多少步保存一次模型狀態（權重、優化器等，默認 500）

作用：支持中斷后從最近 checkpoint 續訓，便于篩選最優模型

推薦值：

場景	推薦值
小數據集 / 快速實驗	50 ~ 100
中等規模訓練	500 ~ 1000
大規模預訓練	1000 ~ 10000

save_total_limit

定義：最多保留的模型 checkpoint 數量（超出自動刪除較早文件）

作用：節省磁盤空間，例如 ??save_total_limit=2?? 僅保留最近 2 個 checkpoint

logging_steps

定義：每隔多少步打印訓練狀態（loss、學習率等，默認 5）

作用：實時監控訓練進度，輔助調試模型表現

gradient_checkpointing_kwargs

顯存不足時啟用；

新版推薦 ??use_reentrant: false??（效率更高）；

老模型兼容用 ??use_reentrant: true??；

大模型微調強烈建議開啟

定義：梯度檢查點的高級配置（默認 None），用于節省顯存

原理：前向傳播僅保留部分激活值，反向傳播時重新計算，以時間換內存

建議：

dataloader_num_workers

定義：PyTorch DataLoader 用于數據加載的子進程數量

作用：并行處理數據讀取、預處理等任務，加速數據供給主訓練進程

六、接入SwanLab

6.1 安裝swanlab

pip install swanlab

6.2 CLI微調

只需要在ms-swift的CLI中添加??--report_to???和???--swanlab_project???兩個參數，即可使用SwanLab進行實驗跟蹤與可視化：

swift sft \
    ...
    --report_to swanlab \ 
    --swanlab_project swift-robot \ 
    ...

運行指令后，可以在SwanLab看到訓練過程：

魔搭 ms-swift 框架-AI.x社區

支持的完整參數：

??swanlab_token??: SwanLab的api-key
??swanlab_project??: swanlab的project
??swanlab_workspace??: 默認為None，會使用api-key對應的username
??swanlab_exp_name??: 實驗名，可以為空，為空時默認傳入--output_dir的值
??swanlab_mode??: 可選cloud和local，云模式或者本地模式

6.3 WebUI微調

啟動WebUI

swift web-ui

啟動后，會自動打開瀏覽器，顯示微調界面（或者訪問 ??http://localhost:7860/?? ）：

魔搭 ms-swift 框架-AI.x社區

在下方的「訓練記錄」模塊中，在??訓練記錄方式???部分選擇???swanlab???：

魔搭 ms-swift 框架-AI.x社區

還可以在「訓練記錄」模塊的其他填寫更細致的swanlab參數，包括：

??swanlab_token??: SwanLab的api-key
??swanlab_project??: swanlab的project
??swanlab_workspace??: 默認為None，會使用api-key對應的username
??swanlab_exp_name??: 實驗名，可以為空，為空時默認傳入--output_dir的值
??swanlab_mode??: 可選cloud和local，云模式或者本地模式

6.4 Python代碼微調

這部分更詳細的可以查閱 ??https://docs.swanlab.cn/guide_cloud/integration/integration-swift.html#_3-python%E4%BB%A3%E7%A0%81%E5%BE%AE%E8%B0%83??

引入SwanLabCallback

from swanlab.integration.transformers import SwanLabCallback

引入Trainer

from swanlab.integration.transformers import SwanLabCallback
from swift import Seq2SeqTrainer, Seq2SeqTrainingArguments


···


#實例化SwanLabCallback
swanlab_callback = SwanLabCallback(project="swift-visualization")


trainer = Seq2SeqTrainer(
    ...
    callbacks=[swanlab_callback],
    )


trainer.train()

使用SwanLabCallback

# Lora微調一個Qwen2-0.5B模型


from swanlab.integration.transformers import SwanLabCallback
from swift import Seq2SeqTrainer, Seq2SeqTrainingArguments
from swift.llm import get_model_tokenizer, load_dataset, get_template, EncodePreprocessor
from swift.utils import get_logger, find_all_linears, get_model_parameter_info, plot_images, seed_everything
from swift.tuners import Swift, LoraConfig
from swift.trainers import Seq2SeqTrainer, Seq2SeqTrainingArguments
from functools import partial
import os


logger = get_logger()
seed_everything(42)


# Hyperparameters for training
# model
model_id_or_path = 'Qwen/Qwen2.5-3B-Instruct'  # model_id or model_path
system = 'You are a helpful assistant.'
output_dir = 'output'


# dataset
dataset = ['AI-ModelScope/alpaca-gpt4-data-zh#500', 'AI-ModelScope/alpaca-gpt4-data-en#500',
           'swift/self-cognition#500']  # dataset_id or dataset_path
data_seed = 42
max_length = 2048
split_dataset_ratio = 0.01  # Split validation set
num_proc = 4  # The number of processes for data loading.
# The following two parameters are used to override the placeholders in the self-cognition dataset.
model_name = ['小黃', 'Xiao Huang']  # The Chinese name and English name of the model
model_author = ['魔搭', 'ModelScope']  # The Chinese name and English name of the model author


# lora
lora_rank = 8
lora_alpha = 32


# training_args
training_args = Seq2SeqTrainingArguments(
    output_dir=output_dir,
    learning_rate=1e-4,
    per_device_train_batch_size=1,
    per_device_eval_batch_size=1,
    gradient_checkpointing=True,
    weight_decay=0.1,
    lr_scheduler_type='cosine',
    warmup_ratio=0.05,
    logging_first_step=True,
    save_strategy='steps',
    save_steps=50,
    eval_strategy='steps',
    eval_steps=50,
    gradient_accumulation_steps=16,
    num_train_epochs=1,
    metric_for_best_model='loss',
    save_total_limit=5,
    logging_steps=5,
    dataloader_num_workers=1,
    data_seed=data_seed,
)


output_dir = os.path.abspath(os.path.expanduser(output_dir))
logger.info(f'output_dir: {output_dir}')


# Obtain the model and template, and add a trainable Lora layer on the model.
model, tokenizer = get_model_tokenizer(model_id_or_path)
logger.info(f'model_info: {model.model_info}')
template = get_template(model.model_meta.template, tokenizer, default_system=system, max_length=max_length)
template.set_mode('train')


target_modules = find_all_linears(model)
lora_config = LoraConfig(task_type='CAUSAL_LM', r=lora_rank, lora_alpha=lora_alpha,
                         target_modules=target_modules)
model = Swift.prepare_model(model, lora_config)
logger.info(f'lora_config: {lora_config}')


# Print model structure and trainable parameters.
logger.info(f'model: {model}')
model_parameter_info = get_model_parameter_info(model)
logger.info(f'model_parameter_info: {model_parameter_info}')


# Download and load the dataset, split it into a training set and a validation set,
# and encode the text data into tokens.
train_dataset, val_dataset = load_dataset(dataset, split_dataset_ratio=split_dataset_ratio, num_proc=num_proc,
        model_name=model_name, model_author=model_author, seed=data_seed)


logger.info(f'train_dataset: {train_dataset}')
logger.info(f'val_dataset: {val_dataset}')
logger.info(f'train_dataset[0]: {train_dataset[0]}')


train_dataset = EncodePreprocessor(template=template)(train_dataset, num_proc=num_proc)
val_dataset = EncodePreprocessor(template=template)(val_dataset, num_proc=num_proc)
logger.info(f'encoded_train_dataset[0]: {train_dataset[0]}')


# Print a sample
template.print_inputs(train_dataset[0])


# Get the trainer and start the training.
model.enable_input_require_grads()  # Compatible with gradient checkpointing


swanlab_callback = SwanLabCallback(
    project="swift-visualization",
    experiment_name="lora-qwen2-0.5b",
    descriptinotallow="Lora微調一個Qwen2-0.5B模型"
)


trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    data_collator=template.data_collator,
    train_dataset=train_dataset,
    eval_dataset=val_dataset,
    template=template,
    callbacks=[swanlab_callback],
)
trainer.train()


last_model_checkpoint = trainer.state.last_model_checkpoint
logger.info(f'last_model_checkpoint: {last_model_checkpoint}')

運行可視化結果：

魔搭 ms-swift 框架-AI.x社區

筆者能力有限，歡迎批評指正或者在留言區討論

參考：

??https://blog.csdn.net/2401_89025022/article/details/146997066??
??https://cloud.tencent.com/developer/article/2550538??
??https://docs.swanlab.cn/guide_cloud/integration/integration-swift.html#_3-python%E4%BB%A3%E7%A0%81%E5%BE%AE%E8%B0%83??

本文轉載自??鴻煊的學習筆記??，作者：乘風破浪jxj

標簽

已于2025-8-22 10:27:08修改

贊

收藏

回復

舉報

回復

相關推薦

K8s和大模型真的搭嗎？

51CTO技術棧 ? 4331瀏覽 ? 0回復
ICLR 2024：思維框架

AIGC最前線 ? 4367瀏覽 ? 0回復
這三款AI搜索引擎，是我離不開的AI搭子

開發者阿橙 ? 5449瀏覽 ? 0回復
只需400ms！英偉達提出LATTE3D：大規模高質量的Amortized文本到增強3D 合成

angel ? 4976瀏覽 ? 0回復
時尚穿搭想換就換，各種風格一鍵完美搭配！這個引爆時尚圈的平臺上線了

angel ? 4555瀏覽 ? 0回復
Bitnet.cpp：微軟開源1比特推理框架，CPU跑100B模型

老蛀蟲 ? 7826瀏覽 ? 0回復
從谷歌、微軟、百度，到Perplexity、Kimi、秘塔，大模型真的“搭”上了搜索的快車嗎？

51CTO技術棧 ? 4093瀏覽 ? 0回復
基于Agent的金融問答系統：Agent框架的構建

一起AI技術 ? 4037瀏覽 ? 0回復
Agent 智能體開發框架如何優雅選型？

玄姐聊AGI ? 4161瀏覽 ? 0回復
910B芯片Swift多模態模型分布式訓練實踐

zhcs333 ? 8674瀏覽 ? 1回復
PPTAgent：PPT自動生成Agent框架

大模型自然語言處理 ? 6134瀏覽 ? 0回復
RF-DETR：60.5 mAP + 6ms延遲，實時檢測領域的新王者如何碾壓YOLO？

墨風如雪小站 ? 3984瀏覽 ? 0回復
跨越千年的對話：用即夢AI當古人的嘴替搭子

AIGC新知 ? 1.2w瀏覽 ? 0回復
微軟開源DeepSeek-R1魔改版：響應99%敏感提示，風險降50%

Aceryt ? 8437瀏覽 ? 0回復
大模型部署框架Ollama和vLLM怎么選？一文講透兩大框架的優缺點和適用場景

AI博物院 ? 6845瀏覽 ? 0回復
從零到一構建Agent系統：四大模塊 + 框架生態詳解

PyTorch研習社 ? 5420瀏覽 ? 0回復
離線VLLM魔改流式

魯班模錘1 ? 2905瀏覽 ? 0回復
Microsandbox：200ms啟動的硬件級安全代碼執行沙盒

Syrupup ? 3586瀏覽 ? 0回復
零外部數據自我進化大模型訓練框架-R-Zero框架訓練思路

大模型自然語言處理 ? 2756瀏覽 ? 0回復

鴻煊的學習筆記

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

大模型自動化標注：從流程到實戰 2025-11-14 00:11:21發布
大模型微調技術基礎 2025-08-22 08:00:16發布

熱門推薦

大模型自動化標注：從流程到實戰 0回復

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

上一篇：大模型微調技術基礎

下一篇：大模型自動化標注：從流程到實戰

社區精華內容

目錄

国产69视频在线观看| 今天免费高清在线观看国语| 国产精品va无码一区二区三区| 国产精品一在线观看| 欧美精品在线视频| 青春草国产视频| 久蕉在线视频| 国产乱妇无码大片在线观看| 欧美制服第一页| 精品国产精品国产精品| 欧美亚洲国产日韩| 在线不卡一区二区| 欧美aⅴ在线观看| av免费在线免费| 久久精品一区蜜桃臀影院| 91色在线视频| 亚洲永久精品一区| 亚洲承认在线| 久久精品福利视频| 中文字幕av网址| 亚洲网址在线观看| 欧美视频日韩视频在线观看| 成人一区二区免费视频| 欧美成人视屏| 国产婷婷色一区二区三区四区| 91超碰在线免费观看| 男人天堂视频网| 亚洲国产国产亚洲一二三| 久久精品视频网站| 国产午夜福利一区| 香蕉久久精品日日躁夜夜躁| 欧美va亚洲va国产综合| 欧美激情国内自拍| 国产精品黄色片| 日本乱码高清不卡字幕| 日本欧美黄色片| 日韩av毛片| 亚洲精品菠萝久久久久久久| 亚洲一区不卡在线| 欧美3p视频在线观看| 成人高清视频在线| 成人国产1314www色视频| 国产精品高潮呻吟av| 喷水一区二区三区| 国产福利精品在线| 日韩熟女一区二区| 久久久夜夜夜| 日韩女优人人人人射在线视频| 国产精品a成v人在线播放| 亚洲色图欧美| 欧美日韩成人在线播放| 激情四射综合网| 欧美精选一区| 久久免费少妇高潮久久精品99| 强乱中文字幕av一区乱码| 婷婷综合五月| 麻豆成人在线看| 69av视频在线| 在线成人www免费观看视频| 欧美日韩国产成人| 日韩和一区二区| 国产欧美精品| 国产91网红主播在线观看| 精品久久久久久久久久久久久久久久| 亚洲一区二区三区四区五区午夜 | 日本在线人成| 自拍偷拍国产亚洲| 日本xxx免费| 中文字幕在线观看网站| 亚洲香肠在线观看| 国产素人在线观看| 欧美三级精品| 欧美精品99久久久**| 中文字幕人妻无码系列第三区| 狂野欧美xxxx韩国少妇| 欧美v日韩v国产v| a级在线观看视频| 波多野结衣在线观看一区二区三区| 在线观看91久久久久久| 放荡的美妇在线播放| 国产综合激情| 国产97色在线| 国产欧美熟妇另类久久久| 国产精品888| 鲁丝片一区二区三区| 成人资源www网在线最新版| 国产精品不卡视频| 成人免费观看cn| 日韩毛片一区| 亚洲成人xxx| 日韩免费成人av| 亚洲视频日本| 国产精品久久久av| 亚洲精品久久久狠狠狠爱| 久久天天做天天爱综合色| 伊人久久青草| 午夜伦理福利在线| 欧美一区二区三区在线观看| 大地资源二中文在线影视观看| 成人av动漫在线观看| 久久69精品久久久久久久电影好| 九九精品免费视频| 国产麻豆精品95视频| 欧美成人综合一区| 日韩欧美一起| 欧美疯狂做受xxxx富婆| 爱爱的免费视频| 欧美精品三级| 国产日韩一区在线| 香蕉视频黄在线观看| 亚洲日本在线视频观看| 黄色a级片免费| 在线精品国产亚洲| 色悠悠久久88| 一级黄色大片视频| 成人综合婷婷国产精品久久| 亚洲视频小说| 色资源二区在线视频| 3d成人动漫网站| a级黄色免费视频| 亚洲影院在线| 国产午夜精品一区| 欧美xxxx做受欧美88bbw| 欧美日韩精品一区二区三区四区| 成年人网站免费看| 亚洲图片在线| 99热国产免费| 91在线中字| 欧美日韩黄色一区二区| 色噜噜日韩精品欧美一区二区| 伊人影院久久| 粉嫩高清一区二区三区精品视频| 免费大片在线观看www| 91激情五月电影| 欧洲美一区二区三区亚洲| 国产欧美高清| 久久伊人资源站| 精品人人视频| 日韩电影免费观看在线观看| 日韩欧美高清在线观看| 东方欧美亚洲色图在线| 日韩亚洲欧美一区二区| 国色天香久久精品国产一区| 久久精品视频99| 国产福利视频导航| 一区二区三区四区高清精品免费观看| 久久精品亚洲天堂| 亚洲欧美偷拍自拍| 亚洲专区中文字幕| 天天色天天射天天综合网| 91精品国产91久久久久久最新毛片| 免费精品在线视频| 国模娜娜一区二区三区| 91视频成人免费| 超碰精品在线| 91精品国产91久久| 人成免费电影一二三区在线观看| 日韩欧美国产一区二区| 在线不卡av电影| 久久99精品久久久久婷婷| 伊人av成人| 6080成人| 欧美最顶级的aⅴ艳星| 蜜桃视频在线入口www| 欧美在线视频日韩| 国产三级aaa| 国产成人精品一区二区三区四区| 黄色大片中文字幕| 最新国产一区| 91精品久久久久久| 视频在线观看入口黄最新永久免费国产 | 在线观看日韩中文字幕| 久久尤物电影视频在线观看| 别急慢慢来1978如如2| 水蜜桃精品av一区二区| 51成人做爰www免费看网站| 福利网站在线观看| 亚洲区中文字幕| 国产一区二区在线播放视频| 亚洲精品国产a| 亚洲第一页av| 国产主播一区二区三区| 黄网站欧美内射| 日韩国产在线| 国产91精品一区二区绿帽| 亚洲人体视频| 久久视频国产精品免费视频在线| 国产刺激高潮av| 欧美无砖砖区免费| 久久免费小视频| 欧美激情在线免费观看| 无码人妻少妇色欲av一区二区| 亚洲一区国产一区| 超碰免费在线公开| 亚洲理论电影片| 亚洲综合在线小说| 少妇精品视频一区二区免费看| 欧美美最猛性xxxxxx| 奇米影视888狠狠狠777不卡| 91麻豆精品91久久久久久清纯| 久久久久久久久影院| 中文字幕一区二区三区四区| 亚洲少妇18p| 久久99精品久久久久婷婷| 国产精品宾馆在线精品酒店| 一区二区国产在线| 色姑娘综合av| 偷拍自拍亚洲色图| 产国精品偷在线| 爱情电影网av一区二区| 日韩**中文字幕毛片| 少妇av在线| 久久精品国产精品| 精品电影在线| 亚洲国产第一页| jizz中国少妇| 欧美日韩国产欧美日美国产精品| 99久在线精品99re8热| 亚洲精品国产第一综合99久久| 91香蕉国产视频| 国产亚洲一区字幕| 欧美精品欧美极品欧美激情| 国产91高潮流白浆在线麻豆| 午夜一区二区视频| 男男视频亚洲欧美| 亚洲人成无码www久久久| av不卡免费看| 黄色成人在线看| 狠狠色丁香久久综合频道| 成人性做爰片免费视频| 97人人精品| 亚洲人体一区| 久久中文亚洲字幕| 神马影院午夜我不卡| 免费看av成人| 免费亚洲一区二区| 思热99re视热频这里只精品| 久久香蕉综合色| 天堂资源在线亚洲| 免费av在线一区二区| 天堂av一区二区三区在线播放 | 日韩一区免费视频| 欧美mv日韩mv国产网站| 超碰免费在线97| 欧美变态口味重另类| www精品国产| 精品乱码亚洲一区二区不卡| 亚洲第一天堂网| 亚洲成avwww人| 污污视频在线观看网站| 亚洲国产精品电影| 神马电影在线观看| 日韩精品视频在线播放| 欧美日韩国产综合视频 | 波多野在线播放| 中日韩av电影| 91porn在线视频| 亚洲国产视频在线| 国产视频91在线| 91传媒视频在线播放| 在线观看黄色网| 欧美一区二区三区啪啪| 亚洲精品福利网站| 亚洲免费一在线| www.中文字幕久久久| 久久久av一区| av免费不卡| 国产精品444| 国产欧美视频在线| 国产伦视频一区二区三区| 久久av网址| 最新精品视频| 国产日韩欧美一区二区三区在线观看| 免费在线观看毛片网站| 麻豆精品视频在线| 国产成人精品一区二区三区在线观看| 成人av午夜电影| 国产18无套直看片| 一区二区久久久久久| 69视频免费在线观看| 欧美日韩黄色一区二区| 免费成人在线看| 国产亚洲成精品久久| 免费在线看黄| 4k岛国日韩精品**专区| 国产精品xxx| 国产一区二区三区黄| 欧美日韩一二三四| 欧美极品少妇无套实战| 天堂资源在线中文精品| 秋霞午夜鲁丝一区二区| 久久久五月婷婷| 精品99在线观看| 欧美午夜宅男影院| 秋霞av鲁丝片一区二区| 中文字幕日韩视频| 国内精彩免费自拍视频在线观看网址| 国产精品综合网站| 秋霞影视一区二区三区| 亚洲欧美一二三| 玖玖精品视频| www.555国产精品免费| 国产精品久久久久影院色老大| 国产无套内射又大又猛又粗又爽 | **欧美日韩vr在线| 国产精一区二区| 日韩videos| 国产日韩专区| 免费在线观看日韩av| 国产精品美女一区二区三区| www成人在线| 日韩精品一区二区三区蜜臀| 在线观看免费版| 国产999精品久久久| 国产精品超碰| 永久免费看av| 精品中文字幕一区二区小辣椒| 人妻少妇一区二区| 亚洲不卡在线观看| 性一交一乱一伧老太| www国产精品视频| 91天天综合| 欧美一区免费视频| 午夜一区不卡| 免费成人蒂法网站| 亚洲国产综合视频在线观看| 精品国产18久久久久久| 日韩一区二区欧美| 成人午夜毛片| 亚洲综合欧美日韩| 麻豆高清免费国产一区| 高清国产在线观看| 在线亚洲精品福利网址导航| 青春草在线观看 | 久久久久在线视频| 亚洲精品视频免费在线观看| 成人免费观看在线观看| 国产精品有限公司| 尤物网精品视频| 中文字幕无码人妻少妇免费| 亚洲午夜精品17c| 色欲av永久无码精品无码蜜桃| 欧美激情精品久久久久久大尺度| 精品视频在线播放一区二区三区| 视频一区二区视频| 国产精品一区久久久久| 欧美黄色免费看| 精品国内二区三区| av资源新版天堂在线| 国产精品永久入口久久久| 国产一区导航| 我和岳m愉情xxxⅹ视频| 色欧美片视频在线观看| 成人网视频在线观看| 国产精品视频在线观看| 99精品在线观看| 日韩精品xxx| 亚欧色一区w666天堂| 四虎精品成人影院观看地址| 日本欧美精品在线| 成人动漫免费在线观看| 爱爱爱爱免费视频| 亚洲自拍偷拍九九九| 天天干天天爽天天操| 日韩av免费在线播放| 日韩久久视频| 精品人妻无码中文字幕18禁| 午夜精品久久久久久不卡8050| 日本大片在线观看| 国产精品爽爽ⅴa在线观看| 一区二区三区四区日韩| 污污污www精品国产网站| 一本一道久久a久久精品综合蜜臀一本一道综合狠狠老 | 国产美女一区视频| 玛丽玛丽电影原版免费观看1977| 日本不卡免费在线视频| 麻豆天美蜜桃91| 日韩成人在线观看| 欧美在线va视频| 国产精品久久国产| 久久久五月婷婷| 国内精品久久久久久久久久| 国产91精品久久久| 日韩av密桃| 欧美一级片黄色| 91精品欧美综合在线观看最新 | japanese在线观看| 在线视频综合导航| 欧美人与性动交α欧美精品济南到 | 午夜不卡久久精品无码免费| 91黄色激情网站| heyzo高清国产精品| 日韩一区国产在线观看| 国产成人免费在线| 做爰视频毛片视频| 久久人人爽人人爽人人片av高请| 凹凸成人精品亚洲精品密奴| 中文字幕一区二区三区乱码不卡| 欧美日韩久久久一区| 忘忧草在线日韩www影院|