精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解讀大模型的微調

原創 精選
開發 架構
微調預訓練LLM的所有層仍然是適應新目標任務的黃金準則。但是,諸如基于特征的方法、上下文學習和參數高效微調技術等方法,可以在最小化計算成本和資源的同時,有效地將LLM應用到新任務中。

在快速發展的人工智能領域中,有效地利用大型語言模型(LLM)變得越來越重要。然而,有許多不同的方式可以使用大型語言模型,這可能會讓我們感到困惑。實際上,可以使用預訓練的大型語言模型進行新任務的上下文學習并進行微調。

那么,什么是上下文學習?又如何對大模型進行微調呢?

1. 上下文學習與索引

自從GPT-2和GPT-3出現以來,可以發現在預訓練的通用文本語料庫上的生成式大型語言模型(LLM)具備了上下文學習的能力,這意味著如果我們想要執行LLM沒有明確訓練的特定或新任務,不需要進一步訓練或微調預訓練的LLM。同時,我們可以通過輸入提示直接提供一些目標任務的示例。

In Context Learning(ICL)的關鍵思想是從類比中學習。下圖給出了一個描述語言模型如何使用 ICL 進行決策的例子。首先,ICL 需要一些示例來形成一個演示上下文。這些示例通常是用自然語言模板編寫的。然后 ICL 將查詢的問題(即需要預測標簽的 input)和一個上下文演示(一些相關的 cases)連接在一起,形成帶有提示的輸入,并將其輸入到語言模型中進行預測。

圖片

如果無法直接訪問模型,例如通過 API 使用模型,上下文學習非常有用。與上下文學習相關的是“硬提示微調”的概念,可以通過修改輸入來期望改善輸出。將直接修改輸入的單詞或標記的微調稱為“硬”提示微調,另一種微調方式稱為“軟”提示微調或通常稱為“提示微調”。這種提示微調方法提供了一種更為節省資源的參數微調替代方案。然而,由于它不會更新模型參數以適應特定任務的微小差異,因此可能會限制其適應能力。此外,由于通常需要手動比較不同提示的質量,提示微調可能需要耗費大量人力。

另一種利用純粹的上下文學習方法的方法是索引。在LLM的范圍內,索引可以被視為一個上下文學習的解決方法,它使得LLM可以轉換為信息檢索系統,用于從外部資源和網站中提取數據。在此過程中,索引模塊將文檔或網站分解為較小的段落,并將它們轉換為可以存儲在向量數據庫中的向量。然后,當用戶提交查詢時,索引模塊計算嵌入式查詢與數據庫中每個向量之間的向量相似度。最終,索引模塊獲取前k個最相似的嵌入式向量以生成響應。索引的示意圖如下:

圖片

2. 基于三種特征的微調方法

上下文學習是一種有價值且用戶友好的方法,適用于直接訪問大型語言模型受限的情況,例如通過API或用戶界面與LLM進行交互。然而,如果可以訪問LLM,則使用來自目標領域的數據對其進行適應和微調通常會導致更好的結果。那么,我們如何將模型適應到目標任務?下圖概述了三種常規的基于特征的微調方法。

圖片

除了微調編碼器風格的LLM之外,相同的方法也適用于GPT般的解碼器風格LLM。此外,還可以微調解碼器風格的LLM生成多句話的答案,而不僅僅是分類文本。

2.1 基于特征的方法

在基于特征的方法中,需要加載預訓練的LLM,并將其應用于目標數據集。在這里,需要特別關注生成訓練集的輸出嵌入,這些嵌入可以用作訓練分類模型的輸入特征。雖然這種方法在以嵌入為重點的模型(如BERT)中特別常見,但也可以從生成式GPT-style模型中提取嵌入。

分類模型可以是邏輯回歸模型、隨機森林或XGBoost ,也可以任何我們想要的模型。一般地,在這里線性分類器如邏輯回歸表現最佳。

圖片

從概念上講,可以用以下代碼說明基于特征的方法:

model = AutoModel.from_pretrained("distilbert-base-uncased")

# ...
# tokenize dataset
# ...

# generate embeddings
@torch.inference_mode()
def get_output_embeddings(batch):
    output = model(
        batch["input_ids"],
        attention_mask=batch["attention_mask"]
    ).last_hidden_state[:, 0]
return {"features": output}

dataset_features = dataset_tokenized.map(
  get_output_embeddings, batched=True, batch_size=10)

X_train = np.array(imdb_features["train"]["features"])
y_train = np.array(imdb_features["train"]["label"])

X_val = np.array(imdb_features["validation"]["features"])
y_val = np.array(imdb_features["validation"]["label"])

X_test = np.array(imdb_features["test"]["features"])
y_test = np.array(imdb_features["test"]["label"])

# train classifier
from sklearn.linear_model import LogisticRegression

clf = LogisticRegression()
clf.fit(X_train, y_train)

print("Training accuracy", clf.score(X_train, y_train))
print("Validation accuracy", clf.score(X_val, y_val))
print("test accuracy", clf.score(X_test, y_test))

2.2 基于輸出層更新的微調

與上述基于特征的方法相關的一種流行方法是微調輸出層。與基于特征的方法類似,保持預訓練LLM的參數不變,只訓練新添加的輸出層,類似于在嵌入特征上訓練邏輯回歸分類器或小型多層感知器。在代碼中,將如下所示:

model = AutoModelForSequenceClassification.from_pretrained(
    "distilbert-base-uncased",
     num_labels=2
)

# freeze all layers
for param in model.parameters():
    param.requires_grad = False

# then unfreeze the two last layers (output layers)
for param in model.pre_classifier.parameters():
    param.requires_grad = True

for param in model.classifier.parameters():
    param.requires_grad = True

# finetune model
lightning_model = CustomLightningModule(model)

trainer = L.Trainer(
    max_epochs=3,
    ...
)

trainer.fit(
  model=lightning_model,
  train_dataloaders=train_loader,
  val_dataloaders=val_loader)

# evaluate model
trainer.test(lightning_model, dataloaders=test_loader)

理論上,這種方法應該具有與基于特征的方法同樣的良好建模性能和速度。然而,由于基于特征的方法使預計算和存儲嵌入特征更加容易,因此在特定的實際情況下,記憶特征的方法可能更加方便。

2.3 面向所有層更新的微調

盡管原始的BERT論文聲稱,僅微調輸出層可以實現與微調所有層相當的建模性能,但后者涉及更多參數,因此成本更高。例如,BERT基本模型約有1.1億個參數。然而,BERT基本模型用于二元分類的最后一層僅包含1,500個參數。此外,BERT基本模型的最后兩層占據60,000個參數,僅占總模型大小的約0.6%。]

由于目標任務和目標領域與模型預訓練的數據集相似程度的不同,幾乎總是通過微調所有層來獲得更優秀的模型性能。因此,當優化模型性能時,使用預訓練LLM的黃金標準是更新所有層。從概念上講,這種方法與輸出層更新非常相似。唯一的區別是不凍結預訓練LLM的參數,而是對其進行微調。

model = AutoModelForSequenceClassification.from_pretrained(
    "distilbert-base-uncased",
     num_labels=2
)

# don't freeze layers
# for param in model.parameters():
#    param.requires_grad = False

# finetune model
lightning_model = LightningModel(model)

trainer = L.Trainer(
    max_epochs=3,
    ...
)

trainer.fit(
  model=lightning_model,
  train_dataloaders=train_loader,
  val_dataloaders=val_loader)

# evaluate model
trainer.test(lightning_model, dataloaders=test_loader)

多層微調通常會導致更好的性能,但代價也會增加,各種方法的計算和模型性能如下圖所示。

圖片

上面的情景突出了微調的三種極端情況:基于特征,僅訓練最后一層或幾層,或者訓練所有層。當然,根據模型和數據集的不同,在各種選項之間探索也可能是值得的。

3. 參數高效微調

參數高效微調允許我們在最小化計算和資源占用的同時重復使用預訓練模型。總的來說,參數高效微調至少有以下5個優點:

  • 減少計算成本(需要更少的GPU和GPU時間);
  • 更快的訓練時間(更快地完成訓練);
  • 更低的硬件要求(可以使用更小的GPU和更少的存儲器);
  • 更好的模型性能(減少過擬合);
  • 更少的存儲空間(大部分權重可以在不同任務之間共享)。

如前所述,微調更多的層通常會導致更好的結果。如果想要微調更大的模型,例如重新生成的LLM,這些模型只能勉強適合GPU內存,該怎么辦呢?人們開發了幾種技術,只需訓練少量參數便可通過微調提升LLM的性能。這些方法通常被稱為參數高效微調技術(PEFT)。

在huggingface提供的PEFT工具中,可以很方便地實現將普通的HF模型變成用于支持輕量級微調的模型,使用非常便捷,目前支持4種策略,分別是:

  • LoRA
  • Prefix Tuning
  • P-Tuning
  • Prompt Tuning

下圖總結了一些最廣泛使用的PEFT技術。

圖片

那么這些技術是如何工作的呢?簡而言之,它們都涉及引入少量的額外參數,而不是對所有層都進行修改。從某種意義上講,輸出層微調也可以被視為一種參數高效的微調技術。然而,像前綴微調、適配器和低秩適應等技術,它們“修改”多個層,以極低的成本實現更好的預測性能。

4.RHLF

在人類反饋增強學習中,預訓練模型使用監督學習和強化學習相結合進行微調。這種方法是由原始的ChatGPT模型推廣而來,而該模型又基于InstructGPT。RLHF通過讓人類對不同的模型輸出進行排名或評分來收集人類反饋,從而提供獎勵信號。然后,可以使用收集的獎勵標簽來訓練獎勵模型,進而指導LLM對人類偏好的適應。

獎勵模型本身是通過監督學習進行學習的,通常使用預訓練的LLM作為基本模型。接下來,獎勵模型用于更新預訓練的LLM,以適應人類的偏好。訓練使用了一種稱為近端策略優化的強化學習方法。InstructGPT論文中概述了RLHF的過程。

圖片

為什么要使用獎勵模型而不是直接訓練預先訓練好的模型并使用人類反饋?主要原因是將人類納入學習過程會造成瓶頸,我們無法實時獲取反饋。

5.小結

微調預訓練LLM的所有層仍然是適應新目標任務的黃金準則。但是,諸如基于特征的方法、上下文學習和參數高效微調技術等方法,可以在最小化計算成本和資源的同時,有效地將LLM應用到新任務中。此外,帶有人類反饋的強化學習(RLHF)作為有監督微調的替代方法,也可以提高模型性能。

【參考資料】 

  • A Survey on In-context Learning,https://arxiv.org/pdf/2301.00234.pdf
  • LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS,https://arxiv.org/pdf/2106.09685.pdf
  • Prefix-Tuning: Optimizing Continuous Prompts for Generation, https://aclanthology.org/2021.acl-long.353
  • P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks,https://arxiv.org/pdf/2110.07602.pdf
  • The Power of Scale for Parameter-Efficient Prompt Tuning,https://arxiv.org/pdf/2104.08691.pdf
  • BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,https://arxiv.org/abs/1810.04805
  • https://github.com/huggingface/peft
  • https://github.com/rasbt
責任編輯:武曉燕 來源: 喔家ArchiSelf
相關推薦

2025-06-23 07:54:40

2023-10-06 20:30:33

大模型LLMtoken

2025-04-10 07:59:51

2024-09-09 07:46:16

2024-02-05 14:12:37

大模型RAG架構

2024-05-07 08:00:00

自然語言處理機器學習

2024-04-15 12:50:00

大型語言模型ReFT

2024-12-30 00:01:00

多模態大模型Python

2025-01-14 10:56:14

2025-02-28 10:25:09

2024-05-06 07:58:23

MoE模型系統

2023-04-10 09:59:48

昇思

2024-09-26 10:42:20

2025-05-13 05:11:00

推理模型微調

2025-06-26 09:06:59

2024-01-18 15:38:17

語言模型大型語言模型

2023-10-20 17:53:05

2023-09-01 21:12:13

GPT3.5模型微調

2025-10-23 09:28:39

大模型RAG微調

2025-11-06 01:20:00

點贊
收藏

51CTO技術棧公眾號

欧美中文字幕在线观看| 日韩电影中文字幕在线观看| 伊人久久在线观看| 污污的视频网站在线观看| 久久精品国产清高在天天线| 精品国内亚洲在观看18黄 | 欧美亚韩一区二区三区| 精品国产精品国产偷麻豆| 欧美一级艳片视频免费观看| 116极品美女午夜一级| av在线下载| 久久久久国产精品人| 91日本在线视频| 亚洲 欧美 中文字幕| 欧美韩国一区| 中文字幕精品久久| 老熟妇精品一区二区三区| 国产原创一区| 色综合中文字幕国产| av日韩在线看| 理论片午午伦夜理片在线播放| 91视频.com| 成人免费看片网址| 国产又粗又猛又爽又黄视频| 久久精品女人| 98精品国产高清在线xxxx天堂| 日本免费网站视频| 狠狠色丁香婷婷综合影院| 亚洲第一视频网| 亚洲精品一区二区18漫画| 精品久久在线| 欧美亚洲国产一区二区三区| 日韩免费毛片视频| 成人影音在线| 亚洲永久免费av| 中文字幕制服丝袜在线| 日本成a人片在线观看| 国产日韩三级在线| 人禽交欧美网站免费| 色欲av伊人久久大香线蕉影院| 国产麻豆欧美日韩一区| 91探花福利精品国产自产在线| 欧美成人一区二区视频| 日韩精品一二区| 欧洲精品毛片网站| 日韩一区二区视频在线| 国产欧美亚洲一区| 欧美亚洲第一页| 国产精品美女久久久久av爽| 99精品视频免费| 51色欧美片视频在线观看| 日韩av在线天堂| 国产情侣一区| 琪琪第一精品导航| 91在线视频免费播放| 日日夜夜免费精品视频| 国产精品视频在线播放| 中文字幕在线观看高清| 久久超碰97人人做人人爱| 国产精品一二三视频| 亚洲午夜激情视频| 精久久久久久久久久久| 69堂成人精品视频免费| 亚洲成a人片在线| caoporen国产精品视频| 久久riav| 爱久久·www| 一区二区中文视频| 国产a级黄色大片| av资源中文在线| 狠狠色狠色综合曰曰| 欧美精品无码一区二区三区| 日本午夜免费一区二区| 日韩精品中文字幕一区| 中文在线一区二区三区| 欧美色图国产精品| 欧美成人第一页| 三级在线观看视频| 久久99九九99精品| 亚洲va电影大全| 天天干视频在线观看| 久久久国产综合精品女国产盗摄| 水蜜桃一区二区三区| 高h视频在线观看| 精品国产乱码久久久久久虫虫漫画 | 91精品久久香蕉国产线看观看 | 中文亚洲字幕| 国产精品777| 国产成人a人亚洲精品无码| 成人午夜激情在线| 日韩偷拍一区二区| 日韩av官网| 在线日韩一区二区| 国产大片一区二区三区| 欧美尿孔扩张虐视频| 中文字幕av一区二区| 国产主播在线播放| 喷水一区二区三区| 国产日本一区二区三区| 欧美成年黄网站色视频| 五月综合激情婷婷六月色窝| 日本超碰在线观看| 欧美一性一交| 欧美成人全部免费| 亚洲av综合一区| 白白色 亚洲乱淫| 国产高潮呻吟久久久| 超碰一区二区| 欧美r级电影在线观看| 一级片黄色录像| 中日韩男男gay无套| 亚洲综合中文字幕68页| 超碰97在线免费观看| 午夜精品久久久久久| 国产91在线免费观看| 精品免费视频| 奇米一区二区三区四区久久| 可以免费看毛片的网站| 亚洲青青青在线视频| 香蕉视频网站入口| 亚洲va久久久噜噜噜久久| 欧美多人乱p欧美4p久久| 91久久久久久久久久久久| 国产日韩欧美电影| 国产极品美女高潮无套久久久| 成人精品动漫一区二区三区| 久热精品视频在线免费观看 | 91精品国产综合久久精品性色 | 性感美女一级片| 一区二区三区久久| 超碰91在线播放| 亚洲成av人片乱码色午夜| 国产精品自产拍在线观| 午夜视频在线观看免费视频| 欧美亚一区二区| 少妇精品无码一区二区免费视频| 欧美专区18| 久久久一本精品99久久精品66| 高清在线视频不卡| 日韩精品中文字幕在线不卡尤物| 日韩在线中文字幕视频| 国产精品主播直播| 大桥未久一区二区三区| 秋霞一区二区三区| 欧美黑人xxxx| 免费a视频在线观看| 亚洲高清在线精品| bl动漫在线观看| 国产一区二区三区的电影| 精品欧美日韩| 免费成人动漫| 一区二区日韩精品| 一区二区日韩在线观看| 亚洲日本中文字幕区| 一卡二卡三卡四卡五卡| 欧美激情精品久久久六区热门| av免费观看久久| a天堂资源在线| 亚洲欧美制服丝袜| 中文字幕在线视频第一页| 国产精品毛片久久久久久久| 亚洲在线观看网站| 激情久久久久久| 欧美日韩精品中文字幕一区二区| 97成人超碰| 久久影视电视剧免费网站清宫辞电视 | 中文字幕在线观看2018| 丁香啪啪综合成人亚洲小说| 97国产精东麻豆人妻电影 | 人人妻人人澡人人爽欧美一区双| 国产精东传媒成人av电影| 欧美一区二区三区……| yiren22综合网成人| 91精品久久久久久久久99蜜臂| 久久久香蕉视频| 久久欧美中文字幕| 超碰在线资源站| 国产一区二区精品| 在线免费观看成人网| 凹凸av导航大全精品| 国产精品大片wwwwww| 亚洲综合图区| 亚洲欧洲国产伦综合| 国产av无码专区亚洲av| 欧美性xxxxhd| 国产精品成人69xxx免费视频| 99久久亚洲一区二区三区青草| 91最新在线观看| 国产精品jizz在线观看美国| 日韩电影免费观看高清完整| 免费一区二区三区在线视频| 日本精品免费一区二区三区| а天堂中文在线官网| 国产视频亚洲精品| 国产suv一区二区| 色综合视频在线观看| 午夜免费激情视频| 国产喷白浆一区二区三区| 少妇性l交大片7724com| 日韩精品高清不卡| av无码久久久久久不卡网站| 精品久久影视| 久久综合福利| 成人香蕉社区| 91久久精品美女高潮| 无人区在线高清完整免费版 一区二| 欧美成人激情在线| av在线第一页| 亚洲欧美三级伦理| 日韩有码第一页| 欧美疯狂做受xxxx富婆| 青青国产在线视频| 精品日韩视频在线观看| www.av视频| 亚洲天堂精品在线观看| 一级特黄曰皮片视频| 91一区二区在线| 国产51自产区| 国产精品1区二区.| 国产精品嫩草影院8vv8| 视频在线观看一区二区三区| www黄色日本| 亚洲承认在线| 日韩小视频网站| 欧美在线日韩| 欧美 国产 精品| 香蕉av一区二区| 天天干天天操天天干天天操| 日韩精品91| 艳色歌舞团一区二区三区| 精品国产一区二区三区四区| 欧美少妇一区| 深夜福利久久| 日本视频一区二区在线观看| 日韩美女精品| 久久亚裔精品欧美| 中文字幕精品影院| 欧美久久在线| 精品国产日韩欧美| 水蜜桃亚洲精品| 视频在线不卡免费观看| 一区二区精品国产| 亚洲91中文字幕无线码三区| 国产奶头好大揉着好爽视频| 欧美福利网址| 成人在线国产视频| 国产精品日韩久久久| 欧在线一二三四区| 青青草伊人久久| 在线黄色免费看| 国产一区二区精品久久91| 国产精品熟女一区二区不卡| 国产99久久久精品| 国产不卡一二三| 久久久久久久网| 夫妇露脸对白88av| 亚洲男女一区二区三区| 久久久国产精品黄毛片| 婷婷久久综合九色综合绿巨人 | 国产在线播放一区二区三区| 亚洲成人福利视频| 99热精品一区二区| 人妻av无码一区二区三区| 国产精品欧美久久久久一区二区| 国产精品视频看看| 亚洲一区日韩精品中文字幕| av黄色在线看| 精品婷婷伊人一区三区三| 国产精品久久无码一三区| 精品国产91久久久久久久妲己| 天天综合天天色| 中文字幕久精品免费视频| av网站大全在线| 7777kkkk成人观看| 成人四虎影院| 成人羞羞视频免费| 激情五月色综合国产精品| 亚洲啊啊啊啊啊| 米奇777在线欧美播放| 91aaa精品| 91蝌蚪国产九色| 亚洲一级二级片| 福利精品视频在线| 国产精品欧美激情在线| 精品一区二区电影| 精产国品自在线www| 57pao国产成人免费| gogo大尺度成人免费视频| 国精产品99永久一区一区| 国产精品久久观看| 国产一区二区三区精彩视频 | 国产一级一区二区| 韩国一区二区在线播放| www成人在线观看| 婷婷在线精品视频| 在线观看不卡视频| 日本黄色三级视频| 色婷婷**av毛片一区| 中文在线中文资源| 99国产精品久久久久老师| 日韩.com| 激情六月丁香婷婷| 国产成人无遮挡在线视频| 亚洲精品国产精品国自| 偷拍一区二区三区四区| 国产人妖一区二区三区| 亚洲色图五月天| missav|免费高清av在线看| 成人性生交大片免费观看嘿嘿视频| 久久99性xxx老妇胖精品| 成人av在线不卡| 国产在线精品免费av| 这里只有久久精品| 激情亚洲一区二区三区四区| xxxx18国产| 久久久精品免费视频| 99亚洲伊人久久精品影院| 久久久免费看| 中国女人久久久| 久久久久亚洲AV成人无码国产| 一区二区三区在线影院| 一本色道久久综合精品婷婷| 国产香蕉一区二区三区在线视频| 午夜激情在线播放| 国产美女精品久久久| 欧美暴力喷水在线| 青青草原播放器| 亚洲色大成网站www久久九九| 又骚又黄的视频| 一区二区欧美日韩视频| 国产在线|日韩| 日韩久久在线| 日韩国产欧美在线播放| 日韩在线免费观看av| 一本一本久久a久久精品综合麻豆 一本一道波多野结衣一区二区 | 不卡一本毛片| 国产精品视频免费一区| 国产精品大片| 稀缺呦国内精品呦| 精品久久久视频| 日韩av成人| 国产999在线观看| 欧美偷拍综合| 久久黄色片网站| 亚洲素人一区二区| 国产福利视频导航| 久久久久亚洲精品| 日韩av黄色在线| 亚洲人成色77777| 欧美激情中文字幕| 亚洲综合五月天婷婷丁香| 日韩视频免费观看| 亚洲综合影院| 久久久久久久久久久99| 久久―日本道色综合久久| 免费黄色片视频| 精品国模在线视频| 99久久香蕉| 中文字幕乱码人妻综合二区三区| 国产精品天美传媒沈樵| 国产伦精品一区二区三区四区| 久久国产精品视频| 欧美人妖在线观看| 国产aaaaa毛片| 亚洲欧美另类综合偷拍| 免费看日韩av| 国产精品va在线播放我和闺蜜| 91欧美国产| 成人在线电影网站| 色88888久久久久久影院按摩 | 亚洲欧美电影一区二区| 亚洲爱情岛论坛永久| 热99精品只有里视频精品| 欧美顶级大胆免费视频| 日本人妻一区二区三区| 色综合婷婷久久| 麻豆视频在线观看免费网站| 电影午夜精品一区二区三区| 久久香蕉精品| 欧美色图一区二区| 国产一区二区av| 视频一区日韩| 亚洲第一中文av| 亚洲狠狠爱一区二区三区| jizz在线观看视频| 国产精品亚洲不卡a| 免费一区二区视频| 日本熟妇毛茸茸丰满| yw.139尤物在线精品视频| 国产精品毛片视频| 视色视频在线观看| 精品日本高清在线播放| 国产1区在线| 日本成人三级电影网站| 粉嫩高潮美女一区二区三区| 中文字幕在线观看国产| 2019中文字幕免费视频| 自拍视频亚洲| 日韩欧美在线视频播放| 国产丝袜一区二区三区|