精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從零實現大模型-BERT微調 原創 精華

發布于 2024-6-24 16:05
瀏覽
0收藏

按照順序,輪也該輪到BERT指令微調了吧!

是微調,但不是指令微調!

我們在之前的文章介紹過大模型的多種微調方法,指令微調只是其中一種,就像訓犬一樣,讓它坐就坐,讓它臥就臥,同理,你讓LLM翻譯,它不是去總結,你讓它總結,它不是去情感分析。

指令微調在像GPT這種自回歸的模型中應用多一些。我們在前一篇文章中基于GPT-2預訓練模型進行了指令微調。

除了指令微調,還有一種比較常用的是任務微調,預訓練模型雖然具備一定的知識,但尚不能直接用于某些具體任務。

例如,雖然在BERT的預訓練過程中,通過Masked Language Model (MLM)和Next Sentence Prediction (NSP)使其學習了語言的基本特征。

從零實現大模型-BERT微調 -AI.x社區

Masked Language Model (MLM)


從零實現大模型-BERT微調 -AI.x社區

Next Sentence Prediction (NSP)

但它仍不能直接用于自然語言推理(NLI)和問答(QA)等具體任務。因此,今天我們將對之前的BERT預訓練模型進行進一步微調,使其能夠更好地適應這些具體任務。

但完整代碼如下,請結合代碼閱讀本文。

https://github.com/AIDajiangtang/LLM-from-scratch/blob/main/Bert_fine_tune_from_scratch.ipynb

在正式開始之前,有幾點需要注意:

1.在微調階段,模型架構與預訓練要一致,2.使用預訓練模型的權重進行初始化而非隨機初始化,3.使用預訓練相同的分詞方法和詞表,4.輸入數據的格式與預訓練階段一致。例如,BERT模型通常要求輸入序列包含[CLS]和[SEP]標記。

所以在下載預訓練模型時,除了下載模型參數,通常還要下載配套的詞表和模型超參數。

['bert_config.json',
 'bert_model.ckpt.data-00000-of-00001',
 'bert_model.ckpt.index',
 'vocab.txt']

如果要擴充詞表來支持多語言,那模型結構中的嵌入層和輸出層也需要更改,所以往往需要重新預訓練。

有了前面四篇文章的烘托,本篇文章會忽略重復內容。

01、微調任務1:自然語言推理

自然語言推理任務通常是判斷兩個句子之間的邏輯關系(如蘊涵、矛盾或中立)。

從零實現大模型-BERT微調 -AI.x社區

Next Sentence Prediction (NSP)可以看作是一種特殊的自然語言推理任務。

1.訓練數據

本次微調用的數據來自GLUE MRPC,數據由成對的句子構成,并且還有一個人工標注的標簽,表示兩個句子是否語義相似。

FeaturesDict({
    'idx': int32,
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'sentence1': Text(shape=(), dtype=string),
    'sentence2': Text(shape=(), dtype=string),
})

下面打印一條數據。

idx      : 1680
label    : 0
sentence1: b'The identical rovers will act as robotic geologists , searching for evidence of past water .'
sentence2: b'The rovers act as robotic geologists , moving on six wheels .'


  • 對于每個樣本中的句子對,拼接成一個輸入序列,格式為:[CLS] 句子A [SEP] 句子B [SEP]。
  • 使用BERT的分詞器將輸入序列分詞,并將其轉換為輸入ID、注意力掩碼和類型ID。

詞表參數:
{'vocab_size': 30522,
 'start_of_sequence_id': 101,
 'end_of_segment_id': 102,
 'padding_id': 0,
 'mask_id': 103}

設置batch_size=32,max_seq_length = 128。

則輸入ID:

模型的輸入X。

'input_word_ids': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[ 101, 1996, 7235, ...,    0,    0,    0],
        [ 101, 2625, 2084, ...,    0,    0,    0],
        [ 101, 6804, 1011, ...,    0,    0,    0],
        ...,
        [ 101, 2021, 2049, ...,    0,    0,    0],
        [ 101, 2274, 2062, ...,    0,    0,    0],
        [ 101, 2043, 1037, ...,    0,    0,    0]], dtype=int32)>

注意力掩碼:

注意力掩碼用于區分實際的 token 和填充的 token,1表示實際的 token,0表示填充的 token。

在多頭注意力計算時,注意力掩碼會將填充位置對應的注意力權重設置為負無窮(通常是一個非常大的負數,如 -10^9),這樣在通過 softmax 計算時,這些位置的權重就會接近于零,從而使這些填充位置不會對注意力分數產生影響。

在計算損失時,通常會忽略填充位置對應的 token。

'input_mask': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        ...,
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0],
        [1, 1, 1, ..., 0, 0, 0]], dtype=int32)>,

類型ID:

表示token屬于哪個句子,0表示屬于句子A,1表示數據句子B。

'input_type_ids': <tf.Tensor: shape=(32, 128), dtype=int32, numpy=
 array([[0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        ...,
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0],
        [0, 0, 0, ..., 0, 0, 0]], dtype=int32)>

在將token id轉換成詞嵌入向量時,會將類型id視為segment Embedding。

從零實現大模型-BERT微調 -AI.x社區

標簽:

['not_equivalent', 'equivalent']->[0,1]

0:表示兩個句子語義不相似。

1:表示兩個句子語義相似。

<tf.Tensor: shape=(32,), dtype=int64, numpy=
array([0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1,
       1, 1, 1, 1, 1, 0, 0, 1, 0, 1])>

到此,我們就構造了模型輸入和標簽。

input_word_ids  shape: (32, 128)
input_mask      shape: (32, 128)
input_type_ids  shape: (32, 128)
labels          shape: (32,)

2.模型

在模型架構上,相對于BERT預訓練,在微調過程中,會在模型的輸出層添加一個分類層。這個分類層的輸入是[CLS]標記對應的隱藏狀態,其輸出是表示類別概率的logits。

因為EMB_SIZE = 768,所以分類層的輸入(32, 768),輸出(32, 768,2)。

3.微調

超參數
EMB_SIZE = 768//詞嵌入維度
HIDDEN_SIZE = 768 
BATCH_SIZE = 32 #batch size
NUM_HEADS = 4 //頭的個數


3.1.詞嵌入

接下來將token ids轉換成embedding,在Bert中,每個token都涉及到三種嵌入,第一種是Token embedding,token id轉換成詞嵌入向量,第二種是位置編碼。還有一種是Segment embedding。用于表示哪個句子,0表示第一個句子,1表示第二個句子。

從零實現大模型-BERT微調 -AI.x社區

根據超參數EMB_SIZE = 768,所以詞嵌入維度768,Token embedding通過一個嵌入層[30522,768]將輸入[32,128]映射成[32,128,768]。

30522是詞表的大小,[30522,768]的嵌入層可以看作是有30522個位置索引的查找表,每個位置存儲768維向量。

位置編碼可以通過學習的方式獲得,也可以通過固定計算方式獲得,本次采用固定計算方式。

Segment embedding和輸入X大小一致,第一個句子對應為0,第二個位置為1。

最后將三個embedding相加,然后將輸出的embedding[32,128,768]輸入到編碼器中。

3.2.多頭注意力

編碼器的第一個操作是多頭注意力,與Transformer和GPT中不同的是,不計算[PAD]的注意力,會將[PAD]對應位置的注意力分數設置為一個非常小的值,使之經過softmax后為0。

多頭注意力的輸出維度[32,128,768]。

3.3.MLP

與Transformer和GPT中的一致,MLP的輸出維度[32,128,768]。

3.4.輸出

編碼器的輸出[32,128,768],但我們只需要[CLS]對應的輸出[32,768]。

二分類損失

通過另一個線性層[768,2]將開頭的[CLS]的輸出[32,768]映射成[32,2],表示屬于正負類的概率,然后與標簽[32,]計算交叉熵損失。

02、微調任務2:問答

問答任務通常是給定一個段落和一個問題,模型需要從段落中找出答案的起始位置和結束位置。

從零實現大模型-BERT微調 -AI.x社區

示例

假設我們有一個段落和一個問題:

段落:"BERT is a model developed by Google for natural language processing tasks. It stands for Bidirectional Encoder Representations from Transformers."

問題:"Who developed BERT?"

我們需要從段落中找出答案的起始位置和結束位置。在這個例子中,答案是 "Google",它在段落中的位置如下:

  • 起始位置:6 (第7個詞,"Google")
  • 結束位置:6 (第7個詞,"Google")

超參數
max_seq_length = 128
EMB_SIZE = 768//詞嵌入維度
HIDDEN_SIZE = 768 
BATCH_SIZE = 32 #batch size
NUM_HEADS = 4 //頭的個數

1.訓練數據

  • 輸入預處理
  • 將段落和問題轉換為BERT的輸入格式:[CLS] 問題 [SEP] 段落 [SEP]。

從零實現大模型-BERT微調 -AI.x社區

  • 例如:[CLS] Who developed BERT? [SEP] BERT is a model developed by Google for natural language processing tasks. It stands for Bidirectional Encoder Representations from Transformers. [SEP]
  • 分詞和ID轉換
  • 使用BERT的分詞器將輸入序列分詞,并將其轉換為輸入ID、注意力掩碼和類型ID。

本文轉載自公眾號人工智能大講堂 

原文鏈接:??https://mp.weixin.qq.com/s/6MRC88ICo9yR7w1eOeTZiA??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
久久无码专区国产精品s| 自拍偷拍亚洲在线| 久草免费福利在线| 蜜桃久久一区二区三区| 国产美女一区| 日韩性xxxx爱| 97精品人妻一区二区三区蜜桃| 免费h在线看| 国产精品欧美久久久久无广告| 亚洲japanese制服美女| 日本道在线观看| 久久麻豆精品| 日韩国产精品亚洲а∨天堂免| 8x8x最新地址| 91高清视频在线观看| 91丨九色porny丨蝌蚪| 国产中文日韩欧美| 久久久久久久黄色片| 日韩a一区二区| 亚洲第一中文字幕| 中文字幕 日韩 欧美| 两个人看的在线视频www| 国产精品每日更新| 久久精品国产精品青草色艺| 国产精品毛片久久久久久久av| 国产日韩欧美在线播放不卡| 裸体女人亚洲精品一区| 成人性生交大免费看| 2023国产精华国产精品| av中文字幕播放| 日本成人在线网站| 欧美日韩一区二区在线 | 国产精品美女久久福利网站| 久久99精品久久久久久秒播放器 | 国产乱人伦精品一区| 欧美三级日韩三级| 秋霞无码一区二区| 91cn在线观看| 国产精品白丝在线| 日韩国产美国| 你懂的视频在线观看| av在线不卡免费看| 99爱精品视频| 国产情侣一区二区| 久久电影网站中文字幕| 国产成人a亚洲精品| 国产精品午夜影院| 亚洲国产黄色| 国内精品久久久久影院 日本资源| 午夜剧场免费在线观看| 日韩欧美大片| 色香阁99久久精品久久久| 欧美18—19性高清hd4k| 亚洲美女久久| 亚洲欧美一区二区三区四区| 久久国产精品无码一级毛片| 日韩一级电影| 日韩精品www| 三上悠亚ssⅰn939无码播放 | 日韩精品一区二区三区色偷偷| 日韩欧美在线观看一区二区| 久久综合九色综合欧美98| 国产中文一区二区| 婷婷综合激情网| 99久久夜色精品国产网站| 国产伦一区二区三区色一情| 天天干天天色天天| 2022国产精品视频| 欧美日韩日本网| 二区在线视频| 国产精品久久久久久久久搜平片 | 91老司机在线| www.97av| aaa欧美日韩| 久久久久国产精品视频| 蜜桃成人在线视频| 亚洲国产激情av| 中文字幕欧美日韩一区二区三区| v片在线观看| 午夜电影网一区| 激情网站五月天| 成人在线视频免费看| 51久久夜色精品国产麻豆| 可以看的av网址| 亚洲电影一级片| 在线看日韩av| 天天天天天天天天操| 在线日本高清免费不卡| 国产精品va在线播放我和闺蜜| 中文字幕黄色av| 国产成人精品免费视频网站| 久久久久久久久久久久久久久久av | www亚洲视频| 蜜桃久久av一区| 岛国视频一区免费观看| 男人的天堂在线| 亚洲欧美日韩在线播放| 久久久久久久中文| 成人日韩av| 精品国产乱码久久久久久图片| 一本色道综合久久欧美日韩精品| 97久久夜色精品国产| 久久久久久国产三级电影| 无码视频在线观看| 国产精品综合久久| 久久一区二区三区av| 免费大片黄在线观看视频网站| 亚洲成人1区2区| www.久久av.com| 日本午夜精品| 欧美裸体xxxx极品少妇| 亚洲永久精品一区| 成人av综合一区| 在线一区高清| 婷婷激情一区| 精品粉嫩aⅴ一区二区三区四区| www亚洲色图| 99热这里只有精品8| 国产在线观看不卡| 久青草国产在线| 亚洲一区二区在线免费观看视频| 色婷婷成人在线| 性人久久久久| 午夜精品久久久久久久男人的天堂| 亚洲无码精品在线播放| www日韩大片| 男人添女荫道口图片| avtt久久| 少妇激情综合网| 日本黄色一级视频| 99视频精品在线| 996这里只有精品| 国产95亚洲| 日韩在线视频免费观看| 中文字幕xxxx| 26uuu色噜噜精品一区| 屁屁影院ccyy国产第一页| 日韩福利在线观看| 中文一区二区视频| 久草手机在线视频| 97久久精品人人做人人爽| 亚洲色成人www永久在线观看| 91精品一区| 日韩视频免费在线观看| 国产又大又粗又长| 亚洲国产精品精华液ab| 88av.com| 北条麻妃国产九九九精品小说| 欧美资源在线观看| 日韩a在线看| 欧美性生交xxxxx久久久| 强迫凌虐淫辱の牝奴在线观看| 黄色日韩精品| 国模精品一区二区三区| 涩涩视频在线| 亚洲欧洲日产国产网站| 国产成人a v| 欧美韩国日本一区| www.超碰97.com| 五月激情综合| av成人在线电影| 欧美草逼视频| 日韩成人在线免费观看| 亚洲婷婷综合网| 国产亚洲综合在线| 男女视频在线看| 中国精品18videos性欧美| 亚洲专区国产精品| 成人性生交大片免费看网站| 亚洲成年人在线| 国产成人无码av| 国产精品污网站| 杨幂一区二区国产精品| 精品二区久久| 免费看成人av| 欧美性aaa| 欧美激情亚洲综合一区| 偷拍自拍在线| 欧美视频中文字幕| 91杏吧porn蝌蚪| 成人91在线观看| caopor在线视频| 成人看的羞羞网站| 亚洲va久久久噜噜噜| 狠狠躁少妇一区二区三区| 一区二区三区美女xx视频| a级片在线播放| 精品久久香蕉国产线看观看gif| 国内精品卡一卡二卡三| 国产一区二区视频在线播放| 久操网在线观看| 黑人操亚洲人| av一区和二区| 亚洲一区二区三区四区| 欧美老妇交乱视频| 久草福利在线视频| 日韩一区二区三区三四区视频在线观看| 久久午夜免费视频| 亚洲天堂中文字幕| 三上悠亚ssⅰn939无码播放 | 黄色成人影院| 精品视频www| 国产三级精品在线观看| 色综合久久综合网97色综合| 久久国产波多野结衣| 久久女同精品一区二区| 中文字幕第22页| 日韩福利视频导航| 日本一本中文字幕| 日韩综合网站| 欧美日本亚洲| av综合网站| 国产一区视频在线播放| 一区二区乱码| 欧美极品美女电影一区| 天堂地址在线www| 日韩精品在线免费| www日本高清| 欧美精品v国产精品v日韩精品 | 欧美精品一区二区三区蜜臀| 中文在线资源天堂| 欧美日韩在线免费观看| 免费视频一二三区| 亚洲欧洲另类国产综合| 国产一区二区三区四区五区六区| 不卡在线观看av| wwwxxx色| 国内不卡的二区三区中文字幕| 精品久久久久久久无码| 亚洲在线视频| 青娱乐自拍偷拍| 亚洲网站视频| 成人av在线不卡| 欧美在线三区| 黄色网zhan| 久久久久免费av| 亚洲在线观看一区| 日韩精品久久久久久久电影99爱| 欧美人xxxxx| 偷拍一区二区| 欧美日韩一区在线播放| 欧美日韩一区二区三区四区不卡| 国产精华一区二区三区| 日韩精品一级| 999在线观看免费大全电视剧| 24小时成人在线视频| 国产有码在线一区二区视频| 亚洲精品成人一区| 91精品啪在线观看麻豆免费| www.久久久.com| 成人免费网站在线| 中文字幕日本一区| 亚洲a区在线视频| 日韩精品一区二区三区中文在线| 亚洲aⅴ男人的天堂在线观看| 麻豆精品久久| 在线精品高清中文字幕| 韩国三级在线观看久| 亚洲色图第一页| xxxxx日韩| 久久精品2019中文字幕| 成人a在线视频免费观看| 欧美成人精品在线播放| 欧美男男video| 69av成年福利视频| 精品91久久| 国产精品三级美女白浆呻吟| 2020国产精品小视频| 99久久99久久| 日韩欧美在线精品| 亚洲欧洲精品在线| 综合久久一区| 黄色一级视频片| 日韩成人一级大片| 黄色片免费网址| 大尺度一区二区| 国产精品无码久久久久久| 中国av一区二区三区| 超碰在线国产97| 偷窥少妇高潮呻吟av久久免费| 无码人妻一区二区三区免费| 欧美日韩aaaaa| 欧美一级片免费| 中文字幕视频一区二区在线有码| 久cao在线| 欧美一区二区三区四区在线| 国产精品66| 国产精品久久久久久久久久直播 | www.国产在线播放| 日韩激情在线观看| 一起草最新网址| 久久理论电影网| 麻豆精品一区二区三区视频| 欧美午夜片在线免费观看| 一卡二卡三卡在线观看| 亚洲成人精品久久久| 香港伦理在线| 97精品视频在线播放| 日本一区二区三区中文字幕| 国产一区二区三区高清视频| 国产精品99在线观看| 精品欧美一区免费观看α√| 精品影院一区二区久久久| 免费观看一级一片| 日韩毛片高清在线播放| 国产精品100| 日韩一区二区精品| 国产视频网址在线| 国模精品视频一区二区三区| 99国内精品久久久久| 免费av一区二区三区| 国产精品大片| 中文字幕12页| 欧美韩国一区二区| 国产精品21p| 欧美精品一区二区精品网| 自拍视频在线网| 日韩女在线观看| 性欧美lx╳lx╳| 欧美成人精品免费| 激情都市一区二区| 久久视频精品在线观看| 日韩欧美国产视频| 国精品人妻无码一区二区三区喝尿 | 欧美国产综合| 亚洲无在线观看| 中文字幕不卡一区| 亚洲毛片一区二区三区| 亚洲韩国青草视频| 美洲精品一卡2卡三卡4卡四卡| 成人性生交xxxxx网站| 久久电影院7| 少妇网站在线观看| 国产欧美一区二区三区在线老狼| 久久艹免费视频| 亚洲国产日韩精品在线| 色在线视频网| 都市激情久久久久久久久久久| 亚洲色图88| 久久精品久久99| 亚洲色图20p| 国产av无码专区亚洲a∨毛片| 久久久av电影| 国产精选久久| 青青草综合视频| 国产另类ts人妖一区二区| 中国毛片直接看| 日韩视频在线观看一区二区| 直接在线观看的三级网址| 91精品国自产在线观看| 欧美在线高清| 日韩精品人妻中文字幕有码| 婷婷国产在线综合| 日本护士...精品国| 5566日本婷婷色中文字幕97| 国产不卡av一区二区| 无码少妇一区二区三区芒果| 欧美激情一区不卡| 国产一区二区小视频| 欧美精品中文字幕一区| 视频在线观看免费影院欧美meiju| 99久久免费观看| www.成人在线| 日韩精品久久久久久免费| 伊人久久久久久久久久| 久久久久久久性潮| 91成人在线视频观看| 成人网在线免费视频| 美日韩一二三区| 中文字幕日韩专区| 欧美日韩午夜电影网| 欧美不卡在线播放| 国产亚洲va综合人人澡精品| 一本色道久久综合亚洲| 久久99久久99精品中文字幕| 欧美日韩精品一区二区三区在线观看| 欧美牲交a欧美牲交aⅴ免费真 | 免费人成视频在线| 精品亚洲一区二区三区在线观看| 精品裸体bbb| 国产尤物av一区二区三区| 97久久久精品综合88久久| 中文字幕人妻色偷偷久久| 美乳少妇欧美精品| 无码日韩精品一区二区免费| 色一情一区二区| 亚洲成在线观看| 成人高清免费观看mv| 99在线观看| 日韩精品国产欧美| 强行糟蹋人妻hd中文| 亚洲图片在区色| 亚洲一区二区三区日本久久九| 黑森林福利视频导航| 亚洲女性喷水在线观看一区| 天堂资源最新在线| 成人免费网视频| 日韩精品欧美精品| 国产亚洲精品久久久久久无几年桃 | 久久久精品国产一区二区三区|