精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型微調技巧 | 高質量指令數據篩選方法-MoDS

發布于 2024-7-16 09:11
瀏覽
0收藏

寫在前面

大家好,我是劉聰NLP。

大模型時代,指令微調已經成了算法工程師們必不可少的技能。而在指令微調過程中,我們往往會從數據數量和數據質量兩個維度來對模型進行調優。

今天給大家帶來一個新的方法-MoDS,一種面向模型的指令數據選擇方法-《MoDS: Model-oriented Data Selection for Instruction Tuning》,核心是從數據質量、覆蓋范圍、必要性三個角度來對原始數據集進行數據過濾,最終獲取對于不同模型的高質量數據集。并且相較于自動識別方法,在使用更少數據的情況下,就可以獲取更好的效果。

paper: https://arxiv.org/pdf/2311.15653.pdf
github: https://github.com/CASIA-LM/MoDS

MoDS方法

MoDS方法主要通過質量、覆蓋范圍、必要性三個指標來進行數據的篩選,其中數據質量是為了保證所選的指令數據的問題和答案都足夠好;數據覆蓋范圍是為了讓所選擇的數據中指令足夠多樣、涉及知識范圍更廣;數據必要性是選擇對于大模型較復雜、較難或不擅長的數據以填補大模型能力的空白。整體流程如下圖所示,

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

質量篩選

對于數據進行質量過濾時,采用OpenAssistant的reward-model-debertav3-large-v2模型(一個基于DeBERTa架構設計的獎勵模型)對數據進行質量打分。講原始數據的Instruction、Input、Output的三個部分進行拼接,送入到獎勵模型中,得到一個評分,當評分超過α時,則認為數據質量達標,構建一份高質量數據集-Data1。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

多樣性篩選

為了避免所選質量數據高度相似,通過K-Center-Greedy算法進行數據篩選,在最大化多樣性的情況下,使指令數據集最小。獲取種子指令數據集(Seed Instruction Data)-SID。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在該步驟中,采用BERT模型為指令數據生成句向量來計算不同數據之間的距離。

必要性篩選

不同的大型語言模型在預訓練過程中所學到的知識和具有的能力不同,因此在對不同的大型語言模型進行指令微調時,所需的指令數據也需要不同。

對于一條指令,如果給定的大型語言模型本身能夠生成較好的回答,則說明給定的大型語言模型具有處理該指令或者這類指令的能力,反之亦然,并且哪些不能處理的指令對于模型微調來說更為重要。

  • 使用SID數據集對模型進行一個初始訓練
  • 用訓練好的初始模型對整個高質數據集-Data1中的指令進行結果預測
  • 利用獎勵模型對結果進行評分,當分值小于β時,說明初始模型不能對這些指令生成優質的回復,不具有處理這些類型指令的能力,獲取必要性數據集-Data2
  • 對Data2進行多樣性篩選,獲取增強指令數據集(Augmented Instruction Data)-AID。

模型訓練

最終利用種子指令數據集和增強指令數據集一起對模型進行指令微調,獲得最終模型。

實驗結果

訓練數據

訓練數據有兩種,一種是單獨的Alpaca數據集(52k),一種時混合數據集(214k),包含HC3數據集、Alpaca數據集、Alpaca-evol-instruct數據集、Dolly-v2數據集、InstructWild數據集和LIMA數據集。

測試數據主要包含5個測試集,分別為Koala數據集(180)、WizardLM數據集(218)、Self-instruct數據集(252)、Vicuna數據集(80)和LIMA數據集(300)。

訓練超參

模型基座采用LLaMA2-7B模型,訓練過程中學習率為2e-5,warmup的比率為0.03,權重衰減為0.0,批大小為128,訓練輪數為3。在質量評價和必要性評價過程中,Alpaca數據集的α和β均設置為0.0,混合數據集的α和β分別設置為1.0和-1.0。

在模型測試過程中,采用ChatGPT和GPT4作為裁判,對模型生成結果從相關性和準確性兩個角度進行打分,每個角度的評分從1到10。在評價兩個模型勝、平、負時,當兩個角度評分都高時為勝;當兩個角度評分一高一低時為平;當兩個角度評分都低時為負。

結果分析

在Alpaca數據集中通過MoDS方法獲取1k數據的效果要優于全量數據訓練的結果,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在Alpaca數據集中MoDS方法在選擇2k數據時,訓練效果優于基于IFD的自動選擇方法,如下表所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

在混合數據及中MoDS方法獲取4k數據的效果全面優于全量數據訓練的結果,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證指令多樣性選擇的重要性,與隨機選擇進行對比,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

驗證必要性篩選的重要性,與僅用種子數據訓練的模型進行對比,如下圖所示。

大模型微調技巧 | 高質量指令數據篩選方法-MoDS-AI.x社區圖片

寫在最后

大模型時代,大多數算法工程師已經變成了數據工程師,如何構造出讓模型表現更好地數據,變成了大家的日常工作,但千萬不要小看這份工作,往往細節決定成敗。

本文轉載自 ??NLP工作站??,作者: 劉聰NLP

已于2024-7-16 09:24:20修改
收藏
回復
舉報
回復
相關推薦
3d动漫精品啪啪一区二区竹菊| 国产精品久久久久久久第一福利| 高清亚洲成在人网站天堂| 日韩少妇一区二区| 成人一区福利| 国产精品久久久久久久岛一牛影视 | 欧美一区二区三区精品| 日本中文字幕亚洲| 国产高清免费av在线| 国产综合久久久久久鬼色| 97香蕉超级碰碰久久免费的优势 | 国产精品每日更新| 97超碰人人模人人爽人人看| 成人精品免费在线观看| 日韩.com| 亚洲精品在线看| 免费观看黄网站| 日本欧美日韩| 亚洲国产精品久久不卡毛片| 亚洲 国产 欧美一区| 日本韩国在线观看| 黄色资源网久久资源365| 2019中文字幕在线免费观看| 成人在线观看高清| 国产亚洲一卡2卡3卡4卡新区| 欧美成人官网二区| 91丨九色丨蝌蚪| 天天免费亚洲黑人免费| 亚洲第一狼人社区| 日本久久高清视频| 日韩成人影视| 国产欧美精品一区二区色综合朱莉 | 亚洲乱码国产乱码精品精| 下面一进一出好爽视频| 成人看片毛片免费播放器| 午夜视频在线观看一区二区| 日本一区二区免费高清视频| 成人免费在线电影| 久久亚洲影视婷婷| 精品无码久久久久久久动漫| www.com欧美| 国产一区在线视频| 成人激情视频网| 亚洲资源在线播放| 蜜臀精品一区二区三区在线观看| 国产成人亚洲综合91精品| 国产成人无码精品亚洲| 亚洲成人在线| 欧美大片网站在线观看| 欧美成人免费观看视频| 天天做综合网| 久久综合网hezyo| 午夜精品一区二区三级视频| 99国产**精品****| yw.139尤物在线精品视频| 欧美日韩国产黄色| 欧美激情电影| 久久人体大胆视频| 欧美丰满熟妇bbbbbb| 91精品久久久久久久久久不卡| 神马久久桃色视频| 国产免费久久久久| 欧美久久成人| 午夜精品一区二区三区av| 在线免费观看毛片| 亚洲欧美春色| 国产精品444| 中文字幕第2页| 久久99精品久久久久久久久久久久 | 亚洲精品tv久久久久久久久| 午夜国产福利在线| 亚洲视频一区二区在线| 成年人三级视频| 麻豆蜜桃在线| 日韩欧美亚洲范冰冰与中字| 熟妇人妻va精品中文字幕| 国产一区二区主播在线| 欧美美女喷水视频| 国产精品一区二区人妻喷水| 日韩理论电影中文字幕| 中文字幕亚洲图片| 欧美性猛交xxxxx少妇| 国产精品观看| 日本一区二区三区在线播放| 在线播放国产一区| 高清久久久久久| 久久精品五月婷婷| 最新国产在线观看| 亚洲一级二级在线| 免费观看成人网| 精品视频一区二区三区在线观看| 精品国产污网站| 蜜桃传媒一区二区亚洲| 欧美99在线视频观看| 6080yy精品一区二区三区| 中文天堂在线资源| 成人精品视频一区二区三区| 图片区小说区区亚洲五月| 怡红院av在线| 在线精品视频小说1| 台湾佬美性中文| 国产探花在线精品| 欧美国产视频一区二区| 亚洲中文无码av在线| 粉嫩13p一区二区三区| 日本一区不卡| 国产91足控脚交在线观看| 欧美主播一区二区三区美女| 久久久久亚洲av无码专区首jn| 国产探花一区二区| 国外成人在线播放| ,一级淫片a看免费| www国产成人| 成人午夜视频免费观看| 免费视频成人| 亚洲欧美在线播放| 久久亚洲国产成人精品性色| 老司机午夜精品99久久| 久久福利电影| 俺来也官网欧美久久精品| 欧美美女黄视频| 三区四区在线观看| 亚洲欧美日本视频在线观看| 99国产视频| 毛片在线视频| 欧美系列一区二区| 精品人伦一区二区三电影 | 国产中文字幕免费观看| 深夜福利一区| 日韩中文字幕免费| 涩涩视频在线观看| 国产亚洲精品久| 大陆极品少妇内射aaaaa| 日韩精品亚洲专区在线观看| 色偷偷91综合久久噜噜| 成人免费一级片| 久久精品一区二区三区不卡牛牛 | 六月丁香婷婷色狠狠久久| 免费精品视频一区二区三区| 国模私拍一区二区国模曼安| 日韩美女在线视频| 欧洲猛交xxxx乱大交3| 国产一区二区三区在线观看免费视频| 日本高清久久一区二区三区| 亚洲一区站长工具| 亚洲精品丝袜日韩| 91video| 久久免费的精品国产v∧| 国产精品999视频| 精品亚洲免a| 91高清免费视频| 久久视频www| 色av一区二区| 一二三四在线观看视频| 日本 国产 欧美色综合| 亚洲精品免费在线看| av一区在线播放| 中文字幕欧美专区| 91麻豆一区二区| 综合久久一区二区三区| 亚洲av毛片在线观看| 欧美a级片一区| 国产区欧美区日韩区| 精品丝袜在线| 亚洲人成网站色ww在线| 最新中文字幕在线观看视频| 国产精品久久久久影院色老大| 亚洲一二区在线观看| 欧美涩涩网站| 久久久久久99| 久久精品国产福利| 精品中文字幕在线观看| 姝姝窝人体www聚色窝| 欧美午夜片在线免费观看| 免费看裸体网站| 国产在线播放一区| 91精品国产91久久久久麻豆 主演| 欧美jizz19性欧美| 国产精品日韩一区| 丝袜在线观看| 亚洲男人天堂网| 国产一区二区自拍视频| 亚洲va欧美va国产va天堂影院| 波多野结衣a v在线| 久国产精品韩国三级视频| 男人天堂av片| 精品国产午夜| 懂色一区二区三区av片 | 国产欧美日韩免费看aⅴ视频| www在线观看播放免费视频日本| 日韩电影在线观看中文字幕 | 男人的天堂亚洲| 一本色道久久综合亚洲精品婷婷 | 亚洲福利在线播放| 中文字幕在线观看国产| 亚洲一区二区四区蜜桃| 在线免费观看视频| 成人avav影音| 亚洲综合av在线播放| 亚洲国产精品第一区二区三区| 欧美视频1区| 日韩最新av| 国产精品一区二区三| 嗯啊主人调教在线播放视频| 中文在线不卡视频| 四虎永久在线观看| 欧美群妇大交群的观看方式| 91九色丨porny丨肉丝| 亚洲人成影院在线观看| 国产一二三四五区| 成人性视频免费网站| 天堂视频免费看| 米奇777在线欧美播放| 亚洲精品天堂成人片av在线播放| 国产欧美日韩| 久久精品一区二区三区不卡免费视频| 精品一区二区三区中文字幕视频| 日本精品视频在线播放| 超级碰碰不卡在线视频| 久久伊人精品视频| 尤物网在线观看| 亚洲女人初尝黑人巨大| 国模私拍视频在线| 日韩一区二区三区在线| 中文字幕第31页| 色播五月激情综合网| 亚洲精品国产精品乱码| 亚洲专区一二三| 国产午夜精品理论片| 中国av一区二区三区| 91精品人妻一区二区三区蜜桃欧美| 丁香婷婷深情五月亚洲| 久久综合在线观看| 黄页网站大全一区二区| 国产亚洲视频一区| 久久国产精品无码网站| 天天爽夜夜爽一区二区三区| 日一区二区三区| 欧美精品色婷婷五月综合| 99视频精品免费观看| 国产综合中文字幕| 亚洲日韩成人| 黄色一级在线视频| 99精品国产在热久久| 精品久久一二三| 国产偷自视频区视频一区二区| 国产美女主播在线播放| 亚洲人成久久| 黄色一级片播放| 久久久夜精品| 欧美性猛交久久久乱大交小说| 天堂一区二区在线免费观看| 免费黄色特级片| 日韩国产精品久久久久久亚洲| 日韩中文字幕免费在线| 奇米777欧美一区二区| 无限资源日本好片| 精品亚洲国产成人av制服丝袜| 欧美一级视频在线| 国产精品一区二区在线播放| 日韩高清一二三区| 成人av网站大全| theav精尽人亡av| 久久精品一区四区| 影音先锋男人资源在线观看| 亚洲色图20p| 久久久久香蕉视频| 疯狂蹂躏欧美一区二区精品| 亚洲 欧美 日韩 在线| 欧美日韩综合在线免费观看| 97国产成人无码精品久久久| 日韩欧美国产wwwww| 天堂网www中文在线| 国产午夜精品全部视频在线播放 | 国产视频一区二区三区在线播放 | 国产综合视频一区二区三区免费| 亚洲图中文字幕| 黄色精品免费看| 午夜精品久久久久久久久久久久| 黑人巨大精品欧美一区二区桃花岛| 国产xxx69麻豆国语对白| 日韩欧美专区| 国产精品久久精品视| 精品国产精品| 国产在线观看欧美| 久久人人精品| 性xxxxxxxxx| 国产午夜精品久久| 欧美日韩一级在线观看| 日韩欧美在线中文字幕| 一本到在线视频| 亚洲高清免费观看高清完整版| 成年在线电影| 久久久久免费精品国产| 91在线亚洲| 国内视频一区二区| 97视频热人人精品免费| 亚洲熟妇av一区二区三区漫画| 蜜桃av一区二区| 西西大胆午夜视频| 专区另类欧美日韩| 久久久久久久久久成人| 日韩欧美国产午夜精品| 91九色在线porn| 668精品在线视频| 日韩激情综合| 伊甸园精品99久久久久久| 国产精品综合| 蜜桃视频无码区在线观看| 欧美国产成人精品| 青青国产在线观看| 日韩女优av电影| 午夜伦理在线| 国产精品久久久久久av福利| 蜜桃一区av| 青草网在线观看| 韩国av一区二区三区在线观看| 素人fc2av清纯18岁| 一区二区三区四区在线免费观看 | 亚洲电影免费观看高清完整版在线观看 | 国产一区二区三区精品视频| 丁香激情五月少妇| 精品久久久久久久久久久| 国产av无码专区亚洲a∨毛片| 中文字幕国产亚洲2019| 另类图片综合电影| 精品国产一二| 亚洲国产影院| 国产免费无码一区二区| 亚洲人午夜精品天堂一二香蕉| 国产又粗又猛又爽又| 亚洲人免费视频| 亚洲优女在线| 欧美日韩另类丝袜其他| 99精品国产在热久久婷婷| 艳妇乳肉亭妇荡乳av| 亚洲线精品一区二区三区| 精品人妻一区二区三区日产乱码| 久久精品视频在线播放| 亚洲人体在线| 日韩精品第1页| 国产精品一区专区| 日韩影院一区二区| 日韩欧美123| 变态调教一区二区三区| 国产精品中出一区二区三区| 黄色成人在线网址| 麻豆精品国产传媒av| 午夜在线电影亚洲一区| 无码国产色欲xxxx视频| 人人爽久久涩噜噜噜网站| 啄木系列成人av电影| 国产情侣av自拍| 国产精品剧情在线亚洲| 91精品中文字幕| 久久国产精品免费视频| 亚洲专区**| 国产av天堂无码一区二区三区| 菠萝蜜视频在线观看一区| 欧美videossex极品| 亚洲人成在线观看| 日本免费成人| 91嫩草国产丨精品入口麻豆| 成人丝袜18视频在线观看| 日韩欧美激情视频| 亚洲天堂第二页| 99er精品视频| 欧美久久久久久久久久久久久久| 成人成人成人在线视频| 无码人妻丰满熟妇奶水区码| 在线日韩中文字幕| 日本免费精品| 91好吊色国产欧美日韩在线| 国产午夜一区二区三区| 国产精品爽爽久久久久久| 欧美精品激情视频| 国产探花一区在线观看| 日韩av福利在线观看| 黄色成人av网| h网站在线免费观看| 97超碰人人模人人爽人人看| 国产精品久久久久9999高清| 一本在线免费视频| 欧美mv和日韩mv国产网站| 波多野结衣久久精品| 国产麻豆电影在线观看| 99久久99久久精品免费观看| 中文字幕人妻一区二区在线视频| 伦理中文字幕亚洲| 九色成人国产蝌蚪91| 欧美大片久久久| 日韩欧美亚洲成人| 日本无删减在线| 午夜精品一区二区三区在线观看| 国产丶欧美丶日本不卡视频| 国产精品久久久久久久久久久久久久久久久 | 在线一区免费| 精品人妻无码一区二区三区| 欧美一级日韩不卡播放免费| 成人欧美大片|