精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

訓練14分鐘,超越Alpaca!華人團隊發布「飛天羊駝」,基于LLM的數據過濾新范式

人工智能 新聞
最近,來自馬里蘭、三星和南加大的研究人員提出了一種利用LLM自動識別和刪除低質量數據的數據選擇策略——AlpaGasus,不僅在測試中優于原始的Alpaca,而且訓練速度更快。

近期,指令微調(IFT)已經被作為預訓練大語言模型(LLMs)獲得指令遵循能力的關鍵訓練階段。

然而,廣泛使用的IFT數據集(例如,Alpaca的52k數據)卻包含許多質量低下的實例,這些實例帶有錯誤或無關的回應,對IFT產生了誤導和不利影響。

先前的處理方法主要依靠人工篩選這些低質量數據,但這既費時費力,又難以擴展。

因此,如何以高效、自動化的方式過濾出這些低質量數據,成為提升LLM微調效果的關鍵所在。

現在,來自馬里蘭大學,三星和南加大的研究人員提出了一種有效的數據過濾策略,使用強大的LLM(例如,ChatGPT)自動識別和移除低質量數據,以改善指令微調(IFT)的效果。

圖片圖片

論文地址:https://arxiv.org/abs/2307.08701

項目地址:https://lichang-chen.github.io/AlpaGasus/

在這項工作中,研究者提出的模型AlpaGasus,使用從52k Alpaca數據中過濾出來的9k高質量數據進行微調。

AlpaGasus在多個測試集上顯著優于原始的Alpaca,其13B版本甚至在測試任務上的表現超過了90%的教師模型(即,Text-Davinci-003)。

并且,AlpaGasus在訓練時間上也實現了5.7倍的提升,將7B版本的訓練時間從80分鐘縮短到了14分鐘。

更少數據,訓練更強「羊駝」

具體來說,研究者利用強大的LLM(如ChatGPT)自動評估每個(指令,輸入,回應)元組的質量,對輸入的各個維度如Accurac、Helpfulness進行打分,并過濾掉分數低于閾值的數據。

打分的prompt如下:

圖片圖片

方法的pipeline如下:

圖片

實驗部分

在實驗部分,作者使用了一組全面且多樣化的測試集對他們提出的語言模型AlpaGasus進行了評估。

這個全面的評估集包含了來自Self-instruct、Vicuna、WizardLM和Koala的測試集。每一個測試集都提供了不同的指令,減少了評估偏差,提供了對AlpaGasus性能的全面概述。

作者們將AlpaGasus與四種最近的LLMs進行了比較:Alpaca、Text-Davinci-003、ChatGPT和Claude。

性能評估

對于性能的評估,作者們采用了GPT-4作為裁判來評估和比較不同模型對一組指令的回復。

為了解決GPT-4裁判的位置偏差,作者們對兩種順序(即,將AlpaGasus的回復置于基線模型的回復之前/之后)都進行了嘗試,最終得分基于兩次得分的「勝-平-負」準則。

結果分析

在結果部分,作者強調——數據的質量比數量更重要。

這一點通過AlpaGasus-9k與AlpaGasus-52k在所有測試集上的優異表現得到了證明,盡管前者使用的訓練數據明顯少于后者。

作者還將AlpaGasus-9k和使用從Alpaca數據集中隨機挑選出9k數據訓練的模型進行了對比。

為了研究閾值對IFT的影響,作者比較了AlpaGasus和在應用較低閾值(4.0)選出的39k數據上微調的LLaMA。

結果顯示,只用9k高質量數據訓練的模型會顯著好于用39k質量一般數據訓練的模型。

消融實驗部分,作者從選出訓練AlpaGasus的9k數據中隨機抽取3k和6k數據,并使用相同的訓練腳本從LLaMA微調兩個AlpaGasus的變體。

在所有四個測試集上,AlpaGasus在9k數據上的訓練表現最好,這表明更多的高質量數據會導致更好的IFT模型。

細節評估

此外,作者還對AlpaGasus模型在WizardLM和Vicuna測試集的各項技能/類別進行了細致的評估。

首先,作者比較了AlpaGasus-7B(9k)和Alpaca-7B(52k)在WizardLM測試集上的表現。

結果顯示,AlpaGasus在29項技能中的22項上表現得比Alpaca好或相同,但在剩余的7項技能,例如編程(如代碼生成)方面,AlpaGasus并未表現出優勢。

作者發現,這可能是由于在數據選擇和過濾過程中,沒有指定技能類別的比例,導致與編程相關的數據被過濾的比例(88.16%)比平均過濾比例(82.25%)高很多。因此,這導致編程技能比其他技能弱。

也就是說,在IFT中,保持訓練數據在不同類別之間的多樣性和平衡性非常重要。

接下來,作者進一步比較了AlpaGasus-13B(9k)和Alpaga-13B(52k)在WizardLM測試集上的表現。

其中,結果與7B模型的觀察結果一致,AlpaGasus在大多數技能上仍然優于Alpaca。

這表明,即使模型大小增加,數據質量仍然優于數據量。

在對Vicuna測試集的分析中,AlpaGasus-7B在大多數類別上,包括反事實、角色扮演、知識和通用等方面,都優于Alpaca-7B。而且,當基模型規模擴大時,這一結論仍然成立。

然后,作者比較了AlpaGasus、text-Davinci-003、ChatGPT和Claude。結果顯示,AlpaGasus-13B可以達到其教師模型text-Davinci-003 (text-Davinci-003被用來生成Alpaca-52k指令數據) 的90%的能力.

成本節約

在成本節約部分,作者比較了AlpaGasus和Alpaca的訓練成本,考慮到在AWS上所需的計算費用。

對于7B模型,使用9k數據的AlpaGasus的訓練成本為4.78美元,使用52k數據的Alpaca的訓練成本為27.31美元。

對于13B模型,使用9k數據的AlpaGasus的訓練成本為40.96美元,而使用52k數據的Alpaca的訓練成本為225.28美元。

這顯示出,作者的數據選擇策略在模型規模擴大時,可以帶來更顯著的訓練成本節約。

總結

本文提出的數據過濾方法在可擴展性和自動化方面表現出顯著的優勢,證明了精心管理訓練數據質量可以帶來IFT性能的顯著提升以及計算成本的大幅節省。

數據選擇和評估策略也可以廣泛應用于其他的指令微調數據集和LLMs,為大語言模型的實際部署開辟了新的研究方向。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-01-02 06:30:58

ChatGPTGPT-3.5

2025-01-06 07:05:00

2024-04-11 07:10:59

大語言模型AI人工智能

2023-05-22 09:28:30

模型AI

2023-06-15 14:00:00

研究模型

2025-06-13 09:29:51

2025-03-31 08:15:00

LLM大型語言模型人工智能

2024-01-29 09:40:00

AI訓練

2023-09-17 17:51:43

Android 14

2023-10-12 12:13:16

AI訓練

2018-03-23 11:33:56

協同過濾程序算法

2009-11-05 10:55:22

Visual Stud

2013-12-11 10:00:14

C++新特性C

2016-10-28 14:34:26

MacBook Pro蘋果升級

2015-11-17 16:22:22

桌面虛擬化深信服

2023-09-26 22:12:13

數據倉庫Doris

2020-08-28 13:02:17

布隆過濾器算法

2025-07-17 14:23:03

2013-02-26 09:35:35

IBM數據分析算法

2015-09-18 19:38:01

BlackHatSQLChop
點贊
收藏

51CTO技術棧公眾號

国产美女视频一区| 亚洲激情中文| 欧美在线高清视频| 在线视频不卡一区二区| 国产sm主人调教女m视频| 亚洲精选久久| 最近2019好看的中文字幕免费 | 午夜亚洲精品| 精品国产一区二区三区久久久狼 | 真实新婚偷拍xxxxx| 91tv官网精品成人亚洲| 亚洲加勒比久久88色综合| 蜜臀av免费观看| 2001个疯子在线观看| 国产丝袜在线精品| 99c视频在线| 九九热最新视频| 亚洲午夜极品| www.xxxx精品| 97人妻精品一区二区免费| 精品入口麻豆88视频| 色先锋久久av资源部| www.18av.com| 黄网在线观看| 91在线视频观看| 91九色视频在线观看| 波多野结衣视频免费观看| 亚洲婷婷在线| 欧美成人精品在线视频| 日本免费www| 亚洲最好看的视频| 亚洲精品国产免费| 91av免费观看| 国产精品一区二区精品视频观看| 日本大香伊一区二区三区| 青青青青在线视频| a毛片在线看免费观看| 国产欧美日韩久久| 欧美资源一区| 青青青草网站免费视频在线观看| 成人一区二区三区| 亚洲www视频| 国产理论视频在线观看| 人人精品人人爱| 国产精品第1页| 波多野结衣一二区| 日韩有码一区二区三区| 欧美做受高潮电影o| 日韩特黄一级片| 1024成人| 97碰在线观看| 日韩 欧美 综合| 在线欧美一区| 91高清免费视频| 日韩免费一级片| 亚洲片区在线| 3344国产精品免费看| 97人人澡人人爽人人模亚洲| 亚洲国产高清一区二区三区| 久久久久这里只有精品| 欧美成人精品欧美一| 在线电影一区二区| 欧美黄色免费网站| 国产精品23p| 国产欧美成人| 国产99久久精品一区二区 夜夜躁日日躁| 奇米影视第四色777| 亚洲欧洲视频| 日韩av免费网站| 伊人久久成人网| 精品在线播放免费| 97久草视频| 婷婷丁香花五月天| 久久久国产精品不卡| 午夜精品区一区二区三| 日本在线天堂| 夜夜亚洲天天久久| 日本网站免费在线观看| 日韩大片欧美大片| 欧美军同video69gay| 成人免费黄色av| 乱中年女人伦av一区二区| 亚洲美女视频网| 91制片厂在线| 亚洲国产专区| 国产精品第8页| 国产xxxx孕妇| 久久嫩草精品久久久久| 亚洲一二区在线| 男人添女人下部高潮视频在线观看| 亚洲国产精品精华液网站| 草草久久久无码国产专区| 666av成人影院在线观看| 欧美美女一区二区三区| 久久免费精品国产| 成人羞羞网站入口免费| 久久99国产综合精品女同| 99热只有这里有精品| 日韩成人一区二区| 国产高清精品一区| 国产精品影院在线| 一区二区三区在线看| 无码人妻丰满熟妇区毛片18| av国产精品| 亚洲欧美激情视频| 欧美三根一起进三p| 免费看黄裸体一级大秀欧美| 91九色蝌蚪国产| 欧美美女搞黄| 亚洲综合视频在线观看| 欧美婷婷精品激情| 日韩最新在线| 欧美成人网在线| 乱子伦一区二区三区| 不卡av免费在线观看| 一本一生久久a久久精品综合蜜| 蜜乳av一区| 欧美日韩大陆一区二区| 色天使在线视频| 国产一区二区三区四区三区四| 国产精品旅馆在线| 青青草超碰在线| 亚洲一级二级在线| 亚洲欧美天堂在线| 菠萝蜜一区二区| 777国产偷窥盗摄精品视频| 国产白浆在线观看| 中文字幕一区不卡| 日韩av手机版| 九一亚洲精品| 91精品国产乱码久久久久久蜜臀| av网站在线观看免费| 欧美国产丝袜视频| 久久久久免费精品| 亚洲黄页在线观看| 欧美亚洲另类制服自拍| 女人18毛片水真多18精品| ...中文天堂在线一区| 四季av一区二区| 波多野结衣在线播放一区| 日产日韩在线亚洲欧美| 欧美一区二区黄片| 亚洲国产精品精华液网站| 91精品国产高清91久久久久久 | 欧美深夜福利视频| 中文字幕区一区二区三| 欧美成人精品激情在线观看 | 亚洲国产精品电影| 日本少妇在线观看| 播五月开心婷婷综合| 久久久亚洲精品无码| 嫩草国产精品入口| 日本欧美一二三区| 国产高清一区在线观看| 欧美制服丝袜第一页| 成年人免费观看视频网站| 视频在线在亚洲| 日本成人黄色| 成人免费视频观看| 中文字幕在线日韩| 国产精品九九九九| 亚洲精品视频免费看| 久久无码专区国产精品s| 欧美日韩伊人| 精品免费一区二区三区蜜桃| 亚洲国产福利| 一区二区三区 在线观看视| 欧美三级网站在线观看| 中文字幕日本不卡| 青青草精品在线| 亚洲高清资源| 久久久久久国产精品免费免费| 周于希免费高清在线观看| 亚洲欧美在线看| 中文字幕一区二区三区四区视频| 亚洲天天做日日做天天谢日日欢| 91亚洲一区二区| 国产精品普通话对白| 视频在线精品一区| 亚洲视频国产精品| 欧美性一区二区三区| www.在线播放| 日韩精品一区二区三区视频| 日韩精品一卡二卡| 欧美激情综合在线| 91精产国品一二三| 日日夜夜免费精品| 51xx午夜影福利| 网红女主播少妇精品视频| 国产色视频一区| 1024在线看片你懂得| 亚洲视频欧洲视频| 国产v片在线观看| 欧美视频在线观看 亚洲欧| 青青草华人在线视频| 福利电影一区二区| 蜜臀av免费观看| 亚洲经典在线| 日产精品高清视频免费| 精品国产亚洲一区二区三区大结局| 国内精品久久久久久久久| xxxxx日韩| 亚洲精品成人久久电影| 一本色道久久综合无码人妻| 亚洲午夜一区二区| 亚洲精品电影院| 成人免费高清在线观看| 在线视频日韩一区| 亚洲国产一区二区三区a毛片| 午夜欧美性电影| 日韩高清电影免费| 91国产丝袜在线放| 日韩中文视频| 国内伊人久久久久久网站视频| av电影在线观看网址| 精品成人在线观看| 国产精品亚洲lv粉色| 色老汉av一区二区三区| 国产在线观看免费av| 国产精品午夜春色av| v天堂中文在线| 国产精品白丝jk黑袜喷水| 婷婷丁香激情网| 国产精品一页| 久久久久久久久久网| 自产国语精品视频| 一级日韩一区在线观看| 国产毛片一区二区三区| 国产亚洲精品久久飘花| 亚洲日本va| 亚洲综合中文字幕在线| 亚洲精品第一| 国产欧美在线播放| 欧洲成人一区| 97国产suv精品一区二区62| 成年人网站在线| 麻豆国产va免费精品高清在线| 在线国产情侣| 正在播放欧美一区| 91黑丝在线观看| 色呦呦视频在线观看| 久久人体大胆视频| 国产三级视频在线| 国产午夜精品全部视频在线播放| 色就是色亚洲色图| 日韩电影视频免费| 欧美亚洲日本| 亚洲欧美精品一区| 天天干天天舔天天射| 亚洲成人av片在线观看| 亚洲女同志亚洲女同女播放| 日韩欧美的一区二区| www.激情五月.com| 精品国产自在久精品国产| 精品国精品国产自在久不卡| 日韩你懂的在线观看| 欧美视频一二区| 亚洲成人网av| 深夜福利视频一区| 亚洲欧美日韩精品久久亚洲区| 国产视频网址在线| 日韩日本欧美亚洲| a毛片在线播放| 91爱视频在线| 免费成人美女女| 国产在线999| 亚洲高清999| 久久精品二区| 日韩伦理视频| 精品久久久无码人妻字幂| 激情综合在线| 免费午夜视频在线观看| 美女视频黄免费的久久| 日韩av影视大全| 成人免费毛片嘿嘿连载视频| 欧美黑人欧美精品刺激| 中文字幕不卡在线观看| 特级片在线观看| 狠狠做深爱婷婷久久综合一区 | 国产精品久久国产精品| 日韩极品在线| 中文字幕99| 亚洲黄色天堂| 伊人影院综合在线| 成人看片黄a免费看在线| 国产又爽又黄无码无遮挡在线观看| 日本一区二区三级电影在线观看 | 欲求不满的岳中文字幕| 国产色91在线| 精品无码一区二区三区电影桃花| 色综合色综合色综合| 国产欧美一级片| 国产视频精品在线| 黄色网址在线免费观看| 欧美一级大片视频| 成人污版视频| 欧美在线激情| 亚洲三级观看| 午夜激情影院在线观看| 91美女在线视频| 欧美日韩在线观看免费| 欧美三级视频在线观看| 亚洲欧美强伦一区二区| 中文字幕亚洲情99在线| 国产一二三在线| 亚洲一区二区三区乱码aⅴ蜜桃女| 女一区二区三区| 日本成人在线不卡| 久久国产精品色婷婷| 性久久久久久久久久| 亚洲在线视频免费观看| 在线免费观看高清视频| 日韩av影视在线| 伊人手机在线| 国产在线不卡精品| 国产在线日韩精品| av7777777| 99久久夜色精品国产网站| 我家有个日本女人| 欧美日韩一区三区四区| 你懂的好爽在线观看| 久久久之久亚州精品露出| 久久伊人久久| 日韩视频在线观看视频| 日本成人在线电影网| 青青草福利视频| 精品久久久久久中文字幕一区奶水| 国产黄频在线观看| www国产精品视频| 粉嫩91精品久久久久久久99蜜桃 | 成人观看高清在线观看免费| 中文字幕精品影院| 欧美视频在线观看网站| 国产成人高清在线| 欧美成人精品欧美一级| 777色狠狠一区二区三区| 91电影在线播放| 国产精品久久久久久亚洲影视| 啪啪亚洲精品| 人妻丰满熟妇av无码区app| 久久久精品国产免大香伊| 国产乱国产乱老熟| 亚洲欧美国产精品| 欧美xxxxxx| 午夜精品一区二区在线观看 | 日本少妇xxx| 亚洲欧美另类久久久精品2019| 91片黄在线观看喷潮| 久久精品人人爽| 日韩不卡在线视频| 国产精品久久久久9999爆乳| 国产.精品.日韩.另类.中文.在线.播放| 唐朝av高清盛宴| 精品国产乱码久久久久久蜜臀| 四虎影视成人| 精品久久久久久中文字幕动漫| 日韩图片一区| 成人性生交大免费看| 欧美三级视频在线观看| 免费黄网站在线播放| 91精品视频一区| 亚洲私拍自拍| 成人国产精品久久久网站| 在线免费观看日本欧美| 亚洲麻豆精品| y111111国产精品久久婷婷| 激情欧美一区二区三区| 鲁大师私人影院在线观看| 91九色02白丝porn| 黄色网页在线免费看| 999视频在线免费观看| av不卡在线| www成人啪啪18软件| 欧美一级片在线看| ririsao久久精品一区| 欧美二区三区| 久久99久久99| 日韩av在线天堂| 国产一区二区三区在线播放免费观看 | 97精品欧美一区二区三区| 九九久久成人| 香蕉视频xxx| 色综合久久久久综合体桃花网| 尤物网址在线观看| 国产乱码精品一区二区三区中文 | 91精品1区| av2014天堂网| 欧美日韩高清不卡| 免费h在线看| 国产四区在线观看| 97精品久久久午夜一区二区三区| 欧美另类高清videos的特点| 久精品免费视频| 国产一区二区三区日韩精品| 91性高潮久久久久久久| 欧美性xxxx极品hd欧美风情| www免费在线观看| 日韩精品欧美一区二区三区| 国产99久久久国产精品潘金| 国产精品51麻豆cm传媒|