精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擊敗整個(gè)羊駝家族,Meta AI自對齊新方法只需極少人工標(biāo)注數(shù)據(jù)

人工智能 新聞
大語言模型需要大量人工標(biāo)注的指令數(shù)據(jù)進(jìn)行微調(diào),而現(xiàn)在模型可自動(dòng)從網(wǎng)絡(luò)語料庫未標(biāo)記的文本中推理出指令。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

人工標(biāo)注數(shù)據(jù)告急?

Mata新方法僅用少量種子數(shù)據(jù),就構(gòu)建了一個(gè)高質(zhì)量的指令遵循( instruction following)語言模型。

換言之,大語言模型需要大量人工標(biāo)注的指令數(shù)據(jù)進(jìn)行微調(diào),而現(xiàn)在模型可自動(dòng)從網(wǎng)絡(luò)語料庫未標(biāo)記的文本中推理出指令。

然后用自己生成的指令數(shù)據(jù)進(jìn)行訓(xùn)練,堪比自產(chǎn)自銷。

并且用這種方法訓(xùn)練出的模型在Alpaca基準(zhǔn)測試上,超越開源羊駝及其一系列衍生模型

LeCun發(fā)推認(rèn)為該研究在模型自對齊方面具有轟動(dòng)性:

用網(wǎng)友的一句話總結(jié):

羊駝開始自我訓(xùn)練了。

圖片

兩句話總結(jié)是這樣?jì)饍旱模?/p>

原本需要指令>響應(yīng)數(shù)據(jù)集(需要人工標(biāo)注),現(xiàn)在只需要簡單訓(xùn)練一個(gè)“反向模型”做響應(yīng)>指令。任何文本可隨意轉(zhuǎn)換為指令數(shù)據(jù)集。

還有網(wǎng)友發(fā)出靈魂拷問:

是只有我一個(gè)人,覺得這看起來像是通往超級智能的道路?如果你不需要額外的高質(zhì)量外部數(shù)據(jù),就能獲得越來越智能的LLM,那么這就是一個(gè)自我改進(jìn)的封閉系統(tǒng)。

也許只需要一種強(qiáng)化學(xué)習(xí)系統(tǒng)來提供信號,然后LLM自身的迭代就可以完成其余的工作。

羊駝:我自己搞數(shù)據(jù)訓(xùn)練了一頭鯨

這種可擴(kuò)展的新方法叫做指令回譯,Mata為用這種方法訓(xùn)練出的模型起了個(gè)名字——Humpback(座頭鯨,又稱駝背鯨)。

(研究人員表示,之所以起這么個(gè)名字,是因?yàn)樗婉橊劚车年P(guān)系,而且鯨魚體型更大,對應(yīng)模型規(guī)模更大)

訓(xùn)練一個(gè)Humpback的步驟簡單來說就是,從少量標(biāo)注數(shù)據(jù)開始,使用語言模型生成未標(biāo)注文本所對應(yīng)的指令,形成候選訓(xùn)練數(shù)據(jù)。再用模型評估數(shù)據(jù)質(zhì)量,選擇高質(zhì)量數(shù)據(jù)進(jìn)行再訓(xùn)練。然后重復(fù)該過程,進(jìn)一步改進(jìn)模型。

圖片

如上圖所示,需要準(zhǔn)備的“材料”有:

  • 一個(gè)基礎(chǔ)模型——LLaMa
  • 一個(gè)由Open Assistant數(shù)據(jù)集中的3200個(gè)示例構(gòu)成的種子數(shù)據(jù)(Seed Data),每個(gè)示例包括一個(gè)指令和對應(yīng)的輸出。
  • 從ClueWeb語料中抽取了502K段已去重、過濾、刪除了潛在低質(zhì)量段落的未標(biāo)注文本(Unlabeled Data)。

標(biāo)注示例和語料來源都有了,下一步就是自增強(qiáng)(Self-augment)階段。

研究人員用種子數(shù)據(jù)對基礎(chǔ)模型LLaMa進(jìn)行了微調(diào),獲得指令預(yù)測模型。然后用這個(gè)指令預(yù)測模型,為未標(biāo)注文本推理出一個(gè)候選指令。之后組合候選指令與文本(指令-輸出對),作為候選增強(qiáng)訓(xùn)練數(shù)據(jù),也就是上圖中的Augmented Data A。

但還不能用A的數(shù)據(jù)直接訓(xùn)練,因?yàn)槲礃?biāo)注文本本身質(zhì)量參差不齊,生成的候選指令也存在噪聲。

所以需要關(guān)鍵的自管理(Self-curate)步驟,使用模型預(yù)測數(shù)據(jù)質(zhì)量,選擇高質(zhì)量樣本進(jìn)行訓(xùn)練。

圖片

具體來說,研究人員使用僅在種子數(shù)據(jù)上微調(diào)的指令模型對候選數(shù)據(jù)打分。滿分五分,分?jǐn)?shù)較高的才會(huì)被挑選出來作為下一輪的候選數(shù)據(jù)。

為了提高模型指令預(yù)測質(zhì)量,研究人員用候選數(shù)據(jù)迭代訓(xùn)練了模型,在迭代訓(xùn)練中,數(shù)據(jù)質(zhì)量也會(huì)越來越好。

此外,在組合種子數(shù)據(jù)和增強(qiáng)數(shù)據(jù)微調(diào)模型時(shí),他們還使用不同的系統(tǒng)提示標(biāo)記區(qū)分了這兩個(gè)數(shù)據(jù)源:

  • 種子數(shù)據(jù)使用提示“Answer in the style of an AI Assistant.”
  • 篩選數(shù)據(jù)使用提示“Answer with knowledge from web search.”

進(jìn)行兩輪迭代后,最終模型就新鮮出爐啦。

合并兩種訓(xùn)練數(shù)據(jù):1+1>2

下面再來看看研究人員的分析結(jié)果:

圖片

△種子數(shù)據(jù)和增強(qiáng)數(shù)據(jù)的指令多樣性。內(nèi)圈是常見的根動(dòng)詞,外圈是與其對應(yīng)的常見名詞。

上圖是用8%種子數(shù)據(jù)和13%的增強(qiáng)數(shù)據(jù)統(tǒng)計(jì)的指令多樣性。

可以很直觀地看到,在長尾部分增強(qiáng)數(shù)據(jù)多樣性更強(qiáng),且增強(qiáng)數(shù)據(jù)與現(xiàn)有的人工標(biāo)注種子數(shù)據(jù)相輔相成,補(bǔ)充了種子數(shù)據(jù)中未出現(xiàn)的類型。

其次,研究人員比較了三個(gè)增強(qiáng)數(shù)據(jù)集:Augmented data,all(無自管理)、圖片數(shù)據(jù)更少但質(zhì)量更高的圖片

實(shí)驗(yàn)觀察到,盡管數(shù)據(jù)集變小,但伴隨著訓(xùn)練數(shù)據(jù)質(zhì)量的提升模型性能也有了很好的提升。

圖片

△使用自篩選評估不同數(shù)據(jù)大小和質(zhì)量的自增強(qiáng)數(shù)據(jù)。y軸表示在使用給定數(shù)據(jù)大小和質(zhì)量微調(diào)LLaMa 7B時(shí)與text-davinci-003的勝率。

(text-davinci-003,一種基于GPT-3的指令遵循模型,使用強(qiáng)化學(xué)習(xí)在人類編寫的指令數(shù)據(jù)、輸出、模型響應(yīng)和人類偏好上進(jìn)行了微調(diào))

最后來看一下Alpaca排行榜上的結(jié)果。Humpback在不依賴蒸餾數(shù)據(jù)的情況下,表現(xiàn)明顯優(yōu)于其它方法,并且縮小了與專有模型之間的差距。

非蒸餾(Non-distilled),指不依賴于任何外部模型作為任何形式監(jiān)督的訓(xùn)練模型;蒸餾(Distilled),指在訓(xùn)練過程中引入更強(qiáng)大的外部模型,例如使用從外部模型蒸餾的數(shù)據(jù);專有(Proprietary),指使用專有數(shù)據(jù)和技術(shù)進(jìn)行訓(xùn)練的模型。

圖片

△相對于text-davinci-003的勝率

在與開源模型LIMA 65B、Guanaco 65B、Falcon-Instruct 40B和專有模型davinci-003、Claude的比較中,Humpback的表現(xiàn)也都更符合人類偏好。

圖片

此外,研究人員還指出了該方法的局限性:

由于用于訓(xùn)練的文本數(shù)據(jù)來自網(wǎng)絡(luò)語料庫,微調(diào)后的模型可能會(huì)放大網(wǎng)絡(luò)數(shù)據(jù)的偏差。雖然和基礎(chǔ)模型相比,微調(diào)后的模型提高了檢測偏差的準(zhǔn)確性。然而,這并不意味著會(huì)完全解決這個(gè)問題。

傳送門:https://arxiv.org/abs/2308.06259(論文鏈接)

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2023-08-15 14:05:27

AI模型

2015-08-21 09:14:40

大數(shù)據(jù)

2024-10-23 19:47:54

2014-02-26 10:53:10

2023-03-24 08:16:50

3D模型分割人工標(biāo)注

2023-04-25 17:13:03

模型AI

2021-09-27 10:12:42

欺騙防御rMTD網(wǎng)絡(luò)攻擊

2023-07-06 15:29:52

數(shù)據(jù)中心能源回收

2023-05-22 09:28:30

模型AI

2010-04-01 09:30:57

2022-07-07 10:47:16

IngressKubernetes

2019-07-12 13:50:36

物聯(lián)網(wǎng)大數(shù)據(jù)安全

2018-10-07 07:00:59

2023-05-05 18:45:21

Python人工智能機(jī)器學(xué)習(xí)

2023-07-25 14:08:41

羊駝模型

2023-09-25 10:04:37

模型AI

2025-02-06 07:26:35

2024-01-23 17:33:36

2009-07-31 08:56:59

ASP.NET頁面刷新

2011-08-16 11:44:15

散熱數(shù)據(jù)中心服務(wù)器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久久精品日产第一区二区三区精品版| 久久av中文字幕| 中文字幕国产传媒| 男人的天堂在线视频免费观看 | 色偷偷久久人人79超碰人人澡| 亚洲国产婷婷香蕉久久久久久99 | 国产91在线观看丝袜| 97在线免费视频| 制服丨自拍丨欧美丨动漫丨| 日韩中文字幕无砖| 日本高清不卡一区| av无码久久久久久不卡网站| aaa在线观看| 成人高清av在线| 国产精品三级网站| 国产成人无码精品亚洲| 亚洲国产不卡| 亚洲少妇中文在线| 日韩av无码一区二区三区不卡| 久久精品资源| 日本高清不卡aⅴ免费网站| 日韩一二区视频| www在线播放| 96av麻豆蜜桃一区二区| 99久久伊人精品影院| 中文字幕一区2区3区| 在线亚洲欧美| 欧美人与性动交| 日本二区三区视频| 国模吧精品视频| 亚洲激情在线观看| 精人妻一区二区三区| **欧美日韩在线| 欧美中文字幕亚洲一区二区va在线| 免费人成在线观看视频播放| 黄色片网站在线| 欧美激情一区二区在线| 欧美13一14另类| 欧美一级视频免费| 成年人午夜久久久| av免费观看久久| 精品人妻aV中文字幕乱码色欲| 男人操女人的视频在线观看欧美| 午夜精品福利在线观看| 精品在线视频观看| 欧美激情日韩| 色综合色综合久久综合频道88| 久久人妻无码aⅴ毛片a片app| 狠狠色狠狠色综合婷婷tag| 亚洲摸下面视频| 丰满少妇高潮一区二区| 蜜臀av免费一区二区三区| 日韩精品在线观| 泷泽萝拉在线播放| 免费观看久久av| 亚洲精品综合久久中文字幕| 久久无码人妻精品一区二区三区| 日韩电影不卡一区| 亚洲毛片在线免费观看| 可以直接看的无码av| 同性恋视频一区| 亚洲人成在线观看| gv天堂gv无码男同在线观看| 成人激情开心网| y97精品国产97久久久久久| 午夜成人亚洲理伦片在线观看| 99视频精品全部免费在线视频| 久久夜色精品国产欧美乱| 国产免费久久久久| 欧美日韩a区| 羞羞色国产精品| 在线永久看片免费的视频| 日韩激情一二三区| 91香蕉亚洲精品| 俄罗斯嫩小性bbwbbw| 91浏览器在线视频| 亚洲在线观看一区| 欧洲性视频在线播放| 精品久久久久久国产91| 久久精品网站视频| 精品国产一区二区三区2021| 亚洲成人999| 日本一道本视频| 午夜欧美精品| 国产97在线|亚洲| 国产情侣在线播放| 91日韩在线专区| 中文字幕在线亚洲精品| av免费不卡国产观看| 在线免费精品视频| 久久久久久无码精品人妻一区二区| 精品久久ai| 色婷婷av一区二区三区久久| 精品无码人妻一区二区三区| 日韩高清一区二区| 国产66精品久久久久999小说| 青青青草原在线| 亚洲免费观看在线观看| 欧美色图另类小说| 日韩精品成人在线观看| 亚洲日韩中文字幕| 九九视频在线免费观看| 蜜桃精品在线观看| 久久精品人人做人人爽电影| 成人日日夜夜| 欧美在线一二三| 成熟妇人a片免费看网站| 成人精品电影| 日本精品在线视频| 韩国av在线免费观看| 国产精品福利一区| 97国产精东麻豆人妻电影| 免费看一区二区三区| 亚洲三级黄色在线观看| 精品人妻在线播放| 精品亚洲成a人| 日本不卡一区二区三区视频| 草草在线视频| 精品国产99国产精品| 成人免费毛片xxx| 青草av.久久免费一区| 久久国产日韩欧美| 精品极品在线| 精品久久久久久最新网址| 黑人操日本美女| 青青草97国产精品免费观看 | 亚洲字幕一区二区| 18免费在线视频| 欧美性一级生活| 成人乱码一区二区三区av| 欧美久久99| 亚洲一区二区免费在线| 免费av网站在线看| 欧美日韩一区高清| 国产探花视频在线播放| 久久伊人亚洲| 美女黄毛**国产精品啪啪| 色在线视频观看| 日韩禁在线播放| av大片免费在线观看| 成人精品鲁一区一区二区| 黄色特一级视频| 五月亚洲婷婷| 久久久久久一区二区三区| www.久久久久久| 亚洲欧美激情在线| 野花视频免费在线观看| 欧美精品福利| 国产精品v欧美精品v日韩| 女人黄色免费在线观看| 精品国产91九色蝌蚪| 国产无套在线观看| 99视频精品全部免费在线| 欧美视频在线播放一区| 西野翔中文久久精品国产| 国产www精品| 在线中文资源天堂| 337p亚洲精品色噜噜| 天天看片中文字幕| 成人一区二区在线观看| 久久久久久久激情| 欧美日韩激情| 92福利视频午夜1000合集在线观看| 国产激情视频在线| 亚洲成人教育av| 亚洲熟女综合色一区二区三区| 欧美极品少妇xxxxⅹ高跟鞋| 中文字幕日韩综合| 欧美日韩亚洲一区在线观看| 国产一区二区久久久| 91看片一区| 欧美乱大交xxxxx| 深夜福利在线观看直播| 91黄色激情网站| 91精品少妇一区二区三区蜜桃臀| 国产v日产∨综合v精品视频| 国产91对白刺激露脸在线观看| 精品理论电影在线| 97夜夜澡人人双人人人喊| 日本午夜大片a在线观看| 中文字幕日韩有码| 成 人 黄 色 片 在线播放| 欧美日韩中文字幕| 亚洲精品久久久久久国| 成人高清伦理免费影院在线观看| 国产福利影院在线观看| 欧美特黄视频| 亚洲二区自拍| 加勒比色综合久久久久久久久| 国产精品99蜜臀久久不卡二区| 国产精品实拍| 亚洲美女av黄| www日本在线| 欧美综合久久久| 国产真人真事毛片| 国产精品第五页| 国产精品815.cc红桃| 韩国精品一区二区| 国产综合免费视频| 亚洲无线视频| 自拍偷拍99| 亚洲精品播放| 国产精品久久久久久久久久久久午夜片| 忘忧草在线www成人影院| 欧美激情第一页xxx| 色的视频在线免费看| 日韩精品视频观看| 成人激情四射网| 欧美日韩不卡一区二区| 亚洲GV成人无码久久精品| 一个色妞综合视频在线观看| 黄色激情小视频| 国产日韩欧美精品一区| 国产精品一级黄片| 国产成人av一区二区三区在线观看| 男人女人黄一级| 久久成人国产| 欧美精品自拍视频| 欧美日韩国产精品一区二区亚洲| 亚洲精品视频一区二区三区| 免费欧美一区| 久久99精品久久久久久青青日本| 欧州一区二区三区| 成人av资源在线播放| 成人亚洲网站| 国产精品视频最多的网站| 日韩精品影片| 国产ts人妖一区二区三区| 自拍偷拍欧美视频| 奇米4444一区二区三区| 国产直播在线| 2019中文字幕免费视频| 大菠萝精品导航| 7m第一福利500精品视频| 国产丝袜精品丝袜| 欧美精品xxx| 国产理论电影在线| 午夜精品国产精品大乳美女| 阿v视频在线观看| 69影院欧美专区视频| 极品在线视频| 91大神在线播放精品| 老牛影视精品| 国产成人av在线| 影音成人av| 国产欧美精品一区二区| 热久久久久久| 亚洲一区中文字幕| 久久99成人| 成人自拍偷拍| 国产精品极品国产中出| 狠狠色综合网站久久久久久久| 国内精品偷拍| 欧美精品一区二区三区久久| 激情五月综合| 亚洲一一在线| 欧美午夜电影在线观看| 欧美激情视频免费看| 国产模特精品视频久久久久| 情侣黄网站免费看| 蜜桃视频一区二区三区在线观看| 亚洲欧美自拍另类日韩| 国内精品写真在线观看 | 972aa.com艺术欧美| 一级黄色性视频| 国产精品久久久久影院| 国产大学生自拍| 岛国视频午夜一区免费在线观看 | xxxcom在线观看| 51ⅴ精品国产91久久久久久| 日韩不卡视频在线观看| 91精品啪aⅴ在线观看国产| 成人在线tv视频| 日本一区视频在线播放| 一区二区中文字| 大陆极品少妇内射aaaaa| 蜜臂av日日欢夜夜爽一区| 久久久久99人妻一区二区三区| proumb性欧美在线观看| 老司机福利在线观看| 一区二区三区在线观看欧美| 中文字幕在线观看视频网站| 7777精品久久久大香线蕉| 深夜福利视频网站| 日日骚久久av| 色戒汤唯在线观看| 成人免费淫片视频软件| 一区二区三区视频免费观看| av动漫免费观看| 国产亚洲一级| 91视频福利网| 久久精品一区蜜桃臀影院| 欧美日韩综合一区二区| 色婷婷综合久久久久中文| www.精品视频| 这里只有精品在线播放| av电影院在线看| 成人免费在线网址| 综合亚洲色图| 日韩精品一区二区在线视频| 奇米色一区二区三区四区| 国产一线在线观看| 亚洲男女毛片无遮挡| 日韩精选在线观看| 亚洲韩国青草视频| v天堂福利视频在线观看| 国产成人一区二区三区电影| av动漫精品一区二区| 福利网在线观看| 日韩高清一区二区| aaaaaav| 一区二区三区美女| 中文字幕人成人乱码亚洲电影| 日韩精品在线观看视频| 91超碰在线免费| 92国产精品久久久久首页 | 黑人糟蹋人妻hd中文字幕| 黑人巨大精品欧美黑白配亚洲| 久久久久久久久久久久| 午夜不卡av在线| 亚洲国产成人一区二区| 不卡av电影院| www.欧美| 国产对白在线播放| 麻豆91在线看| 人妻互换一区二区激情偷拍| 在线日韩av片| 成年人视频在线观看免费| 日韩免费观看在线观看| 日本亚洲不卡| 一女被多男玩喷潮视频| eeuss国产一区二区三区 | 91亚洲精品丁香在线观看| 国产电影一区二区在线观看| 免费一级特黄录像| 欧美高清在线一区二区| 中文有码在线播放| 国产一区二区三区在线看| 美女色狠狠久久| 日日噜噜噜噜夜夜爽亚洲精品| 久久亚洲色图| 国产免费无遮挡吸奶头视频 | 国产又粗又猛又色又| 久久久999国产精品| 国产精品毛片无码| 路边理发店露脸熟妇泻火| 国产乱对白刺激视频不卡| 日韩精品123区| 日韩欧美高清一区| 爱看av在线入口| 久久riav| 日韩影院在线观看| 成人一级黄色大片| 日韩欧美一级片| 福利成人导航| 免费99视频| 美国一区二区三区在线播放| 麻豆一区在线观看| 91麻豆精品国产91久久久久 | 亚洲图片欧美色图| 婷婷综合激情网| 国产99在线|中文| 久久在线电影| 亚洲av无码成人精品区| 岛国av一区二区在线在线观看| 久草在线青青草| 成人精品一区二区三区| 精久久久久久| 亚洲午夜福利在线观看| 欧美视频一区二区三区四区 | 亚洲精品高清在线观看| 日韩一级片免费在线观看| 日韩美女视频在线观看| 久久综合国产| 日本在线不卡一区二区| 在线影视一区二区三区| av大全在线| 鲁鲁狠狠狠7777一区二区| 美女国产一区二区| 久久精品波多野结衣| 亚洲免费一级电影| 国产va免费精品观看精品| 无码人妻丰满熟妇区96| 亚洲视频你懂的| 亚洲三级中文字幕| 成人精品久久一区二区三区| 亚洲三级电影在线观看| 丁香六月激情综合| 亚洲国模精品一区| 国产精品麻豆| 日韩视频在线免费看| 亚洲美女精品一区| 国产最新视频在线| 成人欧美一区二区三区视频| 日本强好片久久久久久aaa| 国产性70yerg老太| 精品国产拍在线观看| 欧美激情极品| 免费人成视频在线播放| 欧美丝袜第三区|