精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM對齊數據全自動合成!UW華人博士生提出Magpie方法,Macbook Air即可運行

人工智能 新聞
華盛頓大學和Allen AI最近發表的論文提出了一種新穎有趣的數據合成方法。他們發現,充分利用LLM的自回歸特性,可以引導模型自動生成高質量的指令微調數據。

數據對LLM訓練而言是至關重要的存在,但我們的關注點往往放在訓練和評估數據,而會忽略微調數據。

比如Llama系列模型,雖然開放了權重(如Llama-3-Instruct),但微調數據集依舊是私有的。

LLM的成功有很大一部分取決于指令微調(instruction fine-tuning),這個過程能讓模型更好地泛化到訓練過程中沒有接觸過的任務。

正如訓練的有效性依賴于訓練語料的質量,指令微調的有效性也取決于能否獲得高質量的指令數據集。

然而,相比于無標注的自監督訓練語料,高質量微調和對齊數據集更加難以構建、擴展,因為需要更多人工標注,而且存在預先定義的提示范圍。

就連專門為AI科技巨頭提供數據的公司Scale AI,在目前階段都無法實現自動化標注,甚至得高薪聘請專業人士參與微調和對齊數據集的構建。

Scale AI的CEO Alexandr Wang曾表示,LLM合成數據是一個很有前景的解決方案。

最近,華盛頓大學和研究機構Allen AI聯合發表的一篇論文就專注于如何讓對齊過的LLM合成高質量的微調數據。

圖片

論文地址:https://arxiv.org/abs/2406.08464

論文提出的方法實現了全流程的自動化,不需要任何種子問題。更為驚艷的是,代碼不僅能在本地運行,而且用LLM自動生成了非常可靠的高質量數據。

他們用Llama-3-8B的Base模型在自己生成的SFT數據集上微調后,得到了比官方微調版本Llama-3-Instruct性能更強的模型。

圖片

論文得到了AI圈大佬Sebastian Raschka的轉發背書。

圖片

起初,他也不相信這種方法真的能夠在MacBook Air上本地運行,但親自嘗試后驚喜地發現,真的可以。

圖片

Raschka是多本技術暢銷書的作者,包括《從頭開始構建大語言模型》、《Python機器學習》等,他目前擔任Lightning AI的研究工程師。

圖片

圖片

論文的第一作者Zhangchen Xu是華盛頓大學網絡安全實驗室的二年級博士生,師從Radha Poovendran教授,研究興趣是機器學習的安全性、隱私性和公平性,目前關注如何構建可信LLM。

圖片

那就讓我們仔細探究一下,這種高效的數據合成方法究竟如何實現。

方法概述

典型的LLM輸入一般由3個部分組成:

- 查詢前模版(pre-query template)

- 查詢內容(query)

- 查詢后模版(post-query template)

其中的兩個模版一般由模型開發者預先定義,以保證正確地提示模型。

比如Llama-2-chat的輸入形式就是:


[INST] Hi! [/INST]


在之前的研究中,通常有兩種方法構建微調數據集。一是直接讓人類手動制作,顯然既耗時間又耗資源。二是從少量人工注釋的種子指令開始,通過提示調用LLM以合成更多指令。

第二種方法雖然節省人力,但非常考驗提示工程的水平,以及對初始種子問題的選擇。換言之,很難實現可控的大規模擴展。

更為致命的問題是,合成的指令往往與種子指令十分接近,這會嚴重影響大規模數據集的多樣性。用可擴展的方式,創建高質量且多樣化的指令數據集,依舊是LLM領域具有挑戰性的問題。

但作者在早期實驗中的有一個有趣的發現:由于LLM的自回歸特性,只輸入查詢前模版時,模型會自動合成查詢,而且從內容來看,似乎有不錯的質量和多樣性。這表明它能夠有效利用對齊過程中學習到的能力。

以此為啟發,作者提出如下思路構建指令數據集:使用查詢前模版作為提示,輸入給對齊過的LLM,自動生成指令數據。

如下圖所示,每個指令數據實例包含一個或多個指令-響應對(instructon-response pair),且會規定指令提供者(provider)與遵循者(follower)的角色。

圖片

圖1描述了整個數據自動生成的pipeline,大體分為兩個步驟。

首先是指令生成。MAGPIE方法將查詢內容構建為LLM預定義指令模版的格式,但只包含指令提供者(如user),不包含具體的指令內容。

以此作為LLM輸入,模型就會以自回歸的方式生成指令。由于不需要特定的提示工程技巧,也沒有使用任何種子問題,這個流程確保了生成指令的多樣性。

第二步驟中,MAGPIE將之前生成的指令再輸入給LLM,得到響應內容。

將以上兩個步驟進行重復迭代,就能夠得到多輪的指令數據。如果想針對某個特定領域生成數據,加上相應的提示即可實現。

圖片

得到原始的生成結果后,作者還根據文本長度、任務類別、輸入質量、輸入難度等指標進行了過濾。

圖片

論文分別使用Llama-3-8B-Instruct和Llama-3-70B-Instruct兩個模型,構建了兩個數據集MAGPIE-Air和MAGPIE-Pro,并在附錄中給出了生成指令的示例:

圖片

可以看到,文本質量的確不錯,完全可以與人類撰寫的指令水平相當。

然而,想評估如此龐大規模數據的質量不能只依靠主觀感受,于是作者對生成的指令數據集MAGPIE-Pro進行了定量分析。

數據集分析

覆蓋度

要考量指令文本的多樣化程度,一個有效指標是文本嵌入的在語義空間中的覆蓋范圍。

作者從MAGPIE-Pro中隨機采樣指令文本,編碼為嵌入向量并用t-SNE方法投影到二維空間,同時采用三個基線數據集作為對比,包括Alpaca、Evol Instruct和UltraChat。

下圖中的每個t-SNE投影點都代表隨機抽取的1萬條指令。可以看到,MAGPIE-Pro的投影基本將其他三個數據集的范圍囊括在內,這表明它提供了更廣泛、多樣化的主題。

圖片

指令屬性

論文使用Llama-3-8B-Instruct模型評估MAGPIE指令數據的各種屬性,比如指令的任務類別、質量、難度、相似性和響應質量。

生成指令的任務類別主要是信息檢索,占比超過一半,也包括創意性寫作、尋求建議、規劃、數學、推理、頭腦風暴編輯等等,與人類用戶的主流需求基本一致。

圖片

指令的質量和難度同樣使用Llama-3-8B-Instruct模型進行自動評估。

可以看到兩個數據集中,大部分實例都被判定為平均水平及以上,MAGPIE-Pro的總體質量優于MAGPIE-Air。

數據集指令難度的分布基本類似,超過60%集中在「簡單」級別,且Pro數據集比Air略具挑戰性。

圖片

通過計算指令相似度,可以從另一個側面評估多樣化程度。論文使用FAISS搜索每個文本嵌入的最近鄰居并計算二者間距離,來衡量相似程度。

響應質量方面,采用FsfairX-LLaMA3-RM-v0.1作為獎勵評估模型,同時以URIAL作為對比的基線模型。獎勵差異為正值表示質量較高,有利于指令微調過程。

圖5b可以看到,MAGPIE的數據分布相比基線模型整體右移且峰值更低,表明整體上響應質量更好。

圖片

安全性

此外,在指令安全性方面,作者采用Llama-guard-2進行自動評估,發現MAGPIE的數據集絕大部分是安全的,但仍然包含了不到1%的有害指令或響應結果。

圖片

結果評估

這項研究最大的亮點之一在于高效的運行成本,以及完全自動化、無需任何人工干預的pipeline。

在創建3M MAGPIE-Air數據集時,用4塊A100 GPU運行1.55小時/50小時即可完成指令/響應的生成。生成1M MAGPIE-Pro數據集則分別需要3.5小時/150小時。

如果在云服務器上運行,成本也非常可觀。每生成1k個實例花費為0.12美元或1.10美元,具體取決于是Air或Pro數據集。

為了真正體現MAGPIE方法的優勢,論文將數據集真正運用到基座模型的微調中,與官方發布的微調版本進行對比。

作者選擇了ShareGPT、Evol Instruct等6個最先進的開源指令微調數據集作為基線。其中ShareGPT和WildChat由人類撰寫,Evol Instruct和UltraChat為合成數據集。

微調的基座模型包括Llama-3和Qwen-1.5,并選取AlpacaEval和Arena-Hard兩個廣泛采用的指標評估性能。

從兩個表格的詳細數據對比中可以發現,無論在哪個基座模型上,MAGPIE方法生成的數據集都有更高質量,優于所有的基線數據集,并且在絕大部分指標上優于官方發布的微調模型。

圖片

圖片

在LLM的scaling law逐漸觸摸到數據墻時,這篇論文的方法為合成數據又打開了一扇希望之門。或許使用精心設計的算法與技巧,LLM合成數據能逐漸成為公開數據集的「中流砥柱」。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-05-26 15:03:54

芯片技術

2025-02-10 08:52:00

2021-02-20 21:04:53

人工智能機器學習技術

2021-07-19 15:02:48

機器人人工智能算法

2020-09-01 13:30:03

人工智能機器學習技術

2023-07-31 09:54:12

2023-07-30 15:22:47

2022-04-08 07:54:40

人工智能核算結果Python

2025-04-21 16:32:29

視覺模型AI

2018-04-09 09:19:08

谷歌開源機器學習

2023-11-20 09:35:00

模型AI

2020-07-15 15:48:04

MacBook Air蘋果產品線

2025-02-17 10:30:00

AI數據研究

2022-08-05 08:41:15

AI自動合成開源

2023-04-06 15:45:00

博士論文

2024-02-28 09:38:43

2023-06-08 11:27:10

模型AI

2023-10-12 16:34:20

Firefox計時器應用

2024-03-11 16:33:26

機器狗訓練

2024-03-12 13:14:58

模型訓練
點贊
收藏

51CTO技術棧公眾號

97人人做人人爱| 欧美亚洲精品一区| 精品国产一区二区三区麻豆小说| 精品黑人一区二区三区观看时间| av免费在线免费观看| 国产一区二区三区在线看麻豆| 伊人av综合网| 日本va中文字幕| 国产调教视频在线观看| 91在线视频观看| 成人观看高清在线观看免费| 久久久久香蕉视频| 伊人精品久久| 欧美伊人久久久久久久久影院| 蜜桃成人在线| 国产视频在线观看免费| 亚洲男女自偷自拍| 欧美成人一二三| 国产一二三四区在线| 国产精品蜜月aⅴ在线| 亚洲国产毛片aaaaa无费看| 亚洲 国产 欧美一区| 秋霞视频一区二区| 国产在线不卡一区| 欧美高清视频在线| 成人精品一二三区| 最近国产精品视频| 亚洲第一级黄色片| 国产又粗又长又爽又黄的视频| 怡红院在线播放| av中文字幕在线不卡| 成人在线国产精品| 亚洲午夜在线播放| 国产视频一区三区| 夜夜嗨av色一区二区不卡| 怡红院一区二区| 精品视频在线一区二区在线| 五月天精品一区二区三区| 最新av在线免费观看| 二区三区在线播放| 久久久久久久av麻豆果冻| 国内一区二区在线视频观看| www五月婷婷| 国内精品写真在线观看| 91精品久久久久久久久不口人| avtt天堂在线| 图片区亚洲欧美小说区| 亚洲成年人影院在线| 亚洲911精品成人18网站| 麻豆视频在线看| 亚洲一区二区三区四区不卡| 麻豆视频传媒入口| h片在线播放| 亚洲男女一区二区三区| 夜夜爽www精品| 国产高清视频在线播放| 国产日韩欧美在线一区| 欧美重口乱码一区二区| 亚洲国产精品无码久久| 国产一区二区日韩精品| 亚洲综合视频1区| www.成人免费视频| 国产成人精品免费网站| 波多野结衣久草一区| 午夜老司机福利| 成人性视频免费网站| 国产精品自拍偷拍| 国产男男gay网站| 三级精品在线观看| 久久久亚洲网站| 日韩字幕在线观看| 久久久久.com| 国产精品一二三在线| 97久久人国产精品婷婷| 国产成人免费xxxxxxxx| 国产伦精品一区二区三区照片| 91亚洲精品国偷拍自产在线观看| 最新国产拍偷乱拍精品 | 在线观看免费视频a| 蜜臀av性久久久久蜜臀aⅴ流畅| 欧美在线视频播放| 欧美三级网站在线观看| 精品在线播放免费| 国产精品久久久久久婷婷天堂 | 色综合久久中文综合久久97| 欧美成人黑人猛交| 伊人久久大香线蕉综合影院首页| 日本韩国一区二区| 中文字幕亚洲影院| 久久不卡日韩美女| 精品久久免费看| 国产全是老熟女太爽了| 无需播放器亚洲| 久久久亚洲网站| 丰满熟女人妻一区二区三| 国产高清在线观看免费不卡| 成人av在线亚洲| 污污视频在线观看网站| caoporn国产精品| 国内精品久久国产| 黄网页在线观看| 自拍偷自拍亚洲精品播放| 少妇人妻无码专区视频| 欧美亚洲人成在线| 亚洲老头同性xxxxx| 国产福利视频网站| 性欧美精品高清| wwwxx欧美| 日韩av中文| 欧美午夜激情在线| 中文字幕在线观看视频www| 精品国产一区二区三区香蕉沈先生| 亚洲男人7777| 久久久久久蜜桃| 另类调教123区 | 欧美日韩成人在线播放| 精品国产午夜福利| 成人自拍视频在线观看| 日本黄色a视频| 欧美日韩精品免费观看视完整| 欧美在线小视频| 91av视频免费观看| 国产伦一区二区三区| 97免费中文视频在线观看| 国产毛片久久久久| 国产精品网站在线播放| 日本一区二区三区四区五区六区| 天堂8中文在线| 欧美日韩精品三区| 蜜桃久久精品成人无码av| 在线一区欧美| 狠狠色噜噜狠狠狠狠色吗综合| 国产网站在线播放| 精品久久久久久中文字幕| 在线观看亚洲免费视频| 欧美在线免费一级片| 91在线视频成人| 精品欧美色视频网站在线观看| 亚洲图片自拍偷拍| 91丨porny丨九色| 免费成人网www| 欧美亚洲成人xxx| 天天爱天天干天天操| 亚洲图片欧美视频| 久久久久99人妻一区二区三区| 成人午夜视频一区二区播放| 国产亚洲自拍一区| 欧美日韩激情视频在线观看| 最新精品在线| 欧美精品videos| 国内老熟妇对白hdxxxx| 亚洲免费观看高清完整 | 99久久精品费精品国产| 欧美精品www| 欧美视频xxxx| 国产午夜一区二区三区| 精品视频在线观看一区二区| 国产午夜久久av| 欧美日韩xxx| 欧美一级一区二区三区| 亚洲欧洲av另类| www.久久com| 最新精品国产| 国产精品一码二码三码在线| heyzo在线欧美播放| 亚洲第一男人av| 免费黄色网址在线| 国产清纯美女被跳蛋高潮一区二区久久w | 九色成人免费视频| www.av导航| 欧美日韩另类视频| 69视频在线观看免费| 久久福利资源站| 成人在线免费观看视频网站| 青草久久视频| 国产精品吴梦梦| 婷婷色在线播放| 国产婷婷97碰碰久久人人蜜臀| 久久久久久久国产视频| 久久99精品久久久久久动态图| 欧美日韩在线不卡一区| av在线中出| 亚洲香蕉在线观看| 国产美女裸体无遮挡免费视频| 欧美激情一区二区三区蜜桃视频 | 日韩欧美三级电影| 91精品网站在线观看| 中文字幕欧美精品在线| 国产极品久久久| 色综合天天天天做夜夜夜夜做| 亚洲激情 欧美| 国内视频精品| 日韩精品欧美在线| 一区二区三区欧洲区| 日本精品免费观看| 美女做暖暖视频免费在线观看全部网址91 | 亚洲激情视频一区| 国产午夜一区二区三区| 亚洲区 欧美区| 日韩av电影一区| 免费高清一区二区三区| 国产精品极品在线观看| 国产精品久久久久久久一区探花| 在线中文资源天堂| 亚洲福利视频久久| 国产精品九九九九| 玉足女爽爽91| 成人精品aaaa网站| 中文字幕求饶的少妇| 成人免费av在线| 狠狠躁狠狠躁视频专区| 欧美码中文字幕在线| 国产福利一区二区三区在线观看| 国产欧洲在线| 欧美成人免费播放| 国产youjizz在线| 亚洲精品成人久久久| 国产黄色av片| 欧美精品在线视频| 免费一级a毛片夜夜看| 中文字幕不卡一区| 欧美熟妇一区二区| 成人美女视频在线观看| 欧美性受xxxx黒人xyx性爽| 人人狠狠综合久久亚洲| 黑人巨大国产9丨视频| 国产成人久久| 欧美成熟毛茸茸复古| 成人涩涩网站| 成人免费视频网站| 日韩精品一区二区三区中文| 91精品国产91久久久久久| 国产在线观看免费| 欧美夫妻性生活| 亚洲视频在线免费播放| 欧美系列在线观看| 亚洲乱码国产乱码精品| 精品久久久久久亚洲精品| 久久精品国产亚洲av麻豆色欲| 国产亚洲人成网站| 亚洲成人网在线播放| 国产一区二区伦理片| 99精品视频国产| 国产欧美三级| 男人天堂1024| 亚洲综合不卡| 日本黄网站免费| 四虎在线观看| 国产精品原创巨作av| 青青草原国产在线视频| 蜜桃视频一区二区三区在线观看| www插插插无码视频网站 | 欧美人xxxx| 亚洲中文字幕在线观看| 欧美日韩三级视频| 国产精品视频久久久久久| 69堂成人精品免费视频| 国产免费视频一区二区三区| 欧美一级生活片| 亚洲精品国产精| 欧美日本一区二区三区| 91影院在线播放| 日韩欧美国产一区二区在线播放| 亚洲av无码精品一区二区| 欧美中文字幕一区| 亚洲天堂免费av| 日韩一二三四区| 婷婷五月综合久久中文字幕| 欧美一二三四区在线| 亚洲精品一区二区三区蜜桃| 亚洲精品97久久| shkd中文字幕久久在线观看| 久久精品视频va| av在线网页| 国产成+人+综合+亚洲欧洲| 91超碰免费在线| 国产成人精品久久| 精品视频在线一区| 久久精品国产第一区二区三区最新章节| 欧美专区一区| 久久精品国产一区二区三区不卡| 国产毛片久久久| 日本一区免费观看| 午夜免费一区| 欧美老熟妇喷水| 久久精品国产77777蜜臀| 精品国产免费久久久久久婷婷| 国产a久久麻豆| 黄色aaa视频| 亚洲日本在线天堂| 无码人妻精品一区二区三区夜夜嗨 | 久久国产电影| 日韩免费av片在线观看| 一区二区三区回区在观看免费视频| 国产日产亚洲系列最新| 亚洲的天堂在线中文字幕| 懂色av中文在线| 欧美国产精品人人做人人爱| 亚洲欧洲美洲av| 91精品视频免费| 欧美人妖视频| 中文字幕在线观看一区二区三区| 日韩久久电影| 精品无码一区二区三区在线| 美腿丝袜一区二区三区| 五月天激情小说| 专区另类欧美日韩| 波多野结衣影片| 亚洲高清久久网| 哥也色在线视频| 国产精品99久久久久久人| 哺乳挤奶一区二区三区免费看| 国产99午夜精品一区二区三区 | 污影院在线观看| 国产精品999999| 欧美做受69| 青青草综合在线| 久久国产精品99久久久久久老狼| 五月天丁香花婷婷| 成人综合在线视频| av最新在线观看| 亚洲综合成人网| 91在线视频国产| 亚洲深夜福利在线| 久草免费在线| 国产精品无av码在线观看| 亚洲精品动态| 国产伦精品一区二区三区四区视频_| 久久久精品性| 欧美色图亚洲激情| 亚洲午夜私人影院| 国产成人精品av在线观| 精品久久久91| 91精品亚洲一区在线观看| 亚洲欧美日韩另类精品一区二区三区 | 国产乡下妇女做爰视频| 色妞www精品视频| 日韩一区二区三区中文字幕| 久久人人97超碰精品888| 亚洲精品高潮| 日韩欧美猛交xxxxx无码| 久久综合图片| 鲁丝一区二区三区| 色播五月激情综合网| 高清毛片在线看| 国产精品h片在线播放| 亚洲啊v在线免费视频| 日本精品免费视频| 国产一区二区伦理| 欧美成人三级视频| 日韩三级电影网址| 午夜av在线免费观看| 成人动漫视频在线观看完整版 | 高清不卡一区| 9l视频自拍9l视频自拍| 国产麻豆成人传媒免费观看| a级大片在线观看| 一本色道a无线码一区v| 国产视频网站在线| 国产欧美一区二区三区久久 | 亚洲综合国产激情另类一区| 最新中文字幕视频| 欧美在线观看一区| 婷婷激情在线| 99热在线播放| 国产精品一国产精品k频道56| 久草福利在线观看| 亚洲最色的网站| 亚洲av成人精品毛片| 国产精品成人播放| 性人久久久久| 亚洲天堂av线| 国产亚洲精久久久久久| 亚洲图片中文字幕| 欧美日本啪啪无遮挡网站| 欧美绝顶高潮抽搐喷水合集| 欧洲av无码放荡人妇网站| 国产日韩高清在线| 波多野结衣一二区| 久久国产精品首页| 日本福利一区| www.超碰97.com| 国产精品久久久久精k8| 国产高清免费观看| 日韩av电影国产| 亚洲精品极品少妇16p| 免费观看一级一片| 欧美日韩一区二区三区在线看| 高清中文字幕一区二区三区| 51精品国产人成在线观看 | 国产精品久久久久久久久免费高清| 欧洲在线视频一区| 韩国av一区二区三区在线观看| 三上悠亚作品在线观看| 亚洲精品电影在线观看| 国产精品久久久久久久久久齐齐| 一区二区三区av在线| 成人黄色大片在线观看| 在线免费av片| 热re91久久精品国99热蜜臀|