精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

輕松打造家用版GPT-4!微軟開源微調指令集:效果不輸原版,中英雙語都能用

人工智能 新聞
缺數據不是問題,直接用GPT-4生成的指令就夠了,標注員恐怕要失業了!

「指令」(Instruction)是ChatGPT模型取得突破性進展的關鍵因素,可以讓語言模型的輸出更符合「人類的偏好」。

但指令的標注工作需要耗費大量的人力,即便有了開源的語言模型,資金不足的學術機構、小公司也很難訓練出自己ChatGPT.

最近微軟的研究人員利用之前提出的Self-Instruct技術首次嘗試使用GPT-4模型來自動生成語言模型所需的微調指令數據

圖片

論文鏈接:https://arxiv.org/pdf/2304.03277.pdf

代碼鏈接:https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM

在基于Meta開源的LLaMA模型上的實驗結果表明,由 GPT-4生成的5.2萬條英語和漢語instruction-following數據在新任務中的表現優于以前最先進的模型生成的指令數據,研究人員還從GPT-4中收集反饋和比較數據,以便進行全面的評估和獎勵模式訓練。

訓練數據

數據收集

研究人員重用了斯坦福大學發布的Alpaca模型用到的5.2萬條指令,其中每條指令都描述了模型應該執行的任務,并遵循與Alpaca相同的prompting策略,同時考慮有輸入和無輸入的情況,作為任務的可選上下文或輸入;使用大型語言模型對指令輸出答案。

圖片

在Alpaca 數據集中,輸出是使用GPT-3.5(text-davinci-003)生成的,但在這篇論文中,研究人員選擇使用GPT-4來生成數據,具體包括以下四個數據集:

1. 英文Instruction-Following Data:對于在Alpaca中收集的5.2萬條指令,為每一條指令都提供一個英文GPT-4答案。

圖片

未來的工作為遵循迭代的過程,使用GPT-4和self-instruct構建一個全新的數據集。

2. 中文Instruction-Following Data:使用ChatGPT將5.2萬條指令翻譯成中文,并要求GPT-4用中文回答這些指令,并以此建立一個基于LLaMA的中文instruction-following模型,并研究指令調優的跨語言泛化能力。

3. 對比數據(Comparison Data):要求GPT-4對自己的回復提供從1到10的評分,并對GPT-4, GPT-3.5和OPT-IML這三個模型的回復進行評分,以訓練獎勵模型。

圖片

4. 非自然指令的答案:GPT-4的答案是在6.8萬條(指令,輸入,輸出)三元組的數據集上解碼的,使用該子集來量化GPT-4和指令調優后的模型在規模上的差距。

數據統計

研究人員對比了GPT-4和GPT-3.5的英語輸出回復集合:對于每個輸出,都提取了根動詞(root verb)和直接賓語名詞(direct-object noun),在每個輸出集上計算了獨特的動詞-名詞對的頻率。

圖片

頻率高于10的動詞-名詞對

圖片

頻率最高的25對動詞-名詞

圖片

輸出序列長度的頻率分布對比

可以看到,GPT-4傾向于生成比GPT-3.5更長的序列,Alpaca中GPT-3.5數據的長尾現象比GPT-4的輸出分布更明顯,可能是因為Alpaca數據集涉及到一個迭代的數據收集過程,在每次迭代中去除相似的指令實例,在目前的一次性數據生成中是沒有的。

盡管這個過程很簡單,但GPT-4生成的instruction-following數據表現出更強大的對齊性能。

指令調優語言模型

Self-Instruct 調優

研究人員基于LLaMA 7B checkpoint有監督微調后訓練得到了兩個模型:LLaMA-GPT4是在GPT-4生成的5.2萬條英文instruction-following數據上訓練的;LLaMA-GPT4-CN是在GPT-4的5.2萬條中文instruction-following數據上訓練的。

兩個模型被用來研究GPT-4的數據質量以及在一種語言中進行指令調優的LLMs時的跨語言泛化特性。

獎勵模型

從人類反饋中進行強化學習(Reinforcement Learning from Human Feedback,RLHF)旨在使LLM行為與人類的偏好相一致,以使語言模型的輸出對人類更加有用。

RLHF的一個關鍵組成部分是獎勵建模,其問題可以被表述為一個回歸任務,以預測給定提示和回復的獎勵評分,該方法通常需要大規模的比較數據,即對同一提示的兩個模型反應進行比較。

現有的開源模型,如Alpaca、Vicuna和Dolly,由于標注對比數據的成本很高,所以沒有用到RLHF,并且最近的研究表明,GPT-4能夠識別和修復自己的錯誤,并準確判斷回復的質量。

圖片

為了促進對RLHF的研究,研究人員使用GPT-4創建了對比數據;為了評估數據質量,研究人員訓練一個基于OPT 1.3B的獎勵模型,以對不同的回復進行評分:對一個提示和K個回復,GPT-4為每個回復提供一個1到10之間的評分。

實驗結果

在 GPT-4數據上評估以前從未見過的任務的self-instruct調優模型的性能仍然是一項困難的任務。

由于主要目標是評估模型理解和遵守各種任務指示的能力,為了實現這一點,研究人員利用三種類型的評估,并通過研究結果證實,「利用 GPT-4生成數據」相比其他機器自動生成的數據來說是一種有效的大型語言模型指令調優方法。

人類評估

為了評估該指令調優后的大型語言模型對齊質量,研究人員遵循之前提出的對齊標準:如果一個助手是有幫助的、誠實的和無害的(HHH),那它就是與人類評估標準對齊的,這些標準也被廣泛用于評估人工智能系統與人類價值觀的一致性程度。

幫助性(helpfulness):是否能幫助人類實現他們的目標,一個能夠準確回答問題的模型是有幫助的。

誠實性(honesty):是否提供真實信息,并在必要時表達其不確定性以避免誤導人類用戶,一個提供虛假信息的模型是不誠實的。

無害性(harmlessness):是否不會對人類造成傷害,一個產生仇恨言論或提倡暴力的模型不是無害的。

基于HHH對齊標準,研究人員使用眾包平臺Amazon Mechanical Turk對模型生成結果進行人工評估。

圖片

文中提出的兩個模型分別在GPT-4和GPT-3生成的數據上進行了微調,可以看到LLaMA-GPT4以51.2%的占比在幫助性上要大大優于在GPT-3上微調的Alpaca(19.74%),而在誠實性和 無害性標準下,則基本處于平局狀態,GPT-3要略勝一籌。

圖片

在和原版GPT-4對比時,可以發現二者在三個標準上也是相當一致的,即GPT-4指令調優后的LLaMA表現與原始的GPT-4類似。

GPT-4自動評估

受 Vicuna 的啟發,研究人員也選擇用GPT-4來評估不同聊天機器人模型對80個未見過的問題所生成回答的質量,從 LLaMA-GPT-4(7B)和 GPT-4模型中收集回復,并從以前的研究中獲得其他模型的答案,然后要求GPT-4對兩個模型之間的回復質量進行評分,評分范圍從1到10,并將結果與其他強競爭模型(ChatGPT 和 GPT-4)進行比較。

圖片

評估結果顯示,反饋數據和獎勵模型對提高 LLaMA 的性能是有效的;用GPT-4對LLaMA進行指令調優,往往比用text-davinci-003調優(即Alpaca)和不調優(即LLaMA)的性能更高;7B LLaMA GPT4的性能超過了13B Alpaca和LLaMA,但和GPT-4等大型商業聊天機器人相比,仍有差距。

圖片

進一步研究中文聊天機器人的性能時,首先使用GPT-4將聊天機器人的問題也從英文翻譯成中文,用GPT-4獲得答案,可以得到兩個有趣的觀察結果:

1. 可以發現GPT-4評價的相對分數指標是相當一致的,無論是在不同的對手模型(即ChatGPT或GPT-4)和語言(即英語或中文)方面。

2. 僅就GPT-4的結果而言,翻譯后的回復比中文生成的回復表現得更好,可能是因為GPT-4是在比中文更豐富的英文語料庫中訓練的,所以具有更強的英文instruction-following能力。

非自然指令評估(Unnatural Instruction Evaluation)

圖片

從平均ROUGE-L得分來看,Alpaca優于LLaMA-GPT 4和GPT-4,可以注意到,LLaMA-GPT4和GPT4在ground truth回復長度增加時逐漸表現得更好,最終在長度超過4時表現出更高的性能,意味著當場景更具創造性時,可以更好地遵循指令。

在不同的子集中,LLaMA-GPT4跟GPT-4的行為相差無幾;當序列長度較短時,LLaMA-GPT4和GPT-4都能生成包含簡單的基本事實答案的回復,但會增加額外的詞語,使回復更像聊天,可能會導致ROUGE-L得分降低。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-08-15 10:33:06

微軟必應人工智能

2023-04-10 09:23:36

模型AI

2023-05-29 09:29:52

GPT-4語言模型

2024-08-16 11:49:56

2023-06-19 08:19:50

2023-12-26 08:17:23

微軟GPT-4

2023-07-19 21:57:25

Office版微軟企業版

2023-03-28 08:23:38

2025-04-16 09:35:03

2023-09-06 16:44:03

2023-04-11 14:13:23

阿里AI

2023-06-08 11:27:10

模型AI

2023-12-17 22:04:04

微軟GPT-4

2025-05-30 07:40:56

2023-07-19 11:43:59

AIGPT-4

2023-12-27 13:56:00

2024-06-03 10:54:04

2023-08-27 14:44:04

代碼編程語言

2023-03-20 21:44:10

微軟GPT-4AI

2024-01-19 12:51:00

AI數據
點贊
收藏

51CTO技術棧公眾號

国产一区二区三区不卡av| 成人性生交大片免费看午夜| 国产一区二区三区四区老人| 精品国产第一区二区三区观看体验| 狠狠精品干练久久久无码中文字幕| h狠狠躁死你h高h| 国产欧美日韩一级| 在线亚洲欧美视频| 一级日本黄色片| 色戒汤唯在线观看| 亚洲欧美综合另类在线卡通| 国产日韩欧美综合精品| 伊人网免费视频| 在线国产精品一区| 日韩中文在线观看| 亚洲人人夜夜澡人人爽| 色综合视频一区二区三区44| 亚洲成人免费看| 亚洲欧美99| 亚洲色图 校园春色| 六月婷婷色综合| 97在线观看视频| 欧洲美女女同性互添| 麻豆一区二区| 日韩一区二区免费在线电影| 免费激情视频在线观看| 波多野结依一区| 自拍偷拍欧美激情| 色一情一乱一伦一区二区三欧美| 亚洲高清在线观看视频| 麻豆91在线播放| 国产98色在线| 国产精品久久久免费视频| 欧美99久久| 日韩三级影视基地| 卡一卡二卡三在线观看| 天堂一区二区三区四区| 欧美电影免费提供在线观看| 黄色一级片免费的| 日韩制服诱惑| 91久久免费观看| 日韩中文字幕三区| 啊啊啊久久久| 亚洲风情在线资源站| 在线观看污视频| 国产素人视频在线观看| 国产精品视频线看| 色综合电影网| 国产三级在线看| 久久免费视频一区| 蜜桃久久精品乱码一区二区 | 在线亚洲伦理| 久久免费精品视频| 国产精品99精品| 欧美午夜免费影院| 欧美激情三级免费| 豆国产97在线 | 亚洲| 欧美成人69av| 久久久久久久久久久人体| 欧美人妻精品一区二区免费看| 亚洲色图插插| 欧美疯狂xxxx大交乱88av| 欧美黑吊大战白妞| 亚洲视频狠狠| 91高清免费视频| 黄色片视频免费| 秋霞电影一区二区| 91精品国产综合久久久久久久久| 91精品国自产| 国产成人精品三级| 国产精品欧美久久| 亚洲欧美一区二区三| 久久久夜色精品亚洲| 日韩久久久久久久| 丝袜美腿美女被狂躁在线观看| 亚洲欧美偷拍卡通变态| 人妻激情另类乱人伦人妻| av老司机在线观看| 欧美性猛交xxxx黑人猛交| 国产免费999| 99热这里有精品| 精品国产a毛片| 波多野结衣一本| 久久国产亚洲精品| 欧美极品少妇全裸体| 久久精品视频1| 老司机精品视频导航| 成人三级视频在线观看一区二区| 天天操天天插天天射| 国产欧美一区二区在线观看| 最新不卡av| www.色在线| 欧美怡红院视频| 在线播放国产视频| 激情五月综合网| 欧美另类在线播放| 丁香六月婷婷综合| 国产美女娇喘av呻吟久久| 久久精品成人一区二区三区蜜臀| 色哟哟免费在线观看| 亚欧色一区w666天堂| 国产福利一区视频| 91麻豆精品激情在线观看最新| 国产视频亚洲视频| 青草影院在线观看| 久久精品首页| 成人黄色片视频网站| 黄色片在线播放| 亚洲综合免费观看高清完整版在线 | 欧美成人一区二免费视频软件| 欧美在线观看网址综合| 99产精品成人啪免费网站| 久久综合色一综合色88| 青青草原网站在线观看| 欧美色网在线| 亚洲电影在线观看| 少妇人妻丰满做爰xxx| 久久亚洲美女| 国产精品亚洲一区| 黄网站在线免费| 欧洲国内综合视频| 黄色免费看视频| 亚洲欧美一级二级三级| 国产精品永久免费观看| 欧美日韩激情视频一区二区三区| 有码一区二区三区| 九九精品久久久| 精品国产一区二区三区香蕉沈先生| 欧美精品久久久久久久久| 97视频免费在线| 欧美激情一区在线观看| 无码aⅴ精品一区二区三区浪潮 | 国产精品va视频| 揄拍成人国产精品视频| 日本特级黄色片| 91色.com| 精品视频免费在线播放| 6080亚洲理论片在线观看| 久久精品国产亚洲一区二区| 久久精品国产亚洲av麻豆蜜芽| 久久久久88色偷偷免费| 男人天堂网视频| 色吊丝一区二区| 91精品国产91久久久久福利| 欧美 日韩 综合| 亚洲成人自拍偷拍| 国产黑丝在线观看| 亚洲日本免费| 精品无人区一区二区三区 | 99久久激情| 国产日韩欧美日韩| 黄视频网站在线| 91精品国产综合久久久蜜臀粉嫩| 天海翼在线视频| 国产一区二区三区四区五区美女| 精品一区二区成人免费视频| 激情久久免费视频| 久久99久久99精品中文字幕| 不卡的日韩av| 舔着乳尖日韩一区| 日本免费福利视频| 日韩高清不卡一区二区| 亚洲一区二区三区精品视频| 六九午夜精品视频| 另类视频在线观看| 亚洲乱码精品久久久久..| 亚洲成人免费影院| 成人国产精品久久久网站| 青椒成人免费视频| 国产成年人在线观看| 一区二区三区四区视频免费观看| 欧美激情视频一区二区| 视频一区二区在线播放| 欧美在线视频全部完| 国产免费美女视频| www.亚洲色图| 亚洲黄色a v| 中文字幕亚洲综合久久五月天色无吗'' | 久久视频免费| 久久久亚洲精选| 国产视频二区在线观看| 欧美一区二区三区免费在线看| 久久免费视频6| 久久看人人爽人人| 老司机久久精品| 精品av久久久久电影| 欧美高清视频一区| 免费成人黄色网| 久久久亚洲网站| av网站无病毒在线| 精品日产卡一卡二卡麻豆| 国产99久久久| 亚洲精品亚洲人成人网在线播放| 日韩成人av一区二区| 蜜臀91精品一区二区三区| 国产欧美精品aaaaaa片| 神马影视一区二区| av一区二区三区四区电影| 中文在线中文资源| 久久精品中文字幕免费mv| 黄色av免费在线播放| 欧洲成人一区二区三区| 在线精品国精品国产尤物884a| 在线免费看av网站| 久久综合久久综合亚洲| 99精品视频国产| 美女91精品| 日b视频免费观看| 欧美肉体xxxx裸体137大胆| 国产精品v欧美精品∨日韩| 91在线成人| 97在线视频免费观看| 色影视在线观看| 亚洲精品一区二三区不卡| 99在线观看精品视频| 日本电影亚洲天堂一区| 日韩伦人妻无码| 亚洲欧美日韩综合aⅴ视频| 一级片手机在线观看| 丁香婷婷深情五月亚洲| 欧美日韩中文不卡| 水蜜桃久久夜色精品一区的特点| 狠狠精品干练久久久无码中文字幕| 欧美色婷婷久久99精品红桃| 狠狠色噜噜狠狠色综合久| 91成人app| 国产精品美女主播在线观看纯欲| 美女av在线免费看| 高清欧美性猛交| av网址在线| 久久九九热免费视频| 福利在线视频导航| 亚洲人精品午夜在线观看| 日本黄色三级视频| 精品免费日韩av| 精品国产999久久久免费| 337p亚洲精品色噜噜噜| 日韩欧美国产二区| 午夜在线观看视频18| 日韩精品在线一区| 国产精品一二三四五区| 精品视频在线免费看| 国产伦精品一区二区三区视频网站| 亚洲一区二区三区四区在线| 欧美精品一级片| 亚洲黄色免费电影| 九九九在线视频| 一级日本不卡的影视| 黑人巨大精品一区二区在线| 亚洲私人影院在线观看| 在线观看黄网址| 亚洲欧洲精品一区二区精品久久久| 九九热免费在线| 国产精品久久久久毛片软件| 日韩欧美在线视频播放| 国产精品久久久久久久久晋中| 成人欧美一区二区三区黑人一 | 美女网站视频色| 国产精品麻豆一区二区| 天天色天天综合| 亚洲精品乱码久久久久| 久久午夜鲁丝片午夜精品| 亚洲综合一区二区精品导航| 国产精品自拍视频一区| 色综合色狠狠综合色| 午夜精品一区二| 精品视频一区二区不卡| 国产精品一区二区av白丝下载 | 欧洲视频在线免费观看| 亚洲一区999| 天堂аⅴ在线地址8| 萌白酱国产一区二区| www.综合网.com| 日韩免费观看av| 欧美性aaa| 成人在线观看网址| 伊人久久综合影院| 伊人色综合影院| 欧美激情自拍| 日韩欧美在线播放视频| 久久精品国产精品亚洲红杏| 波多野结衣网页| 久久夜色精品国产欧美乱极品| 人成免费在线视频| 夜夜嗨av一区二区三区四季av| 精品国产乱码一区二区| 精品视频1区2区| 风流少妇一区二区三区91| 亚洲欧美日韩精品久久| 欧美xxxx×黑人性爽| 日韩在线理论| 亚洲精品久久久久久久蜜桃臀| 亚洲欧美清纯在线制服| 久久久久xxxx| 91免费国产在线| 婷婷伊人五月天| 一本一道久久a久久精品| 国产成人精品无码高潮| 亚洲男人的天堂在线播放| 黄色在线观看网站| 青青a在线精品免费观看| 成人在线日韩| 欧美精品一区在线发布| 欧美国产先锋| 日韩精品你懂的| 99久久精品99国产精品| 婷婷社区五月天| 色婷婷国产精品| 亚洲乱熟女一区二区| 中文字幕九色91在线| 乱人伦视频在线| 91在线高清免费观看| 国产乱码精品一区二区三区四区| 国产亚洲精品久久久久久久| 日本成人在线不卡视频| 国产精品探花一区二区在线观看| 亚洲人成人一区二区在线观看| 午夜影院免费在线观看| 337p日本欧洲亚洲大胆色噜噜| 免费观看久久久久| 国产精品国产自产拍高清av水多| 久久a爱视频| 粉嫩av一区二区三区天美传媒 | 精品国产免费久久久久久婷婷| 国产精品区一区二区三区| 亚洲熟女综合色一区二区三区| 亚洲国产精品视频在线观看| 国产一二区在线观看| 国产精品一区电影| 狠狠操综合网| 欧美二区在线视频| 成人综合婷婷国产精品久久蜜臀| 成人一级黄色大片| 欧美天堂亚洲电影院在线播放| 免费在线黄色影片| 欧美一区二区大胆人体摄影专业网站| 北条麻妃一区二区三区在线| 青青视频免费在线| 国产一区二三区| 欧美日韩黄色网| 91精品福利在线一区二区三区| 里番在线观看网站| 国产日本欧美一区二区三区| 不卡视频在线| 在线黄色免费观看| 中文天堂在线一区| 亚洲天堂中文网| 精品国产依人香蕉在线精品| 久久福利在线| 欧美日韩一级在线| 国产在线视频一区二区三区| 成人在线观看小视频| 欧美一卡2卡三卡4卡5免费| 中文字幕有码在线观看| 91九色在线免费视频| 欧美va天堂在线| 国产51自产区| 欧美色另类天堂2015| 毛片免费在线观看| 国产精品美女免费| 午夜免费一区| 四虎成人免费视频| 懂色av中文一区二区三区天美| 欧美日韩国产综合视频 | 免费精品一区| 又大又硬又爽免费视频| 99久久伊人精品| 国产在线一级片| 久久视频精品在线| 中文字幕一区二区三区四区久久 | 超碰91在线观看| 欧美人与物videos另类| 日本亚洲天堂网| 丝袜 亚洲 另类 欧美 重口| 欧美精品一区二区三区在线| 看黄在线观看| 日韩一二三区不卡在线视频| 激情文学综合丁香| 日韩av在线播| 国产亚洲一区二区在线| 国产精品3区| 免费成人在线视频网站| 中文字幕免费观看一区| 国产99999| 日本精品性网站在线观看| 天天久久综合| 午夜久久久久久久| 欧美日韩国产另类不卡| 99riav视频在线观看| 先锋影音一区二区三区| 国产91综合一区在线观看| av网站中文字幕| 欧美xxxx做受欧美| 曰本一区二区三区视频| 红桃视频一区二区三区免费| 欧美日韩国产色视频| 精产国品自在线www| 噜噜噜噜噜久久久久久91| 国产在线观看一区二区| 久久久久久久久黄色|