精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

這些技術,ChatGPT和它的潛在競爭者們都在用

人工智能 新聞
如今的人工智能圈,ChatGPT 等 AI 聊天機器人火的一塌糊涂,甚至讓 Stack Overflow 訪問量暴跌。那么這些 AI 聊天機器人背后的技術以及異同點有哪些呢?本文作者探索并試圖回答這些問題。

隨著 ChatGPT 的出現以及隨之而來的廣泛討論,RLHF、SFT、IFT、CoT 等晦澀的縮略詞出現在公眾面前,這都歸功于 ChatGPT 的成功。這些晦澀的縮略詞是什么?為什么它們如此重要?本文作者查閱了所有關于這些主題的重要論文,進行了分類總結。

ChatGPT 并不是第一個基于語言模型(LM)的對話智能體,事實上,許多機構在 OpenAI 之前發布過語言模型對話智能體,包括 Meta BlenderBot、Google LaMDA、DeepMind 的 Sparrow 和 Anthropic Assistant。一些機構也宣布建立開源聊天機器人的計劃,并公開了路線圖(如 LAION 的 Open-Assistant)。肯定還有其它機構在做同樣的工作,只是沒有宣布。

下表根據上面提到的 AI 聊天機器人是否可公開訪問、訓練數據、模型架構和評估的詳細信息,對它們進行了比較。ChatGPT 沒有相關數據,這里使用的是 InstructGPT 的資料,它是 OpenAI 的一個微調模型,被認為是 ChatGPT 的基礎。

圖片

盡管在訓練數據、模型和微調方面存在許多差異,但這些聊天機器人也存在一些共性 —— 指令遵循(instruction following),即根據用戶的指令,給出響應。例如讓 ChatGPT 寫一首關于微調的詩。 

圖片

從預測文本到遵循指令

通常而言,基礎語言建模的目標不足以讓模型高效地遵循用戶的指示。模型創建者還使用指令微調(Instruction Fine-Tuning,IFT),它可以在多樣化任務上對基本模型進行微調,還能應用在情感分析、文本分類、摘要等經典 NLP 任務。

IFT 主要由三個部分組成:指令、輸入和輸出。輸入是可選的,有些任務只需要指令,如上面的 ChatGPT 示例。輸入和輸出構成實例(instance)。給定的指令可以有多個輸入和輸出。相關示例如下([Wang et al., ‘22])。

圖片

IFT 的數據通常使用人類的指令和語言模型 bootstrapped 的指令集合。對于 bootstraping,LM 會在零樣本的情況下根據 prompt,生成新的指令、輸入和輸出。在每一輪中,模型都會得到從人類編寫和生成模型中選擇的樣本的 prompt。人類和模型貢獻數據集的情況可以用頻譜表示,如下圖所示。

圖片

一種是純模型生成的 IFT 數據集如 Unnatural Instructions,另一種是集社區努力、手動創建的指令如 Super natural Instructions。位于這兩者之間,選用高質量種子數據集然后進行 bootstrap 如 Self-instruct。為 IFT 收集數據集的另一種方法是將現有高質量眾包 NLP 數據集用于各種任務(包括 prompting),并使用統一的模式或不同的模板將這些數據集作為指令,相關工作包括 T0、Natural instructions 數據集、FLAN LM 和 OPT-IML。

安全遵循指令

LM 使用微調后的指令,可能并不總是生成有用安全的響應。這種行為的示例包括無效回應(托詞),總是給出諸如「對不起,我不明白」之類的無效回答,或者對用戶關于敏感話題的輸入做出不安全的回應。

為了解決這種問題,模型開發人員使用監督式微調(Supervised Fine-tuning, SFT),在高質量的人類標記數據上微調基礎語言模型,以實現有效和安全的響應。

SFT 和 IFT 緊密相連。指令調優可以看作是監督式微調的子集。在最近的文獻中,SFT 階段通常用于安全主題,而不是在 IFT 之后進行的指令特定主題。未來這種分類和描述會有更清晰的用例和方法。

圖片

谷歌的 LaMDA 也是根據一組規則對帶有安全注釋的對話數據集微調。這些規則通常是由模型創建者預先定義和制定的,包含一系列廣泛的主題,如有害、歧視和錯誤信息。

模型微調

另一方面,OpenAI 的 InstructGPT、DeepMind 的 Sparrow 和 Anthropic 的 ConstitutionalAI 均使用從人類反饋中強化學習(reinforcement learning from human feedback, RLHF)的技術。在 RLHF 中,模型響應基于人類反饋(如選擇一個更好的答案)進行排序,然后用這些帶注釋的響應訓練模型,以返回 RL 優化器的 scalar 獎勵,最后通過強化學習訓練對話智能體來模擬偏好模型。

思維鏈(Chain-of-thought, CoT)是指令演示的特殊情況,通過從對話智能體中引出逐步推理生成輸出。用 CoT 進行微調的模型使用帶有逐步推理的人類注釋的指令數據集。如下示例所示,橙色標記代表指令,粉色標記代表輸入和輸出,藍色標記代表 CoT 推理。

圖片

用 CoT 來微調的模型在涉及常識、算術和符號推理的任務上表現得更好。CoT 進行微調也顯示出對實現無害性非常有效(有時比 RLHF 做得更好),并且模型不會回避并產生「對不起,我無法回答這個問題」等回復。

圖片

要點總結

本文要點總結如下:

1、 與預訓練數據相比,只需要非常小的一部分數據來對指令進行微調。

2、 監督式微調使用人工標注使模型輸出更安全和更有幫助。

3、 CoT 微調提高模型在逐步思考任務上的性能,并減少了它們在敏感話題上的無效響應或回避不答。

對話智能體的進一步工作思考

最后,作者對未來對話智能體的發展給出了自己的一些思考。

1、 RL 在從人類反饋中學習有多重要?可以通過 IFT 或 SFT 中的高質量數據訓練獲得與 RLHF 一樣的性能嗎?

2、 與在 LaMDA 中使用 SFT 相比,在 Sparrow 中使用 SFT+RLHF 的安全性如何?

3、 IFT、SFT、CoT 和 RLHF,需要怎樣程度的預訓練?tradeoff 是什么?應該使用的最好的基礎模型是什么?

4、 文中介紹的許多模型都是經過精心設計,工程師們專門收集導致失敗的模式,并根據已處理的問題改善未來的訓練(prompts 和方法)。要如何系統地記錄這些方法的效果并重現它們?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-03-16 10:12:38

Windows Azu

2011-05-20 11:10:53

TouchPad惠普

2015-07-13 10:27:40

GoRust競爭者

2024-08-19 13:21:14

2012-02-21 17:35:54

VI編輯器

2011-08-17 09:46:18

微軟蘋果Linux

2009-06-02 18:34:45

VMwareHyper-VVI3

2021-07-29 13:31:19

區塊鏈區塊鏈技術

2009-04-22 09:03:07

騰訊手機瀏覽器

2023-02-24 14:03:14

NatureAI

2021-02-26 10:46:11

接口測試DiffUnix系統

2021-11-10 09:19:42

數據庫程序員性能

2009-05-31 09:32:51

時代華納備忘錄AOL

2015-07-02 14:58:55

云存儲Gartner

2021-11-12 08:58:58

CIO客戶體驗首席信息官

2023-08-30 10:24:46

公有云報告

2019-07-21 20:08:50

工具代碼開發

2020-11-05 14:20:01

Google FuchLinux發行版Linux

2012-12-25 10:45:12

InstagramPokeFlickr
點贊
收藏

51CTO技術棧公眾號

亚洲乱码一区av黑人高潮 | 一区二区三区四区不卡视频| 国产欧美精品日韩| 久久精品国产亚洲av高清色欲| 欧美日韩一本| 欧美老年两性高潮| 国产精品自拍片| av在线第一页| 国产高清不卡一区| 国产精品电影网站| 久久婷婷国产麻豆91| 国产精品一线天粉嫩av| 日韩一区二区在线播放| 999精品视频在线| 免费污视频在线| 日本一区二区不卡视频| www.久久久| 波多野结衣一区二区三区在线 | 中文字幕欧美国内| 国产伦精品一区二区免费| 国精品产品一区| 无码av免费一区二区三区试看| 在线看无码的免费网站| 天天操天天射天天舔| 精品一区二区精品| 日本精品久久电影| 精品在线视频免费观看| 久久一区二区中文字幕| 亚洲欧美制服中文字幕| 一级黄色免费视频| 视频在线观看免费影院欧美meiju| 色哟哟亚洲精品| 亚洲 欧美 日韩 国产综合 在线| 99福利在线| 中文字幕亚洲在| 欧美一区二区三区在线免费观看| 五月天婷婷激情网| 国产suv精品一区二区6| 亚洲va欧美va国产综合久久| 五月激情丁香网| 久久国产高清| 欧美亚洲国产精品| 成年人视频在线免费看| 亚洲啪啪91| 欧美精品videossex性护士| 日韩精品一区二区三区在线视频| 欧美丝袜一区| 中国日韩欧美久久久久久久久| 18禁裸乳无遮挡啪啪无码免费| 免费看久久久| 亚洲精品国产suv| 久久久久久久无码| 欧美毛片免费观看| 日韩精品高清在线观看| 亚洲精品理论片| 真人做人试看60分钟免费| 亚洲AV无码一区二区三区少妇| 久久99久久久久久久久久久| 国产精品久久9| 精品黑人一区二区三区| 久久国产欧美| 日韩免费在线观看视频| 日韩三级一区二区| 蜜桃在线一区二区三区| 国产日韩专区在线| av综合在线观看| 成人永久看片免费视频天堂| 成人激情小说乱人伦| 国产91精品一区二区绿帽| 人妻91麻豆一区二区三区| 99麻豆久久久国产精品免费| 蜜桃视频在线观看91| 国产一级片在线| 国产精品福利一区| 免费的av在线| 高清视频在线观看三级| 色婷婷综合五月| 热久久久久久久久| 成人h动漫精品一区二区器材| 亚洲国产精品99| 国产毛片久久久久久久| 日韩精品网站| 欧美福利在线观看| 一级黄色大片视频| 另类综合日韩欧美亚洲| 成人午夜电影在线播放| 色鬼7777久久| 1024成人网色www| 精品久久一二三| 99热播精品免费| 精品久久国产老人久久综合| 三级网站在线免费观看| 亚洲成av人片乱码色午夜| 97精品一区二区视频在线观看| 丰满人妻老熟妇伦人精品| 国内精品免费**视频| 国产精品区一区二区三含羞草| 看电影就来5566av视频在线播放| 亚洲欧洲日产国产综合网| 黄色成人在线看| 黄色成人在线观看网站| 精品国产麻豆免费人成网站| 国产又黄又粗视频| 亚洲午夜黄色| 国产欧美日韩中文字幕在线| 欧美 日韩 国产 在线| 国产精品午夜在线| 欧美 丝袜 自拍 制服 另类| 亚洲伊人精品酒店| 亚洲乱码一区二区| 久久精品国产亚洲av无码娇色 | 最新天堂在线视频| 欧美激情久久久久久久久久久| 日韩视频免费大全中文字幕| 中文字幕亚洲乱码熟女1区2区| 国产高清精品久久久久| 日韩精品电影网站| 2018av在线| 欧美二区三区的天堂| 日本性高潮视频| 亚洲经典三级| 99porn视频在线| 五月天婷婷在线视频| 一本在线高清不卡dvd| 国产a级片视频| 99久久.com| 国产成人综合亚洲| 激情在线视频| 日韩欧美高清视频| 西西大胆午夜视频| 亚洲国产专区| 国产精品久久久久久久小唯西川 | 国产精品素人一区二区| 国产免费黄视频| 国产亚洲成av人片在线观黄桃| 超碰日本道色综合久久综合| 一级黄色大毛片| 国产女同性恋一区二区| 黑鬼大战白妞高潮喷白浆| 欧美理论电影在线精品| 国模精品系列视频| 亚洲精选一区二区三区| 亚洲一区二区不卡免费| 免费观看一区二区三区| 欧美视频成人| av一区二区三区四区电影| jizzjizz亚洲| 欧美精品九九99久久| 永久免费看片视频教学| 激情五月播播久久久精品| 中文字幕欧美日韩一区二区三区| 成人mm视频在线观看| 中文字幕亚洲情99在线| 一本色道久久综合精品婷婷| 中文字幕在线不卡视频| 亚洲va在线va天堂va偷拍| 国产精品99久久精品| 成人高h视频在线| 国产乱色在线观看| 精品伦理精品一区| 亚洲另类欧美日韩| 国产亚洲成aⅴ人片在线观看| 免费午夜视频在线观看| 国产精品入口久久| 国产一区视频在线| a在线免费观看| 亚洲大胆人体av| 亚洲黄色免费观看| 国产精品的网站| 国产男女无遮挡猛进猛出| 亚洲高清久久| 欧美日韩在线观看一区二区三区 | 欧美三电影在线| 91视频综合网| 在线a人片免费观看视频| 日韩欧美在线视频日韩欧美在线视频| 色无极影院亚洲| 极品少妇xxxx精品少妇偷拍| 男人草女人视频| 在线看成人短视频| 国产区精品在线观看| 在线视频国产区| 国产视频一区在线| 国产又黄又大又粗的视频| 一区二区久久久久久| 不卡一区二区在线观看| 久久99在线观看| 97视频在线免费| 欧美综合在线视频观看| 91精品国产99久久久久久红楼| 在线观看特色大片免费视频| 日韩在线播放一区| 无码国产精品高潮久久99| 欧美日韩视频在线一区二区| 久久无码精品丰满人妻| 中文在线一区二区| 日韩www视频| 蜜桃av噜噜一区二区三区小说| 精品久久久久久无码中文野结衣| 欧美裸体在线版观看完整版| 99久久无色码| 国产精品高潮久久| 51色欧美片视频在线观看| 免费人成在线观看播放视频| 亚洲男人第一网站| а√天堂资源在线| 欧美喷潮久久久xxxxx| 成年人午夜视频| 亚洲老司机在线| 婷婷综合在线视频| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 国产精品久久久久一区二区| 久久免费电影| 久久九九国产精品怡红院| 久久伊伊香蕉| 亚洲国模精品一区| 国产成人三级在线播放| 欧美亚洲日本一区| 日韩精品一区二区亚洲av| 亚洲影院免费观看| 黄色香蕉视频在线观看| 欧美国产一区在线| 右手影院亚洲欧美| 不卡一区二区三区四区| 日本人dh亚洲人ⅹxx| 免费观看在线色综合| 92看片淫黄大片一级| 黄色亚洲在线| 青青视频免费在线| 一区二区蜜桃| 一本一本久久a久久精品综合妖精| 国产精品免费不| 久久久精彩视频| 精品自拍偷拍| 国产女人水真多18毛片18精品| 亚洲精品福利| 超碰97在线播放| 国产精品麻豆| 亚洲自拍偷拍第一页| 自拍偷拍欧美日韩| 91精品国产自产在线老师啪| 99久久久国产精品免费调教网站| 国产精品电影一区| 草民电影神马电影一区二区| 国产精品久久久久久久av大片| 性欧美hd调教| 国产成人一区三区| 国产伊人久久| 92福利视频午夜1000合集在线观看 | 亚洲AV无码一区二区三区少妇| 日韩一级二级三级精品视频| 精品人妻伦一区二区三区久久| 欧美疯狂做受xxxx富婆| 一级黄色片免费看| 欧美一级二级在线观看| www黄色在线观看| 亚洲国产成人在线播放| 水莓100在线视频| 亚洲三级av在线| www.在线视频.com| 久久手机精品视频| 免费影视亚洲| 欧美亚洲日本网站| 成人黄色毛片| 亚洲伊人成综合成人网| 成人免费直播在线| 欧美精品在线一区| 久久国产精品成人免费观看的软件| 一区二区高清视频| 国产精品99免费看| 色综合av综合无码综合网站| 日韩av不卡一区二区| 91丝袜超薄交口足| 国产成人免费高清| 欧美 日本 国产| 中日韩av电影| 国产无遮挡aaa片爽爽| 色悠悠亚洲一区二区| 91亚洲欧美激情| 亚洲精品一区二区在线观看| 久久精品国产亚洲a∨麻豆| 日韩中文字幕在线免费观看| 九色91在线| 国产精品国产自产拍高清av水多| 白嫩亚洲一区二区三区| 国产视频精品网| 久久成人综合| 99视频在线免费播放| 久久成人免费电影| 伊人网综合视频| 中文字幕中文在线不卡住| 香蕉视频一区二区| 精品视频在线视频| 天堂中文在线资源| 久久精品国产91精品亚洲| 激情aⅴ欧美一区二区欲海潮| 国产精品美女久久久免费| xxxx日韩| 一本一本a久久| 亚洲欧美日韩在线观看a三区| 99中文字幕在线| 国产日韩欧美一区二区三区综合| 欧美黑人一级片| 欧美三片在线视频观看| 天天射天天色天天干| 久久久999精品| 精品视频在线一区二区在线| 国产精品成人一区二区三区| 久久国产成人午夜av影院宅| 久久无码高潮喷水| 成人夜色视频网站在线观看| 99精品中文字幕| 91九色最新地址| 深爱五月激情五月| 久精品免费视频| 日韩第二十一页| 欧美资源一区| 亚洲免费黄色| 女同性αv亚洲女同志| 中文字幕在线不卡| 狠狠狠狠狠狠狠| 日韩大陆欧美高清视频区| 中文字幕伦理免费在线视频| 国产日本欧美视频| 欧美中文一区二区| 苍井空浴缸大战猛男120分钟| www.爱久久.com| 久久综合加勒比| 日韩一区二区在线观看视频| 麻豆传媒视频在线观看| 国产精品久久久精品| 蜜臀av免费一区二区三区| 国产黄页在线观看| 99麻豆久久久国产精品免费| 久久亚洲成人av| 精品粉嫩超白一线天av| 欧美性video| 成人片在线免费看| 亚洲精品日本| 国产精品久久久久久亚洲色| 亚洲成人免费视频| 囯产精品久久久久久| 久久久久久欧美| 国产精品zjzjzj在线观看| www.欧美黄色| 成人97人人超碰人人99| 久久精品久久国产| 亚洲国产精品va在线看黑人动漫| 国产激情视频在线看| 久久av免费一区| 久久久久99| 国产精品美女高潮无套| 欧美日韩国产综合一区二区| 三区四区电影在线观看| 91久久国产综合久久91精品网站| 影音先锋日韩精品| 性色av浪潮av| 亚洲国产综合色| 亚洲AV成人无码一二三区在线| 热99精品里视频精品| 精品国产精品久久一区免费式| 91香蕉视频导航| 亚洲婷婷综合色高清在线| www.黄色一片| 欧美与黑人午夜性猛交久久久| 欧美男男gaytwinkfreevideos| 一道本视频在线观看| 亚洲欧美日韩国产成人精品影院| 北条麻妃一二三区| 日本一本a高清免费不卡| 日本一区二区在线看| 亚洲精品在线网址| 亚洲成av人片在线| 国产在线观看黄| 亚洲尤物视频网| 一区二区三区四区五区精品视频| 国产精品三级在线观看无码| 欧美日韩久久一区| 欧美hdxxxx| 色一情一乱一伦一区二区三区| 狠狠久久亚洲欧美| www日韩精品| 少妇高潮久久77777| 99re8这里有精品热视频免费| 男人揉女人奶房视频60分| 中文字幕一区二区三区不卡在线 | 在线国产精品视频| 日韩08精品| 别急慢慢来1978如如2| 亚洲精选视频免费看| 瑟瑟在线观看| 亚洲自拍偷拍一区| 爽好多水快深点欧美视频| √天堂中文官网8在线| 亚洲欧美精品一区二区| 深夜福利一区| 国产喷水theporn| 精品欧美激情精品一区| 国产在线观看a视频| 欧美午夜免费|