精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChatGPT技術國產化嘗試

人工智能
ChatGPT 是一個通用功能型助手。2022 年 12 月 5 日,OpenAI 首席執行官 Sam Altman 在社交媒體上發文稱,ChatGPT 推出五天,已突破 100 萬用戶。AI 聊天機器人 ChatGPT 爆火出圈,已成為一個標志性事件。微軟正洽談 100 億美元增持股份,并很快將其整合到微軟云中。

本次分享題目為 ChatGPT 技術、國產化嘗試和開源模型。分享包含三大部分的內容,第一部分總體介紹 ChatGPT 相關的技術:ChatGPT 技術的演進、目前存在什么樣的問題、ChatGPT 技術學習的三個階段、數據組織和效果評估;第二部分分享我們在 ChatGPT 技術國產化方面進行的嘗試,包含實驗過程中我們遇到的問題、進行的思考以及模型的效果和應用;第三部分介紹我們已經發布的中文開源大模型,使用自有數據訓練出本地模型如何進行操作,在實驗過程中可能遇到的問題,和開源的先進模型相比存在的差距以及如何進一步提升模型的效果。

一、ChatGPT 相關技術

ChatGPT 是一個通用功能型助手。2022 年 12 月 5 日,OpenAI 首席執行官 Sam Altman 在社交媒體上發文稱,ChatGPT 推出五天,已突破 100 萬用戶。AI 聊天機器人 ChatGPT 爆火出圈,已成為一個標志性事件。微軟正洽談 100 億美元增持股份,并很快將其整合到微軟云中。

圖片

上圖中展示了兩個例子,展現出了驚人的效果。

ChatGPT 之所以這么受歡迎,一方面是由于其理解用戶意圖的能力和生成的效果比較好;另一方面,通過對話機器人的形式,使得人人都能使用。

下面將從模型演進、最初模型存在的問題、ChatGPT 模型學習的三個階段、訓練 ChatGPT 模型的數據組織和效果幾個方面進行介紹。

1、模型演進

ChatGPT 技術也經過了幾代模型的演進,最初的 GPT 模型是在 2018 年提出的,模型參數只有 1.17 億;2019 年的時候 GPT-2 模型參數是 15 億;到了 2020 年 GPT-3 模型參數達到了 1750 億;通過幾代的模型更新迭代,到 2022 年出現了 ChatGPT 模型。

圖片

2、之前的模型存在什么樣的問題

在 ChatGPT 模型出來之前的模型存在什么樣的問題呢?通過分析發現存在的一個比較顯著的問題是對齊問題,雖然大模型的生成能力比較強,但是生成的答案有時候不符合用戶意圖。通過研究發現造成對齊問題出現的主要原因是語言模型訓練的訓練目標是預測下一個詞,而不是按照用戶意圖來生成。為了解決對齊問題,在訓練 ChatGPT 模型過程中加入了基于人類反饋的強化學習(Reinforcement Learning from Human Feedback,RLHF)過程。

3、學習三階段

ChatGPT 模型的訓練過程是按照三步驟走的形式進行的。

第一步是在 GPT 模型基礎上使用真實用戶的輸入進行監督學習,在這個過程中數據來自真實用戶,數據質量比較高也比較寶貴。

第二步是訓練一個獎勵模型,對于一個 query 通過不同模型會產生不同的輸出結果,標記者對所有模型的輸出結果進行一個排序,用這些排序后的數據訓練獎勵模型。

第三步是把模型生成的初步答案輸入到獎勵模型當中,獎勵模型會對這個答案進行一個評價,如果生成的答案符合用戶的意圖就給一個正向的反饋,否則就給一個負向的反饋,從而把模型調教的越來越好,這就是引入強化學習的目的,使得生成的結果更符合人類的需要。訓練 ChatGPT 模型過程中三步走的過程如下圖所示。

圖片

4、數據組織和效果評估

在訓練模型之前我們需要準備好所用的數據集,在這個過程中就會遇到數據冷啟動的問題可以通過以下三個方面來解決

(1)搜集舊系統用戶使用的數據集

(2)讓標注人員根據之前真實用戶輸入的問題標注一些相似的 prompt 和輸出

(3)數據標注人員從問答、寫故事、生成等自己想的一些 prompt。

訓練 ChatGPT 模型的數據包含三部分數據集(77k 真實數據):

(1)基于真實用戶 prompt 的監督學習數據,用戶 prompt,模型 response,數據量有 13k。

(2)用于訓練獎勵模型的數據集,這部分數據對于一個 prompt 對應多個response 的排序,數據量有 33k。

(3)基于獎勵模型使用強化學習技術進行模型訓練的數據集,只需要用戶prompt,數據量有 31k,對質量要求較高。

完成 ChatGPT 模型訓練后,對于模型的評價也是比較充分的,主要從以下幾個方面來評價:

(1)模型生成的結果是否符合用戶的意圖

(2)生成的結果能不能滿足用戶提到的約束

(3)模型在客服領域能否有好的效果

通過和 GPT 基礎模型進行對比的詳細實驗結果如下圖所示。

二、ChatGPT 技術國產化

下面將從背景與問題、解決思路、效果與實踐三個方面介紹我們進行 ChatGPT 技術國產化的內容。

1、背景與問題

為什么要進行國產化,主要考慮了以下幾個方面:

(1)ChatGPT 技術本身是比較先進的,在許多任務上效果比較好,但是不對中國大陸提供服務。

(2)可能不能滿足國內企業級客戶的需求,無法提供本地化技術支持和服務。

(3)價格是以歐美為主要市場的美元進行計價的,價格比較昂貴,國內多數用戶可能承受不起。通過測試發現對于每條數據約需要花費 0.5 元人民幣,對于擁有大量數據的客戶無法進行商業化。

由于以上三個問題,我們嘗試了 ChatGPT 技術國產化。

2、解決思路

我們在進行 ChatGPT 技術國產化過程中,采用了分布走的策略。

首先訓練了一個具有百億參數的中文預訓練模型;其次在億級別任務數據上使用 Prompt 的形式進行任務監督學習;然后把模型對話化,即以對話或人機交互的形式和人進行交互;最后我們再引入獎勵模型和用戶反饋的強化學習 RLHF 技術。

Prompt 多任務學習模型(PromptCLUE)是一個支持全中文任務零樣本學習的模型。該模型實現了三大統一:統一模型、統一數據形式(所有任務都轉化為 prompt 形式)、統一使用方式(零樣本的形式進行使用)。該模型是基于 1000 億中文字詞級別 token 進行無監督學習,在億級下游任務數據上進行訓練,累積學習了 1.5 萬億中文字詞級別 token。支持 20 多種任務上的零樣本使用(文本理解類、抽取類、生成類任務)。

圖片

如何把模型進行對話化,即轉化為人機交互形式的模型,我們主要做了如下幾方面的工作:

首先為了使模型具有比較好的生成效果,我們移除了文本理解類和抽取類的任務,這樣就加強了問答、對話和生成類任務的學習;其次,轉變成對話模型后,生成結果會受到上下文的干擾,針對這個問題,我們加入了抗干擾數據,使得模型可以在必要時忽略無關的上下文;最后,我們基于真實用戶的反饋數據加入了學習過程,使得模型能夠更好地理解用戶的意圖。下圖是和模型進行單輪和多輪測試的形式。

圖片

3、效果與實踐

下面是針對模型進行測試的效果,通過比較當前與 ChatGPT 模型相比還有1~2 年的差距,不過這種差距是可以逐步彌補的,目前我們進行了一些有益的嘗試,也有了一定的效果,目前可以進行一些對話、問答、寫作等交互。下圖展示了測試結果。

三、國產開源大模型

1、中文開源模型

我們最近剛發布的元語功能型對話大模型(ChatYuan)參數量有 7.7 億,線上的版本是具有 100 億參數量的模型,已經上線了多個平臺,包括 Huggingface、ModelScope、Github、paddlepaddle 都可以使用。模型可以下載到本地,根據自己的用戶數據集進行微調。它是基于 PromptCLUE-large 結合數億條功能對話多輪對話數據進一步訓練得到。

圖片

圖片

上面以 Huggingface 平臺為例,展示了模型本地使用方法。在平臺搜索ChatYuan,加載模型,進行簡單的包裝。使用中有一些比較重要的參數,比如是否采樣 sample,如果需要生成的比較多樣就需要采樣。

2、基于自有數據訓練本地模型

首先需要將數據組織成統一的形式,由兩部分構成:輸入(Input)和輸出(Output)。對于單輪問答或生成輸入(Input):任務描述+輸入文本(如:“用戶:你好\n小元:”),輸出(Output)是指系統需要預測的文本(如:“您好!我是元語AI...”)。對于多輪對話輸入(Input):任務描述+上文+輸入文本,輸出是指系統需要預測的文本,如下圖中"小元"后的內容。

圖片

下圖展示了基于自有數據進行訓練本地模型的一個示例。這一示例涵蓋了整個過程,從數據的準備,到開源數據的下載、轉化,還包括模型的訓練、預測和評估。其基礎使用的是 pCLUE 多任務數據集。用戶可以使用自己的數據進行訓練,也可以使用 pCLUE 進行初步的訓練,來測試效果。

圖片

3、可能的問題、差距和如何進一步提升效果

ChatYuan 和 ChatGPT 都是通用型功能型對話大模型,都能夠在閑聊或法律、醫療等專業領域進行問答、交互和生成。通過和 ChatGPT 模型相比較,目前還有一定的差距,主要體現在是以下幾個方面:

  • 模型大小方面,ChatGPT 參數量是千億級別的,ChatYuan 是百億級別的;
  • 學習到的數據量方面也存在很大差距,ChatYuan 模型還在學習過程中;
  • 在強化學習方面,ChatGPT 模型已經引入了基于用戶反饋的強化學習,我們的模型還在引入過程中。

在使用模型過程中可能遇到生成效果和文本長度方面的問題,取決于數據格式是否正確,在生成過程中是否采樣 sample,輸出結果的長度控制 max_length 等。

要進一步提升模型效果,可以從如下幾個方面入手:

(1)結合行業數據進行進一步訓練,包括無監督預訓,以及使用大量高質量的數據進行有監督學習。

(2)使用真實用戶反饋數據的學習可以彌補分布差異。

(3)引入強化學習,對齊用戶意圖。

(4)選用更大的模型,一般來說模型越大,模型能力越強。

ChatGPT 帶來的新技術和使用場景,讓人們看到了 AI 的巨大潛力。更多應用都將得到升級,也為一些新應用創造了可能。

元語智能,作為大模型 Model-as-a-Service 服務商,在這一領域也在不斷探索中。歡迎感興趣的伙伴關注我們的網站和公眾號。

今天的分享就到這里,謝謝大家。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2014-05-07 16:18:21

高端存儲

2023-10-09 07:31:11

2016-08-22 09:34:52

PowerRedPOWERIBM

2015-12-07 09:56:08

初志科技云存儲

2015-08-27 16:35:56

開源開源國產化OpenStack

2015-11-20 14:57:58

初志科技云存儲

2014-04-23 15:52:50

浪潮王恩東主機

2022-10-09 16:03:04

大數據平臺

2015-07-09 14:48:08

2015-07-03 10:04:07

東方通國產化替代

2015-01-26 17:12:55

浪潮K1廊坊工信局

2022-10-17 09:03:52

2015-12-24 10:06:16

曙光國產化

2015-12-18 14:32:12

寶德國產化

2015-08-27 09:41:58

天璣科技

2023-06-13 23:17:53

騰訊云數據庫金融行業

2021-02-01 10:20:29

Windows虛擬技術ISO文件
點贊
收藏

51CTO技術棧公眾號

男女激情视频一区| 神马久久一区二区三区| 亚洲最新视频在线播放| 国产乱码精品一区二区三区中文 | 欧美xxxx黑人| 电影在线观看一区| 国产精品久久久久精k8| 国产精品对白一区二区三区| 波多野结衣影片| 欧美视频二区| 中文字幕久久亚洲| 中国一级特黄录像播放| 色999韩欧美国产综合俺来也| 亚洲777理论| 一本一生久久a久久精品综合蜜 | www.爱久久| 欧美主播一区二区三区| 国产日本在线播放| 看黄网站在线观看| 国产午夜一区二区三区| 国产精品一区视频网站| 一级黄色片免费| 日韩中文字幕不卡| 2019中文字幕在线观看| 精国产品一区二区三区a片| 精品国产乱码| 亚洲免费伊人电影在线观看av| 欧美色图校园春色| 欧美激情福利| 在线精品亚洲一区二区不卡| 分分操这里只有精品| 97超碰在线公开在线看免费| 国产欧美视频一区二区| 精品一区久久久| 懂色av一区二区三区四区 | www国产视频| www.欧美| 制服丝袜日韩国产| 九色porny自拍| 欧美日韩精品免费观看视完整| 亚洲一二三区在线观看| avav在线播放| 欧美人与性动交α欧美精品济南到| 国产精品国产自产拍高清av王其| 亚洲高清不卡一区| 国产高清视频免费最新在线| 久久久久久夜精品精品免费| 蜜桃久久精品乱码一区二区| 亚洲AV第二区国产精品| 99国产精品一区| 九九九九九精品| 日韩偷拍自拍| 久久久综合精品| 日本电影一区二区三区| 国产免费a∨片在线观看不卡| 久久久久88色偷偷免费| 日韩精品久久久免费观看| 噜噜噜在线观看播放视频| 26uuu国产在线精品一区二区| 久久精品国产一区二区三区不卡| 少妇又色又爽又黄的视频| 99麻豆久久久国产精品免费 | 凹凸成人精品亚洲精品密奴| 中文字幕精品视频| 免费看特级毛片| 欧美日韩福利| 97在线观看免费高清| 久久久久女人精品毛片九一| 久久久久国产一区二区| 国产精品久久二区| 国产男男gay体育生网站| 国产成人综合亚洲网站| 国内精品久久久久久久果冻传媒| 污污视频在线免费看| 久久久www成人免费毛片麻豆| 日韩黄色影视| 成人免费观看视频大全| 午夜一区二区三区在线观看| aⅴ在线免费观看| 巨大黑人极品videos精品| 欧美一级日韩免费不卡| 国产精久久久久| 香蕉久久夜色精品国产使用方法 | 久久99国产精品免费| 91传媒在线免费观看| 日本视频在线观看一区二区三区 | 久久精品一二三区| av大片在线播放| 亚洲一区日韩精品中文字幕| 国产亚洲综合视频| 91精品国产66| 亚洲福利在线播放| 国产精品久久久视频| 午夜精品偷拍| 日本久久亚洲电影| jlzzjlzz亚洲女人18| 99在线精品免费| 国产高清精品软男同| f2c人成在线观看免费视频| 欧美日韩一区在线观看| 天天躁日日躁狠狠躁免费麻豆| 九一亚洲精品| 国语对白做受69| 亚洲午夜激情视频| 久久久综合精品| 成人免费在线网| 在线免费观看亚洲| 亚洲欧美在线免费| 精品视频久久久久| 精品亚洲成a人| 久久精品国产第一区二区三区最新章节 | 日本一二三区视频在线| 亚洲电影有码| 亚洲精品720p| 久久久久久久福利| 久久国产免费看| 欧美午夜精品理论片a级大开眼界| 最爽无遮挡行房视频在线| 欧美三级中文字幕在线观看| 中文字幕免费高清视频| 午夜欧美视频| 成人性教育视频在线观看| 美女欧美视频在线观看免费 | 欧美 日韩 国产 高清| 超碰国产精品一区二页| 国产亚洲激情视频在线| 久久99精品波多结衣一区| 国产成人精品综合在线观看| 亚洲精品在线观看免费| 午夜精品久久久久久久久久蜜桃| 精品国产一二三区| 国产性70yerg老太| 粉嫩一区二区三区在线看| 三级在线免费观看| 国产精品igao视频网网址不卡日韩| 亚洲欧洲成视频免费观看| 91国产丝袜播放在线| 粉嫩av亚洲一区二区图片| 国产一二三四五| 欧洲亚洲精品久久久久| 爽爽爽爽爽爽爽成人免费观看| 日本成人一级片| 中文字幕精品一区二区精品绿巨人 | 精品午夜久久福利影院 | av大大超碰在线| 日韩午夜激情免费电影| 91视频综合网| 国产精品正在播放| 97中文字幕在线| 国产精品久久久网站| 欧美高清一级大片| 天堂中文网在线| 午夜精品aaa| 大又大又粗又硬又爽少妇毛片| 亚洲一区视频| 欧洲亚洲一区| 日本在线一区二区| 免费av在线一区| 亚洲欧美高清视频| 精品日本美女福利在线观看| 性欧美13一14内谢| 日本午夜精品视频在线观看| 在线精品日韩| 911亚洲精品| 91成人福利在线| 黄色片在线播放| 91麻豆精品国产91久久久久久久久| fc2ppv在线播放| 成人免费视频caoporn| 国自产拍偷拍精品啪啪一区二区| 九九免费精品视频在线观看| 成人高清视频观看www| 色呦呦在线视频| 亚洲精品国产精品国自产在线| 亚洲成人第一网站| 18涩涩午夜精品.www| 人妻激情偷乱频一区二区三区| 国产情侣久久| 一区二区免费电影| 国产精品色在线网站| 国产99视频精品免视看7| 毛片网站在线免费观看| 精品国产亚洲在线| 免费在线观看av的网站| 亚洲精选免费视频| 一本色道久久综合亚洲精品图片| 美女高潮久久久| 欧美高清中文字幕| 欧美日韩伦理| 国产在线一区二区三区播放| 成人av色网站| 国内免费精品永久在线视频| 国产粉嫩一区二区三区在线观看 | 午夜激情一区| 日本视频一区二区在线观看| 国产精品xnxxcom| 国产成人久久久精品一区| 午夜dj在线观看高清视频完整版| 亚洲欧美日韩高清| 黄色av免费观看| 在线看日本不卡| 久草视频在线观| 亚洲情趣在线观看| 亚洲区自拍偷拍| 成人免费三级在线| 午夜激情影院在线观看| 性欧美xxxx大乳国产app| 日本人妻伦在线中文字幕| 日韩久久电影| 欧美日本韩国在线| 97色成人综合网站| 成人免费视频网址| 日韩中文在线播放| 91黄色8090| 色黄网站在线观看| 精品国产欧美一区二区五十路| 奇米影视888狠狠狠777不卡| 亚洲成年网站在线观看| 国产绿帽刺激高潮对白| 欧美性色aⅴ视频一区日韩精品| 日产亚洲一区二区三区| 亚洲国产一区二区三区| 一区二区国产精品精华液| 欧美韩国日本一区| 自拍偷拍亚洲天堂| 91美女视频网站| 男女性杂交内射妇女bbwxz| 国产福利一区二区三区视频 | 久久影视中文字幕| 色综合天天狠狠| 三级黄色在线视频| 精品毛片网大全| 日韩av一二三区| 调教+趴+乳夹+国产+精品| 久久免费在线观看视频| 亚洲一区二区三区国产| 在线观看成人毛片| 夜夜嗨av一区二区三区网页 | 日韩视频精品在线观看| 国产免费一区二区视频| 欧美视频福利| av日韩一区二区三区| 国产精品草草| 成人在线观看你懂的| 99精品99| 国产a级片免费观看| 久久久成人网| 天天干天天玩天天操| 奇米一区二区三区av| 激情 小说 亚洲 图片: 伦| 蜜臀av性久久久久蜜臀av麻豆| 精品999在线| 精品系列免费在线观看| 久久黄色一级视频| 99久久精品国产精品久久| 精品人妻一区二区三区视频| 久久久久成人黄色影片| 在线观看天堂av| 亚洲视频在线一区二区| 欧美三级在线免费观看| 亚洲福利国产精品| 特级做a爱片免费69| 在线免费观看成人短视频| 中文字幕1区2区3区| 91麻豆精品91久久久久同性| 精品二区在线观看| 亚洲激情自拍图| 国产在线观看免费| 色偷偷9999www| 黑人玩欧美人三根一起进| 欧美亚洲国产另类| 国产原创一区| 福利精品视频| 亚洲欧洲色图| 椎名由奈jux491在线播放| 国一区二区在线观看| 97国产精东麻豆人妻电影| 免费高清视频精品| 在线观看一区二区三区视频| 26uuu国产一区二区三区| 国产wwwwxxxx| 夜夜爽夜夜爽精品视频| 69视频免费看| 日韩视频免费观看高清完整版 | 亚洲精品视频一二三区| 久久综合入口| 68国产成人综合久久精品| 毛片在线视频观看| 久久亚洲二区| 欧美激情第四页| 久久久综合激的五月天| a级片在线观看免费| 欧美日韩在线另类| 999免费视频| 亚洲欧洲在线免费| 第一中文字幕在线| 国产精品欧美在线| 欧美电影在线观看免费| 中文字幕剧情在线观看一区| 一区二区三区国产盗摄| 999在线精品视频| 91美女蜜桃在线| 成年人av电影| 在线免费亚洲电影| 亚洲av电影一区| 插插插亚洲综合网| 成人国产一区二区三区精品麻豆| 国产区欧美区日韩区| 午夜久久免费观看| 丁香婷婷激情网| 久久这里只有精品6| 日韩欧美中文字幕视频| 欧美日韩精品综合在线| 青青草手机在线| 久久久久女教师免费一区| 亚州欧美在线| 亚洲国产一区二区精品视频 | 国产一区二区在线播放| 在线一级成人| 久操网在线观看| 国产精品综合在线视频| 影音先锋男人看片资源| 色婷婷综合五月| 天天射天天操天天干| 国模精品一区二区三区色天香| 日本一区二区乱| 久久免费视频2| 国产资源在线一区| 2017亚洲天堂| 在线观看免费成人| 成人精品一区二区三区免费| 2019亚洲日韩新视频| 久久99精品国产自在现线| 无码av天堂一区二区三区| 国产高清一区日本| 国产一区二区视频在线观看免费| 欧美乱妇15p| eeuss影院在线播放| 国产精品久久久久久久久久三级| 亚洲人成精品久久久| 欧美a在线视频| 久久综合av免费| 手机av免费观看| 中文字幕日韩欧美| 成人国产精品一区二区免费麻豆| 亚洲精品在线免费看| 麻豆成人免费电影| 侵犯稚嫩小箩莉h文系列小说| 欧美浪妇xxxx高跟鞋交| 91中文在线| 国产精品久久波多野结衣| 亚洲国产一区二区三区a毛片| 国产av一区二区三区传媒| 激情亚洲一区二区三区四区| 婷婷综合激情网| 国产成人福利网站| 日韩久久综合| 国产精品嫩草影院8vv8| 亚洲视频精选在线| 你懂的网站在线| 国产91精品不卡视频| 国产一区二区三区探花| 亚洲另类第一页| 洋洋成人永久网站入口| 日韩精品福利| 国产精品免费观看在线| 亚洲精品久久久| 特级西西人体wwwww| 日本道色综合久久| 日本不卡三区| 国产91视觉| 久久午夜影视| 天天干中文字幕| 精品丝袜一区二区三区| xxxxx.日韩| 大伊香蕉精品视频在线| 久久无码av三级| 7777久久亚洲中文字幕| 久久久久久亚洲| 日韩一区三区| 中文视频在线观看| 色天天综合久久久久综合片| 欧美jizzhd69巨大| 久久99久久精品国产| 麻豆精品国产传媒mv男同| 免费网站看av| 伊人久久久久久久久久久久久| 国产精品久久久久久久久久辛辛 | 免费在线观看日韩欧美| 麻豆视频在线观看| 亚洲桃花岛网站| 99精品在免费线中文字幕网站一区| 国产亚洲综合视频| 一区二区三区美女视频| 国内在线精品| 99精品欧美一区二区三区| 免费美女久久99| 永久免费看片在线播放| 麻豆国产精品va在线观看不卡| 国产videos久久|