精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

調用多個ChatGPT API相互對話,清華開源的多輪對話數據UltraChat來了

人工智能 新聞
UltraChat 解決了數據荒的一大難題。

自 ChatGPT 發布以來,這段時間對話模型的熱度只增不減。當我們贊嘆這些模型表現驚艷的同時,也應該猜到其背后巨大的算力和海量數據的支持。

單就數據而言,高質量的數據至關重要,為此 OpenAI 對數據和標注工作下了很大力氣。有多項研究表明,ChatGPT 是比人類更加可靠的數據標注者,如果開源社區可以獲得 ChatGPT 等強大語言模型的大量對話數據,就可以訓練出性能更好的對話模型。這一點羊駝系列模型 ——Alpaca、Vicuna、Koala—— 已經證明過。例如,Vicuna 使用從 ShareGPT 收集的用戶共享數據對 LLaMA 模型進行指令微調,就復刻了 ChatGPT 九成功力。越來越多的證據表明,數據是訓練強大語言模型的第一生產力。

ShareGPT 是一個 ChatGPT 數據共享網站,用戶會上傳自己覺得有趣的 ChatGPT 回答。ShareGPT 上的數據是開放但瑣碎的,需要研究人員自己收集整理。如果能夠有一個高質量的,覆蓋范圍廣泛的數據集,開源社區在對話模型研發方面將會事半功倍。

基于此,最近一個名為 UltraChat 的項目就系統構建了一個超高質量的對話數據集。項目作者嘗試用兩個獨立的 ChatGPT Turbo API 進行對話,從而生成多輪對話數據。

圖片

  • 項目地址:https://github.com/thunlp/UltraChat
  • 數據集地址:http://39.101.77.220/
  • 數據集交互地址:https://atlas.nomic.ai/map/0ce65783-c3a9-40b5-895d-384933f50081/a7b46301-022f-45d8-bbf4-98107eabdbac

具體而言,該項目旨在構建一個開源、大規模、多輪的基于 Turbo APIs 的對話數據,方便研究者開發具有通用對話能力的強大語言模型。此外,考慮到隱私保護等因素,該項目不會直接使用互聯網上的數據作為提示。為了確保生成數據質量,研究者在生成過程中采用了兩個獨立的 ChatGPT Turbo API,其中一個模型扮演用戶角色來生成問題或指令,另一個模型生成反饋。

圖片

如果直接使用 ChatGPT 基于一些種子對話和問題讓其自由生成,容易出現話題單一、內容重復等問題,從而難以保證數據本身的多樣性。為此,UltraChat 對對話數據覆蓋的主題和任務類型進行了系統的分類和設計,還對用戶模型和回復模型進行了細致的提示工程,它包含三個部分:

  • 關于世界的問題(Questions about the World):這部分對話來自于對現實世界中的概念、實體和對象相關的廣泛詢問。所涉及的主題涵蓋科技、藝術、金融等多個領域。
  • 寫作與創作(Writing and Creation):這部分對話數據著重于指示 AI 從頭進行創作一個完整的文本材料,并在此基礎上進行后續的提問或進一步指導以完善寫作,撰寫的材料內容類型包括文章、博客、詩歌、故事、戲劇,電子郵件等等。
  • 對于現有資料的輔助改寫(Writing and Creation):該對話數據是基于現有資料生成的,指令包括但不限于改寫、續寫、翻譯、歸納、推理等,涵蓋主題同樣非常多樣。

這三部分數據覆蓋了大部分用戶對于 AI 模型的要求。同時,這三類數據也會面臨著不同的挑戰,為此需要不同的構造方法。

例如,第一部分的數據主要挑戰在于如何在總量為幾十萬組對話中盡量廣泛地涵蓋人類社會中的常見知識,為此研究者從自動生成的主題和來源于 Wikidata 的實體兩個方面進行了篩選和構造。

第二、三部分的挑戰主要來自于如何模擬用戶指令,并在后續對話中讓用戶模型的生成盡量多樣化的同時又不偏離對話的最終目標(按照要求生成材料或改寫材料),為此研究者對用戶模型的輸入提示進行了充分的設計和實驗。在構造完成之后,作者還對數據進行了后處理以削弱幻覺問題。

目前,該項目已經發布了前兩部分的數據,數據量為 124 萬條,應該是目前開源社區內規模最大的相關數據集。內容包含在現實世界中豐富多彩的對話,最后一部分數據將在未來發布。

世界問題數據來源于 30 個具有代表性和多樣性的元主題,如下圖所示:

圖片


  • 基于以上元主題,該項目生成了 1100 + 子主題用于數據構建;
  • 對于每個子主題,最多生成 10 個具體問題;
  • 然后使用 Turbo API 為 10 個問題中的每一個生成新的相關問題;
  • 對于每個問題,如上所述迭代地使用兩個模型生成 3~7 輪對話。

此外,該項目從維基數據中收集了最常用的 10000 個命名實體;使用 ChatGPT API 為每個實體生成 5 個元問題;對于每個元問題,生成 10 個更具體的問題和 20 個相關但一般的問題;采樣 20w 個特定問題和 25w 個一般問題以及 5w 個元問題,并為每個問題生成了 3~7 輪對話。

接下來我們看一個具體的例子:

圖片

我們在 UltraChat 平臺上測試了數據搜索效果。例如,輸入「音樂(music)」,系統會自動搜索出 10000 組與音樂相關的 ChatGPT 對話數據,并且每組都是多輪對話

圖片

輸入關鍵詞「數學(math)」的搜索結果,有 3346 組多輪對話:

圖片

目前,UltraChat 涵蓋的信息領域已經非常多,包括醫療、教育、運動、環保等多個話題。同時,筆者嘗試使用開源的 LLaMa-7B 模型在 UltraChat 上進行監督的指令微調,發現僅僅訓練 10000 步后就有非常可觀的效果,一些例子如下:

圖片

世界知識:分別列出 10 個很好的中國和美國大學?

圖片

想象問題:當時空旅行成為可能后,有什么可能的后果?

圖片

三段論:鯨魚是魚嗎?

圖片

假設問題:證明成龍比李小龍更出色

圖片

總體來說,UltraChat 是一個高質量、范圍廣的 ChatGPT 對話數據集,可以和其它數據集結合,顯著地提升開源對話模型的質量。目前 UltraChat 還只放出了英文版,但也會在未來放出中文版的數據。感興趣的讀者快去探索一下吧。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-08 07:33:48

2025-07-04 00:00:00

2025-07-17 09:28:09

2025-07-14 07:30:00

2023-05-21 23:40:03

開源圖文模型

2025-10-27 01:50:00

2023-04-04 19:09:20

ChatGPT開源

2020-04-23 13:51:05

AI管理GUI

2023-04-28 09:02:24

智能客服人工智能Siri

2023-01-14 14:59:05

達摩院

2023-05-08 06:52:47

開源PythonAPI

2024-01-08 13:33:00

數據訓練

2025-04-21 08:13:58

ChatGPTAINLP

2025-06-09 08:30:00

2023-09-02 12:49:01

2023-03-15 09:36:14

模型

2020-08-04 14:18:56

算法開源Github

2025-03-24 12:42:52

2025-05-23 09:18:25

點贊
收藏

51CTO技術棧公眾號

国产三级一区二区| 国产精品免费看| 91精品国产免费| 欧美一区二区视频在线播放| 亚州男人的天堂| 青娱乐精品在线视频| 久久国产精品久久久| 久久久久久久人妻无码中文字幕爆| 香蕉伊大人中文在线观看| 中文字幕第一页久久| 成人av电影免费| 无码人妻精品一区二区三区9厂| 97精品视频在线看| 亚洲精品乱码久久久久久金桔影视| 欧美自拍小视频| 黄色成人在线网| 国产精品毛片大码女人| 久久99久久99精品蜜柚传媒| 国产精品视频在线观看免费| 首页亚洲欧美制服丝腿| 欧美—级a级欧美特级ar全黄 | 国产视频一区在线观看| 亚洲影院在线看| 五月婷婷丁香在线| 99精品国产在热久久| 久久亚洲国产成人| 自拍偷拍你懂的| 亚洲精品白浆高清| 欧美精品一区二区三区四区| 日韩精品aaa| 久久精品国产福利| 日本福利一区二区| 国产女大学生av| 国产www视频在线观看| 亚洲欧美怡红院| 手机看片福利永久国产日韩| 婷婷在线免费观看| 国产**成人网毛片九色| 成人性生交大片免费观看嘿嘿视频 | 男女污污的视频| 国产精品vvv| 亚洲一区二区三区不卡国产欧美| 国产精品美女在线播放| 成a人片在线观看www视频| 久久久久国色av免费看影院| 久久国产精品 国产精品| 乱色精品无码一区二区国产盗| 蜜桃精品视频在线| 国产日产久久高清欧美一区| 国产在线一级片| 日韩有码一区二区三区| 日韩免费在线播放| 成人免费毛片视频| 美女网站久久| 国产成人在线视频| 7799精品视频天天看| 国产欧美精品久久| 欧美亚洲午夜视频在线观看| 日韩久久久久久久久| 超碰在线最新| 蜜桃成人av| 精品国产污网站| 亚洲自拍偷拍精品| 欧美aaaaaaaa牛牛影院| 亚洲精品国产精品久久清纯直播 | 中文资源在线播放| 日本亚洲欧美天堂免费| 国产精品入口福利| 国产精品国产一区二区三区四区| 极品销魂美女一区二区三区| 91福利入口| 少妇精品视频一区二区| 久久影院电视剧免费观看| 欧美男人的天堂| av女优在线| 亚洲色图一区二区三区| www.18av.com| 九色porny自拍视频在线观看| 欧美日韩国产丝袜另类| 欧美性猛交xxx乱久交| 日韩伦理一区二区| 精品卡一卡二卡三卡四在线| 三叶草欧洲码在线| 成人写真视频| 欧美成人性生活| 亚洲男人的天堂在线视频| 久久精品一区二区国产| 国产在线精品播放| 丰满肉肉bbwwbbww| 国产欧美视频一区二区三区| 日韩人妻一区二区三区蜜桃视频| 国内激情视频在线观看| 欧美午夜一区二区| 九九九久久久久久久| 精品国产一区二区三区不卡蜜臂| 国产一区二区黄| 岛国毛片在线观看| 久久综合图片| 91免费在线观看网站| 青青色在线视频| 亚洲视频综合在线| 国产免费一区二区三区视频| 欧美网站免费| 亚洲精品国产精品久久清纯直播| 国产不卡视频在线| 成人免费看片98| 天使萌一区二区三区免费观看| 成人激情免费在线| 五月天婷婷社区| 亚洲视频在线一区| 日韩视频在线免费看| 亚洲精品不卡在线观看| 在线成人中文字幕| 日本一区二区不卡在线| 久久精品国产精品亚洲综合| 欧美成人综合一区| 日本动漫同人动漫在线观看| 在线观看国产日韩| a天堂视频在线观看| 国产精品99久久| 日本sm极度另类视频| 粉嫩小泬无遮挡久久久久久| 国产欧美一区二区精品性色超碰| 久久综合色视频| 日韩一区网站| 日韩一区二区三区xxxx| 在线免费观看av网址| 成人视屏免费看| 国产一区一区三区| 91p九色成人| 亚洲乱码国产乱码精品精| 国产在线拍揄自揄拍无码视频| 九九视频精品免费| 午夜视频久久久| 日韩欧美看国产| 亚洲韩国日本中文字幕| 精品少妇一二三区| 国产高清成人在线| 麻豆映画在线观看| 免费观看性欧美大片无片| 最近2019中文免费高清视频观看www99 | 色综合亚洲欧洲| 国产精品久久久久久亚洲色| 欧美日本亚洲韩国国产| 成人自拍性视频| 成人在线免费看片| 在线播放中文一区| 蜜桃av免费观看| 美女一区二区久久| 另类少妇人与禽zozz0性伦| 日韩精品一区二区三区四| 牛牛电影国产一区二区| 日韩欧美你懂的| 久久久久亚洲av成人片| 国产成人免费在线观看| 国产精品一色哟哟| 国产劲爆久久| 69av视频在线播放| 青青草av免费在线观看| 欧美视频免费在线| 亚洲精品成人无码熟妇在线| 一区二区动漫| 欧美欧美一区二区| 国产精品99久久久久久董美香 | 日韩高清国产精品| 国产私拍福利精品视频二区| 中文日韩电影网站| 国产毛片在线视频| 亚洲综合激情网| 日韩网站在线播放| 老**午夜毛片一区二区三区| 色综合视频二区偷拍在线| 日韩一级视频| 欧美高跟鞋交xxxxhd| 性xxxx视频| 欧美怡红院视频| 精品欧美一区二区久久久久| jizz一区二区| 亚洲黄色a v| 你懂的成人av| 久久精品美女| 日韩黄色在线| 97香蕉久久夜色精品国产| 黄色大片在线看| 欧美一区二区三区在线观看| 亚欧洲精品在线视频| 国产三级精品视频| 日本中文字幕在线不卡| 免费日韩av片| 伊人情人网综合| 欧美理论电影在线精品| 国产精品美女久久| 欧美xxxxhdvideosex| 亚洲欧美国产高清va在线播| 国产又黄又爽视频| 精品成人在线视频| 久久人妻无码aⅴ毛片a片app| 成人的网站免费观看| 91在线观看免费高清完整版在线观看| 日本美女黄色一级片| 捆绑调教美女网站视频一区| 精品无码国产一区二区三区av| 精品国产一区二区三区小蝌蚪 | 99久久亚洲精品| 国产麻豆日韩| 亚洲精品一区二区在线播放∴| 亚洲91精品在线| 乱人伦中文视频在线| 日韩经典一区二区三区| 国产巨乳在线观看| 色噜噜狠狠成人中文综合| 免费日韩在线视频| 国产精品久久久99| 爱爱免费小视频| 国产99久久久国产精品潘金| 性欧美极品xxxx欧美一区二区| 亚洲美女毛片| 欧美 国产 精品| 国产在线日韩精品| 国产一区二区黄色| 人人九九精品视频| 国产在线观看91精品一区| 亚洲欧美小说色综合小说一区| 欧美美女操人视频| 91精彩在线视频| 亚洲人成电影在线播放| 日韩一区二区三区在线观看视频| 欧美日韩国产大片| 婷婷激情五月综合| 色综合久久天天| 欧美三级韩国三级日本三斤在线观看| 一区二区三区毛片| 欧美一区二区三区爽爽爽| 国产精品毛片高清在线完整版| 在线观看福利片| 99精品国产视频| 国产成人av无码精品| 国产成人一区在线| 91精品视频国产| 国产在线播精品第三| 夜夜夜夜夜夜操| 久久www免费人成看片高清| 亚洲黄色a v| 蜜臀久久99精品久久久久久9| 日韩无套无码精品| 久久精品官网| 国产精品人人妻人人爽人人牛| 久久精品动漫| 日韩中文字幕免费在线| 在线免费看h| 亚洲乱码一区二区三区在线观看| 级毛片内射视频| 国产日韩精品一区二区三区 | 亚洲品质自拍视频| 黄视频网站免费看| 亚洲免费视频中文字幕| 黄色在线观看免费| 亚洲高清免费视频| 日韩av黄色片| 色综合天天综合狠狠| 男人天堂视频在线| 欧美日韩国产成人在线免费| 99久久久久久久| 欧美一级高清片| 性生交生活影碟片| 精品国产乱码久久| 亚洲欧美色视频| 亚洲区免费影片| 中文字幕在线观看日本| 久久久999精品免费| 美女航空一级毛片在线播放| 欧美亚洲伦理www| 欧美国产日韩电影| 99视频免费观看蜜桃视频| 久久综合五月婷婷| 丝袜足脚交91精品| 亚洲91久久| 国产97在线 | 亚洲| 欧美在线综合| 亚洲18在线看污www麻豆| 国产成人av电影在线| 香蕉网在线播放| 亚洲视频免费看| 在线观看中文字幕视频| 欧美视频一区二区三区四区 | 视频精品导航| julia一区二区中文久久94| 小说区图片区色综合区| 在线视频不卡一区二区三区| 影音先锋亚洲电影| 少妇一级淫免费播放| 成+人+亚洲+综合天堂| 国产破处视频在线观看| 亚洲国产成人高清精品| 波多野结衣家庭主妇| 欧美一区二区在线免费观看| 三级毛片在线免费看| 久久精品成人动漫| 最新中文字幕在线播放| 91网免费观看| 狠狠综合久久av一区二区蜜桃| 成人免费在线视频播放| 热久久一区二区| 99久久人妻精品免费二区| 自拍偷拍欧美激情| 日本高清不卡码| 日韩欧美国产系列| 在线播放麻豆| 在线观看91精品国产入口| 国产十八熟妇av成人一区| 国产欧美1区2区3区| 精品无码人妻一区二区三区| 欧美日韩亚洲不卡| 青青草在线视频免费观看| 九九精品视频在线观看| 成人在线免费av| 蜜桃91精品入口| 亚洲国产mv| 原创真实夫妻啪啪av| 欧美国产一区在线| 可以免费在线观看的av| 日韩欧美激情四射| 欧美性videos| 国产精品老女人视频| 亚洲人成网亚洲欧洲无码| 日韩伦理在线免费观看| 国产乱子轮精品视频| 特级西西人体高清大胆| 色综合av在线| 色视频在线看| 羞羞色国产精品| 91精品国产自产精品男人的天堂| 一区二区三区四区免费视频| 日韩一区精品字幕| 日韩乱码人妻无码中文字幕久久 | 中文字幕a级片| 亚洲男人天堂手机在线| 精品众筹模特私拍视频| 91成人伦理在线电影| 欧美韩国一区| 特种兵之深入敌后| 亚洲黄色录像片| 亚洲第一视频在线播放| 欧美黄色小视频| 伊色综合久久之综合久久| 免费的一级黄色片| 国产成人午夜精品5599| 久久亚洲AV无码| 亚洲黄色www| 高清不卡av| 日本精品一区二区三区视频| 日本成人中文字幕在线视频| eeuss中文字幕| 欧美电影在线免费观看| 超碰在线观看免费| 97久久人人超碰caoprom欧美| 午夜国产精品视频| 黑人巨大猛交丰满少妇| 亚洲成人第一页| 日本视频在线观看一区二区三区| 2023亚洲男人天堂| av在线不卡免费观看| 国产色视频在线播放| 亚洲欧洲国产日韩| www.亚洲黄色| 97超级碰碰碰久久久| 国产精品一区二区av交换| 成人免费在线观看视频网站| 综合网在线视频| 亚洲男人第一天堂| 2019国产精品自在线拍国产不卡| 久久爱www成人| 黄色aaaaaa| 亚洲第一在线综合网站| 九九九伊在人线综合| 国产一区二区色| 丝袜中文在线| 欧美v亚洲v综合ⅴ国产v| 国产成人午夜| 国内精品久久国产| 青青草国产精品亚洲专区无| 一区二区成人免费视频| 亚洲а∨天堂久久精品9966| 亚洲www啪成人一区二区| 国产高清精品软男同| 成人免费福利片| 中文字幕乱码无码人妻系列蜜桃| 另类色图亚洲色图| 最近国产精品视频| 国产精品久久久久久久99| 黄色成人在线播放| 欧美三级电影一区二区三区| 国产精品精品软件视频| 奇米精品一区二区三区在线观看| 免费中文字幕视频| 在线色欧美三级视频| 中文一区二区三区四区| 嫩草影院国产精品| 婷婷丁香激情综合| 动漫一区在线|