精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

世界首款真開源類ChatGPT大模型Dolly 2.0,可隨意修改商用

人工智能 新聞
我們鼓勵員工手搓了一個數據集,訓練 LLM 還把它開源。

眾所周知,在 ChatGPT 的問題上 OpenAI 并不 Open,從 Meta 那里開源的羊駝系列模型也因為數據集等問題「僅限于學術研究類應用」,在人們還在因為尋找繞過限制方法的時候,主打 100% 開源的大模型來了。

4 月 12 日,Databricks 發布了 Dolly 2.0,這是兩周前發布的類 ChatGPT 人類交互性(指令遵循)大語言模型(LLM)的又一個新版本。

Databricks 表示,Dolly 2.0 是業內第一個開源、遵循指令的 LLM,它在透明且免費提供的數據集上進行了微調,該數據集也是開源的,可用于商業目的。這意味著 Dolly 2.0 可用于構建商業應用程序,無需支付 API 訪問費用或與第三方共享數據。

圖片

  • 項目鏈接:https://huggingface.co/databricks/dolly-v2-12b
  • 數據集:https://github.com/databrickslabs/dolly/tree/master/data

根據 Databricks 首席執行官 Ali Ghodsi 的說法,雖然已有其他大模型可以用于商業目的,但「它們不會像 Dolly 2.0 那樣與你交談。」而且基于 Dolly 2.0 模型,用戶可以修改和改進訓練數據,因為它是在開源許可下免費提供的。所以你可以制作你自己的 Dolly 版本。

Databricks 還發布了 Dolly 2.0 在其上進行微調的數據集,稱為 databricks-dolly-15k。這是由數千名 Databricks 員工生成的超過 1.5 萬條記錄的語料庫,Databricks 稱這是「第一個開源的、人工生成的指令語料庫,專門設計用于讓大型語言能夠展示出 ChatGPT 的神奇交互性。」

Dolly 2.0 是怎么誕生的

在過去的兩個月里,業界、學界紛紛追趕 OpenAI 提出了一波遵循指令的類 ChatGPT 大模型,這些版本被許多定義視為開源(或提供某種程度的開放性或有限訪問)。其中 Meta 的 LLaMA 最受人關注,它引發了大量進一步改進的模型,如 Alpaca、Koala、Vicuna 以及 Databricks 的 Dolly 1.0。

但另一方面,許多這些「開放」模型都處于「工業限制」之下,因為它們接受了旨在限制商業用途的條款的數據集的訓練 —— 例如來自 StanfordAlpaca 項目的 5.2 萬個問答數據集,是根據 OpenAI 的 ChatGPT 的輸出進行訓練的。而 OpenAI 的使用條款包括一條規則,即你不能使用 OpenAI 的服務反過來與其競爭。

Databricks 思考了解決這個問題的方法:新提出的 Dolly 2.0 是一個 120 億參數的語言模型,它基于開源 EleutherAI pythia 模型系列,專門針對小型開源指令記錄語料庫進行了微調(databricks-dolly-15k),該數據集由 Databricks 員工生成,許可條款允許出于任何目的使用、修改和擴展,包括學術或商業應用。

到目前為止,在 ChatGPT 的輸出上訓練的模型一直處于合法的灰色地帶?!刚麄€社區一直在小心翼翼地解決這個問題,每個人都在發布這些模型,但沒有一個可以用于商業用途,」Ghodsi 表示。「這就是我們非常興奮的原因?!?/span>

「其他人都想做得更大,但我們實際上對更小的東西感興趣,」Ghodsi 在談到 Dolly 的微縮規模時說?!钙浯危覀兎喠怂械拇鸢?,它是高質量的?!?/span>

Ghodsi 表示,他相信 Dolly 2.0 將啟動「雪球」效應,讓人工智能領域的其他人加入并提出其他替代方案。他解釋說,對商業用途的限制是一個需要克服的大障礙:「我們現在很興奮,因為我們終于找到了一個繞過它的方法。我保證你會看到人們將這 15000 個問題應用于現有的每一個模型,他們會看到這些模型中有多少突然變得有點神奇,你可以與它們互動?!?/span>

手搓數據集

要下載 Dolly 2.0 模型的權重,只需訪問 Databricks Hugging Face 頁面,并訪問 databricks-labs 的 Dolly repo,下載 databricks-dolly-15k 數據集。

「databricks-dolly-15k」數據集包含 15000 個高質量的人類生成的 prompt / 回復對,由 5000 多名 Databricks 員工在 2023 年 3 月和 4 月期間撰寫,專門設計用于指令調優大型語言模型。這些訓練記錄自然、富有表現力,旨在代表廣泛的行為,從頭腦風暴、內容生成到信息提取和總結。

根據該數據集的許可條款(Creative Commons Attribution-ShareAlike 3.0 Unported License),任何人都可因任何目的使用、修改或擴展這個數據集,包括商業應用。

目前,這一數據集是首個開源的、由人類生成的指令數據集。

為什么要創建這樣一個數據集?團隊也在博客中解釋了原因。

創建 Dolly 1.0 或任何遵循 LLM 的指令的一個關鍵步驟是,在指令和回復對的數據集上訓練模型。Dolly 1.0 的訓練費用為 30 美元,使用的是斯坦福大學 Alpaca 團隊用 OpenAI API 創建的數據集。

在 Dolly 1.0 發布之后,就有很多人要求試用,此外還有一部分用戶希望在商業上使用這個模型。

但是訓練數據集包含 ChatGPT 的輸出,正如斯坦福大學團隊所指出的,服務條款試圖阻止任何人創建一個與 OpenAI 競爭的模型。

此前,所有的知名指令遵循模型(Alpaca、Koala、GPT4All、Vicuna)都受到這種限制:禁止商業使用。為了解決這個難題,Dolly 團隊開始尋找方法來創建一個沒有商業用途限制的新數據集。

具體而言,團隊從 OpenAI 公布的研究論文中得知,最初的 InstructGPT 模型是在一個由 13000 個指令遵循行為演示組成的數據集上訓練出來的。受此啟發,他們開始研究是否可以在 Databricks 員工的帶領下取得類似的結果。

結果發現,生成 13000 個問題和答案比想象中更難。因為每個答案都必須是原創的,不能從 ChatGPT 或網絡上的任何地方復制,否則會「污染」數據集。但 Databricks 有超過 5000 名員工,他們對 LLM 非常感興趣。因此,團隊進行了一次眾包實驗,創造出了比 40 位標注者為 OpenAI 創造的更高質量的數據集。

當然,這項工作耗時耗力,為了激勵大家,團隊設立置一個競賽,前 20 名的標注者將獲得驚喜大獎。同時,他們也列出了 7 項非常具體的任務:

  • 公開問答:例如「為什么人們喜歡喜劇電影?」或「法國的首都是什么?」在某些情況下,沒有一個正確的答案,而在其他情況下,需要借助于整個世界的知識;
  • 封閉式問答:這些問題只用一段參考文獻中的信息就可以回答。例如,給定維基百科中關于原子的一段,人們可能會問:「原子核中質子和中子的比例是多少?」;
  • 從維基百科中提取信息:在這里,標注者會從維基百科上復制一個段落,并從該段落中提取實體或其他事實信息,如重量或測量;
  • 總結維基百科上的信息:對于這一點,注釋者從維基百科上提供了一段話,并被要求將其提煉為一個簡短的摘要;
  • 集思廣益:這項任務要求進行開放式的構思,并列出相關的可能選項。例如「這個周末我可以和我的朋友做哪些有趣的活動?」;
  • 分類:在這項任務中,標注者被要求對類別成員進行判斷(例如,列表中的項目是動物、礦物還是蔬菜),或者判斷一段短文的屬性,例如電影評論的情緒;
  • 創意寫作:這項任務將包括寫一首詩或一封情書等內容。

以下是一些示例:

圖片

圖片

最開始,團隊對于是否能達到 10000 個結果持懷疑態度。但通過每晚的排行榜游戲,一周內就成功地突破了 15000 個結果。

隨后,出于對「占用員工生產力」的擔心,團隊關閉了比賽(這很合理)。

商業化的可行性

在數據集火速創建完成之后,團隊開始考慮商業應用的問題了。

他們想制作一個可在商業上使用的開源模型。盡管 databricks-dolly-15k 比 Alpaca(訓練 Dolly 1.0 的數據集)小得多,但基于 EleutherAI pythia-12b 的 Dolly 2.0 模型卻表現出高質量的指令遵循行為。

事后看來,這并不令人驚訝。畢竟最近幾個月發布的許多指令調優數據集包含合成數據,這些數據往往包含幻覺和事實錯誤。

另一方面,databricks-dolly-15k 是由專業人士生成的,質量很高,而且包含大多數任務的長篇答案。

以下是 Dolly 2.0 用于總結和內容生成的一些例子:

圖片

圖片

圖片

Dolly 團隊表示,根據最初的客戶反饋,像這樣的能力可在整個企業中進行廣泛的應用。因為很多企業希望擁有自己的模型,以此為自己的特定領域應用創建更高質量的模型,而不是將自己的敏感數據交給第三方。

Dolly 2 的開源為構建更好的大模型生態開了一個好頭。開放源代碼的數據集和模型鼓勵評論、研究和創新,有助于確保每個人都從人工智能技術的進步中受益。Dolly 團隊期望新模型和開源數據集將作為眾多后續工作的種子,幫助引導出更強大的語言模型。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-02 21:39:14

ChatGPT開源

2009-04-29 09:23:04

rapid-frame2.0封裝

2018-09-05 17:14:36

戴爾

2024-01-18 15:10:47

開源模型開源InternLM2

2009-05-13 08:06:56

九城魔獸協議帳號

2009-03-10 08:43:38

Erwise圖形瀏覽器

2023-05-12 13:14:59

ChatGPTAI工具

2025-09-16 12:53:54

2012-05-24 10:32:54

網絡流量網絡中立法

2023-03-21 08:10:18

2023-07-25 13:52:54

開源模型

2012-03-02 13:43:28

2024-01-15 14:19:34

開源ChatGPT

2023-07-28 15:39:20

TransGPT人工智能開源

2024-02-06 10:38:10

昆侖萬維大模型

2023-06-16 14:10:45

開源人工智能

2023-08-03 19:11:45

2024-01-22 13:59:00

模型訓練

2025-09-28 04:00:00

CWM世界模型語言模型
點贊
收藏

51CTO技術棧公眾號

午夜视频福利在线观看| 欧美日韩一级大片| 国产69精品久久久久9999人| 国产精品三级视频| 51成人做爰www免费看网站| 九九久久免费视频| 五月激激激综合网色播| 欧美日韩中文另类| 欧美日韩视频免费| 免费在线黄色影片| 国产又黄又大久久| 欧洲中文字幕国产精品| 日韩三级久久久| 久久影院资源站| 欧美日韩三级在线| 成人黄色av片| free性欧美hd另类精品| 99精品欧美一区| 成人在线一区二区| 久久99国产综合精品免费| 精品美女在线视频| 亚洲第一视频网站| 日韩欧美国产片| 波多野结衣亚洲| 一区二区三区不卡视频| 亚洲精品成人久久久998| 亚洲成人777777| 久久超碰97中文字幕| 欧美亚洲国产视频| 久久精品久久国产| 亚洲精品tv久久久久久久久久| 精品无人区乱码1区2区3区在线| 日本网站在线看| 久久天堂av| 欧美日韩一二三四五区| 欧美性受黑人性爽| 在线a免费看| 久久久久国色av免费看影院| 国产精品免费观看高清| 中文字幕在线日亚洲9| 国产亚洲精品v| 欧美激情亚洲激情| 麻豆成人在线视频| 在线观看免费一区二区| 日韩亚洲第一页| 91成人精品一区二区| 伊人久久大香线蕉综合网站| 亚洲精品国产精品国自产观看浪潮| 黄色一级片免费播放| 91成人app| 欧美日韩国产另类不卡| 免费看污黄网站| 欧美三级精品| 91成人免费网站| 国产女女做受ⅹxx高潮| 欲香欲色天天天综合和网| 午夜视频在线观看一区二区三区| 日本成人在线不卡| 天堂av最新在线| 亚洲综合久久久| 成人黄色大片网站| 国产精品186在线观看在线播放| 亚洲综合一区二区精品导航| 9191国产视频| 日韩三级免费| 亚洲地区一二三色| 亚洲熟妇无码另类久久久| 爱情岛亚洲播放路线| 亚洲成a人片在线不卡一二三区 | 亚洲精选一区二区三区| 国产一区不卡在线| 国产精品露出视频| 午夜18视频在线观看| 91麻豆国产精品久久| 欧美日韩一区二| av在线电影观看| 自拍偷拍亚洲欧美日韩| 永久免费网站视频在线观看| 日本色护士高潮视频在线观看| 亚洲永久免费视频| 国产视频一视频二| yw.尤物在线精品视频| 欧美另类一区二区三区| 黑人巨大猛交丰满少妇| 老司机aⅴ在线精品导航| 亚洲视频一区二区| 91嫩草丨国产丨精品| 亚洲视频日本| 国产不卡精品视男人的天堂| 亚洲一区二区三区高清视频| 国产精品99久久不卡二区| 久久国产精品一区二区三区四区| 国产福利第一视频在线播放| 亚洲男同性恋视频| 国产免费黄色av| 亚洲国产91视频| 亚洲成人精品av| 老头老太做爰xxx视频| 最新精品国产| 国产成人一区二区在线| h片在线免费看| 久久先锋影音av鲁色资源网| 色呦呦网站入口| 日本黄色免费在线| 7777精品伊人久久久大香线蕉经典版下载 | 天天干天天干天天操| 奇米精品一区二区三区四区| 成人动漫在线视频| аⅴ资源新版在线天堂| 亚洲一线二线三线视频| 亚洲欧美自拍另类日韩| 久久悠悠精品综合网| 久久夜精品va视频免费观看| 日本三级视频在线| 精品亚洲国内自在自线福利| 快播亚洲色图| 大香伊人中文字幕精品| 777午夜精品免费视频| 人妻一区二区视频| 亚洲理伦在线| 51午夜精品| 日韩伦理在线观看| 色天天综合久久久久综合片| 亚洲一区和二区| 日韩av免费大片| 欧美在线中文字幕| 欧洲精品久久一区二区| 亚洲欧美另类久久久精品2019| 99视频在线免费| 96sao在线精品免费视频| 精品精品国产国产自在线| 草莓视频18免费观看| eeuss影院一区二区三区| wwwjizzjizzcom| 91精品麻豆| 日韩天堂在线视频| 91久久国语露脸精品国产高跟| 国产亚洲综合在线| 欧洲av无码放荡人妇网站| 国产精品美女在线观看直播| 九九热这里只有在线精品视| 国产又爽又黄又嫩又猛又粗| 国产精品色哟哟| 毛片毛片毛片毛片毛片毛片毛片毛片毛片| 欧美国产极品| 91精品成人久久| 少妇人妻一区二区| 亚洲成人黄色影院| 在线观看免费视频黄| 一区在线免费| 国产精品区一区二区三含羞草| 四虎影视国产在线视频| 欧美成人免费网站| 久久精品亚洲无码| 北岛玲一区二区三区四区| 久久手机在线视频| 国产精品nxnn| 5278欧美一区二区三区| 日本黄在线观看| 一本久久a久久精品亚洲| www.av天天| 免费视频一区二区| 影音先锋在线亚洲| 日本少妇精品亚洲第一区| 欧美第一黄网免费网站| 人妻夜夜爽天天爽| 欧美特级www| 美国美女黄色片| 韩国精品久久久| 4444亚洲人成无码网在线观看| а√中文在线天堂精品| 国模视频一区二区| 国产在线一二三区| 欧美猛男超大videosgay| 国产精品久久久精品四季影院| 国产成人aaa| 成年人视频网站免费观看| 精品久久精品| 91文字幕巨乱亚洲香蕉| 一本大道色婷婷在线| 日韩在线中文视频| 性欧美18一19性猛交| 狠狠躁夜夜躁人人爽超碰91| 怡红院一区二区三区| 韩国成人在线视频| 国产网站免费在线观看| 久久中文字幕av一区二区不卡| 亚洲在线免费观看| 日韩伦理在线| 久久精品亚洲一区| 天天综合网在线| 欧美亚洲综合网| 久久久久久久久艹| 国产清纯美女被跳蛋高潮一区二区久久w | 国产高清久久久久| 又粗又黑又大的吊av| 久久中文字幕av| 久久大香伊蕉在人线观看热2| 国产成+人+综合+亚洲欧美| 欧美福利视频在线| 国产福利在线看| 欧美精品一区二区三区蜜桃视频 | 久久午夜精品| 亚洲激情免费视频| 欧美精选一区二区三区| 国产精品香蕉视屏| 日韩黄色在线| 欧美在线观看网站| 色a资源在线| 按摩亚洲人久久| 久久手机免费观看| 精品久久久三级丝袜| 亚洲天堂手机在线| 色综合色综合色综合| 妺妺窝人体色www聚色窝仙踪| 国产精品美女久久久久久久 | 亚洲第一狼人区| 99热精品在线观看| 影音先锋成人资源网站| 清纯唯美亚洲综合一区| 久久99精品久久久久久久青青日本| 亚州欧美在线| 国产精品视频中文字幕91| 国产剧情av在线播放| 上原亚衣av一区二区三区| 日韩av资源| 亚洲国产高潮在线观看| 国产成人久久精品77777综合 | 国产精品27p| 欧美男男激情videos| 欧美激情一级欧美精品| sm国产在线调教视频| 日韩视频精品在线| 国产黄在线观看| 亚洲欧美中文日韩在线| 人妻少妇一区二区三区| 日韩精品在线看片z| 国产精品久久久久毛片| 欧美人伦禁忌dvd放荡欲情| 欧美性受xxx黑人xyx性爽| 91久久奴性调教| 69亚洲精品久久久蜜桃小说| 欧美日韩激情小视频| 国产精品999久久久| 亚洲一区二区三区四区在线免费观看| 少妇被躁爽到高潮无码文| 中文字幕一区在线观看| 在线视频这里只有精品| 中文字幕在线观看不卡视频| 国产探花在线视频| 亚洲三级在线免费| 手机在线免费看毛片| 尤物视频一区二区| 国产亚洲成人精品| 天天综合日日夜夜精品| 亚洲日本视频在线观看| 色综合天天综合| 波多野结衣mp4| 欧美写真视频网站| 97人妻精品一区二区三区| 欧美一区二区免费视频| 亚洲av无码乱码在线观看性色| 欧美成人乱码一区二区三区| 蜜桃av噜噜一区二区三区麻豆| 欧美精品一区二区三区在线| 午夜性色福利视频| 一区二区成人精品| 老司机精品影院| 久久露脸国产精品| 亚洲精品永久免费视频| 国产精品视频专区| 亚洲开心激情| 久久99蜜桃综合影院免费观看| 亚洲免费毛片| 伊人久久青草| 精品动漫3d一区二区三区免费| 国产一级爱c视频| 日韩在线一区二区| www.五月天色| av网站免费线看精品| 在线观看福利片| 日韩一区在线看| 日本一二三区视频| 色国产综合视频| 国产免费不卡视频| 日韩成人在线视频| 日本综合在线| 久久久久中文字幕| 成人全视频在线观看在线播放高清| 91日韩在线播放| 亚洲高清极品| 超碰97免费观看| 国产精品婷婷| 中文字幕亚洲影院| 26uuu精品一区二区| 麻豆天美蜜桃91| 色综合久久久久| a天堂在线视频| 国产亚洲综合久久| av在线最新| 成人在线视频网| 日韩欧美国产大片| 国产911在线观看| 久久综合图片| 国产一卡二卡三卡四卡| 国产精品美女久久久久久2018| 亚洲黄色一区二区| 538在线一区二区精品国产| 天堂在线一二区| 欧美成人精品在线视频| 日韩av超清在线观看| 国产精品欧美久久| 亚洲成人二区| 无码少妇一区二区三区芒果| 成人黄色a**站在线观看| 99热这里只有精品4| 一本久久a久久精品亚洲| 亚洲国产视频一区二区三区| 日韩在线欧美在线| 福利影院在线看| 鬼打鬼之黄金道士1992林正英| 日韩三级在线| 国产精品无码av无码| 99久久免费国产| 久久久全国免费视频| 69久久99精品久久久久婷婷| 国产精品一二三区视频| 欧美亚洲激情视频| 哺乳挤奶一区二区三区免费看| 一区二区三区四区免费观看| 免费观看日韩电影| 国产在线观看h| 一本一道波多野结衣一区二区 | 99re成人精品视频| 欧美日韩精品在线观看视频 | 青青青草网站免费视频在线观看| 欧美国产日韩免费| 91国内精品白嫩初高生| 日产精品久久久久久久蜜臀| 国内精品写真在线观看| 男人天堂资源网| 欧美性三三影院| 国产福利第一视频在线播放| 国产精品91免费在线| 国产亚洲一卡2卡3卡4卡新区 | 国精品产品一区| 亚洲国产精品综合| 麻豆专区一区二区三区四区五区| a天堂中文字幕| 欧美私模裸体表演在线观看| 超碰免费在线| 国产精品视频区1| 欧美3p在线观看| 天天色天天综合网| 亚洲乱码中文字幕| 亚洲男女视频在线观看| 欧美精品国产精品日韩精品| 99久热这里只有精品视频免费观看| 亚洲中文字幕无码一区二区三区| 丰满少妇久久久久久久| 国产乡下妇女做爰视频| 日韩风俗一区 二区| 六月婷婷综合| 亚洲一区二区高清视频| 精品一区中文字幕| 国产一级理论片| 日韩二区三区在线| 成人黄色免费观看| 男女裸体影院高潮| av电影一区二区| 欧美brazzers| 久久精品成人动漫| a看欧美黄色女同性恋| 国产99久久九九精品无码| 久久精品一区二区三区不卡牛牛| 中文字幕人妻一区二区三区视频| 久久精品一偷一偷国产| 大香伊人久久精品一区二区| 国产精品亚洲αv天堂无码| 国产精品女人毛片| 精品久久久久久亚洲综合网站| 国内精品久久久久久久久| 免费av一区| 天天av天天操| 疯狂欧美牲乱大交777| 色网站在线看| 国产乱码精品一区二区三区中文 | 国产女主播在线直播| 91九色单男在线观看| 99精品国产一区二区青青牛奶| 日本xxxxxxxxx18| 欧美一区二区三区小说| 男人av在线播放| www.午夜色| 26uuu欧美| 精品久久久免费视频| 国产精品露脸自拍| 亚洲第一毛片| 69夜色精品国产69乱| 精品视频一区在线视频|