精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

談談GPT 模型背后以數據為中心的 AI

人工智能
人工智能 (AI) 在改變我們生活、工作和與技術互動的方式方面取得了巨大的進步。最近,取得重大進展的領域是大型語言模型 (LLM) 的開發,例如GPT-3、ChatGPT和GPT-4。這些模型能夠準確的執行語言翻譯、文本摘要和問答等任務。

人工智能 (AI) 在改變我們生活、工作和與技術互動的方式方面取得了巨大的進步。最近,取得重大進展的領域是大型語言模型 (LLM) 的開發,例如GPT-3、ChatGPT和GPT-4。這些模型能夠準確的執行語言翻譯、文本摘要和問答等任務。

圖片

雖然很難忽視 LLM 不斷增加的模型規模,但同樣重要的是要認識到,他們的成功很大程度上歸功于用于訓練他們的大量高質量數據。

在本文中,我們將從以數據為中心的 AI 角度概述 LLM 的最新進展。我們將通過以數據為中心的 AI 視角研究 GPT 模型,這是數據科學界中一個不斷發展的概念。我們通過討論三個以數據為中心的 AI 目標:訓練數據開發、推理數據開發和數據維護,來揭示 GPT 模型背后以數據為中心的 AI 概念。

大型語言模型 (LLM) 和 GPT 模型

LLM 是一種自然語言處理模型,經過訓練可以在上下文中推斷單詞。例如,LLM 最基本的功能是在給定上下文的情況下預測缺失的標記。為此,LLM 接受了訓練,可以從海量數據中預測每個候選單詞的概率。下圖是在上下文中使用 LLM 預測丟失標記的概率的說明性示例。

GPT模型是指OpenAI創建的一系列LLM,如GPT-1、GPT-2、GPT-3、InstructGPT、ChatGPT/GPT-4等。與其他 LLM 一樣,GPT 模型的架構主要基于Transformers,它使用文本和位置嵌入作為輸入,并使用注意力層來模擬令牌的關系。

GPT-1 模型架構

后來的 GPT 模型使用與 GPT-1 類似的架構,除了使用更多模型參數和更多層、更大的上下文長度、隱藏層大小等。

什么是以數據為中心的人工智能

以數據為中心的 AI是一種新興的思考如何構建 AI 系統的新方法。以數據為中心的人工智能是系統地設計用于構建人工智能系統的數據的學科。

過去,我們主要專注于在數據基本不變的情況下創建更好的模型(以模型為中心的 AI)。然而,這種方法在現實世界中可能會導致問題,因為它沒有考慮數據中可能出現的不同問題,例如標簽不準確、重復和偏差。因此,“過度擬合”數據集不一定會導致更好的模型行為。

相比之下,以數據為中心的人工智能專注于提高用于構建人工智能系統的數據的質量和數量。這意味著注意力在數據本身,模型相對更固定。使用以數據為中心的方法開發人工智能系統在現實場景中具有更大的潛力,因為用于訓練的數據最終決定了模型的最大能力。

需要注意的是,“以數據為中心”與“數據驅動”有著根本的區別,后者只強調用數據來指導人工智能的發展,通常仍以開發模型而不是數據為中心。

圖片

以數據為中心的人工智能與以模型為中心的人工智能之間的比較

以數據為中心的 AI 框架包含三個目標:

  • 訓練數據開發就是收集和生產豐富、高質量的數據,以支持機器學習模型的訓練。
  • 推理數據開發是為了創建新的評估集,這些評估集可以提供對模型的更細粒度的洞察力,或者通過數據輸入觸發模型的特定功能。
  • 數據維護是為了在動態環境下保證數據的質量和可靠性。數據維護至關重要,因為現實世界中的數據不是一次性創建的,而是需要持續維護。

圖片

以數據為中心的 AI 框架

為什么以數據為中心的 AI 使 GPT 模型成功

幾個月前,Yann LeCun 在推特上表示 ChatGPT 并不是什么新鮮事。事實上,ChatGPT 和 GPT-4 中使用的所有技術(變壓器、從人類反饋中強化學習等)一點都不新鮮。然而,他們確實取得了以前模型無法實現的結果。那么,他們成功的原因什么?

訓練數據開發。通過更好的數據收集、數據標記和數據準備策略,用于訓練 GPT 模型的數據的數量和質量有了顯著提高。

  • GPT-1:BooksCorpus 數據集用于訓練。該數據集包含4629.00 MB 的原始文本,涵蓋各種類型的書籍,例如冒險、幻想和浪漫。
    -以數據為中心的 AI 策略:無。
    -結果:在該數據集上使用 GPT-1 可以通過微調提高下游任務的性能。
  • GPT-2:訓練中使用WebText 。這是 OpenAI 中的一個內部數據集,通過從 Reddit 抓取出站鏈接創建。
    -以數據為中心的 AI 策略:(1) 僅使用來自 Reddit 的出站鏈接來整理/過濾數據,該鏈接至少獲得 3 個業力。(2) 使用工具Dragnet和Newspaper來提取干凈的內容。(3) 采用去重和其他一些基于啟發式的清洗。
    -結果:過濾后得到 40 GB 的文本。GPT-2 無需微調即可獲得強大的零樣本結果。
  • GPT-3:GPT-3的訓練主要基于Common Crawl。
    -以數據為中心的 AI 策略:(1) 訓練分類器根據每個文檔與WebText(高質量文檔)的相似性過濾掉低質量文檔。(2)利用Spark的MinHashLSH對文檔進行模糊去重。(3) 使用WebText、圖書語料庫和維基百科擴充數據。
    - 結果:45TB的明文過濾后得到570GB的文本(本次質量過濾只選擇了1.27%的數據)。GPT-3 在零樣本設置中明顯優于 GPT-2。
  • InstructGPT:讓人類評估調整GPT-3 的答案,使其更好地符合人類的期望。他們為標注者設計了測試,只有通過測試的人才有資格標注。他們甚至設計了一項調查,以確保注釋者全心投入到注釋過程中。
    -以數據為中心的 AI 策略:(1)使用人類提供的提示答案通過監督訓練調整模型。(2)收集比較數據以訓練獎勵模型,然后使用此獎勵模型通過人類反饋強化學習(RLHF)調整GPT-3。
    - 結果:InstructGPT 表現出更好的真實性和更少的偏差,即更好的對齊。
  • ChatGPT/GPT-4:OpenAI 沒有透露細節。但眾所周知,ChatGPT/GPT-4 很大程度上沿用了之前 GPT 模型的設計,他們仍然使用 RLHF 來調整模型(可能有更多和更高質量的數據/標簽)。人們普遍認為,隨著模型權重的增加,GPT-4 使用了更大的數據集。

推理數據開發。由于最近的 GPT 模型已經足夠強大,我們可以通過在模型固定的情況下調整提示或調整推理數據來實現各種目標。例如,我們可以通過提供要總結的文本以及諸如“總結它”或“TL;DR”之類的指令來引導推理過程,從而進行文本摘要。

圖片

及時調整

設計正確的推理提示是一項具有挑戰性的任務。它嚴重依賴啟發式方法。一個很好的調查總結了不同的促銷方法。有時,即使是語義相似的提示也會有非常不同的輸出。在這種情況下,可能需要基于軟提示的校準來減少方差。

圖片

LLM推理數據開發的研究仍處于早期階段。在不久的將來,可以在 LLM 中應用更多已用于其他任務的推理數據開發技術。

數據維護。ChatGPT/GPT-4作為商業產品,不僅訓練一次,而且不斷更新和維護。顯然,我們無法知道在 OpenAI 之外如何進行數據維護。因此,我們討論了一些通用的以數據為中心的 AI 策略,這些策略已經或將很可能用于 GPT 模型:
- 連續數據收集:當我們使用 ChatGPT/GPT-4 時,我們的提示/反饋可能反過來被 OpenAI 使用進一步推進他們的模型。可能已經設計并實施了質量指標和保證策略,以在此過程中收集高質量數據。
- 數據理解工具:可以開發各種工具來可視化和理解用戶數據,促進更好地了解用戶需求并指導未來改進的方向。
- 高效的數據處理:隨著ChatGPT/GPT-4用戶數量的快速增長,需要一個高效的數據管理系統來實現快速的數據采集。

圖片

上圖是ChatGPT/GPT-4 通過“贊”和“不贊”收集用戶反饋的示例。

數據科學界可以從這波 LLM 浪潮中學到什么

LLM的成功徹底改變了人工智能。展望未來,LLM可以進一步徹底改變數據科學生命周期。我們做出兩個預測:

  • 以數據為中心的人工智能變得更加重要。經過多年研究,模型設計已經非常成熟,尤其是在Transformer之后。數據成為未來改進 AI 系統的關鍵方式。另外,當模型變得足夠強大時,我們就不需要在日常工作中訓練模型了。相反,我們只需要設計適當的推理數據來從模型中探索知識。因此,以數據為中心的人工智能的研發將推動未來的進步。
  • LLM將實現更好的以數據為中心的人工智能解決方案

許多繁瑣的數據科學工作可以在LLM的幫助下更有效地進行。例如,ChaGPT/GPT-4 已經可以編寫可工作的代碼來處理和清洗數據。此外,LLM 甚至可以用于創建訓練數據。例如使用 LLM 生成合成數據可以提高文本挖掘中的模型性能。

圖片

責任編輯:華軒 來源: 數據驅動智能
相關推薦

2023-04-23 08:00:00

人工智能ChatGPTGPT模型

2021-10-18 10:43:59

數據數據中心DCIM

2017-04-11 20:10:56

2021-03-24 14:13:51

數據分析架構大數據

2023-11-07 08:28:08

GPT模型環境

2012-07-30 09:48:32

設計管理

2011-08-05 16:36:02

Informatica數據中心

2023-12-28 15:22:19

AI

2024-01-31 09:00:12

人工智能數據模型

2022-02-21 10:18:13

機器學習數據模型

2025-05-16 01:00:00

2023-01-04 13:03:22

AI模型

2018-12-14 09:39:07

軟件開發用戶迭代

2013-08-16 10:14:32

APIWeb應用以API為中心的Web

2010-11-09 10:22:19

開放數據中心云計算

2024-09-12 09:20:48

2024-03-04 16:27:06

數據中心

2011-07-08 09:55:02

數據中心防震

2021-08-20 10:13:38

人工智能AI深度學習

2013-10-11 18:46:57

點贊
收藏

51CTO技術棧公眾號

久久国产精品99久久久久久丝袜| 亚洲欧美一区二区三区四区| 996这里只有精品| 亚洲成人777777| 香蕉av777xxx色综合一区| 亚洲小视频在线| 日韩欧美中文视频| 中老年在线免费视频| 亚洲国产精品二十页| 99精品欧美一区二区三区| 天堂网中文字幕| 久久久久久久久99精品大| 亚洲精品电影在线| 日韩av.com| 蜜桃av在线播放| 亚洲精品日产精品乱码不卡| 欧美亚州在线观看| av中文字幕免费| 日韩精彩视频在线观看| 久久久久久久久久久亚洲| 少妇视频在线播放| 你懂的在线观看一区二区| 67194成人在线观看| 逼特逼视频在线| 牛牛精品在线| 中文字幕欧美日本乱码一线二线| 国内一区二区三区在线视频| 国产精品色综合| 日韩精品每日更新| 精品一区二区三区四区五区| 亚洲品质自拍视频| 日韩一区二区三区资源| 日日躁夜夜躁白天躁晚上躁91| 蜜桃视频第一区免费观看| 97精品国产91久久久久久| 国产稀缺精品盗摄盗拍| 日韩成人免费| 亚洲视频在线看| 国产精品无码一区二区三| 日本超碰一区二区| 在线成人av影院| 亚洲精品久久久中文字幕| 欧美二三四区| 日韩欧美在线播放| 国产在线观看欧美| av网站免费在线观看| 中文字幕一区二区三区av| 日韩av一区二区三区在线| 青青草视频在线免费观看| av影院午夜一区| 国产精品三区在线| 黄色av网站免费在线观看| 国产成人精品一区二区三区四区| 92国产精品视频| 国产乱淫片视频| 国产揄拍国内精品对白| 亚洲自拍小视频免费观看| 国产精品久久久久久av福利软件| 希岛爱理中文字幕| 国产精品久久久久久影院8一贰佰| 中文字幕国产亚洲| 日韩免费av一区| 欧美黄色录像片| 久热在线中文字幕色999舞| www.av成人| 国产精品hd| 国a精品视频大全| 国产成人无码精品亚洲| 久久国产毛片| 国产美女精品视频| 国产美女裸体无遮挡免费视频| 国产精品123| 国产伦精品一区二区三区四区免费 | 无码视频一区二区三区| 美女网站久久| 成人午夜一级二级三级| 亚洲国产视频一区二区三区| 99国产欧美久久久精品| 日韩电影免费观看高清完整| 日本欧美在线视频免费观看| 亚洲久草在线视频| 福利视频一二区| 欧美影视资讯| 日韩区在线观看| 欧美性xxxx图片| 91欧美在线| 韩国视频理论视频久久| 亚洲欧美日韩激情| 国产一区二区免费视频| 久久久久久国产精品免费免费| 国产在线超碰| 一级日本不卡的影视| 爱福利视频一区二区| 91成人福利社区| 亚洲精品一区二区三区不| 黑鬼狂亚洲人videos| 精品国产99久久久久久宅男i| 水蜜桃久久夜色精品一区的特点| 成人自拍性视频| 午夜黄色小视频| **欧美大码日韩| 国产一区二区三区精彩视频| 福利一区三区| 亚洲欧美日韩区| 九九热精彩视频| 蜜臀久久99精品久久久久久9| 国产成人成网站在线播放青青| 国产小视频在线播放| 亚洲精品国产第一综合99久久 | 亚洲永久激情精品| heyzo在线| 欧美电影一区二区三区| 国产毛片久久久久久久| 欧美日韩调教| 国产欧美在线视频| 欧美日韩国产亚洲沙发| 亚洲精品大片www| 中文字幕国产免费| 免费久久久久久久久| 色综合天天综合网国产成人网| 天天综合久久综合| av男人天堂一区| 国产乱人伦精品一区二区三区| 国产成人精品一区二区三区在线| 亚洲第一男人av| 青草草在线视频| 韩国欧美国产一区| 日韩一本精品| 久久久人成影片一区二区三区在哪下载 | 超碰av在线免费观看| 欧美aaaaa级| 欧美成人三级视频网站| 国产又粗又长视频| 国产精品久久久久久久久图文区 | 成人综合在线观看| 佐佐木明希av| 秋霞一区二区三区| 久久成人18免费网站| 97人妻一区二区精品免费视频| 国产精品色噜噜| 天美星空大象mv在线观看视频| 国产一区国产二区国产三区| 欧美一区视频在线| 日韩a在线看| 福利一区视频在线观看| 蜜桃精品成人影片| 免费永久网站黄欧美| 久久艹中文字幕| 色一区二区三区| 亚洲精品资源在线| 在线永久看片免费的视频| 久久久久久久久一| 能在线观看的av网站| 狠狠色狠狠色综合婷婷tag| 日韩暖暖在线视频| 男男电影完整版在线观看| 色婷婷久久一区二区三区麻豆| 麻豆精品免费视频| 免费不卡在线视频| 桥本有菜av在线| 中文字幕一区二区三区四区久久 | 成人国产亚洲欧美成人综合网| 久久人人爽人人爽人人av| 国产欧美啪啪| 欧美在线性爱视频| 99re在线视频| 91精品国产综合久久久久久久久久| 小泽玛利亚一区二区免费| 国产裸体歌舞团一区二区| 欧美性潮喷xxxxx免费视频看| 卡通动漫精品一区二区三区| 日本老师69xxx| 在线免费黄色| 精品国产区一区| 无码任你躁久久久久久久| 中文字幕一区在线观看视频| 国产麻豆剧传媒精品国产| 一本色道久久综合亚洲精品不卡| 日本一区不卡| 日韩一区免费| 人人爽久久涩噜噜噜网站| 成年在线观看免费人视频| 欧美一区日韩一区| 国内精品福利视频| 中文字幕一区二区三区色视频| 中文字幕99页| 青青草一区二区三区| 欧美日韩中文字幕在线播放| 视频一区欧美| 亚洲影院在线看| 偷拍中文亚洲欧美动漫| 欧美大成色www永久网站婷| 日韩欧美电影在线观看| 91麻豆精品国产综合久久久久久 | 欧美男同性恋视频网站| 五月天婷婷丁香| 国产精品美女www爽爽爽| 国产乱淫av麻豆国产免费| 日欧美一区二区| 日韩av新片网| 91青青国产在线观看精品| 鲁丝一区鲁丝二区鲁丝三区| 国产精选久久| 国产精品久久久久不卡| av3级在线| 久久视频免费在线播放| 国模精品一区二区| 亚洲成人网在线| 亚洲网站在线免费观看| 成人一区视频| 精品久久久久久无| 中文字幕av资源| 欧美日韩免费在线| 日韩欧美综合视频| 国产日韩欧美一区二区三区乱码 | 26uuu国产精品视频| 老司机免费在线视频| 亚洲女人天堂色在线7777| 午夜精品久久久久久久99老熟妇 | 一区二区三区四区精品在线视频| 精品无码在线观看| av爱爱亚洲一区| gogo亚洲国模私拍人体| 久久国产精品区| 青青青在线视频免费观看| 亚洲欧美成人综合| 韩日视频在线观看| 欧美暴力喷水在线| 亚洲 欧洲 日韩| 日韩高清欧美| 日本一区二区在线视频| 特黄特色欧美大片| 精品国产乱码一区二区三区四区| 日韩精品一区二区三区中文 | 欧美午夜aaaaaa免费视频| 亚洲永久免费精品| 免费无遮挡无码永久视频| 樱桃成人精品视频在线播放| 国产毛片久久久久久国产毛片| 夜间精品视频| 成人一区二区av| 亚洲精品91| 午夜在线视频免费观看| 亚洲成av人片乱码色午夜| 宅男av一区二区三区| 日韩在线观看一区| 在线码字幕一区| 91精品秘密在线观看| 91制片厂免费观看| 一个色综合网| 大陆av在线播放| 亚洲经典三级| 久久美女福利视频| 日韩精品91亚洲二区在线观看| 国产三级三级看三级| 久久国产精品72免费观看| 中文字幕一区二区在线观看视频| 国产精品资源在线| 亚洲av午夜精品一区二区三区| 成人综合婷婷国产精品久久蜜臀| 男人网站在线观看| 久久亚洲捆绑美女| 精品成人无码一区二区三区| 国产精品婷婷午夜在线观看| 少妇高潮在线观看| 依依成人综合视频| 国产无码精品在线播放| 欧美视频二区36p| 中国女人真人一级毛片| 91精品国产综合久久国产大片| 内射无码专区久久亚洲| 亚洲精品自拍视频| 1024视频在线| 欧美日本国产在线| 亚洲一区资源| 成人情趣片在线观看免费| 国产精品videossex| 欧美日韩一区综合| 99热在线成人| av日韩一区二区三区| 日本怡春院一区二区| 性久久久久久久久久久久久久| 不卡欧美aaaaa| 国产在线综合视频| 樱桃国产成人精品视频| 欧美日韩一级黄色片| 91精品国产日韩91久久久久久| 偷拍精品一区二区三区| 中文字幕欧美国内| 超黄网站在线观看| 国产精品入口夜色视频大尺度| 波多野结衣在线一区二区| 日本福利一区二区三区| 欧美日韩一区二区三区四区在线观看 | 国产精品自拍首页| 日本a级不卡| 日本a视频在线观看| 麻豆免费精品视频| 国产熟女高潮一区二区三区| 中文字幕五月欧美| 香蕉影院在线观看| 欧美成人精品福利| av资源种子在线观看| 97久久国产精品| 国产95亚洲| 欧美亚州在线观看| 亚洲高清毛片| 红桃视频一区二区三区免费| 国产日本一区二区| 国产无遮挡aaa片爽爽| 欧美美女黄视频| 国产在线观看免费| 4k岛国日韩精品**专区| 日韩中文在线| 国产高清精品软男同| 日韩国产精品久久| 色噜噜在线观看| 亚洲国产精品久久久久婷婷884| 国产又粗又猛又爽又黄视频 | 国产大片中文字幕在线观看| 欧美高清性hdvideosex| 国产高清免费av在线| 欧美亚洲视频在线看网址| 51亚洲精品| 99久久99久久精品| 国产一区二区三区视频在线播放| 国产成人免费观看网站| 欧美日韩中文在线| 无码国产精品一区二区色情男同| 欧美激情亚洲国产| 看亚洲a级一级毛片| 在线视频不卡一区二区| 极品销魂美女一区二区三区| 1024在线看片| 欧美亚洲高清一区| 福利视频在线看| 国产精品黄色av| 国产一区二区三区探花| 国产裸体免费无遮挡| 国产日韩精品一区二区浪潮av| jizz国产在线观看| 亚洲夜晚福利在线观看| 欧美xxxx做受欧美护士| 热re99久久精品国产99热| 日日夜夜一区二区| 美国美女黄色片| 欧美日韩激情一区| 欧美日韩在线看片| 成人黄色中文字幕| 一区二区三区四区电影| 国产伦精品一区二区三区妓女下载| 夜夜嗨av一区二区三区中文字幕| 国产日本精品视频| 久久999免费视频| 大吊一区二区三区| 成人精品视频网站| 久久久久久久久久影院| 国产视频自拍一区| 欧美aaa视频| 亚洲日本精品一区| 国产在线观看免费一区| 久久97人妻无码一区二区三区| 欧美成人女星排名| 国模精品视频| 日本一区高清不卡| 精品一区二区三区香蕉蜜桃| 永久免费看黄网站| 欧美精品一区二区蜜臀亚洲| 亚洲小少妇裸体bbw| 日本亚洲导航| 国产精品系列在线播放| 国产午夜视频在线播放| 亚洲人a成www在线影院| 日本免费一区二区三区等视频| 国产亚洲精品久久久久久久| 99re视频精品| 在线播放国产一区| 欧美日韩爱爱视频| 亚欧日韩另类中文欧美| 手机在线成人免费视频| 一区二区三区四区乱视频| 毛片网站在线观看| 成人激情在线观看| 在线综合欧美| 国精产品久拍自产在线网站| 精品国产乱码久久久久久久久 | 激情亚洲成人| 永久免费看mv网站入口78| 欧美精品 日韩| 男女羞羞在线观看| 黄瓜视频免费观看在线观看www| 97超碰欧美中文字幕| 91精品国产乱码久久| 91精品国产精品| 性欧美69xoxoxoxo| 波多野结衣av在线免费观看| 制服.丝袜.亚洲.中文.综合| 亚洲高清黄色| 久久亚洲精品无码va白人极品| 久久精品男人的天堂|