精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

似乎沒區別,但你混淆過驗證集和測試集嗎?

開發 開發工具
本文將介紹訓練數據集(train dataset)、測試數據集和驗證數據集的確切定義,以及如何在機器學習項目中使用這三種數據集。

很多機器學習入門者對測試集和驗證集的概念有所混淆,甚至很多機器學習開發工程師常常都會混淆這兩個概念。因為當我們采用驗證集的時候,測試集好像和驗證集實際上并沒有多大區別,所以本文從學界定義到實踐中的具體影響探討驗證集和測試集間的區別。

[[199187]]

驗證數據集(validation dataset)是模型訓練過程中留出的樣本集,它可以用于調整模型的超參數和評估模型的能力。但測試數據集(test dataset)不同,雖然同是模型訓練過程中留出的樣本集,但它是用于評估最終模型的性能,幫助對比多個最終模型并做出選擇。在開發機器學習系統時,我們對驗證數據集及其與測試數據集的區別存在諸多混淆。本文將介紹訓練數據集(train dataset)、測試數據集和驗證數據集的確切定義,以及如何在機器學習項目中使用這三種數據集。

通過閱讀本文,我們將了解:

  • 機器學習領域的專家對訓練數據集、測試數據集和驗證數據集的定義。
  • 驗證數據集和測試數據集在實踐中的區別。
  • 使用哪些過程能充分利用驗證數據集和測試數據集進行模型評估。

專家對驗證數據集的定義

本節,我們將了解部分***教科書和參考文獻如何定義訓練數據集、測試數據集和驗證數據集及其區別。

通常情況下,「驗證數據集」指模型訓練過程中留出的樣本集,可與「測試數據集」這個術語互換。在訓練數據集上對模型能力進行評估得到的結果存在偏差。因此,用留出的樣本對模型能力進行評估得出的結果偏差更小。我們通常稱之為使用訓練集測試集劃分方法(train-test split approach)進行算法評估。

假如我們想評估在一系列觀察值上使用特定的數據學習方法后所產生的測試誤差,那么驗證集方法非常適合該任務。它包括將這些觀察值任意切分成兩部分:訓練集和驗證集(又稱留出集,hold-out set)。模型在訓練集上進行擬合,然后使用擬合后的模型對驗證集中保留的數據樣本進行預測。并定量地計算模型驗證誤差,通常我們使用 MSE 對錯誤率進行評估,評估生成的驗證集錯誤率即測試錯誤率。

——Gareth James, et al., Page 176, An Introduction to Statistical Learning: with Applications in R, 2013.

在 Kuhn 和 Johnson 的著作《應用預測建模》(Applied Predictive Modeling)一書中,我們可以看到作者認為「驗證數據集」和「測試數據集」這兩個詞語可以互換。他們在實例中明確指出,必須在留出的數據集上進行最終模型評估,無論評估目的是訓練模型還是調整模型參數。

理想情況下,模型評估應該在未用于模型構建或微調的樣本上進行,這樣才能對模型效率進行無偏評估。因此如果我們有大量數據可用,則可以留出一部分樣本集用于最終模型的評估。訓練數據集指構建模型時使用的樣本集,而測試數據集或驗證數據集用于評估模型性能。

——Max Kuhn and Kjell Johnson, Page 67, Applied Predictive Modeling, 2013

傳統情況下,對最終模型進行性能評估的數據叫作「測試集」。Russell 和 Norvig 在 AI 教科書《人工智能:一種現代方法》中再次強調了保持測試集完全獨立的重要性。他們認為,以任何形式使用測試集中的信息都是一種「窺探」(peeking),因此他們建議封存測試集,直到模型調整全部完成再作為***的評估。

模型窺探預留數據集是使用測試集選擇并評估假設函數的后果。若要避免窺視,必須將測試集單獨留出,直到模型學習過程完全結束,才能最終對模型假設進行獨立的評估。(如果你對評估結果不滿意,想返回尋找更好的模型假設,那么你必須獲取并封存一組全新的測試集。)

—Stuart Russell and Peter Norvig, page 709, Artificial Intelligence: A Modern Approach, 2009 (3rd edition)

重要的是,Russel 和 Norvig 認為用于模型擬合的訓練數據集可以進一步劃分成訓練集和驗證集。驗證集是訓練數據集的子集,用于對模型能力進行初步評估。

如果測試集被封存后,你仍想在未知數據上進行模型性能評估,來選擇性能好的模型假設,那么你需要將可用數據(不包含測試集)分為訓練集和驗證集。

—Stuart Russell and Peter Norvig, page 709,Artificial Intelligence: A Modern Approach, 2009 (3rd edition)

該領域的其他教科書級的著作也佐證了此定義。Ripley 的著作《模式識別與神經網絡》(Pattern Recognition and Neural Networks)中的術語表就是一個經典實例。具體來說,訓練集、驗證集和測試集的定義如下:

訓練集:用來學習的樣本集,用于分類器參數的擬合。

驗證集:用來調整分類器超參數的樣本集,如在神經網絡中選擇隱藏層神經元的數量。

測試集:僅用于對已經訓練好的分類器進行性能評估的樣本集。

—Brian Ripley, page 354, Pattern Recognition and Neural Networks, 1996

這些是數據集推薦的定義和用法。重申 Ripley 的術語定義之后,讓我們來繼續討論「測試集」和「驗證集」在機器學習建模過程中的常見混淆。

機器學習相關文獻通常顛倒「驗證集」和「測試集」的意思。這是人工智能研究中最明顯的術語混淆。關鍵在于,神經網絡的文獻對測試集的標準定義認為測試集不應用于選擇兩個或多個網絡較好的那個,因此測試集上的誤差才是泛化誤差的無偏評估(假設測試集和實際總體服從同一分布)。

—Subject: What are the population, sample, training set, design set, validation set, and test set?

訓練數據集、驗證數據集和測試數據集的定義

為了強調上文中專家的研究結果,本節為這三個術語提供明確的定義。

  • 訓練數據集:用于模型擬合的數據樣本。
  • 驗證數據集:用于調整模型的超參數,為擬合后的模型提供無偏評估。如果模型配置中已包括在驗證集上的調整,則該評估偏差會更大。
  • 測試數據集:為擬合后的最終模型提供無偏評估。

我們可以通過下列偽代碼具體來看它們的定義:

  1. # split data 
  2. data = ... 
  3. train, validation, test = split(data) 
  4. # tune model hyperparameters 
  5. parameters = ... 
  6. for params in parameters: 
  7.  model = fit(train) 
  8.  skill = evaluate(model, validation) 
  9. # evaluate final model for comparison with other models 
  10. model = fit(train) 
  11. skill = evaluate(model, test) 

以下是額外需要理解的內容:

  • 驗證數據集可能在其他形式的模型預準備中發揮作用,如特征選擇。
  • 最終模型可以在訓練數據集和驗證數據集上進行擬合。

只有驗證數據集遠遠不夠

在未知數據上對模型性能進行評估還有其他方式。一個常見的實例是使用 K-折交叉驗證(k-fold cross-validation)來調整模型超參數,而不是使用單獨的驗證數據集。Kuhn 和 Johnson 在「Data Splitting Recommendations」一章中指出使用單獨的「測試集」(或驗證集)的局限性。

如前所述,k 折交叉驗證是一種足以取代單獨、獨立測試集的技術:

  • 測試集是對模型的單次評估,無法完全展現評估結果的不確定性。
  • 將大的測試集劃分成測試集和驗證集會增加模型性能評估的偏差。
  • 分割的測試集樣本規模太小。
  • 模型可能需要每一個可能存在的數據點來確定模型值。
  • 不同測試集生成的結果不同,這造成測試集具備極大的不確定性。
  • 重采樣方法可對模型在未來樣本上的性能進行更合理的預測。

Max Kuhn 和 Kjell Johnson 等人還推薦了適用于小規模樣本的 10-折交叉驗證,其偏差低、性能評估變化小;他們還推薦適用于模型性能比較的自助法(bootstrap method),該方法性能評估變化小。對于規模稍大的樣本集,他們同樣推薦 10-折交叉驗證方法。

驗證數據集和測試數據集會淡化

很可能你再也不會在應用機器學習中看到訓練數據集、驗證數據集和測試數據集。

當實踐者選擇在訓練數據集中使用 k-折交叉驗證方法調整模型超參數時,「驗證集」的概念就已經淡化了。

我們可以通過以下為代碼具體來看:

  1. # split data 
  2. data = ... 
  3. train, test = split(data) 
  4. # tune model hyperparameters 
  5. parameters = ... 
  6. k = ... 
  7. for params in parameters: 
  8.  skills = list() 
  9.  for i in k: 
  10.  fold_train, fold_val = cv_split(i, k, train) 
  11.  model = fit(fold_train, params) 
  12.  skill_estimate = evaluate(model, fold_val) 
  13.  skills.append(skill_estimate) 
  14.  skill = summarize(skills) 
  15. # evaluate final model for comparison with other models 
  16. model = fit(train) 
  17. skill = evaluate(model, test) 

結語

在本教程中,你會了解「驗證數據集」和「測試數據集」中的很多謬誤,以及在評估機器學習模型的能力時如何正確地區分這些術語。

具體來說:

  • 過去的專家學者已經對模型評估中「訓練數據集」、「驗證數據集」和「測試數據集」給出了明確定義。
  • 「驗證數據集」主要用于調整超參數和數據準備時對模型進行評估,而「測試數據集」主要用于對比多個最終模型時的評估。
  • 如果采用 k-折交叉驗證等重采樣方法,尤其當重采樣方法已經被嵌套在模型驗證中時,「驗證數據集」和「測試數據集」的概念可能會淡化。

原文:http://machinelearningmastery.com/difference-test-validation-datasets/

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2009-08-03 14:39:25

Asp.Net函數集

2021-10-27 15:57:48

機器學習人工智能計算機

2022-10-10 12:14:53

量子深度學習

2021-01-20 15:19:32

Google 開源數據集

2020-06-20 14:09:01

信息安全數據技術

2022-06-08 09:11:55

測試代碼開發

2018-11-01 13:04:22

IBM云計算紅帽

2020-01-18 10:04:12

開源sourceforge開發者

2021-07-15 23:23:20

垃圾回收器GC

2017-11-07 12:35:53

比特幣區塊鏈虛擬貨幣

2021-03-12 11:00:14

機器學習人工智能爬坡測試

2022-08-02 10:01:34

Import語句ES模塊

2021-03-04 12:40:25

機器學習人工智能爬坡測試

2023-10-04 17:25:01

面向接口編程

2024-01-01 08:25:53

ViewSurface框架

2018-08-01 14:45:16

PHP編程語言

2022-11-28 07:10:57

2022-03-13 18:53:31

interfacetypeTypeScript

2023-06-01 08:15:04

CentOS紅帽

2022-04-07 16:03:36

JavaScriptTypeScript
點贊
收藏

51CTO技術棧公眾號

日韩午夜免费视频| 视频国产精品| 国产精品久久久久天堂| 97免费资源站| 成人在线免费看视频| 日韩啪啪电影网| 日韩精品自拍偷拍| 热久久精品免费视频| 成人免费看片| 久久久久国产精品人| 亚洲www在线观看| 国产精品视频123| 图片区亚洲欧美小说区| 日韩激情视频在线播放| 手机精品视频在线| 日韩一区二区三区在线免费观看| 一区二区三区在线免费播放| 婷婷五月色综合| 天堂在线资源库| 国产一区二区在线看| 国产91免费看片| 精品无码m3u8在线观看| 91久久夜色精品国产按摩| 日韩成人av网址| 国产在线观看免费播放| 白嫩亚洲一区二区三区| 欧美中文字幕不卡| 国产精品50p| 9lporm自拍视频区在线| 亚洲欧美日韩国产综合| 手机在线观看国产精品| 天堂av在线播放| 成人久久久精品乱码一区二区三区| 国产欧美日韩中文字幕在线| 亚洲国产av一区二区三区| 亚洲精选一区| 国内精品久久久久久久久| 免费看一级大片| 91精品秘密在线观看| 在线播放亚洲激情| 一级片视频免费看| 免费观看久久av| 日韩电视剧免费观看网站| 亚洲精品成人无码毛片| 日本免费一区二区视频| 欧美大片在线观看| 久久久久无码精品| 日韩精品视频在线看| 欧美高清一级片在线| 久久综合九色综合88i| 在线观看三级视频| 亚洲午夜视频在线观看| 欧美日韩视频免费| 丁香花在线电影| 香蕉成人伊视频在线观看| 免费看黄在线看| 国产精品高颜值在线观看| 亚洲精品免费看| 精品国产av无码一区二区三区| 七七久久电影网| 午夜欧美2019年伦理| 婷婷五月综合缴情在线视频| 天堂√中文最新版在线| 色一情一乱一乱一91av| 五月婷婷六月合| 国产精品一区二区三区av | 精品视频免费在线播放| 成年网站在线视频网站| 精品久久久久久久久久国产| 久章草在线视频| 中文字幕系列一区| 在线播放/欧美激情| 精品人妻一区二区三区免费| youjizz亚洲| 亚洲欧美日韩天堂一区二区| 五月天精品在线| 国产精品久久观看| 欧美黄色小视频| 美日韩一二三区 | 丰满少妇一区二区三区专区| 日韩视频在线直播| 国产手机视频精品| 99热99这里只有精品| 中出一区二区| 日本成人精品在线| 一区二区三区精| 成人精品一区二区三区四区| 欧美一区二区三区电影在线观看| 天堂中文8资源在线8| 亚洲午夜精品一区二区三区他趣| 久热免费在线观看| 高清不卡一区| 亚洲精品视频在线播放| 久久久精品少妇| 国产亚洲在线观看| 91中文精品字幕在线视频| 天天射天天操天天干| 国产欧美一区二区精品仙草咪| 国产盗摄视频在线观看| 成人欧美magnet| 欧美一级国产精品| 欧美大波大乳巨大乳| 最新国产精品| 国产精品一区电影| 四虎精品成人影院观看地址| 亚洲欧美激情视频在线观看一区二区三区 | 久久精品视频在线观看免费| 日韩成人一级| 欧美精品午夜视频| 自拍偷拍色综合| 97精品久久久午夜一区二区三区| 午夜探花在线观看| 欧美不卡高清一区二区三区| 亚洲精品在线免费播放| 黑鬼狂亚洲人videos| 久久亚洲国产精品一区二区| 国产成人成网站在线播放青青| 亚洲成人影院麻豆| 日韩欧美高清视频| 亚洲av成人片色在线观看高潮| 久久精品亚洲欧美日韩精品中文字幕| 国产成人精品免费久久久久| 天天av天天翘| 亚洲风情在线资源站| 亚洲黄色片免费| 欧美综合久久| 热久久视久久精品18亚洲精品| 亚洲欧美高清视频| 一区二区在线电影| 在线免费观看av网| 仙踪林久久久久久久999| 国产精品1区2区在线观看| 少妇又色又爽又黄的视频| 亚洲五月六月丁香激情| 野花视频免费在线观看| 欧美激情日韩| 91免费看网站| 一色桃子av在线| 91精品国产麻豆| 精品国产视频在线观看| 韩国v欧美v亚洲v日本v| 一本一本a久久| 欧洲亚洲精品久久久久| 色噜噜亚洲精品中文字幕| 无码人妻av免费一区二区三区| 91蜜桃网址入口| 狠狠爱免费视频| 伊人久久大香线蕉无限次| 国产91精品青草社区| 头脑特工队2免费完整版在线观看| 午夜国产精品一区| 亚洲av片不卡无码久久| 中文亚洲免费| 日韩精品一线二线三线| 国产精品伦一区二区| 北条麻妃在线一区二区| 国产美女明星三级做爰| 一区二区三区中文字幕电影 | 亚洲欧洲日产国码无码久久99| 麻豆一区二区麻豆免费观看| 欧美一二三视频| 欧美伦理影视网| 欧美午夜不卡视频| 男女做暖暖视频| 成人性生交大片免费看中文| 日本久久久网站| 亚洲免费成人av在线| 国产精品美女主播| 在线观看的网站你懂的| 亚洲国产精品va在线观看黑人| 五月婷婷色丁香| 国产精品美女久久久久久久久久久| 日本黄色的视频| 一区在线观看| 欧美日韩在线高清| 超碰国产精品一区二页| 久久久久久久久久婷婷| 极品美乳网红视频免费在线观看| 欧美三级乱人伦电影| 久久精品www| 久久久精品一品道一区| 亚洲天堂一区二区在线观看| 亚洲精品男同| 亚洲一区不卡在线| 福利欧美精品在线| 国产精品人成电影| 欧美日韩经典丝袜| 在线观看视频99| 懂色av成人一区二区三区| 色成人在线视频| 欧美黑人一级片| 国产亚洲精品bt天堂精选| 四川一级毛毛片| 日韩成人av影视| 欧美午夜性视频| 91精品久久久久久久蜜月| 久久精品ww人人做人人爽| 欧洲精品久久久久毛片完整版| **欧美日韩vr在线| 国产成人午夜| 亚洲人成电影在线观看天堂色| 99在线精品视频免费观看软件| 一本大道综合伊人精品热热 | 激情视频一区二区三区| 亚洲欧洲国产日韩精品| 色先锋久久影院av| 99久re热视频这里只有精品6| 亚洲高清黄色| 97在线精品视频| 怡红院在线播放| 色七七影院综合| 国产美女视频一区二区三区 | 三区四区在线视频| 亚洲欧美在线免费| 人妻妺妺窝人体色www聚色窝| 欧美日韩电影一区| 中文字幕亚洲高清| 亚洲综合激情小说| 特一级黄色录像| 国产精品成人一区二区艾草| 亚洲精品色午夜无码专区日韩| 不卡一区二区三区四区| 欧洲成人午夜精品无码区久久| 极品尤物av久久免费看| 欧美成人黄色网址| 另类av一区二区| 女人喷潮完整视频| 亚洲国产二区| 成人免费观看在线| 欧美成人高清| 国产精品三级一区二区| 亚洲综合色网| 在线观看av的网址| 中文字幕一区二区av| 蜜臀av.com| 中文在线播放一区二区| 影音先锋成人资源网站| 先锋资源久久| 久久福利一区二区| 国产精品啊v在线| 丁香花在线影院观看在线播放| 欧美视频官网| 欧美日韩福利在线| 日韩视频一区| jizzjizzxxxx| 久久人人超碰| 少妇一级淫免费放| 久久99国产精品麻豆| 制服丝袜中文字幕第一页| 国产一区二区伦理| 中文字幕欧美视频| 成人综合婷婷国产精品久久蜜臀| zjzjzjzjzj亚洲女人| 国产精品996| 中文字幕乱码一区| 91欧美一区二区| 国产美女永久免费无遮挡| 国产精品素人一区二区| 亚洲xxxx3d动漫| 一级做a爱片久久| 日本午夜小视频| 日韩欧亚中文在线| 中文字幕日韩经典| 欧美一区二区在线看| 男人的天堂a在线| 亚洲美女性生活视频| 91啦中文在线| 欧美激情视频播放| 蜜桃麻豆影像在线观看| 97成人超碰免| 高清电影一区| 91九色蝌蚪嫩草| 欧美中文一区| 亚洲一区尤物| 亚洲视屏一区| 欧美成人免费高清视频| 国产主播一区二区三区| 一区二区免费在线观看视频| 国产视频一区在线播放| www色aa色aawww| 精品久久香蕉国产线看观看亚洲 | 电影一区二区三区| 成人h视频在线| 国产精品流白浆在线观看| 欧洲在线视频一区| 中文字幕一区二区三区欧美日韩| 91国视频在线| 国产一区二区久久| 少妇大叫太粗太大爽一区二区| 亚洲欧美综合网| 精品国产免费观看| 91精品国产91久久久久久一区二区| 人妻精品一区二区三区| 日韩一级黄色av| 美女福利一区二区| 99r国产精品视频| 禁果av一区二区三区| 又大又硬又爽免费视频| 蜜桃精品视频在线| 亚洲精品女人久久久| 国产精品成人一区二区艾草 | 日本不卡一区| 在线欧美亚洲| 亚洲天堂网站在线| 日本一区二区免费在线观看视频 | 人妻少妇精品一区二区三区| 色婷婷激情综合| 蜜臀av中文字幕| 久久九九免费视频| 国产日韩另类视频一区| 韩日午夜在线资源一区二区| 久久精品国内一区二区三区水蜜桃| 国产日产欧美视频| 成人性生交大合| 国产精品成人免费观看| 欧美日本一区二区三区四区 | 欧美成人精品一区二区| 无人区在线高清完整免费版 一区二| 国产一区国产精品| 欧美精品九九| 伊人五月天婷婷| 一区二区中文字幕在线| 无码一区二区三区在线观看| 日韩精品久久久久久久玫瑰园| 日本小视频在线免费观看| 成人写真视频福利网| 欧美韩日一区| www.cao超碰| 中文字幕一区二区三区不卡 | 久久av秘一区二区三区| 全国精品久久少妇| аⅴ天堂中文在线网| 91黄色免费网站| 九色视频在线观看免费播放| 欧美自拍视频在线| 久久99国内| 日韩在线xxx| 国产欧美精品一区| 国产成人精品亚洲| 中文字幕亚洲专区| 精品美女一区| 异国色恋浪漫潭| 国产精品一区二区免费不卡| 欧美黑人性猛交xxx| 日韩一区二区视频| 国产网红女主播精品视频| 国产伦精品一区二区三区免| 在线观看视频日韩| 亚洲最大的黄色网| 欧美午夜视频在线观看| 国产玉足榨精视频在线观看| 国产精品视频久久久久| 欧美电影三区| 中文字幕55页| 亚洲一本大道在线| 欧美套图亚洲一区| 国产精品嫩草影院一区二区| 视频在线不卡免费观看| 亚洲综合中文网| 亚洲va欧美va国产va天堂影院| 五月婷婷六月色| 国产精品99一区| 99久久精品费精品国产| 女同性αv亚洲女同志| 天天综合日日夜夜精品| 精品亚洲成a人片在线观看| 国产日本欧美一区二区三区在线| 亚洲成av人电影| chinese麻豆新拍video| 色av成人天堂桃色av| 色多多视频在线观看| 国产精品久久一区二区三区| 亚洲永久免费| 日韩在线观看免| 亚洲成人动漫在线播放| 香蕉久久免费电影| 国产精品亚洲天堂| 91在线你懂得| 亚洲香蕉在线视频| 欧美黄色性视频| 国产一区二区三区91| wwwxxx色| 欧美性猛交xxxxxx富婆| 日韩影视在线| 欧美成人一区二区在线| 激情综合色综合久久综合| 日韩伦人妻无码| 久久伊人色综合| 亚洲第一福利社区| 在线观看视频你懂得| 91精品办公室少妇高潮对白| 中文字幕中文字幕在线中高清免费版 | www午夜视频| 香蕉久久一区二区不卡无毒影院| 91福利在线视频| 精品国产一二| 国产精品一区二区视频| 国产99久久久久久免费看| 久久久久久国产精品三级玉女聊斋| 国产影视一区|