精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器學習中處理缺失值的9種方法

人工智能 機器學習
數據科學就是關于數據的。它是任何數據科學或機器學習項目的關鍵。在大多數情況下,當我們從不同的資源收集數據或從某處下載數據時,幾乎有95%的可能性我們的數據中包含缺失的值。

 數據科學就是關于數據的。它是任何數據科學或機器學習項目的關鍵。在大多數情況下,當我們從不同的資源收集數據或從某處下載數據時,幾乎有95%的可能性我們的數據中包含缺失的值。我們不能對包含缺失值的數據進行分析或訓練機器學習模型。這就是為什么我們90%的時間都花在數據預處理上的主要原因。我們可以使用許多技術來處理丟失的數據。在這個文章中,我將分享處理數據缺失的9種方法,但首先讓我們看看為什么會出現數據缺失以及有多少類型的數據缺失。

[[349856]]

 

不同類型的缺失值

缺失的值主要有三種類型。

  • 完全隨機缺失(MCAR):當數據為MCAR時,如果所有觀測的缺失概率都相同,則一個變量完全隨機缺失,這意味著數據缺失與數據集中任何其他觀察到的或缺失的值完全沒有關系。換句話說,那些缺失的數據點是數據集的一個隨機子集。
  • 丟失數據不是隨機的(MNAR):顧名思義,丟失的數據和數據集中的任何其他值之間存在某種關系。
  • 隨機丟失(MAR):這意味著數據點丟失的傾向與丟失的數據無關,但與數據集中其他觀察到的數據有關。

數據集中缺少值的原因有很多。例如,在數據集的身高和年齡,會有更多年齡列中缺失值,因為女孩通常隱藏他們的年齡相同的如果我們準備工資的數據和經驗,我們將有更多的薪水中的遺漏值因為大多數男人不喜歡分享他們的薪水。在更大的情況下,比如為人口、疾病、事故死亡者準備數據,納稅人記錄通常人們會猶豫是否記下信息,并隱藏真實的數字。即使您從第三方資源下載數據,仍然有可能由于下載時文件損壞而丟失值。無論原因是什么,我們的數據集中丟失了值,我們需要處理它們。讓我們看看處理缺失值的9種方法。

這里使用的也是經典的泰坦尼克的數據集

讓我們從加載數據集并導入所有庫開始。

 

  1. import pandas as pd 
  2. df=pd.read_csv("data/titanic.csv",usecols=['Age','Cabin','Survived']) 
  3. df.isnull().mean() 
  4. df.dtypes 

 

運行上述代碼塊后,您將看到Age、Cabin和裝載裝載包含空值。Age包含所有整數值,而Cabin包含所有分類值。

1、均值、中值、眾數替換

在這種技術中,我們將null值替換為列中所有值的均值/中值或眾數。

平均值(mean):所有值的平均值

 

  1. def impute_nan(df,column,mean): 
  2.     df[column+'_mean']=df[column].fillna(mean) ##NaN -> mean 
  3.      
  4. impute_nan(df,'Age',df.Age.mean()) ##mean of Age(29.69) 

 

機器學習中處理缺失值的9種方法

 

 

中值(median):所有值的中心值

 

  1. def impute_nan(df,column,median): 
  2.     df[column+'_mean']=df[column].fillna(median) 
  3. impute_nan(df,'Age',df.Age.median()) ##median of Age(28.0) 

 

 

機器學習中處理缺失值的9種方法

 

眾數(mode):最常見的值

 

  1. def impute_nan(df,column,mode): 
  2.     df[column+'_mean']=df[column].fillna(mode) 
  3. impute_nan(df,'Age',df.Age.mode()) ##mode of Age(24.0) 

 

 

機器學習中處理缺失值的9種方法

 

優點

  • 易于實現(對異常值健壯)
  • 獲得完整數據集的更快方法

缺點

  • 原始方差的變化或失真
  • 影響相關性
  • 對于分類變量,我們需要眾數。平均值和中位數都不行。

2、隨機樣本估算

在這種技術中,我們用dataframe中的隨機樣本替換所有nan值。它被用來輸入數值數據。我們使用sample()對數據進行采樣。在這里,我們首先取一個數據樣本來填充NaN值。然后更改索引,并將其替換為與NaN值相同的索引,最后將所有NaN值替換為一個隨機樣本。

優點

  • 容易實現
  • 方差失真更小

缺點

  • 我們不能把它應用于每一種情況

用隨機樣本注入替換年齡列NaN值

 

  1. def impute_nan(df,variable): 
  2.     df[variable+"_random"]=df[variable] 
  3.     ##It will have the random sample to fill the na 
  4.     random_sample=df[variable].dropna().sample(df[variable].isnull().sum(),random_state=0) 
  5.     ##pandas need to have same index in order to merge the dataset 
  6.     random_sample.index=df[df[variable].isnull()].index #replace random_sample index with NaN values index 
  7.     #replace where NaN are there 
  8.     df.loc[df[variable].isnull(),variable+'_random']=random_sample 
  9.     col=variable+"_random" 
  10.     df = df.drop(col,axis=1) 
  11.  
  12. impute_nan(df,"Age"

 

 

機器學習中處理缺失值的9種方法

 

3、用新特性獲取NAN值

這種技術在數據不是完全隨機丟失的情況下最有效。在這里,我們在數據集中添加一個新列,并將所有NaN值替換為1。

優點

  • 容易實現
  • 獲取了了NaN值的重要性

缺點

  • 創建額外的特性(維度詛咒)

 

  1. import numpy as np 
  2. df['age_nan']=np.where(df['Age'].isnull(),1,0) 
  3. ## It will create one new column that contains value 1 in the rows where Age value is NaN, otherwise 0.  

 

4、End of Distribution

在這種技術中,我們用第3個標準偏差值(3rd standard deviation)替換NaN值。它還用于從數據集中刪除所有異常值。首先,我們使用std()計算第3個標準偏差,然后用該值代替NaN。優點

  • 容易實現。
  • 抓住了缺失值的重要性,如果有的話。

缺點

  • 使變量的原始分布失真。
  • 如果NAN的數量很大。它將掩蓋分布中真正的異常值。
  • 如果NAN的數量較小,則替換后的NAN可以被認為是一個離群值,并在后續的特征工程中進行預處理。

 

  1. def impute_nan(df,variable,median,extreme): 
  2.     df[variable+"_end_distribution"]=df[variable].fillna(extreme) 
  3.      
  4. extreme=df.Age.mean()+3*df.Age.std() ##73.27--> 3rd std deviation  
  5. impute_nan(df,'Age',df.Age.median(),extreme) 

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

5、任意值替換

在這種技術中,我們將NaN值替換為任意值。任意值不應該更頻繁地出現在數據集中。通常,我們選擇最小離群值或最后離群值作為任意值。

優點

  • 容易實現
  • 獲取了缺失值的重要性,如果有的話

缺點

  • 必須手動確定值。

 

  1. def impute_nan(df,var): 
  2.     df[var+'_zero']=df[var].fillna(0) #Filling with 0(least outlier) 
  3.     df[var+'_hundred']=df[var].fillna(100) #Filling with 100(last
  4.  
  5. impute_nan(df,'Age'

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

6、頻繁類別歸責

該技術用于填充分類數據中的缺失值。在這里,我們用最常見的標簽替換NaN值。首先,我們找到最常見的標簽,然后用它替換NaN。

優點

  • 容易實現

缺點

  • 由于我們使用的是更頻繁的標簽,所以如果有很多NaN值,它可能會以一種過度表示的方式使用它們。
  • 它扭曲了最常見的標簽之間的關系。

 

  1. def impute_nan(df,variable): 
  2.     most_frequent_category=df[variable].mode()[0] ##Most Frequent 
  3.     df[variable].fillna(most_frequent_category,inplace=True
  4.      
  5. for feature in ['Cabin']:           ##List of Categorical Features 
  6.     impute_nan(df,feature) 

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

 

機器學習中處理缺失值的9種方法

 

7、nan值視為一個新的分類

在這種技術中,我們只需用一個新的類別(如Missing)替換所有NaN值。

 

  1. df['Cabin']=df['Cabin'].fillna('Missing') ##NaN -> Missing 

8、使用KNN填充

在這項技術中,我們使用sklearn創建一個KNN imputer模型,然后我們將該模型與我們的數據進行擬合,并預測NaN值。它被用來計算數值。這是一個5步的過程。

  • 創建列列表(整數、浮點)
  • 輸入估算值,確定鄰居。
  • 根據數據擬合估算。
  • 轉換的數據
  • 使用轉換后的數據創建一個新的數據框架。

優點

  • 容易實現
  • 結果一般情況下會最好

缺點

  • 只適用于數值數據

我們在上篇文章中已經有過詳細的介紹,這里就不細說了

在python中使用KNN算法處理缺失的數據

9、刪除所有NaN值

它是最容易使用和實現的技術之一。只有當NaN值小于10%時,我們才應該使用這種技術。

優點:

  • 容易實現
  • 快速處理

缺點:

  • 造成大量的數據丟失

 

  1. df.dropna(inplace=True) ##Drop all the rows that contains NaN 

總結

還有更多處理丟失值的其他技術。我們的目標是找到最適合我們的問題的技術,然后實施它。處理丟失的值總是一個更好的主意,但有時我們不得不刪除所有的值。它基本上取決于數據的類型和數量。

責任編輯:華軒 來源: 今日頭條
相關推薦

2020-10-31 17:16:31

機器學習數據缺失數據科學

2024-10-18 07:10:43

2024-07-29 08:00:00

2021-04-12 09:00:00

機器學習深度學習技術

2022-08-30 00:31:12

機器學習超參數調優算法

2020-11-27 15:57:28

Github應用速度

2022-09-20 23:38:24

機器學習工具數字優化

2023-03-16 15:13:41

缺失值據集中數據分析

2022-01-16 09:30:34

Ansible自動化工具開源

2023-09-25 15:08:43

Python方離群值

2020-08-10 00:30:55

備份密碼iPhone移動安全

2021-04-01 22:19:54

機器學習模型數據

2021-11-02 07:54:40

List分片Java

2016-03-31 14:16:56

2021-01-20 15:43:01

機器學習深度學習科學

2022-08-30 18:13:38

機器學習

2023-10-30 17:41:29

機器人自動化

2023-05-16 17:00:06

機器人人工智能

2019-03-27 08:51:38

機器學習類失衡算法

2010-09-08 13:29:48

CSS
點贊
收藏

51CTO技術棧公眾號

超碰在线中文字幕| 国产婷婷一区二区三区久久| 国产亚洲一区二区三区不卡| 欧美日韩国产电影| 91免费黄视频| 中文日本在线观看| 国产亚洲福利| 中文字幕综合在线| 最新中文字幕日本| 在线看欧美视频| 一区二区三区四区中文字幕| 欧美日韩一区二区视频在线 | 久久亚洲捆绑美女| 国产美女精品免费电影| 久久精品视频久久| 欧美xxxx中国| 亚洲免费电影在线观看| 亚欧美一区二区三区| xx欧美视频| 久久精品视频免费| 国产精品久久久久久久美男| 日本免费在线播放| 天天综合网91| 一本色道久久综合狠狠躁篇的优点 | 天天综合网 天天综合色| 亚洲日本精品国产第一区| 人妻丰满熟妇av无码区hd| 久久99精品国产麻豆不卡| 欧洲成人午夜免费大片| 久久久无码一区二区三区| 日本大胆欧美| 亚洲一级免费视频| 亚洲精品乱码久久久久久不卡 | 国产日韩欧美夫妻视频在线观看 | 亚洲国产一区二区视频| 久久精品成人一区二区三区蜜臀| 久久精品无码av| 影音先锋日韩资源| 欧美超级乱淫片喷水| 国产精品无码无卡无需播放器| 国产麻豆一区二区三区| 欧美午夜精品久久久久久超碰| 法国空姐在线观看免费| 亚洲天天影视| 国产精品久久久久一区二区三区| 国产精品免费一区二区三区四区 | 久久精品30| 2025国产精品视频| 日本三级网站在线观看| 在线成人av| 91国内揄拍国内精品对白| 精品视频一区二区在线观看| 亚洲午夜久久久久久尤物| 色综合男人天堂| 青娱乐国产在线视频| 欧美日韩18| 亚洲美女淫视频| 午夜精品短视频| 91在线直播| 国产精品福利一区| 亚洲AV无码成人精品一区| 亚洲s色大片| 99天天综合性| 久久99热只有频精品91密拍| 四虎影视在线观看2413| 久久久高清一区二区三区| 91麻豆蜜桃| 午夜精品一区二区三| www..com久久爱| 91夜夜未满十八勿入爽爽影院| 日韩成人高清视频| 一区二区三区毛片免费| 亚洲女人天堂视频| 黑人狂躁日本娇小| 欧洲乱码伦视频免费| 亚洲黄色av网站| 毛片网站免费观看| 日韩av密桃| 色综合久久精品亚洲国产| 日本在线视频中文字幕| 久久九九电影| 亚洲qvod图片区电影| 亚洲乱码在线观看| 韩国三级中文字幕hd久久精品| 国产mv免费观看入口亚洲| 日本五十熟hd丰满| 日韩专区欧美专区| 亚洲综合av影视| 深夜福利视频在线观看| 国产精品久久久久一区二区三区 | 国产欧美 在线欧美| 精品久久久久成人码免费动漫| 美女视频黄频大全不卡视频在线播放| 欧美做爰性生交视频| 亚洲无码精品国产| 波多野结衣在线一区| 亚洲精品一品区二品区三品区| 麻豆av电影在线观看| 中文字幕一区二区在线观看| 福利在线一区二区| www.一区| 欧美麻豆精品久久久久久| 中文字幕精品视频在线| 欧美gayvideo| 欧美成人性色生活仑片| 国产情侣自拍av| 国产精品自在在线| 神马影院我不卡午夜| www在线看| 欧美精品久久天天躁| 性农村xxxxx小树林| 都市激情亚洲| 久久久999精品视频| 久久不卡免费视频| 国产高清无密码一区二区三区| 97免费资源站| 日本中文字幕在线看| 色综合久久综合网欧美综合网 | 精品国产一二三| gv天堂gv无码男同在线观看| 99精品热6080yy久久| 99热最新在线| 国产在线高潮| 欧美日韩国产一区| 国产在线a视频| 四季av一区二区三区免费观看| 九九九久久久久久| 夜夜嗨aⅴ一区二区三区| 久久色成人在线| 亚洲国产成人精品无码区99| 日韩一二三区| 亚洲美腿欧美激情另类| 日韩黄色在线视频| 成人性生交大合| 亚洲精品国产suv一区88| 91丨精品丨国产| 日韩在线视频观看| 久久精品99北条麻妃| 国产三级精品三级| 男人草女人视频| 丝袜美腿诱惑一区二区三区| 日韩精品免费视频| 欧美日韩在线视频免费播放| 国产一区二区三区四区五区入口| 国新精品乱码一区二区三区18| 国产区av在线| 欧美性极品少妇| 国产第一页精品| 六月丁香综合在线视频| 伊人色综合影院| 精品视频在线观看网站| 欧美xxxx14xxxxx性爽| 亚洲精品18p| 国产精品麻豆网站| 中文国产在线观看| 国产精品vip| 91精品视频一区| а√中文在线8| 久久亚洲精品人成综合网| 国产厕拍一区| 欧美猛交ⅹxxx乱大交视频| 99视频国产精品免费观看a| 亚洲欧美偷拍三级| 欧美视频在线观看网站| 国产精品45p| 91成人精品网站| 精品视频一二区| 欧美性视频一区二区三区| 狂野欧美性猛交| 国产精品一二一区| 亚洲美免无码中文字幕在线| 亚洲欧美tv| 国产在线精品播放| 国产一级免费在线观看| 欧美日韩一区二区三区免费看 | 一本色道久久综合精品婷婷| 91麻豆福利精品推荐| 九九视频精品在线观看| 久久久久蜜桃| 精品国产乱码久久久久| 亚洲www免费| 久久视频免费在线播放| 黄色美女一级片| 色视频成人在线观看免| 五月天av网站| 久久综合久久综合久久综合| 亚欧美在线观看| 激情偷拍久久| 日本一区免费看| 国产麻豆一区二区三区| 45www国产精品网站| 日本在线视频网| 亚洲精品第一页| 国产老妇伦国产熟女老妇视频| 国产精品狼人久久影院观看方式| 成年人在线观看视频免费| 欧美a级片一区| 任我爽在线视频精品一| 最新国产精品精品视频| 国产成人小视频在线观看| 视频在线观看入口黄最新永久免费国产 | 久久久www成人免费精品张筱雨| 一级黄色片在线观看| 午夜国产不卡在线观看视频| 午夜国产福利视频| 99精品久久久久久| 国内精品国产三级国产aⅴ久| 国模吧视频一区| 五码日韩精品一区二区三区视频| 欧美一区二区三区婷婷| 琪琪第一精品导航| 狂野欧美性猛交xxxxx视频| 亚洲精品国产精品国自产观看浪潮| 国产成人啪精品午夜在线观看| 91免费视频网址| 日本黄色一级网站| 麻豆精品视频在线| 久久精品午夜福利| 中文在线不卡| 僵尸世界大战2 在线播放| 在线看片不卡| 一本久道久久综合狠狠爱亚洲精品| 电影一区二区三区久久免费观看| 欧美另类xxx| 手机福利小视频在线播放| 日韩一级免费观看| 亚洲综合精品在线| 欧美日韩高清一区二区| 中日韩在线观看视频| 色婷婷精品久久二区二区蜜臂av| 99国产精品无码| 国产欧美日韩不卡| 手机免费看av| 久久久精品人体av艺术| 人妻精品久久久久中文字幕| 91麻豆高清视频| 超碰在线资源站| 国模娜娜一区二区三区| 国内外成人免费激情视频| 亚洲国产高清一区| 亚洲精品久久区二区三区蜜桃臀| 亚洲网一区二区三区| 成人av中文| a看欧美黄色女同性恋| 国产精品对白刺激久久久| 8av国产精品爽爽ⅴa在线观看| 欧美激情影音先锋| 超清av在线| 热久久免费国产视频| 中文在线а√在线8| 欧美一级成年大片在线观看| 手机看片久久| 成人免费福利视频| 麻豆精品久久| 国产美女精品久久久| 婷婷成人av| 亚洲一区二区三区乱码aⅴ蜜桃女 亚洲一区二区三区乱码aⅴ | 一二三四区视频| 欧美理论片在线| 精品国产乱码一区二区三 | 国产精品视频a| 日本乱人伦aⅴ精品| 国产性70yerg老太| 中文字幕一区二区三| 丁香花五月激情| 亚洲成人av资源| 伊人中文字幕在线观看| 精品久久久久久久大神国产| 黄色一级片免费在线观看| 91成人国产精品| 日本免费在线观看视频| 欧美亚洲日本一区| 亚洲高清在线看| 欧美精品丝袜久久久中文字幕| 好吊色在线视频| 91精品国产综合久久国产大片| 99re热视频| 日韩欧美国产综合| 国产黄色一级大片| 日韩经典中文字幕| 污污网站在线免费观看| 伊人av综合网| 欧美精品videosex| 国产精品白丝jk喷水视频一区| 亚洲色图官网| 国产日韩欧美在线| 国产精品sss在线观看av| 日本在线观看不卡| 亚洲国产国产亚洲一二三| 久久婷婷综合色| www.欧美精品一二区| 久久久久久久久久97| 国产精品成人一区二区艾草| 国产一级一级片| 欧美视频一区在线观看| 一区二区三区播放| 日韩国产精品亚洲а∨天堂免| 天天综合天天综合| 久久好看免费视频| 成人性生活av| 成人av免费电影| 99热在线成人| 无码少妇一区二区三区芒果| 国产成人午夜电影网| 久久午夜精品视频| 最新欧美精品一区二区三区| 日韩在线视频免费播放| 日韩一卡二卡三卡| 免费在线你懂的| 国产精品成人免费电影| 开心激情综合| 91视频 - 88av| 国内欧美视频一区二区| 国产传媒国产传媒| 欧美日韩日本国产| 亚洲精品97久久中文字幕| 日韩精品视频免费在线观看| 日本孕妇大胆孕交无码| 欧美一级淫片播放口| 99精品中文字幕在线不卡| 9l视频自拍9l视频自拍| 免费不卡在线视频| 亚洲天堂岛国片| 一本一道综合狠狠老| 五月婷婷丁香网| 久久久久久国产精品三级玉女聊斋| 自拍网站在线观看| 精品视频在线观看| 亚洲精品资源| 国产视频久久久久久| 亚欧色一区w666天堂| www.热久久| 久精品免费视频| 欧美色999| 你懂的网址一区二区三区| 99精品国产在热久久| 日韩精品人妻中文字幕有码| 一级女性全黄久久生活片免费| 国产91国语对白在线| 精品偷拍一区二区三区在线看| 免费在线观看av片| 国产日韩欧美成人| 亚洲最好看的视频| 免费高清在线观看免费| 91视频你懂的| 天天干天天干天天| 亚洲日韩中文字幕| 怡红院成人在线| 国产精品国产三级国产专区53 | 国产成人无码专区| 亚洲人在线视频| 欧美影视资讯| 中文字幕欧美日韩一区二区| 狠狠色丁香九九婷婷综合五月| 免费毛片视频网站| 色8久久人人97超碰香蕉987| 久香视频在线观看| 国产精品一区二区久久| 亚洲老妇激情| 久久久久久久久久影视| 亚洲一区二区三区中文字幕在线| 中文字幕精品在线观看| 日韩一区二区av| 日韩精品一区二区三区中文字幕| 亚洲亚洲精品三区日韩精品在线视频| 一本色道久久综合亚洲精品不卡| 亚洲国产午夜精品| 亚洲第一在线综合网站| 男生女生差差差的视频在线观看| 欧美精品aaa| 久久av导航| 污免费在线观看| 精品国产精品三级精品av网址| 亚洲第一天堂网| 日本亚洲欧美成人| 国产精品久久久久久久免费观看 | 成人毛片在线观看| 在线免费黄色av| 久久久电影免费观看完整版| 999精品视频在这里| 老司机午夜av| 久久精品一二三| a天堂中文在线观看| 欧美亚洲在线观看| 综合激情一区| 欧美日韩高清丝袜| 日韩视频免费观看高清完整版 | 久久久久久久久久久91| 亚洲无线观看| 黄色片在线免费| 日本一区二区久久| 国产综合视频在线| 国产精品高精视频免费| 日韩理论电影| 第四色在线视频| 91精品在线麻豆| 亚洲1234区| 国产av麻豆mag剧集| 中文字幕一区二区在线观看| 青春有你2免费观看完整版在线播放高清|