精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

技術分享:數據不平衡問題

大數據
在學術研究與教學中,很多算法都有一個基本假設,那就是數據分布是均勻的。當我們把這些算法直接應用于實際數據時,大多數情況下都無法取得理想的結果。因為實際數據往往分布得很不均勻,都會存在“長尾現象”,也就是數據不平衡”。

在學術研究與教學中,很多算法都有一個基本假設,那就是數據分布是均勻的。當我們把這些算法直接應用于實際數據時,大多數情況下都無法取得理想的結果。因為實際數據往往分布得很不均勻,都會存在“長尾現象”,也就是數據不平衡”。

[[243245]]

以下幾種方法是針對數據不平衡問題所做的處理,具體包括:

  1. smote采樣
  2. adasyn采樣
  3. 欠采樣
  4. 一分類
  5. 改進的adaboost方法

一、smote采樣

SMOTE全稱是Synthetic Minority Oversampling Technique即合成少數類過采樣技術,它是基于隨機過采樣算法的一種改進方案,由于隨機過采樣采取簡單復制樣本的策略來增加少數類樣本,這樣容易產生模型過擬合的問題,即使得模型學習到的信息過于特別(Specific)而不夠泛化(General),SMOTE算法的基本思想是對少數類樣本進行分析并根據少數類樣本人工合成新樣本添加到數據集中,算法流程如下。

  1. 對于少數類中每一個樣本x,以歐氏距離為標準計算它到少數類樣本集中所有樣本的距離,得到其k近鄰。
  2. 根據樣本不平衡比例設置一個采樣比例以確定采樣倍率N,對于每一個少數類樣本x,從其k近鄰中隨機選擇若干個樣本,假設選擇的近鄰為xn。
  3. 對于每一個隨機選出的近鄰xn,分別與原樣本按照如下的公式構建新的樣本 xnew=x+rand(0,1)∗|x−xn|

部分代碼如下: 

  1. df=get_data()  
  2. x, y = load_creditcard_data(df)  
  3. X_resampled_smote, y_resampled_smote = SMOTE().fit_sample(x, y) # print(y_resampled_smote)  
  4. X_train, X_test, y_train, y_test = train_test_split(X_resampled_smote, y_resampled_smote, test_size=0.3,random_state=0) 

二、adasyn采樣

本文介紹的是 ADASYN: 自適應綜合過采樣方法。

算法步驟如下:

(1)計算不平衡度

記少數類樣本為ms,多數類為ml,則不平衡度為 d = ms / ml,則d∈(0,1]。(作者在這里右邊用了閉區間,我覺得應該用開區間,若是d = 1,則少數類與多數類樣本數量一致,此時數據應該平衡的)

(2)計算需要合成的樣本數量

G = (ml - ms)* b,b∈[0,1],當b = 1時,即G等于少數類和多數類的差值,此時合成數據后的多數類個數和少數類數據正好平衡

(3)對每個屬于少數類的樣本用歐式距離計算k個鄰居,為k個鄰居中屬于多數類的樣本數目,記比例r為r = / k,r∈[0,1]

(4)在(3)中得到每一個少數類樣本的 ri ,

用 計算每個少數類樣本的周圍多數類的情況

(5)對每個少數類樣本計算合成樣本的數目 (6)在每個待合成的少數類樣本周圍k個鄰居中選擇1個少數類樣本,根據下列等式進行合成

重復合成直到滿足需要步驟(5)合成的數目為止。

部分代碼如下: 

  1. df=get_data()  
  2. x, y = load_creditcard_data(df)  
  3. X_resampled_smote, y_resampled_smote = ADASYN().fit_sample(x, y) 

三、欠采樣

以下兩種方法都屬于欠抽樣,不同于直接欠抽樣,他們將信息的丟失程度盡量降低。兩者的核心思想為:

1. EasyEnsemble 核心思想是:

  • 首先通過從多數類中獨立隨機抽取出若干子集
  • 將每個子集與少數類數據聯合起來訓練生成多個基分類器
  • 最終將這些基分類器組合形成一個集成學習系統

EasyEnsemble 算法被認為是非監督學習算法,因此它每次都獨立利用可放回隨機抽樣機制來提取多數類樣本

2. BalanceCascade 核心思想是:

  • 使用之前已形成的集成分類器來為下一次訓練選擇多類樣本
  • 然后再進行欠抽樣

四、一分類

對于正負樣本極不平衡的場景,我們可以換一個完全不同的角度來看待問題:把它看做一分類(One Class Learning)或異常檢測(Novelty Detection)問題。這類方法的重點不在于捕捉類間的差別,而是為其中一類進行建模,經典的工作包括One-class SVM等。

我們只對一類進行訓練,模型的結果會聚集在某個范圍內,測試集進行測試,則模型的輸出結果為1和-1兩種,當落在這個區間,結果為1,不在這個區間,則結果為-1

部分代碼如下: 

  1. def MechanicalRupture_Model():  
  2. train = pd.read_excel(normal)  
  3. test = pd.read_excel(unnormal)  
  4. clf = svm.OneClassSVM(nu=0.1, kernel=rbf, gamma=0.1)  
  5. clf.fit(train)  
  6. y_pred_train = clf.predict(train)  
  7. y_pred_test = clf.predict(test) 

五、改進的adaboost方法

AdaCost算法修改了Adaboost算法的權重更新策略,其基本思想是對于代價高的誤分類樣本大大地提高其權重,而對于代價高的正確分類樣 本適當地降低其權重,使其權重降低相對較小。總體思想是代價高樣本權重增加得大降低得慢。

具體adacost代碼如下: 

  1. #!/usr/bin/env python3# -*- coding:utf-8 -*-import numpy as npfrom numpy.core.umath_tests import inner1dfrom sklearn.ensemble import AdaBoostClassifierclass AdaCostClassifier(AdaBoostClassifier):#繼承AdaBoostClassifier 
  2. def _boost_real(self, iboost, X, y, sample_weight, random_state):  
  3. implement a single boost using the SAMME.R real algorithm.  
  4. :param iboost:  
  5. :param X:  
  6. :param random_state:  
  7. :param y: 
  8.  :return:sample_weight,estimator_error  
  9. estimator = self._make_estimator(random_state=random_state)  
  10. estimator.fit(X, y, sample_weight=sample_weight)  
  11. y_predict_proba = estimator.predict_proba(X) if iboost == 0:  
  12. self.classes_ = getattr(estimator, 'classes_', None)  
  13. self.n_classes_ = len(self.classes_)  
  14. y_predict = self.classes_.take(np.argmax(y_predict_proba, axis=1),axis=0)  
  15. incorrect = y_predict != y  
  16. estimator_error = np.mean(np.average(incorrect, weights=sample_weight, axis=0)) if estimator_error = 0: return sample_weight, 1., 0.  
  17. n_classes = self.n_classes_ 
  18.  classes = self.classes_  
  19. y_codes = np.array([-1. / (n_classes - 1), 1.])  
  20. y_coding = y_codes.take(classes == y[:, np.newaxis])  
  21. proba = y_predict_proba # alias for readability  
  22. proba[proba np.finfo(proba.dtype).eps] = np.finfo(proba.dtype).eps  
  23. estimator_weight = (-1. * self.learning_rate * (((n_classes - 1.) / n_classes) *  
  24. inner1d(y_coding, np.log(y_predict_proba)))) # 樣本更新的公式,只需要改寫這里  
  25. if not iboost == self.n_estimators - 1:  
  26. sample_weight *= np.exp(estimator_weight *  
  27. ((sample_weight 0) |  
  28. (estimator_weight 0)) *  
  29. self._beta(y, y_predict)) # 在原來的基礎上乘以self._beta(y, y_predict),即代價調整函數  
  30. return sample_weight, 1., estimator_error def _beta(self, y, y_hat):  
  31. adjust cost function weight  
  32. :param y:  
  33. :param y_hat:  
  34. :return:res  
  35. res = [] for i in zip(y, y_hat): if i[0] == i[1]:  
  36. res.append(1) # 正確分類,系數保持不變,按原來的比例減少  
  37. elif i[0] == 0 and i[1] == 1: # elif i[0] == 1 and i[1] == -1:  
  38. res.append(1) # 將負樣本誤判為正樣本代價應該更大一些,比原來的增加比例要高  
  39. elif i[0] == 1 and i[1] == 0: # elif i[0] == -1 and i[1] == 1:  
  40. res.append(1.25) # 將正列判為負列,代價不變,按原來的比例增加  
  41. else: print(i[0], i[1]) return np.array(res) 

總結:

其中

smote采樣 、adasyn采樣、欠采樣、一分類是針對數據集做出處理。

改進的adaboost方法是對模型方法進行的改進。

具體采用哪種方式,需要結合具體情況。

責任編輯:未麗燕 來源: 搜狐
相關推薦

2021-01-04 10:40:37

Python不平衡數據機器學習

2023-12-26 15:32:25

不平衡數據過采樣機器學習

2017-03-28 09:40:23

機器學習數據不平衡

2016-12-13 11:48:05

數據處理不平衡數據

2021-06-06 22:41:30

人才技術預測不平衡

2017-06-16 22:14:45

機器學習數據不平衡

2019-02-25 08:35:22

機器學習數據模型

2018-04-20 11:33:22

不平衡數據數據集模型

2023-09-29 22:51:22

數據不平衡Python機器學習

2020-10-06 10:44:16

機器學習不平衡數據算法

2018-06-11 16:20:22

數據不平衡數據集算法

2022-05-06 09:48:56

機器學習樣本不平衡

2025-01-20 09:00:00

2024-10-18 07:10:43

2017-03-20 09:25:10

機器學習采樣數據合成

2020-09-21 09:02:56

AI機器學習類不平衡

2019-03-27 08:51:38

機器學習類失衡算法

2016-09-07 13:26:25

R語言不平衡數據

2016-09-19 14:52:12

Hadoophdfs磁盤

2013-04-23 11:17:47

Hadoop
點贊
收藏

51CTO技術棧公眾號

欧美+日本+国产+在线a∨观看| 日韩在线影院| 91免费在线播放| 国产精品女人久久久久久| 亚洲色图综合区| 西野翔中文久久精品字幕| 欧美性受xxxx| 日本五级黄色片| 番号在线播放| 成人毛片在线观看| 国产精品视频永久免费播放| 精品处破女学生| 欧洲福利电影| 亚洲第一网站免费视频| 中文字幕 91| 成入视频在线观看| 亚洲欧美一区二区三区孕妇| 欧美一区二区视频在线| 黄频网站在线观看| 麻豆精品一区二区av白丝在线| 97精品视频在线观看| 日韩一区二区三区四区视频| 麻豆一区二区| 日韩欧美国产午夜精品| www.日本一区| 亚洲色图官网| 亚洲成av人片| 草草草视频在线观看| 自拍视频在线免费观看| 久久久精品免费免费| 精品国产乱码久久久久久郑州公司| 国产精品久久婷婷| 麻豆精品久久久| 国产成人啪精品视频免费网| 中文字幕在线观看视频网站| 在线观看日韩av电影| 九九久久久久99精品| 精品无码久久久久成人漫画| 日韩精品首页| 夜夜嗨av一区二区三区四区 | 亚洲精品国产精品乱码| 中文字幕一区二区三区在线视频| 色视频www在线播放国产成人| 成人免费毛片糖心| 国产一区不卡| 亚洲人午夜精品免费| 新91视频在线观看| 国产探花在线精品| 在线播放精品一区二区三区 | 久久视频www| 91免费视频网| 日本精品一区二区三区视频 | av片中文字幕| 神马电影网我不卡| 欧美色网站导航| 欧美午夜aaaaaa免费视频| 成人自拍av| 欧美性猛交xxxxxxxx| 亚洲黄色a v| 视频欧美精品| 欧美成人欧美edvon| 欧美午夜精品一区二区| 国产香蕉精品| 亚洲美女在线视频| 国产极品视频在线观看| 亚洲精品久久久| 欧美激情在线一区| 日韩高清免费av| 久久国产精品久久w女人spa| 国产精品久久久| 亚洲综合精品视频| 国产成人一区在线| 久久99精品久久久久久青青日本| 四虎精品成人影院观看地址| 中文一区二区在线观看| 亚洲美女自拍偷拍| 久久av色综合| 一本大道久久a久久综合婷婷| 99热这里只有精品在线播放| 免费观看亚洲视频大全| 日韩av在线精品| 青青青视频在线播放| 欧美日韩三区| 日本韩国在线不卡| 精品国产乱码久久久久久蜜臀网站| 成人污视频在线观看| 秋霞久久久久久一区二区| 免费黄色在线看| 图片区小说区国产精品视频| 在线观看高清免费视频| 国产成人在线中文字幕| 在线色欧美三级视频| 久久婷婷综合国产| 日韩av一二三| 国产伦精品一区二区三区四区免费 | 一夜七次郎国产精品亚洲| av激情在线观看| 老**午夜毛片一区二区三区| 91嫩草国产在线观看| 蜜桃视频在线免费| 一区二区三区在线视频观看| 福利在线一区二区三区| 豆花视频一区二区| 久久精品亚洲精品| 日韩 国产 欧美| 粉嫩av亚洲一区二区图片| 日韩欧美第二区在线观看| h片在线观看| 91精品国模一区二区三区| 老牛影视av老牛影视av| 欧美另类女人| 91色在线视频| 77777影视视频在线观看| 精品国产91久久久久久| www.黄色网| 一区二区在线| 国产日韩一区在线| 国产女人在线观看| 黑人欧美xxxx| 欧美一级片黄色| 国产精品av久久久久久麻豆网| 成人激情综合网| 第九色区av在线| 精品国产精品三级精品av网址| 亚洲天堂小视频| 小说区亚洲自拍另类图片专区| 国产精品老女人视频| 欧美日韩在线精品一区二区三区激情综| 亚洲乱码国产乱码精品精可以看 | 欧美精品一区三区| 91精品国自产| 国产精品美女久久久久久久网站| 久久久国产欧美| 九九免费精品视频在线观看| 97成人精品视频在线观看| 欧洲成人一区二区三区| 夜夜精品浪潮av一区二区三区| 手机看片国产精品| 欧美一区综合| 亚洲综合国产精品| 97超碰资源站在线观看| 日韩一本二本av| 久久成人在线观看| 成人av网在线| 奇米影视亚洲色图| 女仆av观看一区| 国内伊人久久久久久网站视频| 色屁屁草草影院ccyycom| 亚洲一区在线播放| 国产精品成人99一区无码 | 日本va中文字幕| 九热爱视频精品视频| 青青草国产精品一区二区| 久草在现在线| 欧美日韩你懂得| 亚洲av无码一区二区三区在线| 黄一区二区三区| 9191国产视频| 九九热播视频在线精品6 | 在线视频成人| 欧美第一页在线| 天天操天天舔天天干| 亚洲在线中文字幕| 欧美在线一级片| 夜夜嗨av一区二区三区网站四季av| 国产日韩中文字幕| 高清电影在线观看免费| 亚洲人成在线播放| 在线不卡免费视频| 中文久久乱码一区二区| 91香蕉国产线在线观看| 一区二区91| 一区二区不卡在线观看| 2020最新国产精品| 欧美在线性爱视频| 成人a在线视频免费观看| 亚洲成年人在线播放| 日韩黄色一级视频| 亚洲欧美日韩一区二区| 丰满大乳奶做爰ⅹxx视频| 麻豆国产精品一区二区三区 | 精品99久久久久久| 国产精品久久久久久久久久精爆| 国产精品国产三级国产| 动漫美女无遮挡免费| 日韩在线a电影| 日本福利视频网站| 日韩dvd碟片| 国产欧美日韩综合精品二区| 啪啪av大全导航福利综合导航| 欧美福利视频在线| 阿v免费在线观看| 精品剧情v国产在线观看在线| 日本精品入口免费视频| 亚洲一区二区视频| а天堂中文在线资源| 99久久夜色精品国产网站| 特黄视频免费观看| 视频精品一区二区| av在线观看地址| 91精品蜜臀一区二区三区在线| 久久艳妇乳肉豪妇荡乳av| 日韩av综合| 日韩av手机在线观看| 成人日批视频| 最新91在线视频| 精品成人一区二区三区免费视频| 精品免费视频一区二区| 伊人网免费视频| 一本大道av伊人久久综合| 国产中文字幕免费| 自拍偷在线精品自拍偷无码专区| 亚洲av无码一区二区二三区| 成熟亚洲日本毛茸茸凸凹| 免费成人黄色大片| 日本中文字幕一区二区有限公司| av免费观看国产| 亚洲最新色图| 亚洲欧美日产图| 深爱激情综合| 国产一区二区三区奇米久涩| 欧美精品影院| 亚洲伊人久久综合| 91精品国产自产观看在线| 国产精品久久久一区| 亚洲播播91| 国产91网红主播在线观看| 午夜伦理福利在线| 欧美一级高清免费| 国产不卡人人| 91av视频在线观看| 日本不卡1234视频| 538国产精品一区二区在线 | 欧美午夜激情小视频| 国产精品免费av一区二区| 亚洲观看高清完整版在线观看| 久久久久久久久久久久久久免费看 | 久久久夜色精品| 亚洲综合色在线| 久久久久久久国产视频| 亚洲香肠在线观看| 国产一级片免费观看| 亚洲成人免费视频| 久久久国产精品成人免费| 天天影视网天天综合色在线播放| 四虎成人精品永久免费av| 亚洲成国产人片在线观看| 国产成人精品一区二三区| 午夜视频在线观看一区二区三区 | 国产在线高清理伦片a| 久久成人免费视频| 黄页网站在线| 97视频在线观看视频免费视频 | 9久re热视频在线精品| 黄网站欧美内射| 午夜亚洲一区| 韩国一区二区av| 久久精品国产色蜜蜜麻豆| 欧美日韩精品区别| 国产成人av福利| www.超碰97| 中文文精品字幕一区二区| 91嫩草丨国产丨精品| 亚洲综合成人在线视频| 青青草成人av| 欧美日韩在线不卡| av中文字幕播放| 亚洲第一网站男人都懂| 九色视频成人自拍| 最新国产精品拍自在线播放| 在线你懂的视频| 欧美有码在线观看视频| 亚洲色图综合| 精品久久久久久亚洲| 精品美女久久久| 天天想你在线观看完整版电影免费| 亚洲黄色av| 国产真人无码作爱视频免费| 激情久久五月天| 亚洲黄色免费在线观看| 国产精品久久久久久久久快鸭| 国产亚洲欧美精品久久久www| 色94色欧美sute亚洲线路一ni| 国产特黄一级片| 精品视频中文字幕| 国产精品剧情| 茄子视频成人在线| 亚洲一区二区三区免费| 日韩精品大片| 亚洲小说区图片区| 少妇一级淫免费放| av网站免费线看精品| 韩国一级黄色录像| 狠狠久久五月精品中文字幕| 一级片免费网站| 亚洲精品少妇网址| 制服丝袜中文字幕在线| 国产精品视频xxxx| 欧美重口另类| 国产精品视频一二三四区| 日日欢夜夜爽一区| 日本道中文字幕| 亚洲手机成人高清视频| 亚洲av无码不卡| 亚洲国产成人精品女人久久久| 自拍视频在线网| 日韩美女视频免费在线观看| 北条麻妃一区二区三区在线观看| 中文字幕在线亚洲三区| 水蜜桃久久夜色精品一区的特点 | 动漫av免费观看| 99久久综合狠狠综合久久| 美国黄色小视频| 56国语精品自产拍在线观看| 高清性色生活片在线观看| 91精品国产91久久| 97se亚洲| 成年人深夜视频| 国产精品资源网| 欧美日韩黄色网| 欧美猛男男办公室激情| 2017亚洲天堂1024| 国产精品99蜜臀久久不卡二区| 四虎884aa成人精品最新| 韩日视频在线观看| 成人免费看的视频| 国产在线视频你懂的| 精品少妇一区二区三区| 在线观看的网站你懂的| 91久久大香伊蕉在人线| 一本一道久久a久久精品蜜桃| 免费一区二区三区在线观看| 久久精品日韩一区二区三区| 99超碰在线观看| 亚洲精品资源在线| 原纱央莉成人av片| 日本视频精品一区| 日本特黄久久久高潮| 一级肉体全黄裸片| 欧美四级电影在线观看| av在线电影观看| 国产欧美一区二区三区视频| 999国产精品视频| 91性高潮久久久久久久| 亚洲免费资源在线播放| 国产成人无码www免费视频播放| 欧美另类高清videos| 伊人久久影院| 欧美视频免费看欧美视频| 91捆绑美女网站| 免费视频网站在线观看入口| 中文字幕欧美在线| 粉嫩av国产一区二区三区| 成人在线免费高清视频| 成人精品一区二区三区中文字幕| 特一级黄色大片| 亚洲色图国产精品| 欧美亚洲二区| 99热这里只有精品免费| jlzzjlzz亚洲日本少妇| 狠狠人妻久久久久久综合| 一色桃子一区二区| 日韩精品一区二区三区中文| 久久这里只有精品23| 久久久亚洲综合| 91久久久久国产一区二区| 欧美巨猛xxxx猛交黑人97人| 欧美美女啪啪| 九九热在线免费| 亚洲欧美日韩一区二区三区在线观看| 好吊色一区二区| 国产mv久久久| 亚洲一区 二区 三区| 人妻在线日韩免费视频| 欧美亚洲动漫制服丝袜| 青春草视频在线| 免费电影一区| 精品一区二区免费看| 国产精品1000| 日韩在线精品一区| 久久夜色电影| 亚洲综合av在线播放| 午夜成人免费视频| 69av亚洲| 美国av一区二区三区| 国产一区二区三区视频在线播放| 国语对白永久免费| 久久综合九色九九 | 中文字幕超清在线免费观看| 成人97人人超碰人人99| 亚洲一级黄色大片| 97精品国产aⅴ7777| 天堂美国久久| 李宗瑞91在线正在播放| 日韩欧美的一区二区| 777午夜精品电影免费看| 久久精品国产sm调教网站演员| 国产精品久久影院| 欧美女子与性| 国产亚洲一区二区三区在线播放|