精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器學習案例實戰之信用卡欺詐檢測

人工智能 機器學習
我是51CTO學院講師唐宇迪,在51CTO學院“4.20 IT充電節”(4月19~20日)到來之際,和大家分享一下機器學習實戰案例經驗。

我是51CTO學院講師唐宇迪,在51CTO學院“4.20 IT充電節”(4月19~20日)到來之際,和大家分享一下機器學習實戰案例經驗。正文來啦~~~

故事背景:原始數據為個人交易記錄,但是考慮數據本身的隱私性,已經對原始數據進行了類似PCA的處理,現在已經把特征數據提取好了,接下來的目的就是如何建立模型使得檢測的效果達到最好,這里我們雖然不需要對數據做特征提取的操作,但是面對的挑戰還是蠻大的。

機器學習案例實戰之信用卡欺詐檢測

數據分析與建模可不是體力活,時間就是金錢我的朋友(魔獸玩家都懂的!)如果你用Python來把玩數據,那么這些就是你的核武器啦。簡單介紹一下這幾位朋友!

Numpy-科學計算庫 主要用來做矩陣運算,什么?你不知道哪里會用到矩陣,那么這樣想吧,咱們的數據就是行(樣本)和列(特征)組成的,那么數據本身不就是一個矩陣嘛。

Pandas-數據分析處理庫 很多小伙伴都在說用python處理數據很容易,那么容易在哪呢?其實有了pandas很復雜的操作我們也可以一行代碼去解決掉!

Matplotlib-可視化庫 無論是分析還是建模,光靠好記性可不行,很有必要把結果和過程可視化的展示出來。

Scikit-Learn-機器學習庫 非常實用的機器學習算法庫,這里面包含了基本你覺得你能用上所有機器學習算法啦。但還遠不止如此,還有很多預處理和評估的模塊等你來挖掘的!

機器學習案例實戰之信用卡欺詐檢測

首先我們用pandas將數據讀進來并顯示最開始的5行,看見木有!用pandas讀取數據就是這么簡單!這里的數據為了考慮用戶隱私等,已經通過PCA處理過了,現在大家只需要把數據當成是處理好的特征就好啦!

接下來我們核心的目的就是去檢測在數據樣本中哪些是具有欺詐行為的!

機器學習案例實戰之信用卡欺詐檢測

千萬不要著急去用機器學習算法建模做這個分類問題。首先我們來觀察一下數據的分布情況,在數據樣本中有明確的label列指定了class為0代表正常情況,class為1代表發生了欺詐行為的樣本。從上圖中可以看出來。。。等等,你不是說有兩種情況嗎,為啥圖上只有class為0的樣本啊?再仔細看看,納尼。。。class為1的并不是木有,而是太少了,少到基本看不出來了,那么此時我們面對一個新的挑戰,樣本極度不均衡,接下來我們首先要解決這個問題,這個很常見也是很頭疼的問題。

這里我們提出兩種解決方案 也是數據分析中最常用的兩種方法,下采樣和過采樣!

先挑個軟柿子捏,下采樣比較簡單實現,咱們就先搞定第一種方案!下采樣的意思就是說,不是兩類數據不均衡嗎,那我讓你們同樣少(也就是1有多少個 0就消減成多少個),這樣不就均衡了嗎。

很簡單的實現方法,在屬于0的數據中,進行隨機的選擇,就選跟class為1的那類樣本一樣多就好了,那么現在我們已經得到了兩組都是非常少的數據,接下來就可以建模啦!不過在建立任何一個機器學習模型之前不要忘了一個常規的操作,就是要把數據集切分成訓練集和測試集,這樣會使得后續驗證的結果更為靠譜。

在訓練邏輯回歸的模型中做了一件非常常規的事情,就是對于一個模型,咱們再選擇一個算法的時候伴隨著很多的參數要調節,那么如何找到最合適的參數可不是一件簡單的事,依靠經驗值并不是十分靠譜,通常情況下我們需要大量的實驗也就是不斷去嘗試最終得出這些合適的參數。

不同C參數對應的最終模型效果:

C parameter: 0.01

  • Iteration 1 : recall score = 0.958904109589
  • Iteration 2 : recall score = 0.917808219178
  • Iteration 3 : recall score = 1.0
  • Iteration 4 : recall score = 0.972972972973
  • Iteration 5 : recall score = 0.954545454545
  • Mean recall score 0.960846151257

C parameter: 0.1

  • Iteration 1 : recall score = 0.835616438356
  • Iteration 2 : recall score = 0.86301369863
  • Iteration 3 : recall score = 0.915254237288
  • Iteration 4 : recall score = 0.932432432432
  • Iteration 5 : recall score = 0.878787878788
  • Mean recall score 0.885020937099

C parameter: 1

  • Iteration 1 : recall score = 0.835616438356
  • Iteration 2 : recall score = 0.86301369863
  • Iteration 3 : recall score = 0.966101694915
  • Iteration 4 : recall score = 0.945945945946
  • Iteration 5 : recall score = 0.893939393939
  • Mean recall score 0.900923434357

C parameter: 10

  • Iteration 1 : recall score = 0.849315068493
  • Iteration 2 : recall score = 0.86301369863
  • Iteration 3 : recall score = 0.966101694915
  • Iteration 4 : recall score = 0.959459459459
  • Iteration 5 : recall score = 0.893939393939
  • Mean recall score 0.906365863087

C parameter: 100

  • Iteration 1 : recall score = 0.86301369863
  • Iteration 2 : recall score = 0.86301369863
  • Iteration 3 : recall score = 0.966101694915
  • Iteration 4 : recall score = 0.959459459459
  • Iteration 5 : recall score = 0.893939393939
  • Mean recall score 0.909105589115
  • Best model to choose from cross validation is with C parameter = 0.01

在使用機器學習算法的時候,很重要的一部就是參數的調節,在這里我們選擇使用最經典的分類算法,邏輯回歸!千萬別把邏輯回歸當成是回歸算法,它就是最實用的二分類算法!這里我們需要考慮的c參數就是正則化懲罰項的力度,那么如何選擇到最好的參數呢?這里我們就需要交叉驗證啦,然后用不同的C參數去跑相同的數據,目的就是去看看啥樣的C參數能夠使得最終模型的效果最好!可以看到不同的參數對最終的結果產生的影響還是蠻大的,這里最好的方法就是用驗證集去尋找了!

模型已經造出來了,那么怎么評判哪個模型好,哪個模型不好呢?我們這里需要好好想一想!

一般都是用精度來衡量,也就是常說的準確率,但是我們來想一想,我們的目的是什么呢?是不是要檢測出來那些異常的樣本呀!換個例子來說,假如現在醫院給了我們一個任務要檢測出來1000個病人中,有癌癥的那些人。那么假設數據集中1000個人中有990個無癌癥,只有10個有癌癥,我們需要把這10個人檢測出來。假設我們用精度來衡量,那么即便這10個人沒檢測出來,也是有 990/1000 也就是99%的精度,但是這個模型卻沒任何價值!這點是非常重要的,因為不同的評估方法會得出不同的答案,一定要根據問題的本質,去選擇最合適的評估方法。

同樣的道理,這里我們采用recall來計算模型的好壞,也就是說那些異常的樣本我們的檢測到了多少,這也是咱們最初的目的!這里通常用混淆矩陣來展示。

機器學習案例實戰之信用卡欺詐檢測

這個圖就非常漂亮了!(并不是說畫的好而是展示的很直接)從圖中可以清晰的看到原始數據中樣本的分布以及我們的模型的預測結果,那么recall是怎么算出來的呢?就是用我們檢測到的個數(137)去除以總共異常樣本的個數(10+137),用這個數值來去評估我們的模型。利用混淆矩陣,我們可以很直觀的考察模型的精度以及recall,也是非常推薦大家在評估模型的時候不妨把這個圖亮出來可以幫助咱們很直觀的看清楚現在模型的效果以及存在的問題。

機器學習案例實戰之信用卡欺詐檢測

這可還木有完事,我們剛才只是在下采樣的數據集中去進行測試的,那么這份測試還不能完全可信,因為它并不是原始的測試集,我們需要在原始的,大量的測試集中再次去衡量當前模型的效果。可以看到效果其實還不錯,但是哪塊有些問題呢,是不是我們誤殺了很多呀,有些樣本并不是異常的,但是被我們錯誤的當成了異常的,這個現象其實就是下采樣策略本身的一個缺陷。

對于邏輯回歸算法來說,我們還可以指定這樣一個閾值,也就是說最終結果的概率是大于多少我們把它當成是正或者負樣本。不用的閾值會對結果產生很大的影響。

機器學習案例實戰之信用卡欺詐檢測

上圖中我們可以看到不用的閾值產生的影響還是蠻大的,閾值較小,意味著我們的模型非常嚴格寧肯錯殺也不肯放過,這樣會使得絕大多數樣本都被當成了異常的樣本,recall很高,精度稍低。當閾值較大的時候,我們的模型就稍微寬松些啦,這個時候會導致recall很低,精度稍高,綜上當我們使用邏輯回歸算法的時候,還需要根據實際的應用場景來選擇一個最恰當的閾值!

說完了下采樣策略,我們繼續嘮一下過采樣策略,跟下采樣相反,現在咱們的策略是要讓class為0和1的樣本一樣多,也就是我們需要去進行數據的生成啦。

機器學習案例實戰之信用卡欺詐檢測

SMOTE算法是用的非常廣泛的數據生成策略,流程可以參考上圖,還是非常簡單的,下面我們使用現成的庫來幫助我們完成過采樣數據生成策略。

很簡單的幾步操作我們就完成過采樣策略,那么現在正負樣本就是一樣多的啦,都有那么20多W個,現在我們再通過混淆矩陣來看一下,邏輯回歸應用于過采樣樣本的效果。數據增強的應用面已經非常廣了,對于很多機器學習或者深度學習問題,這已經成為了一個常規套路啦!

機器學習案例實戰之信用卡欺詐檢測

我們對比一下下采樣和過采樣的效果,可以說recall的效果都不錯,都可以檢測到異常樣本,但是下采樣是不是誤殺的比較少呀,所以如果我們可以進行數據生成,那么在處理樣本數據不均衡的情況下,過采樣是一個可以嘗試的方案!

總結:對于一個機器學習案例來說,一份數據肯定伴隨著很多的挑戰和問題,那么最為重要的就是我們該怎么解決這一系列的問題,大牛們不見得代碼寫的比咱們強,但是他們卻很清楚如何去解決問題。今天咱們講述了一個以檢測任務為背景的案例,其中涉及到如何處理樣本不均衡問題,以及模型評估選擇的方法,最后給出了邏輯回歸在不用閾值下的結果。這里也是希望同學們可以通過案例多多積攢經驗,早日成為大牛。

這次就先跟大家分享這樣一個樣本不平衡的檢測案例,更多精彩內容歡迎參與到我的視頻課程中,更多干貨等待你的加入!

51CTO學院 4.20 IT充電節

(19-20號兩天,100門視頻課程免單搶,更有視頻課程會員享6折,非會員享7折,套餐折上8折,微職位立減2000元鉅惠)

活動鏈接:http://edu.51cto.com/activity/lists/id-47.html?wenzhang

相關直播教程:

《一站式搞定Python數據分析與機器學習特訓營直播實站》

責任編輯:未麗燕 來源: 51CTO學院
相關推薦

2017-04-11 12:45:29

Python機器學習信用卡欺詐檢測

2017-04-06 09:20:10

機器學習模型信用卡詐騙

2020-09-23 13:40:01

信用卡欺詐網絡釣魚攻擊

2020-09-23 11:26:40

人工智能技術網絡犯罪

2017-03-10 09:11:49

信用卡盜刷機器學習

2017-04-28 14:25:06

支付卡合規方案

2017-04-27 11:09:52

信用卡支付技術

2019-10-11 19:51:19

Python數據結構信用卡

2013-05-24 10:58:25

2024-06-06 08:00:00

2018-07-05 14:20:48

信用卡

2012-03-16 10:08:39

Geode指紋掃描器信用卡

2009-03-20 23:50:54

2014-03-24 09:41:45

攜程信息泄露信用卡

2020-09-21 09:02:56

AI機器學習類不平衡

2021-04-15 07:43:34

信用卡勒索軟件攻擊

2012-07-02 10:07:40

2014-09-22 10:32:34

2014-06-24 13:33:34

2014-03-24 09:16:55

點贊
收藏

51CTO技術棧公眾號

女同性αv亚洲女同志| 99re视频精品| 亚洲综合色网站| 亚洲精品网址在线观看| 免费观看亚洲视频| 美女黄页在线观看| 亚洲欧洲av| 亚洲va欧美va人人爽午夜| 亚洲free嫩bbb| 91动漫免费网站| 欧美7777| 久久久91精品国产一区二区精品| 久久噜噜噜精品国产亚洲综合| 日韩成人av免费| 免费在线观看av| 欧美在线免费看视频| av网站在线免费播放| 亚洲婷婷在线| 精品国产乱子伦一区| 无码人妻精品一区二区三区99v| 久久久久久无码精品大片| 欧美一级全黄| 精品久久久久久电影| 国产美女99p| 国产探花视频在线| 欧美91看片特黄aaaa| 一区二区三区在线视频观看| 99se婷婷在线视频观看| 美国黄色小视频| 日韩中文字幕视频网| 亚洲一区二区美女| 狠狠色噜噜狠狠色综合久| 日韩美女黄色片| 亚洲精品国产动漫| 欧美videossexotv100| www.xxx麻豆| 婷婷久久久久久| 久久福利一区| 日韩一区二区久久久| 欧美视频亚洲图片| hd国产人妖ts另类视频| 92国产精品观看| 91精品网站| 国产成人精品亚洲男人的天堂| 我不卡手机影院| 精品久久免费看| 欧美成人手机在线视频| 色999久久久精品人人澡69 | 亚洲成人久久影院| 国产自产精品| 黄色三级网站在线观看| 欧美亚洲一区二区三区| 最近2019年手机中文字幕| 特黄视频免费观看| 成人国产激情| 亚洲影视在线播放| 只有这里有精品| 国产黄色小视频在线| 93久久精品日日躁夜夜躁欧美| 国产精品12| 91porny九色| 美女日韩在线中文字幕| 国产成人高潮免费观看精品| 农村黄色一级片| 中国精品18videos性欧美| 日韩高清人体午夜| 五月天丁香花婷婷| 国产精品日韩精品在线播放| 懂色av中文一区二区三区天美| 亚洲蜜桃av| 亚洲AV成人无码一二三区在线| 美女视频黄频大全不卡视频在线播放| 久久久久久久久久国产| 亚洲av毛片基地| 理论片一区二区在线| 欧美喷潮久久久xxxxx| 中国老女人av| 在线观看的网站你懂的| 国产清纯白嫩初高生在线观看91| 97超级碰碰| 国产自产一区二区| www久久精品| 波多野结衣久草一区| 日韩一区二区三区不卡| 国产一区二区三区综合| 国产精品电影观看| 日韩在线视频免费播放| 欧美精品大片| 久久激情视频免费观看| 人妻少妇一区二区| 黄色成人美女网站| 国产亚洲欧美aaaa| 蜜桃传媒一区二区亚洲av| 国产91一区| 日韩精品高清视频| 欧美激情久久久久久久| 亚洲一区二区日韩| 91成人国产在线观看| 久久久国产精品人人片| 午夜激情久久| 色婷婷久久一区二区| 强乱中文字幕av一区乱码| 国产精品久久久久久久久久妞妞| 欧美xxxx综合视频| 日本一级特级毛片视频| 91亚洲人成网污www| 中文字幕在线精品| 亚洲精品成人av久久| 欧美精品麻豆| 国产精品极品美女粉嫩高清在线| 国产wwwxxx| 国产精品一区二区在线观看不卡| 91中文在线观看| 日韩资源在线| 久久久综合激的五月天| 精品日本一区二区三区在线观看| h视频在线播放| 国产欧美日韩视频在线观看| 男人的天堂avav| 乱插在线www| 亚洲成人第一页| 免费成人黄色大片| 国产探花一区| 日韩在线中文字| 影音先锋在线国产| 久久综合图片| 国产精品视频导航| 国产精品免费无遮挡| 国产主播一区二区三区| 日本精品一区二区| 日本免费中文字幕在线| ●精品国产综合乱码久久久久| 国产对白在线播放| 美女网站视频在线| 7777精品伊人久久久大香线蕉超级流畅 | 国产精品日韩av| 欧美成人综合在线| 国产视频不卡一区| 天天做天天爱天天高潮| 国产精品高清乱码在线观看| 欧美性色黄大片| 91在线免费看网站| 韩国av免费在线| 一区二区三区中文字幕| 男女视频在线观看网站| 小说区亚洲自拍另类图片专区| 国产精品九九久久久久久久| 九九在线视频| 亚洲免费三区一区二区| 九色在线视频观看| 久久99国产精品二区高清软件| 日韩欧美三级在线| 97人妻精品一区二区免费| 午夜精品视频一区二区三区在线看| 国产精品盗摄久久久| 国产h在线观看| 亚洲一区二区偷拍精品| 四虎国产精品免费| 国产成人av| 国产精品av免费在线观看| 久香视频在线观看| 欧美网站大全在线观看| 亚洲精品一区二区三区在线播放| 亚洲激情精品| 国产原创欧美精品| 神马一区二区三区| 午夜电影网一区| 波多野结衣福利| 日韩精品每日更新| 国产日产精品一区二区三区四区 | 午夜精品久久久久久久99热浪潮| 无码无套少妇毛多18pxxxx| 国产精品综合二区| 国产在线观看欧美| 亚洲制服欧美另类| 国产免费一区二区三区在线观看 | 最新中文字幕一区| 中文字幕不卡的av| 亚洲 高清 成人 动漫| 国产精品一区二区99| 国产人妖伪娘一区91| 影音先锋男人资源在线| 日韩高清免费在线| 亚洲综合免费视频| 久久久久国产精品麻豆ai换脸| 精品久久久久久中文字幕2017| 国产91精品入| 九九精品在线观看| 国产精品嫩草影院精东| 性做久久久久久久久| 日韩人妻无码精品综合区| 一区视频在线| 国产69精品久久久久9999apgf| 中文字幕色婷婷在线视频| 精品国产在天天线2019| 九九热精品视频在线| 18成人在线观看| 亚洲av无码一区二区三区网址| 欧美精品一线| 欧美一级二级三级| 亚洲精品v亚洲精品v日韩精品| 久久久成人精品| 欧美 日韩 国产 成人 在线| 在线观看av不卡| 亚洲第一综合网| 美女诱惑一区| 国产爆乳无码一区二区麻豆| 狠狠做深爱婷婷综合一区| 成人免费视频网站| 国产精品传媒麻豆hd| 97国产在线视频| www.久久ai| 中文字幕亚洲自拍| 青青青草网站免费视频在线观看| 欧美成人bangbros| 91激情在线观看| 中文字幕一区二区三区不卡在线| 三级av免费观看| 亚洲丝袜啪啪| 999国内精品视频在线| 久久91超碰青草在哪里看| 茄子视频成人在线| 国产黄在线播放| 亚洲国产91精品在线观看| 日本亚洲欧美在线| 亚洲男同性恋视频| www.99re6| 国产精品卡一卡二卡三| 午夜一区二区视频| 日韩国产精品久久| 免费高清在线观看免费| 成人激情开心网| 你懂的视频在线一区二区| 卡通欧美亚洲| 色噜噜狠狠狠综合曰曰曰88av | 亚洲精品三区| 欧美国产亚洲精品久久久8v| 天堂在线资源库| 精品国产三级a在线观看| 国产日本精品视频| 天天亚洲美女在线视频| 黄色小说在线观看视频| 久久久五月婷婷| 国产精品无码在线| 95精品视频在线| 亚洲av无码一区二区三区人| 91在线高清观看| 3d动漫精品啪啪一区二区下载| 91污在线观看| 免费在线观看你懂的| 久久新电视剧免费观看| 国产激情在线免费观看| 久久久久久久久久久黄色| 中文字幕免费高清| 国产精品入口麻豆九色| 日本爱爱小视频| 亚洲男女毛片无遮挡| 久一视频在线观看| 天天爽夜夜爽夜夜爽精品视频| 日韩毛片在线视频| 色久优优欧美色久优优| 妺妺窝人体色www聚色窝仙踪| 久久日韩粉嫩一区二区三区| 成人午夜福利一区二区| 国产日韩欧美a| 国产人与禽zoz0性伦| 亚洲天堂免费在线观看视频| 免费污网站在线观看| 国产欧美一区二区精品性色| 国产又粗又长又硬| 亚洲资源中文字幕| 久草手机在线视频| 欧美日本韩国一区二区三区视频| 国产av无码专区亚洲av麻豆| 亚洲电影在线看| 高清日韩av电影| 欧美www在线| 高潮一区二区| 91精品在线国产| 美女呻吟一区| 亚洲精品一区二区三区四区五区| 午夜国产欧美理论在线播放| 亚洲国产精品一区二区第一页| 999久久久精品国产| 男人的天堂avav| 首页综合国产亚洲丝袜| 久久精品久久99| 久久噜噜亚洲综合| 免费毛片在线播放免费| 色8久久人人97超碰香蕉987| 一区二区三区亚洲视频| 亚洲国产精品成人精品| 一级日本在线| 97视频com| 成人在线日韩| 日本一区二区三区视频在线观看 | 日韩毛片高清在线播放| 国产小视频在线免费观看| 欧美日韩国产天堂| 婷婷开心激情网| 九九精品在线视频| 日韩大陆av| 欧美成人第一区| 欧美韩日精品| 亚洲国产成人va在线观看麻豆| 99久久精品免费看| 欧美精品一区二区蜜桃| 欧美亚洲精品一区| 天堂网在线播放| 久久综合九色九九| 国产一区久久精品| www.亚洲一区| 亚洲成人看片| 精品在线不卡| 狠狠爱综合网| 三日本三级少妇三级99| 国产午夜一区二区三区| 日韩精品――中文字幕| 欧美成人精品高清在线播放| 亚洲精品承认| 国产精品美女主播在线观看纯欲| 人妖一区二区三区| 福利视频免费在线观看| 国产一区二区看久久| 日本一二三不卡视频| 色欧美88888久久久久久影院| 日韩在线观看视频一区| 欧美激情亚洲另类| 亚洲视频三区| av在线免费观看国产| 国产99久久久国产精品潘金 | 色综合久久悠悠| 亚洲高清影院| 在线免费观看成人| 国产精品大片| 免费看的av网站| wwww国产精品欧美| 国产成人精品a视频一区| 日本福利一区二区| 毛片免费在线观看| 国产不卡在线观看| 欧美一二区在线观看| 亚洲精品一二三四五区| 欧美国产日韩a欧美在线观看| 国产黄色免费视频| 中文字幕在线视频日韩| 久久爱.com| 青青草原网站在线观看| 国内成人免费视频| 亚洲精品女人久久久| 精品久久中文字幕| 欧美在线观看在线观看| 国产91九色视频| 深夜激情久久| 成人免费a级片| 成人激情校园春色| 91香蕉国产视频| 欧美乱妇20p| 成人在线网址| 国产精品久久久久久久小唯西川| 伊人成人在线视频| 精品国产无码在线观看| 欧美亚洲综合色| 在线xxxx| 久久精品五月婷婷| 欧美片第1页综合| 稀缺小u女呦精品呦| 中文字幕五月欧美| 精品久久久无码中文字幕| 国产亚洲欧洲在线| 成人a在线观看高清电影| 午夜探花在线观看| 成人avav在线| 欧美在线视频精品| 欧美国产中文字幕| 亚洲伊人春色| 亚洲自拍第三页| 精品免费在线观看| 成人午夜影视| 高清免费日韩| 日韩av网站在线观看| 亚洲av综合一区二区| 欧洲中文字幕精品| 天堂va在线| 91久久在线观看| 1024成人| 五月天婷婷丁香网| 精品国产91乱码一区二区三区| 亚洲第一二三四区| 国产成人亚洲综合无码| 国产午夜精品一区二区| 国产wwwwwww| 国产精品久久久久久久电影| 欧美精品网站| 日韩一级片在线免费观看| 亚洲成人1234| 一区在线不卡| 大香煮伊手机一区| 久久精品一区二区| 国产三级小视频|