精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

異常檢測(cè)的N種方法,阿里工程師都盤出來了

開發(fā) 架構(gòu)
互聯(lián)網(wǎng)黑產(chǎn)盛行,其作弊手段層出不窮,導(dǎo)致廣告效果降低,APP推廣成本暴增。精準(zhǔn)識(shí)別作弊是互聯(lián)網(wǎng)公司和廣告主的殷切期望。

背景

異常點(diǎn)檢測(cè)(Outlier detection),又稱為離群點(diǎn)檢測(cè),是找出與預(yù)期對(duì)象的行為差異較大的對(duì)象的一個(gè)檢測(cè)過程。這些被檢測(cè)出的對(duì)象被稱為異常點(diǎn)或者離群點(diǎn)。異常點(diǎn)檢測(cè)在生產(chǎn)生活中有著廣泛應(yīng)用,比如信用卡反欺詐、工業(yè)損毀檢測(cè)、廣告點(diǎn)擊反作弊等。

[[266003]]

異常點(diǎn)(outlier)是一個(gè)數(shù)據(jù)對(duì)象,它明顯不同于其他的數(shù)據(jù)對(duì)象。如下圖1所示,N1、N2區(qū)域內(nèi)的點(diǎn)是正常數(shù)據(jù)。而離N1、N2較遠(yuǎn)的O1、O2、O3區(qū)域內(nèi)的點(diǎn)是異常點(diǎn)。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖1.異常點(diǎn)示例

異常檢測(cè)的一大難點(diǎn)是缺少ground truth。常見的方法是先用無監(jiān)督方法挖掘異常樣本,再用有監(jiān)督模型融合多個(gè)特征挖掘更多作弊。

近期使用多種算法挖掘異常點(diǎn),下面從不同視角介紹異常檢測(cè)算法的原理及其適用場(chǎng)景,考慮到業(yè)務(wù)特殊性,本文不涉及特征細(xì)節(jié)。

1.時(shí)間序列

1.1 移動(dòng)平均(Moving Average,MA)

移動(dòng)平均是一種分析時(shí)間序列的常用工具,它可過濾高頻噪聲和檢測(cè)異常點(diǎn)。根據(jù)計(jì)算方法的不同,常用的移動(dòng)平均算法包括簡(jiǎn)單移動(dòng)平均、加權(quán)移動(dòng)平均、指數(shù)移動(dòng)平均。假設(shè)移動(dòng)平均的時(shí)間窗口為T,有一個(gè)時(shí)間序列:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

1.1.1 簡(jiǎn)單移動(dòng)平均(Simple Moving Average,SMA)

異常檢測(cè)的N種方法,阿里工程師都盤出來了

從上面的公式容易看出可以用歷史的值的均值作為當(dāng)前值的預(yù)測(cè)值,在序列取值隨時(shí)間波動(dòng)較小的場(chǎng)景中,上述移動(dòng)均值與該時(shí)刻的真實(shí)值的差值超過一定閾值則判定該時(shí)間的值異常。

適用于:

a.對(duì)噪聲數(shù)據(jù)進(jìn)行平滑處理,即用移動(dòng)均值替代當(dāng)前時(shí)刻取值以過濾噪聲;

b.預(yù)測(cè)未來的取值。

1.1.2 加權(quán)移動(dòng)平均(Weighted Moving Average, WMA)

由于簡(jiǎn)單移動(dòng)平均對(duì)窗口內(nèi)所有的數(shù)據(jù)點(diǎn)都給予相同的權(quán)重,對(duì)近期的***數(shù)據(jù)不夠敏感,預(yù)測(cè)值存在滯后性。按著這個(gè)思路延伸,自然的想法就是在計(jì)算移動(dòng)平均時(shí),給近期的數(shù)據(jù)更高的權(quán)重,而給窗口內(nèi)較遠(yuǎn)的數(shù)據(jù)更低的權(quán)重,以更快的捕捉近期的變化。由此便得到了加權(quán)移動(dòng)平均和指數(shù)移動(dòng)平均。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

加權(quán)移動(dòng)平均比簡(jiǎn)單移動(dòng)平均對(duì)近期的變化更加敏感,加權(quán)移動(dòng)平均的滯后性小于簡(jiǎn)單移動(dòng)平均。但由于僅采用線性權(quán)重衰減,加權(quán)移動(dòng)平均仍然存在一定的滯后性。

1.1.3 指數(shù)移動(dòng)平均(Exponential Moving Average, EMA)

指數(shù)移動(dòng)平均(Exponential Moving Average, EMA)和加權(quán)移動(dòng)平均類似,但不同之處是各數(shù)值的加權(quán)按指數(shù)遞減,而非線性遞減。此外,在指數(shù)衰減中,無論往前看多遠(yuǎn)的數(shù)據(jù),該期數(shù)據(jù)的系數(shù)都不會(huì)衰減到 0,而僅僅是向 0 逼近。因此,指數(shù)移動(dòng)平均實(shí)際上是一個(gè)無窮級(jí)數(shù),即無論多久遠(yuǎn)的數(shù)據(jù)都會(huì)在計(jì)算當(dāng)期的指數(shù)移動(dòng)平均數(shù)值時(shí),起到一定的作用,只不過離當(dāng)前太遠(yuǎn)的數(shù)據(jù)的權(quán)重非常低。在實(shí)際應(yīng)用中,可以按如下方法得到t時(shí)刻的指數(shù)移動(dòng)平均: 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中異常檢測(cè)的N種方法,阿里工程師都盤出來了表示權(quán)重的衰減程度,取值在0和1之間。異常檢測(cè)的N種方法,阿里工程師都盤出來了越大,過去的觀測(cè)值衰減得越快。

1.2 同比和環(huán)比 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖2.同比和環(huán)比

同比和環(huán)比計(jì)算公式如圖2所示。適合數(shù)據(jù)呈周期性規(guī)律的場(chǎng)景中。如:1.監(jiān)控APP的DAU的環(huán)比和同比,以及時(shí)發(fā)現(xiàn)DAU上漲或者下跌;2.監(jiān)控實(shí)時(shí)廣告點(diǎn)擊、消耗的環(huán)比和同比,以及時(shí)發(fā)現(xiàn)變化。當(dāng)上述比值超過一定閾值(閾值參考第10部分)則判定出現(xiàn)異常。

1.3 時(shí)序指標(biāo)異常檢測(cè)(STL+GESD)

STL是一種單維度時(shí)間指標(biāo)異常檢測(cè)算法。大致思路是:

(1)先將指標(biāo)做STL時(shí)序分解,得到seasonal,trend,residual成分,如圖3所示;

(2)用GESD (generalized extreme studentized deviate)算法對(duì)trend+residual成分進(jìn)行異常檢測(cè);

(3)為增強(qiáng)對(duì)異常點(diǎn)的魯棒性,將GESD算法中的mean,std等統(tǒng)計(jì)量用median, MAD(median absolute deviation)替換;

(4)異常分輸出:abnorm_score = (value - median)/MAD, value為當(dāng)前值,median為序列的中位數(shù)。負(fù)分表示異常下跌,正分表示異常上升。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖3.STL分解示例

2.統(tǒng)計(jì)

2.1 單特征且符合高斯分布

如果變量x服從高斯分布:異常檢測(cè)的N種方法,阿里工程師都盤出來了,則其概率密度函數(shù)為:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

我們可以使用已有的樣本數(shù)據(jù)異常檢測(cè)的N種方法,阿里工程師都盤出來了來預(yù)測(cè)總體中的異常檢測(cè)的N種方法,阿里工程師都盤出來了,計(jì)方法如下:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

2.2 多個(gè)不相關(guān)特征且均符合高斯分布

假設(shè)n維的數(shù)據(jù)集合形如:異常檢測(cè)的N種方法,阿里工程師都盤出來了

且每一個(gè)變量均符合高斯分布,那么可以計(jì)算每個(gè)維度的均值和方差異常檢測(cè)的N種方法,阿里工程師都盤出來了,具體來說,對(duì)于異常檢測(cè)的N種方法,阿里工程師都盤出來了,可以計(jì)算:

異常檢測(cè)的N種方法,阿里工程師都盤出來了
異常檢測(cè)的N種方法,阿里工程師都盤出來了

如果有一個(gè)新的數(shù)據(jù)異常檢測(cè)的N種方法,阿里工程師都盤出來了,可以計(jì)算概率異常檢測(cè)的N種方法,阿里工程師都盤出來了如下:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

2.3 多個(gè)特征相關(guān),且符合多元高斯分布

假設(shè)n維的數(shù)據(jù)集合異常檢測(cè)的N種方法,阿里工程師都盤出來了,且每一個(gè)變量均符合高斯分布,可以計(jì)算n維的均值向量異常檢測(cè)的N種方法,阿里工程師都盤出來了的協(xié)方差矩陣: 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

如果有一個(gè)新的數(shù)據(jù)異常檢測(cè)的N種方法,阿里工程師都盤出來了,可以計(jì)算概率: 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

2.4 馬氏距離(Mahalanobis distance)

對(duì)于一個(gè)多維列向量的數(shù)據(jù)集合D,假設(shè)異常檢測(cè)的N種方法,阿里工程師都盤出來了是均值向量,那么對(duì)于數(shù)據(jù)集D中的任意對(duì)象異常檢測(cè)的N種方法,阿里工程師都盤出來了,從異常檢測(cè)的N種方法,阿里工程師都盤出來了異常檢測(cè)的N種方法,阿里工程師都盤出來了的馬氏距離是:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中異常檢測(cè)的N種方法,阿里工程師都盤出來了是協(xié)方差矩陣。可以對(duì)數(shù)值異常檢測(cè)的N種方法,阿里工程師都盤出來了進(jìn)行排序,如果數(shù)值過大,那么就可以認(rèn)為點(diǎn)是離群點(diǎn)。

2.5 箱線圖

箱線圖算法不需要數(shù)據(jù)服從特定分布,比如數(shù)據(jù)分布不符合高斯分布時(shí)可以使用該方法。該方法需要先計(jì)算***四分位數(shù)Q1(25%)和第三四分位數(shù)Q3(75%)。令I(lǐng)QR=Q3-Q1,然后算出異常值邊界點(diǎn)Q3+λ*IQR和Q1- λ*IQR,通常λ取1.5(類似于正態(tài)分布中的異常檢測(cè)的N種方法,阿里工程師都盤出來了,如下圖4所示: 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖4.箱線圖算法示意圖

3.距離

3.1、基于角度的異常點(diǎn)檢測(cè) 

 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖5.點(diǎn)集和角度

如上圖5所示,現(xiàn)在有三個(gè)點(diǎn)X,Y,Z,和兩個(gè)向量異常檢測(cè)的N種方法,阿里工程師都盤出來了,如果對(duì)任意不同的點(diǎn)Y,Z,異常檢測(cè)的N種方法,阿里工程師都盤出來了變化都較小,則點(diǎn)X是異常點(diǎn)。通過余弦夾角公式易得角度:

 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

D是點(diǎn)集,則對(duì)于任意不同的點(diǎn)異常檢測(cè)的N種方法,阿里工程師都盤出來了,點(diǎn)X的所有角度的方差為:

 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

異常點(diǎn)的上述方差較小。該算法的時(shí)間復(fù)雜度是異常檢測(cè)的N種方法,阿里工程師都盤出來了,適合數(shù)據(jù)量N較小的場(chǎng)景。

3.2 基于KNN的異常點(diǎn)檢測(cè)

D是點(diǎn)集,則對(duì)于任意點(diǎn)異常檢測(cè)的N種方法,阿里工程師都盤出來了,計(jì)算其K近鄰的距離之和Dist(K,X)。Dist(K,X)越大的點(diǎn)越異常。時(shí)間復(fù)雜度是異常檢測(cè)的N種方法,阿里工程師都盤出來了,其中N是數(shù)據(jù)量的大小。

4.線性方法(矩陣分解和PCA降維)

基于矩陣分解的異常點(diǎn)檢測(cè)方法的主要思想是利用主成分分析(PCA)去尋找那些違反了數(shù)據(jù)之間相關(guān)性的異常點(diǎn)。為了找到這些異常點(diǎn),基于主成分分析的算法會(huì)把數(shù)據(jù)從原始空間投影到主成分空間,然后再從主成分空間投影回原始空間。對(duì)于大多數(shù)的數(shù)據(jù)而言,如果只使用***主成分來進(jìn)行投影和重構(gòu),重構(gòu)之后的誤差是較小的;但是對(duì)于異常點(diǎn)而言,重構(gòu)之后的誤差相對(duì)較大。這是因?yàn)?**主成分反映了正常點(diǎn)的方差,***一個(gè)主成分反映了異常點(diǎn)的方差。

假設(shè)X是一個(gè)p維的數(shù)據(jù)集合,有N個(gè)樣本,它的協(xié)方差矩陣是異常檢測(cè)的N種方法,阿里工程師都盤出來了。那么協(xié)方差矩陣就可以分解為:異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中P是一個(gè)異常檢測(cè)的N種方法,阿里工程師都盤出來了維正交矩陣,它的每一列異常檢測(cè)的N種方法,阿里工程師都盤出來了都是的特征向量。D是一個(gè)異常檢測(cè)的N種方法,阿里工程師都盤出來了維對(duì)角矩陣,包含了特征值異常檢測(cè)的N種方法,阿里工程師都盤出來了。在圖形上,一個(gè)特征向量可以看成2維平面上的一條線,或者高維空間里面的一個(gè)平面。特征向量所對(duì)應(yīng)的特征值反映了這批數(shù)據(jù)在這個(gè)方向上的拉伸程度。通常情況下,將特征值矩陣D中的特征值從大到小的排序,特征向量矩陣P的每一列也進(jìn)行相應(yīng)的調(diào)整。

數(shù)據(jù)集X在主成分空間的投影可以寫成Y=XP,注意可以只在部分的維度上做投影,使用top-j的主成分投影之后的矩陣為:異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中異常檢測(cè)的N種方法,阿里工程師都盤出來了是矩陣P的前j列,也就是說異常檢測(cè)的N種方法,阿里工程師都盤出來了是一個(gè)異常檢測(cè)的N種方法,阿里工程師都盤出來了維的矩陣。異常檢測(cè)的N種方法,阿里工程師都盤出來了是矩陣Y的前j列,異常檢測(cè)的N種方法,阿里工程師都盤出來了是一個(gè)異常檢測(cè)的N種方法,阿里工程師都盤出來了維的矩陣。按同樣的方式從主成分空間映射到原始空間,重構(gòu)之后的數(shù)據(jù)集合是異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中異常檢測(cè)的N種方法,阿里工程師都盤出來了是使用top-j的主成分重構(gòu)之后的數(shù)據(jù)集,是一個(gè)異常檢測(cè)的N種方法,阿里工程師都盤出來了維的矩陣。如圖6所示:

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖6.矩陣變換示意圖

定義數(shù)據(jù)異常檢測(cè)的N種方法,阿里工程師都盤出來了的異常值分為:

異常檢測(cè)的N種方法,阿里工程師都盤出來了
異常檢測(cè)的N種方法,阿里工程師都盤出來了

其中異常檢測(cè)的N種方法,阿里工程師都盤出來了表示的是top-j主成分占所有主成分的比例,特征值是按照從大到小的順序排列的。因此異常檢測(cè)的N種方法,阿里工程師都盤出來了是遞增的,這就意味著j越大,越多的方差就會(huì)被算到異常檢測(cè)的N種方法,阿里工程師都盤出來了中,因?yàn)槭菑?1 到 j 的求和。在這個(gè)定義下,偏差***的***個(gè)主成分獲得最小的權(quán)重,偏差最小的***一個(gè)主成分獲得了***的權(quán)重1。根據(jù) PCA 的性質(zhì),異常點(diǎn)在***一個(gè)主成分上有著較大的偏差,因此會(huì)有更大的異常分。

5.分布

即對(duì)比基準(zhǔn)流量和待檢測(cè)流量的某個(gè)特征的分布。

5.1 相對(duì)熵(KL散度)

相對(duì)熵(KL散度)可以衡量?jī)蓚€(gè)隨機(jī)分布之間的距離,當(dāng)兩個(gè)隨機(jī)分布相同時(shí),它們的相對(duì)熵為零,當(dāng)兩個(gè)隨機(jī)分布的差別增大時(shí),它們的相對(duì)熵也會(huì)增大。所以相對(duì)熵可以用于比較兩個(gè)分布的相似度。設(shè)異常檢測(cè)的N種方法,阿里工程師都盤出來了是兩個(gè)概率分布的取值,則對(duì)應(yīng)相對(duì)熵為異常檢測(cè)的N種方法,阿里工程師都盤出來了

5.2 卡方檢驗(yàn)

卡方檢驗(yàn)通過檢驗(yàn)統(tǒng)計(jì)量異常檢測(cè)的N種方法,阿里工程師都盤出來了來比較期望結(jié)果和實(shí)際結(jié)果之間的差別,然后得出實(shí)際結(jié)果發(fā)生的概率。其中O代表觀察值,E代表期望值。這個(gè)檢驗(yàn)統(tǒng)計(jì)量提供了一種期望值與觀察值之間差異的度量辦法。***根據(jù)設(shè)定的顯著性水平查找卡方概率表來判定。

6.樹(孤立森林)

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖7.iForest檢測(cè)結(jié)果

孤立森林(Isolation Forest)假設(shè)我們用一個(gè)隨機(jī)超平面來切割數(shù)據(jù)空間, 每切一次便可以生成兩個(gè)子空間。接著繼續(xù)用一個(gè)隨機(jī)超平面來切割每個(gè)子空間,循環(huán)下去,直到每個(gè)子空間里面只有一個(gè)數(shù)據(jù)點(diǎn)為止。那些密度很高的簇是需要被切很多次才能讓子空間中只有一個(gè)數(shù)據(jù)點(diǎn),但是那些密度很低的點(diǎn)的子空間則很快就被切割成只有一個(gè)數(shù)據(jù)點(diǎn)。如圖7所示,黑色的點(diǎn)是異常點(diǎn),被切幾次就停到一個(gè)子空間;白色點(diǎn)為正常點(diǎn),白色點(diǎn)聚焦在一個(gè)簇中。孤立森林檢測(cè)到的異常邊界為圖7中紅色線條,它能正確地檢測(cè)到所有黑色異常點(diǎn)。

如圖8所示,用iForest切割4個(gè)數(shù)據(jù),b和c的高度為3,a的高度為2,d的高度為1,d***被孤立,它最有可能異常。

 

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖8.iForest切割過程

7.圖

7.1 ***聯(lián)通圖

在無向圖G中,若從頂點(diǎn)A到頂點(diǎn)B有路徑相連,則稱A和B是連通的;在圖G中存在若干子圖,其中每個(gè)子圖中所有頂點(diǎn)之間都是連通的,但不同子圖間不存在頂點(diǎn)連通,那么稱圖G的這些子圖為***連通子圖。

如圖9所示,device是設(shè)備id,mbr是會(huì)員id,節(jié)點(diǎn)之間有邊表示設(shè)備上有對(duì)應(yīng)的會(huì)員登錄過,容易看出device_1、device_2、device_3、device_4是同人,可以根據(jù)場(chǎng)景用于判斷作弊,常用于挖掘團(tuán)伙作弊。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖9.***聯(lián)通圖結(jié)果

***聯(lián)通圖的前提條件是每條邊必須置信。適用場(chǎng)景:找所有連通關(guān)系。當(dāng)數(shù)據(jù)中存在不太置信的邊時(shí),需要先剔除臟數(shù)據(jù),否則會(huì)影響***聯(lián)通圖的效果。

7.2 標(biāo)簽傳播聚類

標(biāo)簽傳播圖聚類算法是根據(jù)圖的拓?fù)浣Y(jié)構(gòu),進(jìn)行子圖的劃分,使得子圖內(nèi)部節(jié)點(diǎn)的連接較多,子圖之間的連接較少。標(biāo)簽傳播算法的基本思路是節(jié)點(diǎn)的標(biāo)簽依賴其鄰居節(jié)點(diǎn)的標(biāo)簽信息,影響程度由節(jié)點(diǎn)相似度決定,通過傳播迭代更新達(dá)到穩(wěn)定。圖10中的節(jié)點(diǎn)經(jīng)標(biāo)簽傳播聚類后將得2個(gè)子圖,其中節(jié)點(diǎn)1、2、3、4屬于一個(gè)子圖,節(jié)點(diǎn)5、6、7、8屬于一個(gè)子圖。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖10.標(biāo)簽傳播聚類算法的圖結(jié)構(gòu)

標(biāo)簽傳播聚類的子圖間可以有少量連接。適用場(chǎng)景:節(jié)點(diǎn)之間“高內(nèi)聚低耦合”。圖10用***聯(lián)通圖得1個(gè)子圖,用標(biāo)簽傳播聚類得2個(gè)子圖。

8.行為序列(馬爾科夫鏈)

如圖11所示,用戶在搜索引擎上有5個(gè)行為狀態(tài):頁面請(qǐng)求(P),搜索(S),自然搜索結(jié)果(W),廣告點(diǎn)擊(O),翻頁(N)。狀態(tài)之間有轉(zhuǎn)移概率,由若干行為狀態(tài)組成的一條鏈可以看做一條馬爾科夫鏈。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖11.用戶行為狀態(tài)圖

統(tǒng)計(jì)正常行為序列中任意兩個(gè)相鄰的狀態(tài),然后計(jì)算每個(gè)狀態(tài)轉(zhuǎn)移到其他任意狀態(tài)的概率,得狀態(tài)轉(zhuǎn)移矩陣。針對(duì)每一個(gè)待檢測(cè)用戶行為序列,易得該序列的概率值,概率值越大,越像正常用戶行為。

9.有監(jiān)督模型

上述方法都是無監(jiān)督方法,實(shí)現(xiàn)和理解相對(duì)簡(jiǎn)單。但是由于部分方法每次使用較少的特征,為了全方位攔截作弊,需要維護(hù)較多策略;另外上述部分方法組合多特征的效果取決于人工經(jīng)驗(yàn)。而有監(jiān)督模型能自動(dòng)組合較多特征,具備更強(qiáng)的泛化能力。

9.1 機(jī)器學(xué)習(xí)模型GBDT

樣本:使用前面的無監(jiān)督方法挖掘的作弊樣本作為訓(xùn)練樣本。如果作弊樣本仍然較少,用SMOTE或者GAN生成作弊樣本。然后訓(xùn)練GBDT模型,用轉(zhuǎn)化數(shù)據(jù)評(píng)估模型的效果。

9.2 深度學(xué)習(xí)模型Wide&Deep

Wide&Deep通過分別提取wide特征和deep特征,再將其融合在一起訓(xùn)練,模型結(jié)構(gòu)如圖12所示。wide是指高維特征和特征組合的LR。LR高效、容易規(guī)模化(scalable)、可解釋性強(qiáng)。出現(xiàn)的特征組合如果被不斷加強(qiáng),對(duì)模型的判斷起到記憶作用。但是相反的泛化性弱。

deep則是利用神經(jīng)網(wǎng)絡(luò)自由組合映射特征,泛化性強(qiáng)。deep部分本質(zhì)上挖掘一些樣本特征的更通用的特點(diǎn)然后用于判斷,但是有過度泛化的風(fēng)險(xiǎn)。

算法通過兩種特征的組合去平衡記憶(memorization)和泛化( generalization)。

為了進(jìn)一步增加模型的泛化能力,可以使用前面的無監(jiān)督方法挖掘的作弊樣本作為訓(xùn)練樣本,訓(xùn)練Wide&Deep模型識(shí)別作弊。

異常檢測(cè)的N種方法,阿里工程師都盤出來了

圖12.Wide&Deep模型

10.其他問題

10.1 常用選擇閾值的思路

上述各種方法都需要計(jì)算異常閾值,可以用下述思路先選閾值,再用轉(zhuǎn)化數(shù)據(jù)驗(yàn)證該閾值的合理性。

a.無監(jiān)督方法:使用分位點(diǎn)定閾值、找歷史數(shù)據(jù)的分布曲線的拐點(diǎn);

b.有監(jiān)督模型:看驗(yàn)證集的準(zhǔn)召曲線

10.2 非高斯分布轉(zhuǎn)高斯分布

有些特征不符合高斯分布,那么可以通過一些函數(shù)變換使其符合高斯分布,以便于使用上述統(tǒng)計(jì)方法。常用的變換函數(shù):異常檢測(cè)的N種方法,阿里工程師都盤出來了,其中c為非負(fù)常數(shù);

異常檢測(cè)的N種方法,阿里工程師都盤出來了,c為0-1之間的一個(gè)分?jǐn)?shù)。

參考文獻(xiàn):

[1] Charu C, Aggarwal, et al. Outlier Analysis Second Edition, Springer.2016

[2] Varun Chandola, Arindam Banerjee, et al. Anomaly Detection: A survey,ACM Computing Surveys. 2009

[3] Kalyan Veeramachaneni, Ignacio Arnaldo, et al. AI2: Training abig data machine to defend, In Proc. HPSC and IDS. 2016

[4] Liu, Fei Tony, Kai Ming Ting, and Zhi-Hua Zhou, et al. Isolationforest, ICDM. 2008

責(zé)任編輯:武曉燕 來源: 阿里技術(shù)
相關(guān)推薦

2018-01-31 22:47:19

阿里巴巴Python編程

2010-08-10 13:29:58

軟件工程師

2019-08-28 20:38:12

好代碼編寫代碼代碼質(zhì)量

2020-11-03 16:42:46

容器Dockerfile技術(shù)

2020-11-25 09:27:49

Docker容器技術(shù)

2018-10-29 08:20:26

Apache Flin工程師AI

2019-06-17 08:57:13

優(yōu)秀工程師技術(shù)程序員

2025-06-12 01:11:11

AsyncAwait函數(shù)

2011-05-24 10:01:21

SEO

2022-04-05 13:56:48

設(shè)計(jì)模式javascript

2020-11-09 09:10:31

javascript設(shè)

2015-03-17 19:35:49

Xen漏洞阿里云

2020-05-12 10:32:25

Python列表重復(fù)

2018-06-22 15:59:46

2020-10-27 10:52:37

Docker容器存儲(chǔ)

2020-10-19 09:32:49

容器Docker管理

2020-10-26 15:11:50

Docker容器IT

2023-03-24 14:41:23

人工智能ChatGPT

2015-08-26 14:18:25

Web前端工程師價(jià)值

2018-06-03 14:26:00

阿里工程師內(nèi)網(wǎng)代碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲精品中文字幕乱码三区91| 日韩欧美理论片| 日本一本草久在线中文| 亚洲成人资源| 一区二区日韩精品| 尤物网站在线看| 中日韩脚交footjobhd| 国产精品天美传媒沈樵| 99久久伊人精品影院| 免费观看一区二区三区毛片| 成人羞羞网站入口| 精品美女在线播放| 国产裸体免费无遮挡| 久操视频在线| 久久日一线二线三线suv| 91免费视频国产| 国产视频1区2区| 黄色国产精品| 久久九九免费视频| 好吊视频在线观看| 9l视频自拍九色9l视频成人| 欧美日韩一区二区三区四区 | 中文字幕免费高清在线| 国产盗摄精品一区二区酒店| 国产精品国产三级国产普通话三级| 国产高清一区视频| 国产精品欧美激情在线| 日日夜夜一区二区| 97精品伊人久久久大香线蕉 | 午夜视频免费看| 国产美女av一区二区三区| 欧美亚洲激情在线| 久久国产在线观看| 欧美1级片网站| 亚洲精品一区在线观看香蕉| 佐佐木明希电影| 99久久这里有精品| 欧美日韩国产一区二区三区地区| 免费在线激情视频| 国产传媒av在线| 亚洲韩国一区二区三区| 神马午夜伦理影院| 美女隐私在线观看| 成人免费在线播放视频| 欧美在线播放一区| 国模精品一区二区| 国产亚洲人成网站| 欧美成人在线免费观看| 日韩av资源站| 久久久久久久久免费| 免费h精品视频在线播放| 五月婷婷丁香网| 99久久精品国产观看| 国产一区在线免费| 五月婷婷在线观看视频| 99久久99久久精品免费看蜜桃| 福利精品视频| 午夜国产在线视频| 国产日韩精品视频一区| 亚州欧美一区三区三区在线| 永久免费在线观看视频| 自拍偷拍亚洲欧美日韩| 自拍偷拍亚洲色图欧美| 宅男在线观看免费高清网站| 一区二区三区四区在线免费观看| 久久这里只有精品8| av在线加勒比| 欧美性色xo影院| 黄色av免费在线播放| av成人免费看| 欧美一区二区三区电影| 人妻互换一二三区激情视频| 欧美日韩另类图片| 亚洲人高潮女人毛茸茸| 特级西西人体高清大胆| 中文精品电影| 6080yy精品一区二区三区| 亚洲GV成人无码久久精品| 日韩高清一区在线| 亚洲在线观看视频| 亚洲产国偷v产偷v自拍涩爱| 99re66热这里只有精品3直播| 久久婷婷开心| 在线播放麻豆| 亚洲午夜一区二区三区| 无码人妻h动漫| 欧美97人人模人人爽人人喊视频| 3atv一区二区三区| 六十路息与子猛烈交尾| 久久在线视频| 久久人人爽人人爽人人片av高请 | 国产欧美日韩综合精品二区| 黄色av网站在线看| 又紧又大又爽精品一区二区| 日韩av片在线看| 亚洲伊人伊成久久人综合网| 亚洲激情在线观看| 午夜激情福利电影| 亚洲神马久久| 亚洲自拍av在线| 国产私人尤物无码不卡| 亚洲一区二区三区影院| 久久91亚洲精品中文字幕奶水| 国产欧美日韩中文字幕在线| mm131美女视频| 欧美黄色录像片| 午夜精品久久久久久久99热浪潮| 五月天婷婷久久| 国产专区综合网| 欧美日韩国产一二| 免费av不卡在线观看| 久久综合av免费| 正在播放91九色| 制服丝袜专区在线| 精品国产麻豆免费人成网站| 精品熟妇无码av免费久久| 国产在线日韩| 国产一区二区香蕉| 黄色美女网站在线观看| 亚洲成人资源网| 午夜激情影院在线观看| 日韩中文字幕高清在线观看| 欧美成年人视频| 中文字幕一二区| 狠狠色综合网| 萌白酱国产一区二区| 欧美激情一区二区三区免费观看| 成人黄色网址在线观看| 蜜桃网站在线观看| 香蕉久久久久久| 中文字幕av日韩| 久久久精品福利| 99久久er热在这里只有精品66| 欧洲美女和动交zoz0z| 日韩在线电影| 性欧美暴力猛交另类hd| 亚洲一级一级97网| 一本加勒比北条麻妃| 欧美fxxxxxx另类| 91精品国产91久久久久久| 国产熟女一区二区丰满| 国产日韩三级在线| 在线成人性视频| 唐人社导航福利精品| 欧美日韩免费网站| 无码人妻aⅴ一区二区三区 | 成人黄色生活片| 久久久久久久久久久免费精品 | 国产毛片久久久久| 中文一区在线播放| 日韩福利影院| 国产精品4hu.www| 色偷偷亚洲男人天堂| 免费在线观看a级片| 蜜臀国产一区二区三区在线播放| 欧美一区二区福利| 亚洲黄色小说视频| 丁香花免费高清完整在线播放| 中文字幕在线不卡视频| 国产精品人人妻人人爽人人牛| 性欧美xxx69hd高清| 精品五月天久久| 精品一区二区三区人妻| 成人午夜视频网站| 欧美日韩二三区| 妖精一区二区三区精品视频| 国产成人精品亚洲精品| 亚洲 国产 日韩 欧美| 国产精品萝li| 日本特黄在线观看| 亚洲经典自拍| 欧美成人在线免费| 在线免费观看毛片| 国产激情视频一区二区在线观看| 欧美另类网站| 国产精品伦一区二区| 久久激情五月丁香伊人| 精品人妻一区二区三区蜜桃| 亚洲高清免费一级二级三级| 丰满岳乱妇一区二区| 三级影片在线观看欧美日韩一区二区| 婷婷久久伊人| 亚洲一区二区免费在线观看| 97精品久久久| av在线播放网| 亚洲一区二区三区在线看| 亚洲最大综合网| av在线网站观看| 制服诱惑一区二区| 国产精品自产拍高潮在线观看| 四虎在线免费观看| 动漫精品一区二区| 国产九九九视频| 午夜日本精品| 高清视频一区二区三区| 美女高潮在线观看| 一区二区成人av| 国内老熟妇对白hdxxxx| 色先锋久久av资源部| 日本一卡二卡在线播放| 精品无人码麻豆乱码1区2区| 激情伊人五月天| 99久久精品国产亚洲精品| 国产伦精品一区二区三区免| 忘忧草在线影院两性视频| 日韩高清欧美高清| 91视频免费在线看| 不卡电影免费在线播放一区| heyzo国产| 国产不卡一区| 国产精品免费在线| 日日狠狠久久| 日韩av手机在线| 黄色在线观看视频网站| 丝袜亚洲另类欧美重口| 天天操天天干天天| 97视频一区| 亚洲国产精品字幕| 国产又大又长又粗| 亚洲乱码国产乱码精品精98午夜 | 日本三级2019| 2020日本不卡一区二区视频| 一区二区三区视频网| 亚洲成人99| 亚洲电影网站| 成人美女视频| 欧美大片免费观看在线观看网站推荐| 水莓100在线视频| 91精品国产91久久久久久最新毛片| 久久一区二区三区视频| 国产免费观看久久| 在线免费看黄视频| 99免费精品在线观看| 欧美成人乱码一二三四区免费| 国产精品毛片| 日本韩国欧美在线观看| 狠狠久久婷婷| 欧美成人精品免费| 国产精品嫩草影院桃色| 高清av一区二区| 欧美亚洲国产成人| 黄色日韩在线| 人人妻人人澡人人爽欧美一区双 | 色琪琪综合男人的天堂aⅴ视频| 国产成人自拍一区| 亚洲一区二区三区不卡国产欧美| 欧美手机在线观看| 亚洲色图欧美在线| 日本在线观看网址| 国产欧美一区二区精品久导航 | xxxx日韩| 国产精品日韩一区二区免费视频| 美女在线视频一区二区| 自拍偷拍欧美| 日韩av影视| 成人嘿咻视频免费看| 国内精品国语自产拍在线观看| 国产suv精品一区| 91中文字幕在线| 日韩一区二区三区精品| 热久久这里只有| 亚洲av综合一区| 欧美日韩一本到| 国产伦精品一区二区三区四区| 欧美性猛交xxxx乱大交退制版| 中文字幕免费在线观看视频| 亚洲图片欧美一区| www.毛片.com| 欧美亚洲综合色| 精品国产精品国产精品| 亚洲精品日产精品乱码不卡| 91麻豆制片厂| 亚洲毛片av在线| 国产一区二区三区黄| a毛片在线看免费观看| 精品视频9999| 好吊日视频在线观看| 久久精品国产久精国产一老狼| 2024最新电影免费在线观看| 欧美激情一级精品国产| 中文不卡1区2区3区| 国产精品www色诱视频| 女同久久另类69精品国产| 国产无一区二区| 欧美性视频在线播放| 黑丝一区二区三区| 成年人网站大全| 激情六月婷婷综合| yy6080午夜| 中文字幕制服丝袜一区二区三区 | 成人自拍爱视频| 性欧美lx╳lx╳| 女同性恋一区二区| 亚洲资源av| av噜噜在线观看| 99久久国产综合色|国产精品| 少妇愉情理伦三级| 亚洲成人一区在线| 在线观看毛片视频| 精品久久五月天| 99视频在线观看地址| 久久久伊人日本| 亚洲精品无播放器在线播放| 国产伦精品一区二区三区免费视频| 成人女性视频| 波多野结衣乳巨码无在线| 黄页视频在线91| 国产av自拍一区| 亚洲尤物在线视频观看| 波多野结衣毛片| 亚洲国产一区自拍| 在线视频观看国产| 国产精品香蕉av| 欧美久久香蕉| 国产日韩欧美大片| 免费高清在线一区| 给我看免费高清在线观看| 亚洲欧美韩国综合色| 国产99久久久久久免费看| 亚洲第一在线视频| 亚洲性图自拍| 成人www视频在线观看| 啪啪亚洲精品| 国产av国片精品| 高清在线不卡av| 无码黑人精品一区二区| 欧美专区日韩专区| 亚洲欧美色视频| 97国产精品视频人人做人人爱| 国产麻豆精品| 中文字幕第一页亚洲| 首页综合国产亚洲丝袜| av在线网站观看| 欧美性xxxxxx| 亚洲色图另类小说| 性欧美xxxx交| 久久中文字幕导航| 国产免费黄色一级片| 国产成人午夜精品影院观看视频| 999久久久国产| 欧美欧美欧美欧美| 一区二区三区视频在线观看视频| 国产精品丝袜高跟| 成人av国产| 午夜剧场在线免费观看| 国产精品久久网站| 中文字幕日韩第一页| 在线播放国产一区中文字幕剧情欧美| 美女100%一区| 日本在线播放一区| 日韩成人伦理电影在线观看| 精品欧美一区二区久久久| 在线一区二区三区四区五区| 每日更新av在线播放| 国产精品91一区| 成人精品天堂一区二区三区| 久久久国产欧美| 亚洲欧洲www| 99国产在线播放| 欧美人与性动交a欧美精品| youjizz亚洲| 又粗又黑又大的吊av| 久久亚洲一区二区三区四区| 岛国av中文字幕| 一区二区三区动漫| 国产精品一区二区三区av| 欧美另类videosbestsex日本| 国产美女视频一区| 欧美亚洲天堂网| 亚洲人成网站999久久久综合| 久久久人成影片一区二区三区在哪下载| 品久久久久久久久久96高清| 美日韩一区二区三区| 中文字幕av久久爽av| 亚洲福利小视频| av激情成人网| 美国av在线播放| 99久久精品免费看| 亚洲高清在线看| 欧美另类99xxxxx| 中文有码一区| 亚洲综合20p| 精品久久久久久亚洲精品 | 精品自拍视频在线观看| 激情小说亚洲色图| 国产免费又粗又猛又爽| 一区二区三区色| 精品亚洲综合| 亚洲一区久久久| 亚洲欧美久久久| 91免费公开视频| 亚洲欧美一区二区精品久久久| 日本一区二区中文字幕| 久久久久久免费看| 国产精品毛片久久久久久| 色一情一乱一区二区三区| 国产精品欧美风情| 亚洲欧洲午夜| 天天操夜夜操av| 亚洲美女在线观看|