【干貨】怎樣用數(shù)據(jù)分析找對象
上篇
寫在前面
在工作中,經(jīng)常利用多個數(shù)據(jù)指標(biāo)對整體進行綜合評價,需要把多個數(shù)據(jù)壓縮成一個綜合指標(biāo),這就是多指標(biāo)綜合評價方法。 耐心學(xué)完本期內(nèi)容,足夠裝X一整年。
專業(yè)內(nèi)容
專業(yè)術(shù)語的名稱能嚇?biāo)廊耍挥蒙罹俊?nbsp;
實際內(nèi)容很簡單,一個案例你就可以完全掌握。
一個案例
富帥們看著美女?dāng)?shù)據(jù),在進行激烈的討論...
那么,李富帥喜歡的“綜合起來最好的”類型,到底是哪個?
- 小龍女是最好的?雖然她最高,但是體重和胸圍都不是最優(yōu)的
- 趙敏頭發(fā)是最長的,但是其他數(shù)據(jù)也不是最好
要找出“綜合最好的”,需要把各項數(shù)據(jù)進行綜合評分,這樣就能幫李富帥找到心目中的女神!接下來看操作方法:
STEP1 無量綱處理
Q1 “量綱”是什么?就是數(shù)據(jù)的單位,例如厘米、公斤等等。
Q2 為什么要進行無量綱處理?我們對一個美女綜合評分不能直接相加,因為身高和胸圍單位不同,并且數(shù)據(jù)范圍相差太大,直接相加沒有任何意義,這是數(shù)據(jù)分析人員最常犯的錯誤之一。
Q3 具體怎么操作?(重點)統(tǒng)計標(biāo)準(zhǔn)化方法:z=(x-μ)/σ。其中x為某一項數(shù)據(jù),μ為均值,σ為標(biāo)準(zhǔn)差。此種方法也叫Z標(biāo)準(zhǔn)化,比較常用。
小龍女的身高:x=1.7全部美女身高的均值:μ=1.635全部美女身高的標(biāo)準(zhǔn)差:σ=0.0363
那么小龍女身高的標(biāo)準(zhǔn)化z=(x-μ)/σ=(1.7-1.635)/0.0363=1.8
當(dāng)然,實際計算不需要這么麻煩,下載模板填數(shù)據(jù)就ok啦~~~標(biāo)準(zhǔn)化的結(jié)果如下:
左側(cè)四列數(shù)據(jù)為Z標(biāo)準(zhǔn)分,右側(cè)數(shù)據(jù)為T標(biāo)準(zhǔn)分,T=50+100*Z,這樣做的目的只是為了調(diào)整數(shù)據(jù)的范圍,便于比較,因為看大一些的數(shù)字要直觀多啦,不然Z標(biāo)準(zhǔn)分的小數(shù)點看著眼花~~~
結(jié)論:
趙敏綜合評分最高~~~
趙敏是李富帥心目中的女神~~~~
但是,李富帥對結(jié)論卻不滿意
STEP2 權(quán)重確定
由于李富帥提出了進一步的要求,需要重新找出女神,接下來我們要做的,是確定身高、頭發(fā)長度、胸圍的權(quán)重,權(quán)重是幫我們找出女神的好方法。
下篇為你解答確定權(quán)重的方法,你可以了解到主觀賦權(quán)法和客觀賦權(quán)法是怎么回事。
下篇
李富帥為什么不滿意我們找的女神嗎?
確定各個指標(biāo)的權(quán)重可以解決這個問題,那么問題來了,權(quán)重又是什么鬼?
權(quán)重是一個相對的概念,針對某一指標(biāo)而言,某一指標(biāo)的權(quán)重是指該指標(biāo)在整體評價中的相對重要程度。
身高、胸圍、頭發(fā)長度這三個指標(biāo)中間,李富帥可能會更喜歡高個大長腿,而對長頭發(fā)短頭發(fā)不甚在意。在上一期文章中,綜合評分=身高得分+胸圍得分+頭發(fā)得分,這也默認(rèn)了三個指標(biāo)的權(quán)重是一致的,而本期我們會增加權(quán)重的概念。
加權(quán)之后,計算綜合評分會變成這種樣子:綜合評分=身高得分*60%+胸圍得分*30%+頭發(fā)得分*10%(各個指標(biāo)的權(quán)重之和必須等于1)
當(dāng)然不是!常用的權(quán)重確定方法有兩類
- 主觀賦權(quán)法
- 客觀賦權(quán)法
主觀賦權(quán)法
主觀賦權(quán)法沒有統(tǒng)一的標(biāo)準(zhǔn),簡單的說就是找一堆人過來憑感覺瞎猜,來,跟我一起念:ping gan jue xia cai~~~~,這里只介紹磚家調(diào)查法,簡便易行。
STEP1
找一堆磚家過來先坐著,李富帥找來了自己的基友們(為便于理解只選了3個磚家,實際應(yīng)用時越多越好)
STEP2
讓每個磚家給出自己的權(quán)重,并計算均值(如果各位磚家給出的權(quán)重差異較大,不能直接求平均數(shù),這種情況的處理方法感興趣的同學(xué)直接留言)
STEP3
數(shù)據(jù)分析其實也很簡單對吧?加權(quán)后的女神們得分結(jié)果如下
結(jié)論:
很明顯小龍女得分最高!
小龍女才是真正的女神!
what the fu....為何這么難纏,活該他找不到女神...
但是他的想法是對的,主觀賦權(quán)法的問題在于客觀性較差,如果李富帥的基友們審美有問題,那坑你沒商量!為了讓李富帥閉嘴,我們再試試客觀賦權(quán)法。
客觀賦權(quán)法
客觀賦權(quán)法是與主觀賦權(quán)法相對而言的,是根據(jù)指標(biāo)的原始數(shù)據(jù),通過數(shù)學(xué)或者統(tǒng)計方法處理后獲得權(quán)重,常見的有主成分分析、因子分析、相關(guān)、回歸等。
以上方法對智商有一點點要求,而且比較繁瑣,我們的宗旨是簡單易行接地氣,下面介紹標(biāo)準(zhǔn)差系數(shù)權(quán)數(shù)法。
前方高能預(yù)警!!!公式可以略過不看.....坦率的講,我壓根也不想看這些公式,我們只需要搞清楚思想,計算過程用軟件一步到位,不用擔(dān)心~~
標(biāo)準(zhǔn)差系數(shù)權(quán)重法是根據(jù)每個指標(biāo)的變異程度大小來進行賦權(quán),變異程度大的說明能夠更好的區(qū)分各個指標(biāo),應(yīng)賦予更高的權(quán)重,反之賦予較小的權(quán)重。
大濕憋了3個小時,想把這部分內(nèi)容寫的更簡單,但現(xiàn)在看起來還是有點難懂,有看不懂的歡迎在公眾號發(fā)消息提問。
STEP1
計算各指標(biāo)均值
STEP2
計算各指標(biāo)標(biāo)準(zhǔn)差
STEP3
計算各指標(biāo)標(biāo)準(zhǔn)差系數(shù),也叫離散系數(shù),就是STEP2的結(jié)果除以STEP1的結(jié)果
STEP4
計算各指標(biāo)權(quán)數(shù)
經(jīng)過以上慘無人道的計算之后...身高權(quán)重=0.093075613胸圍權(quán)重=0.279571615頭發(fā)權(quán)重=0.627352772
結(jié)論:
趙敏綜合評分最高
趙敏是女神!
看到這個結(jié)果,李富帥徹底怒了!!!
大濕的解釋:
● 主觀賦權(quán)法是由人的主觀經(jīng)驗或者感受得來● 客觀賦權(quán)法通過對原始數(shù)據(jù)的處理得來的,變異程度較大的指標(biāo)有更高的權(quán)重,本例中由于美女之間頭發(fā)長度相差最大,所以頭發(fā)長度有最高的權(quán)重
大濕的回答:
● 如果各個指標(biāo)間存在明顯的人為喜好、業(yè)務(wù)經(jīng)驗上顯然某指標(biāo)更重要等,用主觀賦權(quán)法更加合適、簡便。(偏向于業(yè)務(wù)的數(shù)據(jù)分析大多屬于此類)● 反之,各指標(biāo)間不存在哪個更重要,或者評分不包含人為喜歡或者經(jīng)驗上更重要,用客觀賦權(quán)。


































