別再到處翻資料了,數(shù)據(jù)分析入門先看這些
很多人在入門數(shù)據(jù)分析的時候都無從下手,很多時候都是因?yàn)榛A(chǔ)知識掌握不牢,連數(shù)據(jù)分析的目的都沒搞清楚,怎么會成功呢?其實(shí)想要學(xué)習(xí)數(shù)據(jù)分析,也需要抖點(diǎn)機(jī)靈!
比如,某電商雙十一跟著淘寶做了一個大促活動,事后想了解活動的效果,于是找到了小王。
于是,小王開始收集數(shù)據(jù)、處理數(shù)據(jù)、建立模型、制作報(bào)表。最終得出結(jié)論:活動期間UV上漲了50%,訂單增長了40%,銷售額提高了45%云云。
這叫數(shù)據(jù)分析嗎?當(dāng)然不,因?yàn)樾⊥醺緵]有找到數(shù)據(jù)分析的目的,只是單純的統(tǒng)計(jì)數(shù)據(jù)而已。沒有目的,自然也就不會有結(jié)論,而這兩者是數(shù)據(jù)分析最關(guān)鍵的兩點(diǎn)。

總結(jié)來看,數(shù)據(jù)分析的目的是整個研究方案的起點(diǎn),決定著后續(xù)研究的內(nèi)容,數(shù)據(jù)的來源,使用的方法,其目的無非就是兩個:
分析現(xiàn)狀和過去——有問題了,通過數(shù)據(jù)分析尋找原因,制定決策
預(yù)測未來——有新項(xiàng)目、產(chǎn)品、方案要上線,或企業(yè)制定大決斷,需要數(shù)據(jù)分析結(jié)論做輔助參考
數(shù)據(jù)分析的步驟

- 明確分析的目的,提出問題。只有弄清楚了分析的目的是什么,才能準(zhǔn)確定位分析因子,提出有價值的問題,提供清晰的指引方向。
- 數(shù)據(jù)采集。收集原始數(shù)據(jù),數(shù)據(jù)來源可能是豐富多樣的,一般有數(shù)據(jù)庫、互聯(lián)網(wǎng)、市場調(diào)查等。具體辦法可以通過加入“埋點(diǎn)”代碼,或者使用第三方的數(shù)據(jù)統(tǒng)計(jì)工具。
- 數(shù)據(jù)處理。對收集到的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)加工,主要包括數(shù)據(jù)清洗、數(shù)據(jù)分組、數(shù)據(jù)檢索、數(shù)據(jù)抽取等處理方法。
- 數(shù)據(jù)探索。通過探索式分析檢驗(yàn)假設(shè)值的形成方式,在數(shù)據(jù)之中發(fā)現(xiàn)新的特征,對整個數(shù)據(jù)集有個全面認(rèn)識,以便后續(xù)選擇何種分析策略。
- 分析數(shù)據(jù)。數(shù)據(jù)整理完畢,就要對數(shù)據(jù)進(jìn)行綜合分析和相關(guān)分析,需要對產(chǎn)品、業(yè)務(wù)、技術(shù)等了如指掌才行,常常用到分類、聚合等數(shù)據(jù)挖掘算法。Excel是最簡單的數(shù)據(jù)分析工具,專業(yè)數(shù)據(jù)分析工具有FineBI、Python等。
- 得到可視化結(jié)果。借助可視化數(shù)據(jù),能有效直觀地表述想要呈現(xiàn)的信息、觀點(diǎn)和建議,比如金字塔圖、矩陣圖、漏斗圖、帕累托圖等,同時也可以使用報(bào)告等形式與他人交流。
怎么做數(shù)據(jù)分析
簡單來說,數(shù)據(jù)分析的本質(zhì)還是分析,就是一個發(fā)現(xiàn)問題-分析問題-解決問題的過程。
首先要說的是,數(shù)據(jù)分析不光是一個技術(shù)門類,同時它也是一個龐雜無比的理論門類,里面包含了大數(shù)據(jù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等等諸多領(lǐng)域的知識,很多剛接觸數(shù)據(jù)分析的人都不知道該從何學(xué)起,其實(shí)無外乎三個字——道、法、器。
1、道:這里指的是業(yè)務(wù)思想,千萬不要以為數(shù)據(jù)分析就是取數(shù)、用數(shù),你首先要學(xué)的不是什么編程語言或者分析工具,而是和建立業(yè)務(wù)分析體系相關(guān)的管理、營銷知識。一句話,沒有業(yè)務(wù)思想,你就算是學(xué)會了所有編程語言,也成為不了數(shù)據(jù)分析師。這一點(diǎn)是對于完全外行的人來說的,建議先讀一本《商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)》。

2、法:自然就是方法,這里主要是指數(shù)據(jù)分析方法,比如杜邦分析法、漏斗分析法、四象限分析法等等,這些都是入門數(shù)據(jù)運(yùn)營所必備的知識。這方面建議新手讀一本《誰說菜鳥不會數(shù)據(jù)分析》
3、器:業(yè)務(wù)思想有了,分析方法也學(xué)會了,下面就可以學(xué)習(xí)數(shù)據(jù)運(yùn)營用到的各種工具了。
- 數(shù)據(jù)庫:企業(yè)比較常用的大型數(shù)據(jù)庫有Oracle 、db2 、sql server 、Sybase、Mysql,這么多數(shù)據(jù)庫不用都會,只要學(xué)會掌握其中一兩種就行了,新手的話建議學(xué)習(xí)sql。
- Excel:先別急著驚訝,Excel絕對是數(shù)據(jù)運(yùn)營工作當(dāng)中必須要掌握的工具!想要精通Excel也絕對不是你想象的那么簡單,起碼要學(xué)會Excel里的各種進(jìn)階操作,比如透視表,再高級一點(diǎn)的函數(shù)可以等你入門后再學(xué)習(xí)。
- Python/R語言:作為偏向于數(shù)據(jù)分析的編程語言,R與Python其實(shí)都是差不多的,但是就學(xué)習(xí)難易上講我還是推薦Python,因?yàn)镻ython幾乎可以說是市面上最簡潔、最強(qiáng)大、最成功的編程語言了,標(biāo)準(zhǔn)的全能語言。
- 數(shù)據(jù)分析工具、可視化工具:剩下這些工具就是按照你所選擇的方向進(jìn)行學(xué)習(xí)了,主要由下面幾個類別:
- 圖表類插件:ECharts、Highcharts等功能都十分強(qiáng)大。
- 數(shù)據(jù)報(bào)表類:FineReport等,對于日常的報(bào)表制作,更加易學(xué)實(shí)用。
- 可視化BI類:比如FineBI、cognos、tableau等,更直接地針對業(yè)務(wù)分析。

數(shù)據(jù)分析常用方法
1、PEST分析:
是利用環(huán)境掃描分析總體環(huán)境中的政治、經(jīng)濟(jì)、社會與科技等四種因素的一種模型。這也是在作市場研究時,外部分析的一部分,能給予公司一個針對總體環(huán)境中不同因素的概述。這個策略工具也能有效的了解市場的成長或衰退、企業(yè)所處的情況、潛力與營運(yùn)方向。一般用于宏觀分析。

2、SWOT分析:
又稱優(yōu)劣分析法或道斯矩陣,是一種企業(yè)競爭態(tài)勢分析方法,是市場營銷的基礎(chǔ)分析方法之一,通過評價自身的優(yōu)勢、劣勢、外部競爭上的機(jī)會和威脅,用以在制定發(fā)展戰(zhàn)略前對自身進(jìn)行深入全面的分析以及競爭優(yōu)勢的定位。

3、5W2H分析:
用五個以W開頭的英語單詞和兩個以H開頭的英語單詞進(jìn)行設(shè)問,發(fā)現(xiàn)解決問題的線索,尋找發(fā)明思路,進(jìn)行設(shè)計(jì)構(gòu)思,從而搞出新的發(fā)明項(xiàng)目具體:
- WHAT:是什么?目的是什么?做什么工作?
- WHY:為什么要做?可不可以不做?有沒有替代方案?
- WHO:誰?由誰來做?
- WHEN:何時?什么時間做?什么時機(jī)最適宜?
- WHERE:何處?在哪里做?
- HOW :怎么做?如何提高效率?如何實(shí)施?方法是什么?
- HOW MUCH:多少?做到什么程度?數(shù)量如何?

4、7C羅盤模型:
7C模型包括
C1——競爭對手;C2——商品;C3——成本;C4——流通渠道;C5——交流;
C6——消費(fèi)者
- N = 需求:生活必需品,像水、衣服、鞋。
- W = 想法:想得到的東西,像運(yùn)動飲料、旅游鞋。
- S = 安全:安全性,像核電、車、食品等物品的安全。
- E = 教育:對消費(fèi)者進(jìn)行教育
C7——環(huán)境
- N = 國內(nèi)和國際
- W = 天氣
- S = 社會和文化
- E = 經(jīng)濟(jì)
5、海盜指標(biāo)法AARRR
是互聯(lián)網(wǎng)常用的“用戶增長模型”,黑客增長模型:
- Acquisition:獲取用戶
- Activation:提高活躍度
- Retention:提高留存率
- Revenue:獲取收入
- Refer:自傳播

























