學Python就能做好數據分析?萬能語言背后是一片韭菜地
“會python的大學生,找工作有多賺?“
“python到底是什么鬼,學姐靠他拿了5個offer"
“數據分析還在用Excel?學會python效率高10倍!“
......
這樣的標題你在朋友圈、公眾號一定見過,不管是技術類公眾號,還是求職公眾號,甚至情感雞湯類公眾號都會時不時地給你推一篇讓你學python的文章,尤其在數據分析領域,“python數據分析“的公眾號或者文章遍地都是,當然,你隨手點開一個類似上述標題的文章,拉到最后一定都是一個python課程的報名廣告...
在鋪天蓋地廣告的洗腦下,讓很多想要學習數據分析或者已經從事數據分析的人產生了這樣的疑問:python真的很厲害嗎?學數據分析一定要python嗎?它為什么可以這么火?
首先,不可否認,python的確是一門非常好的編程語言,應用非常廣泛,語法簡潔、代數邏輯清晰,而且擁有海量的第三方庫。
在數據分析領域功能十分強大, 數據爬取、清洗、可視化分析,挖掘....python無所不能。開發效率高、運營速度快、而且入門簡單,據說,部分地區的小學生信息課程甚至也加入了Python,看起來學 python是大勢所趨,勢不可擋。
但是數據分析的都要學python嗎?
答案顯然不是。
不管是python、R還是Excel、spss,這些都是數據分析的工具,對于數據分析,我一直強調核心是業務,通過業務的分析邏輯影射到數據分析的處理邏輯,而數據分析工具則是幫助我們實現結果的手段。
如果把數據分析的結果比喻成你要去的一個目的地,那么python只是可以到達這個目的地的一個交通工具,換句話來說,你換個工具也能做到,所以python和數據分析之間,并沒有不可分割的關系。
既然關乎到選工具,肯定是選擇最好用工具才能夠最快達到目的,那python是不是數據分析工具的最佳選擇呢?
不一定是。不一樣的路適合的交通工具不一樣,同樣,不一樣的類型的數據分析工作,合適的數據分析工具也不一樣。
在實際工作中,數據分析這個大類的崗位層次不一,崗位職能也大不相同,在不同的公司,同樣都叫數據分析師的崗位,可能一個就是給業務取數,提供基礎數據支撐,而另一個卻要涉及數據建模、挖掘。這兩種人需要掌握的工具技能肯定也大不相同。
我這里把數據分析籠統的分類業務向和技術向兩類:
業務類分析師,側重業務分析,一般掛靠在業務部門,或者有單獨數據分析部門,最要工作內容就是對特定業務做專題分析,通過對數據分析來做一些業務規劃、方案等。日常的工作大多就是整理報表,做一些探索性的業務分析,解決業務問題。
技術類分析師,一般都在IT部、數據中心。根據從事的工作環節不同,被分成數據庫工程師,ETL工程師,爬蟲工程師,算法工程師等角色,主要的工作一般有數據倉庫搭建、專題分析、建模分析、數據挖掘預測等。
說完數據分析師的工作內容,再來看目前市場流行的幾類數據分析工具:Excel、python/R、BI工具
先說大家都熟悉的Excel,excel在數據分析領域的地位不可動搖,尤其對入門新手來說,大部分的人在進入工作之前都多少接觸Excel,所以在此基礎上要做數據分析,學習Excel是最合適不過的,從簡單的表格制作,數據透視表,寫公式,再到VBA語言,基本能夠滿足80%業務人員的分析需求。而且學習Excel的成本比學習一門編程語言低多了。
(見過有很多機構開始利用職場焦慮忽悠普通職場人學python,說句良心話,花費大幾千甚至破萬的價格去報班學python,沒有基礎幾個月也只能學個皮毛,回到自己的工作中根本用不上,除非你認真考慮轉行,當然轉行也不可能像培訓機構說的那么簡單)
回到正題,我們再說BI工具,BI的誕生,目的是為了縮短從業務數據到經營決策的時間,提高決策效率,所以它的產品設計理念就是圍繞提高數據分析的過程展開的。
和Excel相比,BI工具在分析流程上更加簡化,以我用過的FineBI為例,從數據鏈接、數據處理、到可視化圖表分析,很多功能都是封裝好的,鼠標點擊拖拽就能迅速完成一次分析。這樣的可視化操作界面讓BI的學習門檻大大降低,更適合面向企業中的業務分析人員。
另外,在面對大數據量分析時,BI工具也能彌補Excel的不足,還有一個吸引人的點,就是BI工具的可視化效果,在Excel中制作動態圖表或者高級的可視化圖表效果,需要經過諸多復雜的步驟,用編程語言實現,也需要一行行代碼調整,才能得到想要的效果,但是在BI工具中,簡單拖拽設置,就能制作出令人驚艷的可視化圖表
不過,因為BI工具是非開源的,所以在功能上有局限性,如果產品沒有設計某一項功能,可能就沒有辦法完成分析工作。這時候python或R這類編程語言就顯得更加靈活了,只要代碼寫得好,基本沒有實現不了的東西。
而且在數據挖掘、機器學習領域,BI和Excel就更加無能為力了,在這個階段,python語言是一個絕佳選擇,它對復雜的數據處理、建模、預測更加游刃有余。
最后總結一下,工具的選擇要根據自身需要,而不是哪個火學哪個,只有最適合自己的才是最好的。
像財務、人事、運營這類的基礎業務分析,excel完全就夠用了,如果想要提升效率,追求可視化效果,BI工具也是不錯的選擇,完全沒有必要花費極大的精力去湊Python的熱鬧,當然如果你對編程很感興趣,那當我沒說。
最后再來回答最后一個問題,為啥python這么火?
當然是因為好賺錢,以前互聯網興起的時候,各種java、C++的培訓炒的火熱,培訓機構大把大把撈金,現在大數據時代來了,數據分析、數據挖掘、人工智能的概念又火了,一片新的韭菜地出現在眼前,培訓機構們還能放著這么多的錢不賺?
隨便拿個業內TOP數據分析師的薪資給你畫個月入2W的大餅,實際上你入職大概率6-8K,而且你在培訓課里學到那點皮毛功夫還要面臨全網被割韭菜的各行各業神仙轉行來和你PK,最后能找到心儀工作的少之又少。
更慘的是一些無辜小白,在原來的崗位干的好好的,看到營銷文案,一股心血來潮要轉行,花了大價錢大精力去報班學python,最后轉行也轉不了,反而沒在自身的崗位上有什么提升,掙大錢的夢破碎了。
最后再強調一下,大部分的數據分析師本質是個業務輔助崗位,核心是對業務的理解能力和數據敏感度,像下面這張圖里寫的,那些告訴你學python就能入門數據分析,學python就能做好數據分析的,百分之90都是為了賺錢,另外,想轉行數據分析的也要慎重考慮,這一行也并不是你想象的那么美好。






























