這可能是今年最值得推薦的數(shù)據(jù)分析工具
"數(shù)據(jù)可視化工具,可愛者甚番。分析師獨愛R,自Python以來,世人盛愛matplotlib。余獨愛BI之出分析而不拖沓,做可視化還算酷炫......."。
什么是BI?
BI全稱商業(yè)智能(Business Intelligence),在傳統(tǒng)企業(yè)中,它是一套完整的解決方案。將企業(yè)的數(shù)據(jù)有效整合,快速制作出報表以作出決策。涉及數(shù)據(jù)倉庫,ETL,OLAP,權(quán)限控制等模塊。
分析師剛上手往往更多的是做報表,而做報表更多用到的是BI。
在學(xué)習(xí)數(shù)據(jù)分析的初級階段,為了培養(yǎng)分析思維,快速了解數(shù)據(jù)分析。我通常會推薦大家用BI上手分析。因為BI上手簡單,避免了大部分人因為工具的羈絆而讓數(shù)據(jù)分析之路止步不前。R和Python這類高級工具,可以邊分析邊學(xué)習(xí)。
關(guān)于BI,最為人津津樂道的就屬Tableau和PoerBI,百度上搜他們的介紹一搜一大把。但是本文想分享另一個BI工具,F(xiàn)ineBI,一個被雪藏的利器。
我在之前的文章中有過推薦,不過我更愛他的"兄弟"FineReport,企業(yè)報表必備,以至于換了兩家公司都連續(xù)推薦采購,功能豐富且強(qiáng)大,只不過我不懂開發(fā),只知皮毛。FineBI和它都是一個公司的,新出的5.1版本著實讓我驚艷了一把,給人的感覺,平價版的Tableau替代!
接下來講重點講解它的主要功能、特點和同類具的對比、以及基本使用方法。
下一篇還會用BI做一個詳細(xì)深入的實操分析。
閱讀目錄
- 前言
- FineBI的主要功能
- FineBI的主要特點
- FineBI Vs 其他同類產(chǎn)品
- FineBI的分析思想
- 獲取方法&學(xué)習(xí)資料
- 小結(jié)
FineBI的主要功能
先來說說BI,BI全稱商業(yè)智能(Business Intelligence),是一套完整的數(shù)據(jù)解決方案,將企業(yè)的數(shù)據(jù)有效整合,快速制作可視化報表,以供業(yè)務(wù)決策。它一般涉及數(shù)據(jù)倉庫(現(xiàn)也和很多大數(shù)據(jù)方案對接)、ETL、OLAP分析,權(quán)限控制等模塊。
顧名思義,F(xiàn)ineBI是一款BI商業(yè)智能工具,能簡單快速的生成各種酷炫的可視化數(shù)據(jù)報表,做有目的性的數(shù)據(jù)分析。
所以,它主要完成下面幾個工作:
1. 數(shù)據(jù)的整合
2. 數(shù)據(jù)的分析和可視化
3. 報表制作與發(fā)布
FineBI的主要特點
BI工具那么多,為何我要重點推薦這款BI工具呢?
Tableau和PowerBI的好自不用我多說,知乎上大家都議論了很多。
但這款BI做為國產(chǎn),不由得讓我產(chǎn)生好奇和好感,值得關(guān)注和鼓勵。更何況它能夠足以應(yīng)對基本的數(shù)據(jù)分析,不虛于那兩者,且具備下面幾大特點:
1、打通各類數(shù)據(jù)源
FineBI能夠從各種數(shù)據(jù)源中抓取數(shù)據(jù)進(jìn)行分析,除了支持大家常用的Oracle、SQLServer、MySQL等數(shù)據(jù)庫,還支持SAP BW、HANA、Essbase等多維數(shù)據(jù)庫。
大數(shù)據(jù)前端分析,F(xiàn)ineBI可對接Hadoop、Kylin、Derby、Gbase、ADS、Hbase、Mongodb等大數(shù)據(jù)平臺。在對接方面有自己的分布式連接方案。
下圖是FineBI的數(shù)據(jù)連接窗口:
還支持導(dǎo)入Excel數(shù)據(jù),支持從R語言腳本導(dǎo)入數(shù)據(jù)。所以基本能對接各類數(shù)據(jù)源,打通并整合。
2. 易用性(無需編程)
筆者給自己的定位是一枚數(shù)據(jù)科學(xué)家,因此不會也不能將過多精力放在可視化工作上。畢竟數(shù)據(jù)庫/數(shù)據(jù)倉庫系統(tǒng)架構(gòu),數(shù)據(jù)挖掘算法研究等工作更是重中之重。而FineBI采用的拖拽數(shù)據(jù)字段,自動出圖的操作方式,將我從可視化的泥潭中解放出來,把更多精力投放到數(shù)據(jù)管理,算法研究和業(yè)務(wù)溝通上。下圖展示了FineBI清爽商務(wù)的工作界面。
易用性還體現(xiàn)在數(shù)據(jù)處理方面。
要知道一份數(shù)據(jù)拿到在分析是還是要做很多公式計算、過濾篩選處理的。驚喜的是這個工具內(nèi)置了各種計算公式、過濾組件。
比如時間過濾,大家覺得還要手寫公式么。各種現(xiàn)成的計算公式,基本告別SQL和代碼。
各種現(xiàn)成的計算公式,基本告別SQL和代碼。

這里展示的僅僅是一小個方面,絕大多數(shù)商業(yè)公司出品的軟件在易用性方面完爆開源產(chǎn)品。
3、可視化顏值高
一些圖表(出自官方)
下面這些圖是筆者20分鐘不到就做好的,稍加美化,估計也能達(dá)到大部分客戶在顏值上的要求了:
要知道同樣的工作使用R語言的ggplot2至少要2小時(含調(diào)試),使用Python的matplotlib就更久了。
4、數(shù)據(jù)權(quán)限管控
FineBI的數(shù)據(jù)權(quán)限管控,可以說是很專業(yè)了,這也是開源和商業(yè)不能比的。
筆者是FineReport的深度用戶,F(xiàn)ineReport是報表應(yīng)用工具,應(yīng)用面更廣,數(shù)據(jù)安全性要求也更高,F(xiàn)ineBI差不多是沿用了其兄弟產(chǎn)品的一套權(quán)限管理方案。可以對不同部門/崗位/角色的人員,進(jìn)行數(shù)據(jù)源/業(yè)務(wù)包/數(shù)據(jù)表/分析報表的權(quán)限管控。簡單來講,你可以讓不同人看到僅有自己權(quán)限下的報表和數(shù)據(jù)。
嗯,暫時就說這幾點,再說有打廣告嫌疑了......
FineBI Vs 其他同類產(chǎn)品
1. FineBI VS Excel
兩者是不太一樣的產(chǎn)品,Excel更全面更加注重數(shù)據(jù)處理,而FineBI比較精簡更注重報表及可視化,F(xiàn)ineBI更像是數(shù)據(jù)透視表+少量VBA。不過兩者結(jié)合用相得益彰。
2. FineBI VS R語言ggplot2
ggplot2其實是R語言的可視化包,因此對于熟悉R語言的人來說,使用ggplot2會非常得心應(yīng)手。同時由于ggplot2是由編程語言R驅(qū)動,因此它在定制化方面肯定做得比FineBI要好。但是要寫一定量代碼,這個不是每個人都擅長,畢竟如果是簡單的分析,大可不必入R的門。
3. FineBI VS Echarts等開源圖表
Echarts一般是給前端程序員用的,需要編程語言JS驅(qū)動,不推薦沒有編程基礎(chǔ)的分析師使用,雖然Echarts可視化更豐富。
4. FineBI VS 其他商用BI工具(如Tableau、PowerBI等)
功能方面都沒有太大差異,就是你多一個,我少一個的區(qū)別。對大部分人來說日常的數(shù)據(jù)分析足夠了。
使用感都有所不同,F(xiàn)ineBI有個建立業(yè)務(wù)包環(huán)節(jié),對數(shù)據(jù)做業(yè)務(wù)/場景區(qū)分。PowerBI屬于組件拖拽式風(fēng);Tableau在分析時和FineBI差不多,探索式分析,調(diào)整可視化樣式。
實際企業(yè)級商用有差異,因為要考慮得更多。企業(yè)級應(yīng)用出產(chǎn)品使用上還要更多關(guān)注平臺對接,架構(gòu)方案,數(shù)據(jù)抽取方式還有性能,包括之前提的權(quán)限管控等,F(xiàn)ineBI和Tableau更有商用基因,具體要看自己的實際需求和使用環(huán)境。
綜上所述,以上的工具都沒有單純的優(yōu)劣之分,具體問題具體分析,什么需求用什么工具。不過,如果你想快速地做美觀的可視化報表,那FineBI值得一學(xué)。
FineBI的數(shù)據(jù)分析思想
用FineBI做數(shù)據(jù)分析,總體的思路是這樣的,和Tableau有點像:
1.先連接數(shù)據(jù)庫,導(dǎo)入數(shù)據(jù)源。支持的數(shù)據(jù)源類型前文已說過。
2.然后初步處理數(shù)據(jù),選擇要分析的字段,分組匯總、新增列、合并表、行列轉(zhuǎn)換等等。
3.接著進(jìn)行數(shù)據(jù)分析。如果沒目的,可以先根據(jù)自己的假設(shè)拖拽數(shù)據(jù)字段,看看數(shù)據(jù)是什么趨勢是否有規(guī)律,漸漸摸清楚思路,所謂探索性分析。如果有目的,直接可視化就行。
4.最后形成可視化分析報告,導(dǎo)出或分享。
這里,我后面會出個一個詳細(xì)的案例,可能會更容易理解。
小結(jié)
有些人可能會對商業(yè)軟件帶有一種排斥觀念,個人覺得完全沒要。商業(yè)軟件固然需要花錢,但劣質(zhì)的開源軟件更可能浪費大家的寶貴時間。顯然我們應(yīng)該將精力更多的投放到數(shù)據(jù)和算法本身以及具體業(yè)務(wù)上,工具只不過是工具罷了。










































