從0到1構(gòu)建數(shù)據(jù)生態(tài)系列:數(shù)據(jù)價(jià)值挖掘
這估計(jì)《從0到1構(gòu)建數(shù)據(jù)生態(tài)系列》的***一篇,主題是數(shù)據(jù)價(jià)值。
在之前,我們所有做的一切一切,都是基礎(chǔ),那么其最終的目的是什么?
當(dāng)然,結(jié)果很明顯,就是數(shù)據(jù)價(jià)值,那么,作為數(shù)據(jù)生態(tài)的最上層,所謂的數(shù)據(jù)價(jià)值又是以什么形式體現(xiàn)的呢?
BI體系
在 大數(shù)據(jù)職位畫像–看看你是不是白混了賊多年 這篇對(duì)于大數(shù)據(jù)職位分析的文章中,我們知道,大數(shù)據(jù)中很大一部分人的角色定位就是“數(shù)據(jù)分析”。
對(duì)應(yīng)的職位崗位的名稱也多樣,“數(shù)據(jù)分析師”,“大數(shù)據(jù)分析師”,“BI數(shù)據(jù)分析”,“BI工程師”等等,五花八門。
這些崗位對(duì)應(yīng)所創(chuàng)造的最上層數(shù)據(jù)應(yīng)用價(jià)值就是,意圖通過數(shù)據(jù)分析的手段,來帶數(shù)據(jù)化的運(yùn)營監(jiān)測(cè),數(shù)據(jù)化的決策指導(dǎo),以及趨勢(shì)性的預(yù)測(cè)等等。
對(duì)于前一點(diǎn),即數(shù)據(jù)化的運(yùn)營,這是最常規(guī)的應(yīng)用手段,通過數(shù)據(jù)的反饋情況,進(jìn)行運(yùn)營策略的動(dòng)態(tài)修正,以期獲取***化運(yùn)營效果。
對(duì)于上層來說,他需要把控公司企業(yè)整體的事態(tài)走向,來制定未來的戰(zhàn)略規(guī)劃,這也是數(shù)據(jù)分析帶來的好處。
通常,我們?cè)跇?gòu)建起數(shù)據(jù)生態(tài)鏈路之后,***需要支撐的就是BI分析體系,用于運(yùn)營以及決策。
此外,結(jié)合分析以及深化一些的數(shù)學(xué)模型,我們還可以做到一些趨勢(shì)性的預(yù)測(cè),對(duì)于未來的策略做更進(jìn)一步的指導(dǎo),這就屬于BI體系更深入的應(yīng)用了。
畫像體系
除了BI體系之外,畫像體系是上層應(yīng)用的重要核心支持,在此之上可以演變各種有效的實(shí)際業(yè)務(wù)應(yīng)用。
所謂畫像體系,即一方面是指針對(duì)于公司用戶構(gòu)建起能夠全面描述用戶特征的用戶畫像,另一方面,對(duì)于實(shí)體目標(biāo),即除了用戶之外的實(shí)體,我們同樣可以構(gòu)建起畫像,例如品牌畫像,內(nèi)容畫像,產(chǎn)品畫像等等。
基于這些畫像,我們其實(shí)是可以做很多事的。
例如針對(duì)于電商,我們可以結(jié)合推薦系統(tǒng),做更個(gè)性化的商品推薦;結(jié)合活躍時(shí)段,地域,購物特征等,進(jìn)行更加個(gè)性化的推送服務(wù),以及做個(gè)性化的EDM等;又諸如品牌畫像,可以更好的為品牌進(jìn)行制定推廣策略;針對(duì)產(chǎn)品畫像,剖析產(chǎn)品結(jié)構(gòu),優(yōu)化產(chǎn)品內(nèi)部邏輯,指導(dǎo)產(chǎn)品快速迭代等等。
畫像是基石,在基石之上可以做更多可擴(kuò)展性的實(shí)際應(yīng)用,當(dāng)然,前提是你的畫像維度足夠豐富,屬性足夠準(zhǔn)確。
并且,需要注意的一點(diǎn)就是,我們?cè)跇?gòu)建畫像體系的時(shí)候,對(duì)于畫像維度進(jìn)行分層次的拆解,有助于我們填充畫像屬性,以及更好的實(shí)用指導(dǎo)。
至于說如何填充畫像的屬性,其實(shí)方法就很多了,部分是很明顯的屬性,部分是統(tǒng)計(jì)維度的屬性,部分是需要通過機(jī)器學(xué)習(xí)以及挖掘的手段進(jìn)行獲取。
當(dāng)然,更多的細(xì)節(jié)我們就不放在這里討論了。
推薦系統(tǒng)
在網(wǎng)絡(luò)興起之前,用戶能夠接觸到的信息實(shí)體(所謂信息是泛指,商品之類的也算)都是通過線下的實(shí)際展示,能夠直接獲取的范圍有限。
在網(wǎng)絡(luò)興起之后,虛擬空間的概念興起,信息實(shí)體可以放在虛擬空間中,這意味著實(shí)體(包括商品等一系列相關(guān)實(shí)體)的數(shù)量可以***擴(kuò)充。
在很早之前,用戶獲取信息的主要手段有兩種:結(jié)構(gòu)化的目錄導(dǎo)航,搜索。
但在虛擬空間的興起之后,隨著海量實(shí)體的增長,這種以用戶主動(dòng)觸發(fā)為主的獲取實(shí)體模式弊端越來越大:篩選時(shí)間變長、可選項(xiàng)增大帶來選擇困難現(xiàn)象。
在時(shí)間成本越來高的現(xiàn)在,必然追求更加高效的實(shí)體信息獲取方式,最本質(zhì)的目的是:縮短用戶與目標(biāo)實(shí)體之間距離,減少無效信息的獲取,以及提升效率。
所以,以個(gè)性化被動(dòng)信息推動(dòng)為模式的推薦系統(tǒng)則受到了歡迎。
而推薦系統(tǒng),在是建立在數(shù)據(jù)的基礎(chǔ)上,融合適應(yīng)場(chǎng)景的各種模型算法,最終以精準(zhǔn)信息推送為目的,提升用戶的點(diǎn)擊轉(zhuǎn)化,或者其他更明確的商業(yè)目的。
推薦系統(tǒng)是數(shù)據(jù)得以應(yīng)用的最常見的方式之一,也算是在國內(nèi)應(yīng)用的相對(duì)成熟的場(chǎng)景。
數(shù)據(jù)時(shí)代的搜索引擎
就信息檢索來說,搜索引擎早就存在,而且一直存在,但早期的搜索引擎只有一個(gè)目的,那就是檢索與檢索詞相關(guān)的信息。
這里所說的相關(guān),純屬于信息實(shí)體屬性相關(guān)。當(dāng)然,這樣做當(dāng)然是無可厚非的,信息檢索的本質(zhì)本來就是檢索相關(guān)的信息。
但隨著數(shù)據(jù)進(jìn)一步應(yīng)用,以及機(jī)器學(xué)習(xí)等技術(shù)的推廣,搜索引擎的模式也在悄然發(fā)生改變,只是你或許并沒有過多關(guān)注而已,只是感覺搜索越來越好用了。
我們知道,中文博大精深,一句話,稍微改動(dòng)一下,或者說重新組織一下,意思都可能發(fā)生巨大的變化,甚至是相同的一個(gè)詞,理解的角度不同,其意義都是不相同的。
在過去,這種情景是很難處理的,而如今,隨著對(duì)數(shù)據(jù)的進(jìn)一步應(yīng)用,以及算法模型的進(jìn)一步開發(fā),搜索意圖識(shí)別已經(jīng)算是“正經(jīng)”搜索引擎的標(biāo)配了。
除此之外,還有諸如搜索糾正,相關(guān)搜索推薦等基本的優(yōu)化點(diǎn),用于提升用戶的體驗(yàn)。
***的改變?cè)谟冢^去的搜索是一個(gè)“點(diǎn)”,而現(xiàn)在的搜索結(jié)果是一個(gè)“面”。
所謂的“點(diǎn)”即是你所搜索直接關(guān)注的目的,也就是信息本身,而“面”則是一個(gè)多維結(jié)構(gòu),在你關(guān)注的點(diǎn)的同時(shí),擴(kuò)散所有的相關(guān)信息。
這就是知識(shí)圖譜在搜索中的應(yīng)用,產(chǎn)生的搜索結(jié)果是一整個(gè)相關(guān)的知識(shí)圖譜結(jié)構(gòu)。
實(shí)現(xiàn)業(yè)務(wù)的數(shù)據(jù)化、自動(dòng)化、智能化
相對(duì)于上面描述的幾個(gè)相對(duì)明確的數(shù)據(jù)價(jià)值應(yīng)用,這里描述的就相對(duì)于偏業(yè)務(wù)層,并沒有說具體涉及到某種模型,具體的算法,而是一種業(yè)務(wù)驅(qū)動(dòng)模式。
我們希望通過數(shù)據(jù),能夠構(gòu)建起業(yè)務(wù)驅(qū)動(dòng)的自動(dòng)化流程,并且這整個(gè)業(yè)務(wù)流程是可數(shù)據(jù)化觀測(cè)的,然后在一些關(guān)鍵環(huán)節(jié)是可以智能化運(yùn)作的,這樣就能夠提升業(yè)務(wù)的精準(zhǔn)性。
當(dāng)然,更重要的是提升商業(yè)轉(zhuǎn)換價(jià)值。
期間,我們可以利用各種統(tǒng)計(jì)分析的手段,讓業(yè)務(wù)流轉(zhuǎn)是可以數(shù)據(jù)可觀測(cè)的,也可以通過諸如畫像屬性的進(jìn)一步業(yè)務(wù)化,也可以使用諸如推薦、預(yù)測(cè)等相關(guān)相對(duì)底層的技術(shù),甚至是可以利用更復(fù)雜的神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)等自動(dòng)學(xué)習(xí)、自動(dòng)優(yōu)化的手段。
關(guān)鍵在于使用數(shù)據(jù),再結(jié)合機(jī)器學(xué)習(xí)的手段來優(yōu)化整個(gè)流程,這才是我們所需要的。
結(jié)語
***,隨著數(shù)據(jù)的價(jià)值在逐漸被挖掘,上層將會(huì)越來越多的應(yīng)用模式被探索出來。
但可以預(yù)見的是,數(shù)據(jù)價(jià)值的使用,必然會(huì)從單純的數(shù)據(jù)本身價(jià)值,逐漸延伸到更多的其他方面,而作為數(shù)據(jù)價(jià)值探索的手段,機(jī)器學(xué)習(xí)相關(guān)的技術(shù)和數(shù)據(jù)的結(jié)合也會(huì)越來越緊密。





























