精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大數(shù)據(jù):找合適的瓶,釀新的酒

云計(jì)算
云說(shuō)到底是一種基礎(chǔ)架構(gòu)的革命。原先用物理服務(wù)器的應(yīng)用,在云中變成以各種虛擬服務(wù)器的形式交付出去,從而計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源都能被更有效率的利用了。于是,酒量好無(wú)酒不歡的人就可以用個(gè)海碗牛飲二鍋頭;酒量小又想嘗嘗微醺小醉風(fēng)情的人也可以端個(gè)小杯咂巴咂巴女兒紅。

為什么談到大數(shù)據(jù),傳統(tǒng)企業(yè)表現(xiàn)出更多的困惑?其原因是,企業(yè)決策者并不清楚大數(shù)據(jù)能給業(yè)務(wù)帶來(lái)哪些價(jià)值,也不知道如何學(xué)習(xí)、使用大數(shù)據(jù)分析工具。而這些大數(shù)據(jù)工具就擺在那里,誰(shuí)能先一步學(xué)習(xí)使用,誰(shuí)就占有先機(jī)。

算起來(lái),接觸大數(shù)據(jù)、和互聯(lián)網(wǎng)之外的客戶談大數(shù)據(jù)也有快2年了。也該是時(shí)候整理下一些感受,和大家分享下我看到的國(guó)內(nèi)大數(shù)據(jù)應(yīng)用的一些困惑了。

云和大數(shù)據(jù),應(yīng)該是近幾年IT炒的最熱的兩個(gè)話題了。在我看來(lái),這兩者之間的不同就是:云是做新的瓶,裝舊的酒; 大數(shù)據(jù)是找合適的瓶,釀新的酒。

云說(shuō)到底是一種基礎(chǔ)架構(gòu)的革命。原先用物理服務(wù)器的應(yīng)用,在云中變成以各種虛擬服務(wù)器的形式交付出去,從而計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源都能被更有效率的利用了。于是,酒量好無(wú)酒不歡的人就可以用個(gè)海碗牛飲二鍋頭;酒量小又想嘗嘗微醺小醉風(fēng)情的人也可以端個(gè)小杯咂巴咂巴女兒紅。

大數(shù)據(jù)的不同在于,它其實(shí)是把以前人們丟棄不理的數(shù)據(jù)都撿起來(lái),加以重新分析利用,使之產(chǎn)生新價(jià)值的技術(shù)。換句話說(shuō),原先20斤的糧食只能出2斤的酒糟,現(xiàn)在20斤的糧食都變成或者大部分變成酒糟。當(dāng)然這酒糟肯定會(huì)和原先的酒糟有不一樣,所以釀出來(lái)的酒肯定和以前不同,喝酒、裝酒、儲(chǔ)存酒的方法自然也不同。

所以,相對(duì)于云,人們對(duì)大數(shù)據(jù)使用的困惑更大。接下來(lái)談?wù)勎宜吹降膸最愖疃嗟睦Щ螅约拔覀兡壳按嬖谀男﹩?wèn)題。

困惑之一:大數(shù)據(jù)能干什么?

換用前面飲酒來(lái)作比方,這新釀出來(lái)的酒怎么喝才可以喝得痛快。這里不再想討論到底哪些數(shù)據(jù)是大數(shù)據(jù)了。 下面這張圖是Gartner 對(duì)各行業(yè)對(duì)于大數(shù)據(jù)需求的調(diào)查,該統(tǒng)計(jì)針對(duì)大數(shù)據(jù)通用的3個(gè)V , 以及未被利用數(shù)據(jù)的需求情況做了分類。 可見(jiàn)幾乎所有行業(yè)都對(duì)大數(shù)據(jù)有著各種各樣的需求。

 

 

圖片來(lái)自Gartner

為什么有這些需求,是因?yàn)橐郧斑@些類型的數(shù)據(jù)都因?yàn)榧夹g(shù)和成本的原因,用戶沒(méi)有收集處理。現(xiàn)在有了性價(jià)比合理的手段可以讓你收集處理這些數(shù)據(jù),怎么可能說(shuō)不要?還是以釀酒做比喻,以前釀兩斤酒糟要浪費(fèi)18斤的糧食,現(xiàn)在至少20斤糧食可以有10斤都變成酒糟了,雖然這些酒糟可能和以前不大一樣,但至少可以少浪費(fèi)8斤糧食呢。

現(xiàn)在問(wèn)題來(lái)了,酒糟多了,種類不一樣了,怎么根據(jù)新的酒糟釀酒呢?對(duì)不起,這個(gè)問(wèn)題酒作坊就要?jiǎng)e人來(lái)教了。但問(wèn)題是,所有酒坊現(xiàn)在可能都面臨這同一個(gè)問(wèn)題,于是就沒(méi)人可以教你了,只能自己慢慢摸索。這個(gè)就是現(xiàn)在各行業(yè)面對(duì)大數(shù)據(jù)的最大困惑 --- 海量的數(shù)據(jù)收集上來(lái)不知道怎么用。

這里不妨看看為什么傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域沒(méi)有這樣的困惑。如下這張圖很好的說(shuō)明了傳統(tǒng)和現(xiàn)在的區(qū)別:

 

 

圖片來(lái)自Sogeti

從上圖展示的流程可以看出產(chǎn)生困惑的根本原因是:苦逼的IT從業(yè)人員走在了業(yè)務(wù)決策者的前面 (流淚) 。傳統(tǒng)時(shí)代,都是業(yè)務(wù)人員希望得到某類型的統(tǒng)計(jì)報(bào)表或者分析預(yù)測(cè),于是IT行業(yè)人員為了滿足他們的需求找方案、寫(xiě)算法,從而催生出了各種類型的數(shù)據(jù)倉(cāng)庫(kù)和解決方案。而現(xiàn)在,在互聯(lián)網(wǎng)的推動(dòng)下,IT人員發(fā)覺(jué)原來(lái)我們可以通過(guò)一些新的方式存儲(chǔ)海量的原先無(wú)法處理的數(shù)據(jù),但業(yè)務(wù)人員卻沒(méi)有準(zhǔn)備好。所以,當(dāng)你告訴他們:“嘿,哥們兒,我這里現(xiàn)在又有了很多數(shù)據(jù)可以幫你了。”他們一頭霧水不知道這些數(shù)據(jù)對(duì)他們有什么用了。

怎么解決這個(gè)問(wèn)題?先來(lái)看傳統(tǒng)廠商O(píng)racle、IBM他們是怎么做的。方式細(xì)節(jié)略有不同,但他們的思路基本如下:

 

 

圖片來(lái)自HP首席技術(shù)專家 Greg Battas在ABDS2012大會(huì)上的 分享

簡(jiǎn)單來(lái)說(shuō),這種處理方式是把Hadoop和其它各類NewSQL、NoSQL方案以ETL,或外部表的方式引入現(xiàn)有的數(shù)據(jù)分析解決方案架構(gòu)中。這種方案因?yàn)樯蠈拥臄?shù)據(jù)倉(cāng)庫(kù)沒(méi)有大的改變,客戶可以繼續(xù)使用原先的算法和報(bào)表結(jié)構(gòu),即在新的數(shù)據(jù)平臺(tái)上繼續(xù)沿用舊的應(yīng)用場(chǎng)景和分析方法。好處是由于引入了大數(shù)據(jù)技術(shù),可以處理多種數(shù)據(jù)源,同時(shí)降低原先海量數(shù)據(jù)ETL的成本。但這種方法依然存在不少問(wèn)題:

問(wèn)題一:性能瓶頸依然存在。縱觀現(xiàn)在各類NewSQL、NoSQL方案,分布式是一個(gè)最顯著的特色。之所以大家都采用分布式架構(gòu),就是因?yàn)閭鹘y(tǒng)的縱向擴(kuò)展方案,在處理海量數(shù)據(jù)時(shí)候性能沒(méi)法隨著數(shù)據(jù)量的增長(zhǎng)而線性擴(kuò)展,或者成本代價(jià)太高。而上圖的方案,雖然通過(guò)Hadoop解決了ETL的性能瓶頸問(wèn)題,但BI還是傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù),海量的ETL使得原有數(shù)據(jù)倉(cāng)庫(kù)需要處理的數(shù)據(jù)量大增,所以必須花很大代價(jià)再次升級(jí)原有的數(shù)據(jù)倉(cāng)庫(kù),否則分析就會(huì)跑的比原先還慢。因此,用戶依然需要升級(jí)價(jià)格不菲的上層數(shù)據(jù)倉(cāng)庫(kù),向原先效率一般的算法妥協(xié)性能。

問(wèn)題二:大數(shù)據(jù)投資被浪費(fèi)。舊的分析應(yīng)用場(chǎng)景,算法是基于關(guān)系型數(shù)據(jù)庫(kù)的。和大數(shù)據(jù)方案的邏輯模式有很大的不同,這不同主要有兩類。

沙里淘金和打磨玉石的區(qū)別。我舉過(guò)辣子雞的例子來(lái)形容Hadoop,大致是說(shuō)一盤(pán)辣子雞就是大數(shù)據(jù),Hadoop就是辣子雞里剔除尖椒,找出能吃的雞塊的方法。其實(shí),大數(shù)據(jù)的處理就是幫你淘金的過(guò)程。以前沒(méi)有那么合適的“篩子”,所以只能放棄在沙子里淘金的夢(mèng)想,現(xiàn)在有了合適的“篩子”,就可以去從沙灘上比較高效快速的找出那些“閃光”的東西了。而傳統(tǒng)的數(shù)據(jù)處理方式,其實(shí)已經(jīng)通過(guò)人工、半人工的方式,把很多篩撿工作做了。所以雖然丟棄了大量的數(shù)據(jù),但是保留下的數(shù)據(jù)已經(jīng)是塊“璞玉”了,要做的只是對(duì)這塊“璞玉”再精雕細(xì)啄,使其成為價(jià)值連成的“美玉”。 所以,用傳統(tǒng)的數(shù)據(jù)處理方法來(lái)處理大數(shù)據(jù),就是拿美工刀去宰一頭牛,即使有人幫你端盤(pán)子分部位,還沒(méi)殺死牛人就累死。

動(dòng)車組和火車的區(qū)別。分布式的大數(shù)據(jù)架構(gòu),其核心思想和三灣改編時(shí)的核心思想是一樣的:把支部建到連隊(duì)中去。把黨的有生力量分布到各個(gè)戰(zhàn)斗單元中,大大提高中央戰(zhàn)略的貫徹執(zhí)行,提高各個(gè)戰(zhàn)斗單位的機(jī)動(dòng)性和戰(zhàn)斗力。就是動(dòng)車為什么比火車開(kāi)得快的道理:每節(jié)車廂都有動(dòng)力,雖然每節(jié)都不比火車頭強(qiáng)勁,但車廂越多就跑的越快。而火車頭再?gòu)?qiáng)勁,也有拖不動(dòng)更多車廂的時(shí)候。現(xiàn)有的分析算法,很多時(shí)候都是針對(duì)“火車頭”類型的,很多時(shí)候沒(méi)辦法拆分成很多小的運(yùn)算分布到每個(gè)節(jié)點(diǎn)上。于是,如果沿用之前的算法,那么就必須增加額外的軟件方案把已經(jīng)分布出去了的數(shù)據(jù)再“集中”起來(lái),額外增加的環(huán)節(jié),肯定費(fèi)時(shí)費(fèi)力,效果不可能會(huì)好。

在我看來(lái),前面提到的傳統(tǒng)廠商解決企業(yè)大數(shù)據(jù)應(yīng)用困惑的方案不是最好的方案。什么是最好的方案呢?其實(shí)很簡(jiǎn)單,就是針對(duì)新的數(shù)據(jù)集和數(shù)據(jù)庫(kù)結(jié)構(gòu)特點(diǎn)開(kāi)發(fā)新的應(yīng)用分析場(chǎng)景,并把這些分析應(yīng)用場(chǎng)景直接跑到大數(shù)據(jù)架構(gòu)上。而不是去削足適履,拿新的NewSQL、NoSQL嫁接傳統(tǒng)方案。

這么做的好處不言而喻,關(guān)鍵是如何實(shí)現(xiàn)?這些事不能由搞IT的人來(lái)告訴業(yè)務(wù)人員,得讓業(yè)務(wù)人員來(lái)告訴我們!大數(shù)據(jù)應(yīng)用要真正在企業(yè)里生根開(kāi)花,真的需要一些數(shù)據(jù)科學(xué)家做需求生成(Demand Generation)的工作。我們要通過(guò)他們的幫助,使這張圖里的大數(shù)據(jù)路徑翻轉(zhuǎn)過(guò)來(lái),像傳統(tǒng)數(shù)據(jù)處理一樣,由業(yè)務(wù)人員告訴我們,他們想做什么!

我接觸過(guò)很多客戶,去之前得到的需求都是:希望了解Hadoop或者內(nèi)存數(shù)據(jù)庫(kù)。但是去了之后都發(fā)覺(jué),他們其實(shí)不知道Hadoop或者內(nèi)存數(shù)據(jù)庫(kù)可以幫他們達(dá)到哪些目的,希望我們可以告訴他們。但很坦率的說(shuō),這個(gè)不是我們這些搞IT基礎(chǔ)架構(gòu)的人該做的事情。我們已經(jīng)“超前”的儲(chǔ)備好了這類技術(shù)手段了,怎么用這類技術(shù)真的是應(yīng)該懂業(yè)務(wù)的人去想,而不是我們了。

所以,在這里我想呼吁IT行業(yè)里,處在金字塔頂?shù)膶I(yè)咨詢師、數(shù)據(jù)分析人員、數(shù)據(jù)科學(xué)家們,現(xiàn)在是時(shí)候走出原先的框架看看新技術(shù)新架構(gòu)下有些新商機(jī)了。不要總是桎梏于傳統(tǒng)的思路和方法,讓新的大數(shù)據(jù)思想來(lái)做“削足適履”的事情了。真心希望你們可以利用專業(yè)知識(shí)和行業(yè)經(jīng)驗(yàn),幫著那些”求大數(shù)據(jù)若渴“的行業(yè)用戶們好好定位下對(duì)他們真正有價(jià)值的新應(yīng)用場(chǎng)景,設(shè)計(jì)更多的有意義的分布式算法和機(jī)器學(xué)習(xí)模型,真正幫助他們解決大數(shù)據(jù)應(yīng)用之惑。 #p# 

困惑之二:不同的大數(shù)據(jù)方案之間有什么不一樣,我該用哪些?

首先,客戶必須把前一個(gè)問(wèn)題想清楚,明確自己要做什么事,實(shí)現(xiàn)什么功能。然后,我們就可以把這個(gè)需求分解成小的需求:

要處理幾種數(shù)據(jù)類型?

要處理多大的數(shù)據(jù)量?

要處理的多快?

這三個(gè)要求有比較明確答案之后。這張圖表以數(shù)據(jù)處理的時(shí)效性和數(shù)據(jù)量為兩個(gè)維度,把傳統(tǒng)的RDBMS和Hadoop、MPP、內(nèi)存數(shù)據(jù)庫(kù)等各類大數(shù)據(jù)方案做分類。這個(gè)分類針對(duì)的還是各種類別里比較典型的方案。現(xiàn)在實(shí)際情況,特別是MPP和Hadoop,各個(gè)發(fā)行版的特色功能都不盡相同,所以處理的場(chǎng)景也會(huì)各有不同方向的延伸。

大數(shù)據(jù)時(shí)代,一種架構(gòu)包打天下的局面是不大可能出現(xiàn)的。未來(lái)的企業(yè)大數(shù)據(jù)整體方案,肯定是多種數(shù)據(jù)庫(kù)方案結(jié)構(gòu)并存的。企業(yè)數(shù)據(jù)在各個(gè)不同方案架構(gòu)之間可以聯(lián)合互通,根據(jù)分析場(chǎng)景的不同分析工具運(yùn)作在不同的數(shù)據(jù)庫(kù)架構(gòu)上。

 

 

圖片來(lái)自 Nomura Research Institute

既然未來(lái)企業(yè)里面肯定會(huì)有多種數(shù)據(jù)源,多種數(shù)據(jù)庫(kù)結(jié)構(gòu),那么是否可以建立一個(gè)中間的數(shù)據(jù)服務(wù)層,把應(yīng)用和底層數(shù)據(jù)庫(kù)架構(gòu)隔離開(kāi)呢?就好像你趕著上班,沒(méi)時(shí)間買(mǎi)菜,于是就寫(xiě)個(gè)菜單交給鐘點(diǎn)工,給他錢(qián)讓他幫你買(mǎi)。你不用管她到底會(huì)去路邊菜市場(chǎng)買(mǎi)還是超市買(mǎi)。這個(gè)想法看起來(lái)很美好,但我覺(jué)得在企業(yè)里實(shí)行的難度比較大,不是很現(xiàn)實(shí)。為什么這么說(shuō)?這里只是說(shuō)說(shuō)我的一些看法。

看看對(duì)大數(shù)據(jù)應(yīng)用最純熟的互聯(lián)網(wǎng),他們的方式就是:簡(jiǎn)潔,直接。什么樣的數(shù)據(jù),用哪種方式存儲(chǔ)效率最高,處理起來(lái)最快就用哪種方式。能直接在文件系統(tǒng)上做的就不放到數(shù)據(jù)庫(kù)里。數(shù)據(jù)的分析也是如此,結(jié)構(gòu)層次越少越好,數(shù)據(jù)訪問(wèn)越直接越好,能用編程語(yǔ)言直接解決的問(wèn)題就堅(jiān)決不采用數(shù)據(jù)倉(cāng)庫(kù)用SQL。該用SQL解決的問(wèn)題也不去為了統(tǒng)一接口而再去跑一遍Java或Python。一切以高效直接為前提,充分貫徹“把支部建到連隊(duì)里”的核心思想,發(fā)揮小快靈的優(yōu)勢(shì)。以Hadoop舉例,很多互聯(lián)網(wǎng)或者發(fā)行版都開(kāi)始嘗試放棄Map/Reduce直接對(duì)HDFS進(jìn)行操作處理,其思想就是想更直接,更簡(jiǎn)潔。所以,前面所述的“建立一個(gè)數(shù)據(jù)服務(wù)層”還是傳統(tǒng)企業(yè)的舊思路老方法,希望通過(guò)建立中間層減少開(kāi)發(fā)移植難度,其實(shí)結(jié)果就是發(fā)揮不出大數(shù)據(jù)架構(gòu)本身的性能和規(guī)模優(yōu)勢(shì),限制住了技術(shù)架構(gòu)本身的發(fā)展空間。之所以提這個(gè)話題,主要是想引出下一個(gè)行業(yè)對(duì)于大數(shù)據(jù)的困惑。 #p# 

困惑之三:我們應(yīng)該怎樣從傳統(tǒng)的關(guān)系型數(shù)據(jù)架構(gòu)向大數(shù)據(jù)架構(gòu)遷移。

這個(gè)問(wèn)題,我覺(jué)得沒(méi)有人可以給出完美的答案,因?yàn)楝F(xiàn)在的一些新企業(yè),比如互聯(lián)網(wǎng),面對(duì)的就是混合數(shù)據(jù)大數(shù)據(jù)的環(huán)境,不存在遷移的問(wèn)題。而且他們要處理的數(shù)據(jù)類型,應(yīng)用場(chǎng)景也和傳統(tǒng)企業(yè)不一樣,只有一定的借鑒意義,完全復(fù)制是不明智的。傳統(tǒng)的大型企業(yè),現(xiàn)在國(guó)外大多數(shù)的企業(yè)自己在摸著石頭過(guò)河,國(guó)內(nèi)企業(yè)剛開(kāi)個(gè)頭。其實(shí)大家都在摸索過(guò)程中,前方基本沒(méi)有指路的明燈,只有一點(diǎn)點(diǎn)星星之火可供參考。

誰(shuí)能幫你呢?我覺(jué)得還是那些搞企業(yè)咨詢的人士。至少他們可以看到很多國(guó)外類似企業(yè)的成功或者失敗案例。但前提是他們真正站在中立的立場(chǎng)幫你從新的應(yīng)用場(chǎng)景著手分析規(guī)劃。

關(guān)于這個(gè)問(wèn)題,我也分享個(gè)人的觀點(diǎn),僅供參考。

第一步:先把大數(shù)據(jù)存起來(lái),用起來(lái)。現(xiàn)在看過(guò)很多傳統(tǒng)企業(yè)請(qǐng)各類咨詢?nèi)耸孔龅拇髷?shù)據(jù)戰(zhàn)略規(guī)劃,我沒(méi)資格評(píng)價(jià)這些規(guī)劃的可行性和問(wèn)題所在,但我覺(jué)得對(duì)于接受新生事物,首先要做的就是先嘗個(gè)鮮,而不是知道它的未來(lái)會(huì)怎樣。如果小試牛刀的結(jié)果不好,那么調(diào)整重頭再來(lái)的成本也比較小。所以我的建議,首先找個(gè)方案,把你準(zhǔn)備分析處理的數(shù)據(jù)用新的辦法存起來(lái),然后再試著在上面做些簡(jiǎn)單的查詢,比較之類的應(yīng)用,看看效果好不好,領(lǐng)導(dǎo)買(mǎi)不買(mǎi)單。如果效果好了,那么再試著在這上面實(shí)現(xiàn)新的業(yè)務(wù)應(yīng)用場(chǎng)景,解決一部分業(yè)務(wù)人員的某些實(shí)際需求;效果好的話再試著做第二個(gè)應(yīng)用,第三個(gè)分析。。。。。。慢慢的讓越來(lái)越多人看到這些新數(shù)據(jù)新應(yīng)用的價(jià)值。

第二步:考慮新的大數(shù)據(jù)平臺(tái)和原有數(shù)據(jù)平臺(tái)的互通,聯(lián)合問(wèn)題。這里有兩個(gè)方面:

把舊的應(yīng)用分析運(yùn)行在新的大數(shù)據(jù)平臺(tái)上。把數(shù)據(jù)從原先的RDBMS數(shù)據(jù)源抽取到新的大數(shù)據(jù)平臺(tái)上,利用新的大數(shù)據(jù)分析方法實(shí)現(xiàn)傳統(tǒng)的業(yè)務(wù)分析邏輯。這么做有可能會(huì)分析更多的數(shù)據(jù)產(chǎn)生更好的分析結(jié)果,也有可能會(huì)發(fā)現(xiàn)效率還不如原先的RDBMS方案。

把大數(shù)據(jù)平臺(tái)上的數(shù)據(jù)抽取到舊有數(shù)據(jù)倉(cāng)庫(kù)中分析展現(xiàn)。這個(gè)方向主要還是為了保證舊有用戶的SQL使用習(xí)慣,區(qū)別是抽入舊數(shù)據(jù)倉(cāng)庫(kù)的不是外部表,而是經(jīng)過(guò)清洗整理的有價(jià)值的數(shù)據(jù)。

通過(guò)這兩個(gè)方面的嘗試,基本就可以把哪些應(yīng)用可以遷移,哪些不可以遷移搞清楚了。為下一步打下扎實(shí)的基礎(chǔ)。

第三步:數(shù)據(jù)源整合,分析應(yīng)用場(chǎng)景定制。 有了前兩步的基礎(chǔ),基本你就可以很清楚你能夠處理哪些類型的數(shù)據(jù),以及他們會(huì)為你帶來(lái)哪些業(yè)務(wù)價(jià)值了。接下來(lái)就可以發(fā)動(dòng)“總攻”了。

總攻第一步,就是整合數(shù)據(jù)源,把將會(huì)涉及到的各類型數(shù)據(jù)分類,用各自最合適的方法儲(chǔ)存起來(lái)整理好。然后,把應(yīng)用、展現(xiàn)工具根據(jù)所涉及數(shù)據(jù)源的不同,應(yīng)用場(chǎng)景的差異,和不同的數(shù)據(jù)存儲(chǔ)架構(gòu)做耦合,定制化應(yīng)用場(chǎng)景,使每個(gè)應(yīng)用都可以充分利用到底層架構(gòu)的性能和擴(kuò)展能力。對(duì)于需要跨數(shù)據(jù)源的應(yīng)用場(chǎng)景,選定中間處理層方案,保證中間處理層方案的定制化,不會(huì)因其存在影響底層架構(gòu)的性能和上層分析應(yīng)用的實(shí)現(xiàn)。

這樣的步驟,沒(méi)辦法一下子讓企業(yè)領(lǐng)導(dǎo)看到“未來(lái)10年以后的IT架構(gòu)宏偉藍(lán)圖”,但可操作性比較強(qiáng),而且一步不對(duì)修改調(diào)整的機(jī)會(huì)也比較大。這種思路屬于互聯(lián)網(wǎng)和新興行業(yè)那種“小步快跑”的思維模式,先走幾步看看,如果不行也有了寶貴的經(jīng)驗(yàn)教訓(xùn),花的代價(jià)也不算很大。

大致上來(lái)說(shuō),我所能感受到的,行業(yè)用戶對(duì)于大數(shù)據(jù)的困惑就是以上所說(shuō)的三個(gè)方面。之所以會(huì)有這些困惑,歸根結(jié)底還是因?yàn)榇髷?shù)據(jù)的處理方式和以前的傳統(tǒng)方式太不同了。

以Hadoop為代表的大數(shù)據(jù)處理體系,其實(shí)是采取了一種粗放的方式處理海量的數(shù)據(jù),機(jī)器學(xué)習(xí)的原理很多時(shí)候也是依靠大量的樣本而不是精確的邏輯。舉個(gè)例子,我們常說(shuō)的“清明時(shí)節(jié)雨紛紛”,根本沒(méi)有邏輯和科學(xué)公式去推導(dǎo)出這個(gè)結(jié)論。之所以會(huì)有這個(gè)結(jié)論,是無(wú)數(shù)勞動(dòng)人民通過(guò)多年觀察,從“海量的”清明氣候樣本中發(fā)現(xiàn),每到這幾天總是下雨比較多。而為什么清明這幾天會(huì)下雨,卻沒(méi)有人去仔細(xì)分析。大數(shù)據(jù)的處理方式類似,它依托前人留下的經(jīng)驗(yàn),歷史數(shù)據(jù),歸納總結(jié),而不是去依賴一些復(fù)雜的公式演算。其所依仗的,就是“樣本”多,而且能夠通過(guò)技術(shù)手段快速高效的分析整理海量的樣本。而之前因?yàn)闆](méi)辦法處理這么多樣本,只能靠先進(jìn)高精尖的數(shù)學(xué)模型。所以,想用好大數(shù)據(jù),一是要調(diào)整思路,盡量用簡(jiǎn)單的方式去處理大量的數(shù)據(jù);二是在某些情況下可能需要考慮通過(guò)多采樣等方式把數(shù)據(jù)“變大”。

所以,企業(yè)要想用好大數(shù)據(jù),在沙海里淘金,就應(yīng)該大膽的拋棄掉原有的一套成熟的架構(gòu)和方案。從零開(kāi)始,真正的去思考這么多數(shù)據(jù),這些個(gè)新方法對(duì)于企業(yè)能夠有什么意義,產(chǎn)生什么價(jià)值。然后,就是把想法一個(gè)個(gè)在Hadoop,MPP等等架構(gòu)上實(shí)現(xiàn),落地,一旦發(fā)覺(jué)有問(wèn)題了就馬上調(diào)整,從頭再來(lái)。而不是先像以前那樣看看別的人都怎么做,然后做幾十頁(yè)“看上去很美“的PPT,畫(huà)一個(gè)”未來(lái)十年“的美麗的大餅了事。要多向互聯(lián)網(wǎng)和新興行業(yè)學(xué)習(xí),改變思路,掛鉤業(yè)務(wù),活在當(dāng)下,小步快跑。

責(zé)任編輯:王程程 來(lái)源: CSDN
相關(guān)推薦

2010-12-07 15:07:00

2018-11-27 14:42:19

新華三

2018-05-30 14:38:30

Dell,EMC,De

2015-09-07 13:17:44

企業(yè)設(shè)備大數(shù)據(jù)

2014-10-29 15:38:58

2015-08-20 13:39:49

云服務(wù)大數(shù)據(jù)

2015-05-19 16:52:13

企業(yè)網(wǎng)D1Net

2013-05-07 14:56:27

大數(shù)據(jù)應(yīng)用工具數(shù)據(jù)中心網(wǎng)絡(luò)

2013-07-04 11:02:18

2011-03-01 13:24:14

數(shù)據(jù)庫(kù)管理系統(tǒng)磁盤(pán)陣列級(jí)

2013-05-27 15:12:49

Hadoop 2.0

2017-09-22 13:22:59

大數(shù)據(jù)南京大學(xué)宿舍

2015-12-04 10:25:54

大數(shù)據(jù)CDOIBM

2015-11-27 14:38:46

中國(guó)軟件資訊網(wǎng)

2015-08-25 10:56:21

大數(shù)據(jù)

2018-01-11 16:41:01

大數(shù)據(jù)喝酒洋酒

2018-09-18 11:16:11

MapReduceXML大數(shù)據(jù)

2015-05-13 14:20:24

大數(shù)據(jù)大數(shù)據(jù)規(guī)則

2016-10-25 08:38:53

大數(shù)據(jù)DNA 變種癌癥

2014-01-09 10:19:43

大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产哺乳奶水91在线播放| 成人毛片一区二区| 精品国产www| 欧美码中文字幕在线| 色天使色偷偷av一区二区| 国产精品乱子乱xxxx| 久草国产精品视频| 国产精品密蕾丝视频下载| 亚洲一区二区三区四区在线观看| 亚洲自拍偷拍色图| 久草资源在线视频| 国产精品videossex| 亚洲欧美另类久久久精品2019| 91视频国产精品| 久久综合久久鬼| 天堂99x99es久久精品免费| 色婷婷激情综合| 亚洲精品久久区二区三区蜜桃臀 | 98视频精品全部国产| 亚洲h动漫在线| 日本精品一区二区| 99在线精品视频免费观看软件| 亚洲一级特黄| 亚洲无线码在线一区观看| 一起操在线视频| а√在线中文网新版地址在线| 久久久久久99精品| 成人午夜高潮视频| 久久久国产精品人人片| 亚洲国产最新| 欧美变态口味重另类| 日韩中文字幕免费在线| 1024在线播放| 欧美激情一区在线| 国产一区二区三区色淫影院| 三级网站在线播放 | 婷婷精品国产一区二区三区日韩| 国产乱码精品一区二区| 男女av一区三区二区色多| www.久久色.com| 无码国产精品一区二区免费式直播| 美女网站视频一区| 亚洲影视在线播放| 日韩欧美亚洲精品| 欧美一级一区二区三区| 国产一区欧美日韩| 国产精品第一视频| 日韩欧美性视频| 欧美人成网站| 日韩三级影视基地| 成人无码av片在线观看| 国产又粗又黄又猛| www成人啪啪18软件| 国产精品久久免费视频 | 免费一级肉体全黄毛片| 日韩欧美三级在线观看| 伊人久久综合一区二区| 一区二区三区国产豹纹内裤在线| 亚洲欧洲一二三| 青青草在线免费视频| 粉嫩av一区二区三区| 成人精品福利视频| 最近中文字幕在线观看视频| 久久久蜜桃一区二区人| 性欧美视频videos6一9| 久久精品第一页| 欧美全黄视频| 中文字幕亚洲在线| 瑟瑟视频在线观看| 伊人久久大香线蕉| 欧美va亚洲va香蕉在线| 人妻精品久久久久中文字幕69| 国产综合色激情| 欧美性猛交xxxx偷拍洗澡| 免费av手机在线观看| 亚洲七七久久综合桃花剧情介绍| 亚洲天堂a在线| 手机福利在线视频| h视频在线观看免费| 久久久精品影视| 久久偷看各类wc女厕嘘嘘偷窃 | 人九九综合九九宗合| 欧美成人精品欧美一级乱黄| 伊人久久大香线蕉综合四虎小说 | 成人免费在线视频网址| 国产又黄又大又爽| 久久福利视频一区二区| 亚洲iv一区二区三区| 国产91视频在线| 国产一区二区三区在线看麻豆| 91精品国产自产在线老师啪| 国产免费黄色网址| 国产成人8x视频一区二区| 国产乱码精品一区二区三区日韩精品 | 青青青伊人色综合久久| 91极品女神在线| 日本熟女毛茸茸| 视频一区二区三区中文字幕| 国产欧美精品va在线观看| 国产精品免费无遮挡| 国产激情一区二区三区| 国产精品一区二区你懂得| 熟妇人妻中文av无码| 久久综合九色综合97_久久久| 日韩福利二区| 久热av在线| 国产精品国产精品国产专区不蜜| 永久免费网站视频在线观看| 99热99re6国产在线播放| 色综合久久久久综合99| 亚洲欧美日韩三级| 国产精品网址| 中文字幕在线观看亚洲| 日韩高清dvd碟片| 国产精品视区| 92国产精品久久久久首页 | 日本中文字幕一区二区有码在线| 亚洲国产精品t66y| www.av91| 国产成人精品一区二三区在线观看 | 搡的我好爽在线观看免费视频| 国偷自产视频一区二区久| 亚洲最新av网址| 日本妇女毛茸茸| 久久人人97超碰国产公开结果| 成人精品久久一区二区三区| 乱精品一区字幕二区| 国产午夜精品理论片a级大结局| 日本婷婷久久久久久久久一区二区 | 小早川怜子一区二区的演员表| 国产精品99一区二区三| 国内精久久久久久久久久人| 欧美性受xxx黑人xyx性爽| 国产在线视视频有精品| 欧美日韩国产不卡在线看| 尤物在线视频| 国产一区二区三区四区老人| 精品一区二区三区亚洲| 3d成人动漫在线| 精品在线99| 欧美精品在线免费播放| 国产女主播喷水视频在线观看| 国产精品一级黄| 久久综合福利| 97caopron在线视频| 欧美视频免费在线观看| 91aaa精品| 日韩伦理一区二区三区| 久久影院在线观看| 久久精品视频5| 成人黄色大片在线观看 | 日韩在线一区二区| 国产福利久久| 在线观看男女av免费网址| 欧美色窝79yyyycom| 欧美日韩dvd| 国产精品jizz在线观看麻豆| 精品国产一区久久久| www.99热这里只有精品| 国产精品日本一区二区三区在线 | 久久人人超碰精品| 国产精品99导航| 在线丝袜欧美日韩制服| 国内高清免费在线视频| 精品精品欲导航| 日本少妇激情舌吻| 91女厕偷拍女厕偷拍高清| av免费中文字幕| 精品一区二区三| 一二三区精品福利视频| 国产精品视频久久久久| а天堂8中文最新版在线官网| 欧美午夜精品一区二区三区| 911国产在线| 国产91对白在线观看九色| 男人的天堂狠狠干| 美女亚洲一区| 国产啪精品视频| 香蕉成人app免费看片| 亚洲黄色成人网| 日本黄色中文字幕| 18成人在线视频| 黄色在线免费播放| 首页国产欧美日韩丝袜| 99热都是精品| 免费av一区| 92裸体在线视频网站| av中文字幕在线看| 国产一区二区三区视频免费| 国产同性人妖ts口直男| 五月激情丁香一区二区三区| 日本少妇xxxxx| 国产激情视频一区二区在线观看| 国产精品秘入口18禁麻豆免会员| 久久亚洲影视| 国产午夜精品一区| 欧美大片网站| 7777精品久久久久久| 麻豆网站在线| 亚洲欧美精品一区二区| 国产精品久久久久久免费播放| 亚洲aaa精品| 美女100%露胸无遮挡| 丰满白嫩尤物一区二区| 一区二区三区免费播放| 9久re热视频在线精品| 精品久久免费观看| 久久av影视| 超碰97人人在线| 国产精品扒开腿做爽爽爽视频软件| 久久久精品国产亚洲| 日本一级在线观看| 日韩三级高清在线| 中文字幕一区二区人妻痴汉电车| 亚洲国产精品久久人人爱| 日本爱爱小视频| 国产亚洲精品福利| 在线视频 日韩| 国产一区二区三区日韩| 中文字幕永久视频| 亚洲一区国产| 99热久久这里只有精品| 国产精品久久久久久影院8一贰佰| 久久手机视频| 大香伊人久久精品一区二区| 91精品视频网站| 日韩精品第二页| 国产精品av在线播放| 免费高潮视频95在线观看网站| 欧美美女18p| 国产在线观看a视频| 一区二区国产精品视频| 日韩一二三四| 亚洲国产欧美一区二区三区久久| www.久久精品.com| 欧美日韩亚州综合| 日本中文字幕在线观看视频| 精品色蜜蜜精品视频在线观看| 欧美日韩激情在线观看| 综合久久给合久久狠狠狠97色| 白白色免费视频| 久久久一区二区三区捆绑**| 亚洲国产第一区| 99在线精品观看| 欧美夫妇交换xxx| 成人高清视频在线观看| 18禁一区二区三区| 国产美女娇喘av呻吟久久| 九九热精品国产| 国产在线不卡一卡二卡三卡四卡| 色一情一区二区三区| 久久精品久久久精品美女| 色播五月综合网| 精品一区二区三区影院在线午夜 | 欧美亚洲三区| 欧美亚洲黄色片| 最新欧美人z0oozo0| 国产在线无码精品| 欧美啪啪一区| 三上悠亚久久精品| 久久久777| 国产喷水theporn| 精品午夜久久福利影院| 中文字幕第三区| 国产成人h网站| 中国av免费看| 久久久久青草大香线综合精品| 久久久久亚洲av成人无码电影| 国产亚洲成av人在线观看导航| av男人的天堂av| 综合婷婷亚洲小说| 九九视频免费观看| 婷婷成人激情在线网| 无码无套少妇毛多18pxxxx| 欧美日韩国产系列| jlzzjlzz亚洲女人18| 亚洲福利精品在线| 日本又骚又刺激的视频在线观看| 综合国产在线视频| 中文字幕伦理免费在线视频| 亚洲18私人小影院| 欧美日韩精品免费观看视完整| 国产精品亚洲自拍| 日韩一区二区三区色| 久久久久久99| 午夜精品视频一区二区三区在线看| 99中文字幕在线观看| 亚洲久久视频| 性刺激的欧美三级视频| 粉嫩嫩av羞羞动漫久久久| 少妇一级淫片免费放播放| 久久精品这里都是精品| 激情五月少妇a| 欧美小视频在线| 国产喷水吹潮视频www| 亚洲精品电影网| 色视频在线免费观看| 久久久久久久久久久网站| 欧美三级精品| 国产美女精品久久久| 精品日韩免费| 亚洲自拍的二区三区| 亚洲国产精品一区| 色戒在线免费观看| 久久综合精品国产一区二区三区| 免费黄色国产视频| 天天色 色综合| 国产三级小视频| 亚洲人成伊人成综合网久久久| 国产cdts系列另类在线观看| 国产成人aa精品一区在线播放| 亚洲网一区二区三区| 婷婷久久青草热一区二区| 日韩一区二区久久| 久久6免费视频| 国产欧美日韩在线看| 成人毛片18女人毛片| 欧美大片顶级少妇| 午夜在线视频播放| 日本91av在线播放| 欧美美女在线直播| www.国产二区| 久久99日本精品| 欧美波霸videosex极品| 欧美日韩日本国产| 成人毛片在线免费观看| 操日韩av在线电影| 久久精品资源| 五月天亚洲综合情| 美女尤物久久精品| 9.1成人看片| 图片区小说区区亚洲影院| 成人h动漫精品一区二区无码| 日韩中文理论片| 日韩一区二区三区免费视频| 欧美欧美一区二区| 久久久久网站| 久久一区二区电影| 偷拍一区二区三区四区| 人人妻人人澡人人爽人人欧美一区 | 亚洲国产精品久久久天堂| 999精品网站| 久久久精品免费网站| 亚洲黄色免费观看| 亚洲欧美制服第一页| 欧美性xxx| 久久精品二区| 午夜在线观看免费一区| 一区二区视频观看| 欧美日韩一区二区三区在线免费观看| 黄色av中文字幕| 国模视频一区二区三区| japanese色系久久精品| 国产精品久久久久久久久电影网| 国产精品一区二区在线播放 | 国产成人在线一区二区| 欧美精品一区二区三区精品| 免费黄色一级网站| 中文字幕第一区二区| 国产又大又粗又硬| 日韩亚洲第一页| 韩国三级成人在线| 日韩av高清在线看片| 91免费国产在线观看| 波多野结衣日韩| 色偷偷av一区二区三区乱| 天天综合91| 粉嫩av一区二区三区天美传媒 | 久久久久久网| 日本一道本视频| 欧美一区二区三区四区高清| 免费毛片在线看片免费丝瓜视频| 国产美女在线精品免费观看| 一区二区精品| 国产精品一二三区在线观看| 欧美日韩在线观看一区二区| 99在线视频观看| 精品国产一区二区三区麻豆免费观看完整版 | av免费观看国产| 久久久不卡网国产精品一区| 亚洲永久精品视频| 久久久久久久久久久成人| 国产欧美日韩精品一区二区三区 | 依依成人综合网| 日韩一区在线视频| 综合欧美亚洲| 男人插女人下面免费视频| 亚洲丝袜美腿综合| 刘亦菲毛片一区二区三区| 国产精品激情自拍| 欧美日韩国产探花| 亚洲国产av一区| 日韩欧美在线综合网| 欧美中文字幕精在线不卡| 日本特级黄色大片| 91麻豆高清视频| 国产乱叫456在线| 国产ts一区二区| 国产精品theporn| 黄色av免费播放|