精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4種提高多維數據分析的方法

譯文
大數據 數據分析
聯機分析處理(OLAP)需要有即時的響應,因此其性能是至關重要的。雖然其結構較為簡單,但是在處理各種大的數據立方體(data cubes)時,會涉及到大量的計算。

[[202414]]

【51CTO.com快譯】聯機分析處理(OLAP)需要有即時的響應,因此其性能是至關重要的。雖然其結構較為簡單,但是在處理各種大的數據立方體(data cubes)時,會涉及到大量的計算。

常被稱為OLAP(聯機分析處理)的多維分析是一種交互式的數據分析過程,它包括:對于數據立方體(data cube)進行旋轉(rotation)、切片與切塊(slice and dice)、鉆取(drill-down)等執行操作。其后端的計算結構較為簡單,如下列SQL語句所示。

  1. SELECT D,..., SUM(M), ... FROM C WHERE D'=d' AND ... GROUP BY D,... 

該語句通過多個維度(dimension)聚合了各種量度(measure)。其中C是一個數據立方體,D,…表示所選的維度,而M,…則代表用于聚合的各個量度。除了SUM,我們也可以使用其他的聚合函數。D'是一個切片維度。切塊操作的范圍標準,用語句D IN (d,...)來表示。我們還可以在量度中定義一個規則,用WHERE語句來選擇一定范圍內的值。

OLAP分析需要即時的響應,因此高性能是至關重要的。盡管該語句的結構較為簡單,但是當我們處理各種大的數據立方體時,則可能會涉及到大量的計算。而在我們能夠找到一種優化它們的方法之前,其分析過程一般比較緩慢的。以下我們列出了幾種能夠為多維分析提高后端性能的常見方法。

1. 預聚合(Pre-Aggregation)

早期的OLAP產品通常會采用預聚合作為一種有效地交換存儲開銷的方法。該方法通過一些或者所有的維度(在GROUP BY語句中被定義),預先計算聚合的值(在SELECT查詢的各種量度中被定義),并且存儲它們。這些中間結果可以直接被后期的計算所使用到,或是產生一些新的計算。通過這種方式,性能方面能夠大幅地提升。

這些聚合的結果會占用大量的空間。通常情況下,可能會有幾十個維度,而每個維度值的范圍則從一位數到兩位數不等。簡單的數學運算表明:預聚合的結果將比原始數據立方體大幾倍到幾十倍(也就是說:如果考慮到各種類型的聚合函數的話,其比例為(k1+1)*(k2+1)*...到k1*k2*...)。盡管數據立方體不會因為太大而無法獲得即時地響應,但是這個增大幾十倍的數據量還是不可能實現的。

有一個折中的方法是僅計算其中一些維度的聚合值。因為只有少數的分組維度(在GROUP BY語句中被定義)會被顯示在OLAP的接口中,所以我們能夠以m的維度來執行聚合。如果m的值不大于5,則存儲的開銷將在一個合理的范圍內,而大部分的用戶操作也將能得到快速地響應。

當然,部分聚合是不能使用其他維度的切片標準來處理的。然而,鉆取卻正好是基于切片的。這就糟糕地導致了:即使是那些對于多維分析來說并非少見的且廣泛使用的聚合,也無法使用同一個量度來處理某個切片標準(比如說,要獲得超過¥1000的銷售額)。因此,一個聚合函數很可能僅僅包含一個標準(比如說,只是低于¥100的總成本)。可見,預聚合的結果對于所有這些場景都是無用的。

預聚合只能處理一些最為常見的場景,而這些只在所有類型的多維分析場景中占有一小部分。而全量遍歷(full traversal)則仍然在大多數的場景中被用到。

2. 基于段的并行處理(Segment-Based Parallel Processing)

從本質上講,多維分析就是對數據的過濾和分組,這就很容易實現并行處理。它的步驟包括:將數據劃分為多個段,分別處理它們,并收集那些相互獨立的子任務(subtask)所處理的結果,從而進行聚合。無論是在單臺機器上,還是在多節點集群的計算上,甚至是兩者的結合,其多線程處理都不難以被實施。

雖然多維分析的結果是可視化的,但是我們用肉眼所能看到的數據還是遠低于現代計算機內存里所能夠保存的數據。對于一個足夠小的數據集,它能夠很容易地被加載到內存中,而不需要在內存和磁盤之間進行交換。其編程也相對比較簡單,且性能優秀。不過,在一個計算過程中生成的大數據集則會被直接提交給接口,其計算隨即被中止掉。

根據我們的測試,如果所有在同一個多線程處理的子任務,合并它們的結果到一個相同的結果集里,其性能則可能會由于多個線程使用單一的資源進行同步操作,而受到嚴重的影響。可見,通過使用共享的最終數據集,內存的占用會有所減少。

更多的線程并不一定總是更好的,當線程超過CPU內核數時它就變得無效了。對于存放在外部存儲設備中的數據而言,為了獲取多線程處理的實際結果,測試是必要的。因為硬盤的并發能力(通常會小于CPU內核的數量),需要被考慮到。

根據記錄的數量和每一段結束處的標記,來劃分靜態數據是很容易的。但是如果要平均地劃分動態數據就比較麻煩了。本文將在下面更詳細地予以討論。

對于一個單一的計算任務而言,并行處理能夠帶來性能上的成倍增加。而由于OLAP的操作基本就是一個并發的事務,其提高了的性能在用戶的數量很小的情況下可能會被抵消掉。因此我們需要有一種更好的方法。

3. 排序索引(Sorted Index)

因為非切片式的聚合操作總會牽扯到整體的數據立方體,所以我們幾乎無法通過執行預聚合來減少計算量。但是對于切片操作(鉆取)來說,如果數據立方體已經被排序,則沒有必要去做全量遍歷了。

如果我們能為D維度創建一個索引,這就意味著將它的值與對應的序列號記錄關聯上了,并形成了一定的排列順序。然后我們就能夠快速地定位那些包含在D維度里符合切片標準的記錄了。這是一個簡單的二分查找。無需全量遍歷所有的數據,其計算量將能夠降低好幾個數量級(這也取決于D的取值范圍)。理論上說,我們可以為每個維度創建一個索引,因為其開銷并不昂貴。而且在涉及到相應的切片時,其性能會有大幅提升。

不過,那種包含有D1和D2維度的多個字段索引實際上卻鮮少被用到。因為它不能快速地定位到只包含D2維度的切片,它只是對同時包含D1和D2的切片非常有效。在定位到了記錄一個包含著***取值范圍的維度切片之后,大量的計算將會被相應地大幅減少。當然,我們也可以通過他們的維度去遍歷其他的切片。

不幸的是,這種原始的方法只適用于處理那些允許頻繁、小額存取的內存中的數據。在大多數情況下,我們要處理的數據集還是相當大的,而且需要存儲在磁盤之上。但是就算通過索引,檢索那些大量無序記錄的操作對于性能提升影響也不很大。數據只有在被真正排序,和切片里的記錄在被連續存儲時,其性能才會有明顯的提升。

由于各種數據需要根據特定維度的排序目的來進行復制,因此其成本還是相當高的。

有一個用來創建兩份數據拷貝的解決方案是:一處的數據按照D1,…,Dn維度進行排序,而另一處的數據則按照Dn,…,D1維度來排序。由此產生的數據量只是原來的兩倍,這還是可以接受的。通過該二維序列,就有了一處切片維度總是從首部開始降序排列的,確保了此維度的切片數據在整體上是連續的,從而能夠獲得了更好的性能提高。

4. 壓縮列式存儲(Compressed Column Storage)

處理多維分析的一個強大工具是:列式存儲。

通常情況下,我們在對數據立方體進行多維分析時,會有大量的字段(維度和測度),他們從數十到數百不等。但是其中真正有用的卻并不多,如果不考慮切片維度的話,通常也就只有5個或更少。由于切片能夠被索引來進行處理,那么只需要對某幾個字段遍歷便可。

基于這個考慮,列式存儲正好可以發揮其優勢。在外部存儲的計算中,I/O的操作是非常耗時的。因此,與減少計算的數量相比,減少要檢索的數據以提升性能就顯得更有意義了。比如說一個具有100個字段的數據立方體,如果只檢索五個字段的話,其I/O消耗將下降到原來的二十分之一,這會導致性能的數量級飆升。

列式存儲的另一個優點是:它支持數據的壓縮。在排序和存儲數據的D1,…,Dn維度時,我們發現D1在一連串的記錄中有著相同的值;而D2在一個較少的連續記錄中也是如此;以此類推,在越來越少的連續記錄中,都會有這樣的相同值出現;直到Dn中幾乎沒有了這樣的連續性。考慮我們沒有必要去存儲那些反復出現的連續相同值,我們完全可以一次性存儲,并記錄下它們的數字。通過這種減少數據占用空間的方法,我們就能減少對外部存儲的I/O訪問,并提高性能。

在使用列式存儲時,我們還需考慮如下一些問題。

由于列式存儲不會減少計算的數量,它對在內存中操作數據的幫助并不大。但其壓縮存儲的方案卻能夠有效地減少內存的消耗。

列式存儲會復雜化基于段的并行處理和索引的創建。列的分割需要保持彼此的一致性,而索引則需要同時地且準確地參考所有的列。而當使用壓縮的列式存儲時,則會更加麻煩。雖然有這些繁瑣的問題,但是一般來說,對于靜態數據使用列式存儲并不是太難(只是不要忘了對它們的處理)。

列式存儲的使用會增加并發壓力的風險。當字段的總數不多或我們需要檢索太多的字段時,它會失去本身的優勢。通過硬盤來額外地使用并行處理,將會進一步地增加并發的壓力,也可能會導致性能的下降。因此,能夠更好地支持并發性的SSD會更適用一些。

原文標題:4 Ways to Improve Multidimensional Data Analysis  作者: Buxing JIANG

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2022-10-13 14:07:22

數據分析大數據商業智能

2020-10-25 08:56:31

數據分析數據大數據

2022-09-07 15:47:21

數據分析對比分析大數據

2019-01-16 18:39:24

數據開發模型

2021-02-28 12:47:27

數據分析科學技術

2020-03-23 09:53:26

大數據IT技術

2016-10-26 19:33:45

數據分析大數據

2021-08-18 09:11:59

統計學數據分析檢驗

2020-05-29 09:56:31

數據分析數據大數據

2017-08-01 16:42:09

數據分析互聯網

2017-09-21 13:04:35

數據挖掘分析分析方法數據分析師

2020-12-22 15:33:42

數據分析技術IT

2021-10-29 13:42:44

數據分析數據大數據

2019-12-04 12:52:07

物聯網數據分析IOT

2021-07-16 09:55:46

數據工具軟件

2019-09-24 14:36:38

數據分析思維大數據

2013-03-19 10:33:48

大數據相親數據分析

2019-01-29 15:43:28

數據分析數據挖掘分析方法

2015-11-04 14:45:24

數據分析大數據創業

2019-04-25 14:20:56

數據分析套路工具
點贊
收藏

51CTO技術棧公眾號

国产精品嫩草影视| 欧美日韩国产免费一区二区三区| 在线日韩国产网站| 国产精品亚洲欧美一级在线| 亚洲国产精品久久不卡毛片| 欧美日本韩国国产| 中文字幕一区二区在线视频| 欧美+亚洲+精品+三区| 亚洲第一页自拍| 国产又黄又猛又粗又爽的视频| 国产精品久久久久久福利| 国产精品一区在线观看乱码| 7777免费精品视频| 娇小11一12╳yⅹ╳毛片| 97se亚洲| 欧美精选在线播放| www.爱色av.com| 国产cdts系列另类在线观看| 2023国产精品| 亚洲最大av在线| 国产情侣小视频| 影音先锋在线一区| www.日韩系列| 91精品国产自产| 亚洲福利合集| 欧美私人免费视频| 日韩中文字幕三区| 日本色护士高潮视频在线观看| 久久亚洲一级片| 97夜夜澡人人双人人人喊| 伊人免费在线观看| 久久国产高清| 欧美极品美女视频网站在线观看免费 | 亚洲欧洲另类| 不卡av日日日| 国产又黄又粗又猛又爽的| 羞羞答答一区二区| 精品乱人伦小说| 中文字幕一区二区在线观看视频 | 日韩美女免费线视频| 国产精品第一页在线观看| 97视频热人人精品免费| 亚洲天堂av在线免费观看| 91视频在线免费| 亚洲视频精选| 日韩一区二区精品在线观看| 中文字幕视频三区| 日韩成人综合网站| 欧美日韩精品一区二区天天拍小说 | 天天操天天操天天操| 国产激情一区二区三区四区| 91亚洲精品视频| 91影院在线播放| 美女视频网站黄色亚洲| 国产精品久久久久免费a∨| 中文字幕亚洲乱码熟女1区2区| 亚洲承认在线| 久久久爽爽爽美女图片| 国产真人真事毛片| 伊人久久成人| 97超碰国产精品女人人人爽| 天天做天天爱夜夜爽| 香蕉久久a毛片| 日韩美女主播视频| 亚洲永久精品一区| 免费一级片91| 国产在线视频2019最新视频| 国产又粗又大又黄| 国产高清在线精品| 国产精品久久精品国产 | 亚洲国产午夜伦理片大全在线观看网站| 青青草在线播放| 久久久久国产精品麻豆ai换脸| 奇米视频888战线精品播放| www黄在线观看| 国产精品久久久久毛片软件| 欧美日韩一级在线| 欧美hdxxxxx| 黄色成人av在线| 国产成人精品视频ⅴa片软件竹菊| 亚洲成人人体| 4438成人网| 丰满少妇xbxb毛片日本| 亚洲精华一区二区三区| 日韩亚洲欧美中文高清在线| 毛片aaaaa| 亚洲欧美日本日韩| 91精品国产自产在线老师啪| 国产精品天天操| 粉嫩13p一区二区三区| 麻豆精品蜜桃一区二区三区| 992tv免费直播在线观看| 一区二区三区四区不卡在线| 免费高清在线观看免费| vam成人资源在线观看| 欧美大片一区二区三区| 欧美老熟妇乱大交xxxxx| 亚洲国产一区二区三区在线播放 | 精品成a人在线观看| aa片在线观看视频在线播放| 欧美黄色录像片| 亚州欧美日韩中文视频| 中文字幕码精品视频网站| 国产一区二区不卡在线| 欧美xxxx黑人又粗又长密月| 黄视频网站在线| 欧美丝袜美女中出在线| 午夜福利123| 奇米亚洲欧美| 久久久久久久久91| 国产一区二区小视频| 91免费观看国产| 99精品视频网站| 韩国主播福利视频一区二区三区| 欧美一区二区三区爱爱| 日韩毛片无码永久免费看| 影音先锋日韩精品| 国产精品吊钟奶在线| 神马久久久久久久久久| 亚洲欧洲精品天堂一级| 青青在线视频免费| 欧美重口另类| 欧美超级乱淫片喷水| 天天操天天干天天摸| 99在线视频精品| 水蜜桃在线免费观看| av一区在线播放| 日韩国产欧美精品在线| 久草视频在线免费看| 久久99国产乱子伦精品免费| 欧美日韩精品免费观看视一区二区 | 亚洲欧美专区| 亚洲人成在线观看网站高清| 日本一级黄色录像| 国产91高潮流白浆在线麻豆 | 亚洲综合小说| 国产欧美日韩中文字幕| www.av在线播放| 91久久精品一区二区三区| 成人免费av片| 日韩午夜av| 国产精品亚洲综合| 色呦呦在线视频| 欧美一区二区三区视频| 波多野结衣喷潮| 麻豆国产精品一区二区三区| 亚洲国产一区在线| 69堂精品视频在线播放| 亚洲另类xxxx| 亚洲成人第一网站| 国产午夜精品一区二区三区视频 | 欧美精品第1页| 欧美xxxx精品| 蜜桃视频第一区免费观看| 日韩欧美精品在线不卡| www成人在线视频| 夜夜躁日日躁狠狠久久88av| 岛国av中文字幕| 欧美国产精品一区二区三区| 香港日本韩国三级网站| 日韩dvd碟片| 成人激情免费在线| 成人在线app| 欧美sm美女调教| 在线免费观看毛片| 26uuu亚洲| 五月天婷婷激情视频| 久久精品播放| 亚洲曰本av电影| 另类视频在线| 国产视频欧美视频| 影音先锋国产在线| 亚洲青青青在线视频| 国产亚洲精品成人a| 一区二区三区成人精品| 涩涩涩999| 国产专区精品| 97精品国产97久久久久久免费 | 亚洲精品自拍第一页| 无码人妻aⅴ一区二区三区有奶水| 国产精品网站在线观看| 色姑娘综合天天| 亚洲精品九九| 图片区小说区区亚洲五月| 青草伊人久久| 日本成人精品在线| 黄色片免费在线观看| 精品国精品自拍自在线| 69国产精品视频免费观看| 中文字幕一区二区日韩精品绯色| 五月六月丁香婷婷| 羞羞答答国产精品www一本| 亚洲精品一区二区三区四区五区| 麻豆一二三区精品蜜桃| 欧美一级电影在线| 黄av在线播放| 亚洲精选在线观看| 成人av无码一区二区三区| 日韩欧美成人精品| 日韩一级片大全| 久久婷婷国产综合精品青草| 午夜免费一级片| 麻豆精品网站| 久久人妻无码一区二区| 精品国产一区二区三区四区| 999在线观看免费大全电视剧| 卡通欧美亚洲| 欧美疯狂做受xxxx高潮| h视频在线播放| 亚洲成人黄色在线| 91丨porny丨在线中文| 懂色av影视一区二区三区| 国语对白在线播放| 欧美国产日产图区| 亚洲黄色免费在线观看| 国产伦理精品不卡| www.99r| 日韩电影免费一区| 日韩精品一区二区三区久久| 欧美日韩精品免费观看视频完整| 涩涩涩999| 精品影片在线观看的网站| 国产精品一区视频| 狂野欧美xxxx韩国少妇| 国产欧美日韩中文字幕| 主播大秀视频在线观看一区二区| 97超级碰碰人国产在线观看| 女子免费在线观看视频www| www.日韩不卡电影av| 国产一二在线观看| 亚洲开心激情网| 天堂成人在线视频| 精品国产123| 国产黄色一级大片| 欧美一级黄色录像| 国产熟女一区二区三区五月婷| 欧美日韩国产小视频| 中文字幕+乱码+中文字幕明步 | 日韩毛片在线免费看| 悠悠资源网久久精品| 免费的一级黄色片| 欧美一区国产在线| 久久国产精品免费观看| 99精品国产一区二区三区| 五月婷婷综合色| 日韩国产一区二区三区| 亚洲高清在线观看一区| 日韩理论电影| 亚洲日本japanese丝袜| 国产一区三区在线播放| 茄子视频成人在线观看 | 在线观看欧美一区| 日韩电影一区| 中文字幕一区二区三区最新| 91日韩欧美| 四虎永久免费网站| 在线精品视频在线观看高清| 国产成人生活片| 国模大胆一区二区三区| 搞av.com| 裸体素人女欧美日韩| 九九热免费精品视频| 蜜桃免费网站一区二区三区| 天堂在线中文在线| 国产成人av在线影院| www男人天堂| 99麻豆久久久国产精品免费| av网站免费在线播放| 国产女主播一区| 久久99久久99精品免费看小说| 亚洲欧美日韩国产中文在线| 国产亚洲精品av| 欧美日韩国产页| 国产在线一级片| 91精品国产高清一区二区三区 | 久久综合成人网| 欧美日韩中文字幕| 亚洲性猛交富婆| 日韩午夜在线影院| 四虎影院在线域名免费观看| 在线中文字幕日韩| 污影院在线观看| 欧美一级大片在线免费观看| 久久精品资源| 国产不卡一区二区在线观看| 国产日产精品_国产精品毛片| 在线免费观看成人| 亚洲人成免费| 粉色视频免费看| av不卡在线播放| 国产三级aaa| 亚洲v中文字幕| 欧美激情一区二区三区免费观看| 精品少妇一区二区三区在线播放 | 中文人妻av久久人妻18| 7777精品伊人久久久大香线蕉超级流畅 | 91黄色在线| 欧美一区二区三区免费观看| 成人国产精品久久| 欧美二区在线| 欧美激情1区| 五月婷婷六月合| 成人动漫一区二区| 日韩av手机在线免费观看| 欧美三级免费观看| 亚洲第一成人av| 国产一区二区三区丝袜| 成人免费网站观看| 91精品视频网站| 精品福利久久久| 日韩av高清在线看片| 韩国v欧美v亚洲v日本v| 加勒比综合在线| 五月激情综合婷婷| 99国产精品欲| 宅男66日本亚洲欧美视频| 国模私拍一区二区国模曼安| 亚洲综合国产精品| 日本道不卡免费一区| 青青视频在线播放| 国产999精品久久久久久| 国产在线观看免费视频软件| 色八戒一区二区三区| 五月婷婷六月丁香| 久久久久久免费精品| 日韩在线亚洲| 天天爱天天做天天操| 久久av中文字幕片| 女人黄色一级片| 日韩欧美大尺度| 五月天激情开心网| 久久久久久久久久久国产| 国产精品中文| 国产高清免费在线| 久久99精品久久久久久国产越南| 先锋影音av在线| 色又黄又爽网站www久久| 四虎影视在线播放| 欧美综合在线第二页| 亚洲精品一级二级三级| 国产美女无遮挡网站| 99精品1区2区| 男人的天堂一区二区| 日韩av一卡二卡| 三妻四妾的电影电视剧在线观看| 国产一区二区三区四区五区加勒比| 欧美激情在线| 折磨小男生性器羞耻的故事| 亚洲午夜久久久久久久久电影院| 草逼视频免费看| 欧美国产日本在线| 精品女人视频| 亚洲欧洲日产国码无码久久99| 久久网站热最新地址| 免费黄色小视频在线观看| 一本一本久久a久久精品牛牛影视| 在线日本欧美| 中文字幕一区综合| 国产精品中文欧美| 国产稀缺真实呦乱在线| 日韩电视剧免费观看网站| 妞干网免费在线视频| 奇米影视首页 狠狠色丁香婷婷久久综合| 日本视频中文字幕一区二区三区| 国产99在线 | 亚洲| 欧美丰满嫩嫩电影| 欧美另类tv| 久久久久高清| 日产欧产美韩系列久久99| 中国特黄一级片| 日韩午夜av一区| 欧美另类老肥妇| 亚洲成人精品电影在线观看| 精品一区二区三区在线视频| 麻豆91精品91久久久| 日韩精品亚洲精品| 成人免费黄色| 一级黄色片播放| av电影在线观看完整版一区二区| 成人一二三四区| 久久久国产91| 欧美久久香蕉| 午夜两性免费视频| 亚洲一区电影777| 国产在线视频资源| 亚洲xxxx18| 免费看黄裸体一级大秀欧美| jizzjizz日本少妇| 亚洲成人xxx| 久久久加勒比| 久在线观看视频| 国产精品福利一区| 日本成人动漫在线观看| 国产精品欧美激情在线播放| 欧美日韩国产欧| 日本高清黄色片| 亚洲福利视频免费观看| 日韩黄色三级在线观看| 国产91xxx| 亚洲欧美一区二区三区孕妇|