精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

百 PB 級 Hadoop 集群存儲空間治理

存儲 存儲軟件 Hadoop
現在這個世道,隨便什么公司什么人都張嘴閉嘴大數據,連做個幾十人的問卷都敢叫大數據調查分析。真是無知者無畏。

 [[263768]]

現在這個世道,隨便什么公司什么人都張嘴閉嘴大數據,連做個幾十人的問卷都敢叫大數據調查分析。真是無知者無畏。

但也真有不少公司是真的有足夠大的數據量的,也確實是在用心做大數據。這些公司通常規模不小,但盈利不一定理想。就算能穩定盈利,也一定有不小的成本壓力。因為,大數據,如果真的夠大,是真的很費錢。

以我所在的公司為例,每年的服務器采購成本就已經好幾千萬,眼看奔著8位數去了。

因此我們有很強的節省成本的動力。

另一方面,之前我在思考作為公共部門和基礎設施部門,在不做業務不賺錢的情況下,怎么體現自己的價值。其中很重要的一點就是,省錢就是賺錢呀,體現在公司收支上效果是差不多的。

在計算資源可復用、可靈活調度的情況下,存儲空間往往是帶來成本的最重要的原因。這篇文章就簡單梳理下這幾年我們在數十 PB 到百 PB 級別數據量下對存儲空間做的一些治理工作。

1、降低備份數

大家都知道 HDFS 是靠著 3 副本來保證數據的高可用的。但也正是這 3 副本帶來了 3 倍的成本。那要降低成本很自然的就想到降低副本數。

這個辦法看起來很笨也很 low,不過確實能解決問題。當然考慮到會犧牲一定高可用性的風險,確實也不是個普適性的辦法。

我們把這個辦法用在臨時文件上,或者說是線上業務不會直接用到的數據上。就算真的丟了,也不會直接影響到業務。要么確實沒用,丟了就丟了,要么能從其他數據恢復過來。

由于我們對 Hive 庫做了比較嚴格的權限管理,但又為了給大家留一定的靈活空間來開發調試和做實驗,非線上的業務都被趕到了 tmp 庫。雖然我們設定了定時刪除的策略,但 tmp 庫的存儲開銷仍然穩定在一個比較高的水平。

于是我們寫了這么個腳本,定時遍歷去把 tmp 庫的文件副本數設為 2。這樣就把 tmp 庫的存儲消耗降低了 1/3。這可就是幾百萬的 RMB。

當然也考慮過修改 Hadoop 的源碼,自動在分配 block 的時候就去把這個事做了,而不是事后再去改副本數。簡單討論了下,覺得一個小腳本就能解決的問題,事后再做代價也不大,沒必要去侵入代碼增加復雜性。

另外值得一提的是,在節點數足夠多而網絡帶寬也足夠大的情況下,如果存儲壓力實在大,其實可以考慮把更多的數據設置為 2 副本。因為即使有一臺機器掛了,也能很快從其他機器上通過網絡補回 2 副本。當然風險也是有的,如果運氣差到家了,2 個副本所在的機器同時都報廢了,那就真丟數據了。

2、壓縮

除了刪數據和減少副本外,另一個很容易想到的辦法就是壓縮。

 

上面的圖列出了 Hadoop 最常見的幾種壓縮格式。其中 native 決定了對單個文件的處理性能,畢竟 Java 在這種計算密集型的活上還是比不過 C 系列的。而 splitable 決定了一個文件是否可切分給多個 mapper 處理,也就是文件是否能被并行處理,同樣也會對性能造成很大影響。

所以從定性的角度考慮,單看性能,lzo 和 bzip2 似乎是***。

但性能到底怎么樣,還得看實際的性能測試結果,由于時間實在太久,一時找不到當時的數據。從網上找了個 benchmark 看看。不要糾結絕對數字,只要知道相對差距就行。

 

很明顯,bzip2 壓縮和解壓速率實在太慢了,差了數量級了,***個被淘汰。

剩下3個,gzip 壓縮比***,也就是最省空間,但處理速率相對慢些,但也不至于像 bzip2 那么夸張。lzo 和 snappy 無論壓縮比還是處理速度,都很不錯,再考慮到 splitable,似乎 lzo 應該是***。

但實際上,lzo 有個不可忽視的特性。lzo 的 splitable 是需要額外的索引文件來支持的,每個文件都需要有一個同名的索引文件。并且這個索引文件需要單獨去生成。這還不算,索引文件會導致實際文件數多出一倍,這對于大規模集群的 NameNode 會造成巨大的壓力。

綜合上面這些情況,實際生產環境,我們采用的是這樣的方式:

  • 原始日志采集落地的時候使用 snappy 壓縮,兼顧存儲空間和處理速度
  • 周期性的對清洗完的日志文件做 archive,并把 snappy 文件轉換為 gzip,以節省空間
  • 對結構化的數據,主要是 Hive 表,采用 parquet+gzip 的方式,gzip 節省空間,而相對于 snappy 的性能劣勢,則由 parquet 的性能優勢來彌補

這樣,就能在存儲空間和性能之間找到比較好的平衡。

3、冷熱分層

在存儲領域有個很流行的詞,叫異構存儲(heterogeneous storage),大白話講就是不同類型的存儲放在一個系統里,比如 RAM、SSD、DISK 等等。不少類似 Spark 這樣的框架都對異構存儲做了廣泛的支持。

異構存儲通常用來解決訪問性能問題,這很容易理解,不同的存儲介質訪問速度普遍差了數量級。但同時,空間大小和成本也差了數量級,因此也能被用來節省成本。

HDFS 定義了兩個概念來支持異構存儲。

***個概念,Storage Type,用來表示不同類型的存儲,包括:

  • ARCHIVE,其實就是更大更便宜的硬盤,花同樣多的 RMB 能存下更多的數據。我們生產環境單臺 128 TB。
  • DISK,常見的普通硬盤,我們生產環境單臺空間 48TB。
  • SSD,常見的固態硬盤。
  • RAM_DISK,其實就是內存,一般不會這么奢侈。

很顯然,從上到下越來越快但也越來越貴。

第二個概念,Storage Policy,用來表示不同的存儲策略,可以對應數據的冷熱程度,也就是使用頻次。包括:

  • Hot,熱數據,經常被訪問到的數據,所有副本都保存到 DISK
  • Cold,冷數據,很少訪問的數據,所有副本都保存到 ARCHIVE
  • Warm,溫數據,介于冷熱之間的數據,一個副本保存在 DISK,其他全部在 ARCHIVE
  • All_SSD,沒有冷熱對應,所有副本保存在 SSD
  • One_SSD,沒有冷熱對應,一個副本保存在 SSD,其他都在 DISK

不同版本對以上兩個概念的支持可能略有差異。既然是要節省成本,那 SSD 自然就排除掉,離線大數據處理的場景也確實不太有需要 SSD 的情況。

通常按這個思路去劃分數據冷熱,然后設置 Storage Policy 做就能解決大部分問題了。至于怎樣定義和衡量數據冷熱,就又是一個可以另開一篇的話題了。簡單提點思路,可以按照數據時間和訪問次數兩個維度去劃分區間,從 HDFS 審計日志統計結果。

除了社區的默認支持外,我們在 hot warm cold 的基礎上,又加了一層 frozen 層,用來保存最冷的數據。

考慮到 ARCHIVE 已經是***的存儲介質了,具體 frozen 的效果并沒有也沒辦法再在 Storage Type 上做文章。我們把目光轉移到了***節提到的降低備份數上。

當然不能是簡單的設置 repica,不然這部分就直接放***節講了。我們使用的是 HDFS 的糾刪碼(erasure code)。

通俗點說就是 HDFS 上的 RAID。RAID 這個思路其實早就被 Facebook 和騰訊這樣的公司在生產環境大規模實踐過,畢竟他們肯定是***遇到也最有動力解決存儲成本問題的公司。可惜要么版本古老不再更新維護,要么閉源沒有回饋社區。

好在 Hadoop 3.0 正式支持了這個功能。當然,缺點也是有的。首先,代碼穩定性有待考驗,畢竟業界還沒有大規模的 3.0 踩坑經驗;其次,CDH 目前還沒有發布 Hadoop 3.0 的正式版,因此部署維護就沒那么方便和統一了。

所以,只有真的非常老和很長時間都不用的數據才適合設置為 frozen 放在啟用了糾刪碼的 3.0 集群上。

按我們生產環境 archive 機器成本占 disk 機器大概 1/3 算,分層存儲的空間和成本開銷對比如下:

看到這個表格,相信大家都有足夠的動力去做分層存儲了。

4、大存儲機器

但是,最近幾年,有個說法開始逐漸顛覆大家的傳統認知。

說沒有必要再分 DISK、ARCHIVE 兩種機型,直接全部上大存儲機器。

考慮到隨著萬兆網卡的普及,再加上網卡綁定、交換機性能的提升等,網絡 IO 已經不再是瓶頸。

同時考慮到數據規模,DISK/Memory 比也沒有意義,因此也不用顧及計算資源相對少的問題。更何況還有相當數量的冷數據躺在哪里,根本不需要為它們預留計算資源。

看起來很有道理,也值得一試。后面稍稍沒那么忙了,我們會集中測試對比下性能。大家有經驗的可以留言一起探討下。

主要內容就是這樣,其他零散的治理方法就略過了。

隨著數據量的增長,元數據也會急劇膨脹,很快 NameNode 就會成為集群的瓶頸。解決方法是 HDFS Federation,我們在生產環境已經有了不錯的實踐。但這又是一個復雜的話題了,下次有機會單獨開一篇再細說。

責任編輯:武曉燕 來源: 漫談大數據
相關推薦

2022-03-11 09:47:17

Google手機空間應用歸檔

2013-05-29 10:07:34

大數據存儲技術

2017-12-04 08:37:31

存儲空間NAS

2018-06-27 14:40:50

Windows 10Windows存儲空間

2015-12-15 15:38:57

Windows 10存儲空間微軟

2013-03-04 09:55:18

大數據存儲

2012-11-06 09:31:12

2021-09-18 10:48:29

手機內存微信

2022-03-16 12:49:28

IT數據存儲

2018-08-15 15:50:03

Windows 10存儲空間應用程序

2020-08-06 14:36:24

Elasticsear集群運維

2018-03-08 11:10:33

分布式存儲Ceph

2025-09-10 07:57:44

SpringBootMinio存儲

2021-05-19 07:59:35

VDO存儲Centos8

2020-04-27 14:17:00

iPhone SE蘋果存儲

2014-05-22 09:56:36

初志科技云存儲

2010-01-22 16:55:52

C++編譯器

2021-04-21 08:15:47

Android 12自動休眠安卓

2023-09-11 06:23:42

谷歌Android

2020-09-07 14:08:36

Windows 10存儲空間硬盤
點贊
收藏

51CTO技術棧公眾號

国产精品国产精品国产专区不卡| 色久综合一二码| 91亚洲精品视频| 国产亚洲第一页| 天堂成人娱乐在线视频免费播放网站| 伊人久久大香线蕉综合四虎小说| 欧美日韩国产经典色站一区二区三区| 50度灰在线观看| 日韩一级片免费看| 日韩高清不卡一区二区三区| 久久精品国产欧美激情| 日本少妇xxxx软件| 日韩精品三区| 玉米视频成人免费看| 欧美精品人人做人人爱视频| 国产一区二区在线视频聊天| 在线日韩中文| 久久激情视频免费观看| 中文字幕人妻一区二区三区| 欧美高清影院| 欧美日韩在线第一页| a级网站在线观看| 免费黄色片在线观看| 老司机免费视频一区二区三区| 国内精品久久久久久| 日本一道本视频| 国产精品网在线观看| 欧美猛男超大videosgay| 日本在线xxx| av香蕉成人| 国产午夜亚洲精品羞羞网站| 国产尤物91| www.97av| 国内精品久久久久影院一蜜桃| 国产成人精品久久二区二区| 日韩激情在线播放| 天天射成人网| 在线精品高清中文字幕| 最新版天堂资源在线| 欧美黄色网络| 欧美日韩中文一区| 国产麻花豆剧传媒精品mv在线| 丰满的护士2在线观看高清| 国产精品拍天天在线| 欧美日韩在线精品一区二区三区| 不卡视频免费在线观看| 韩日av一区二区| 国产美女91呻吟求| 在线不卡免费视频| 日本美女视频一区二区| 国产成人亚洲综合91精品| 亚洲av中文无码乱人伦在线视色| 国产欧美日本| 91国产一区在线| 黄网在线观看视频| 国产亚洲精品久久久久婷婷瑜伽| 久久久噜久噜久久综合| 国产亚洲精品女人久久久久久| 欧美日本一区二区高清播放视频| 欧美极品欧美精品欧美视频 | 国产精品久久久久久户外露出| 久久久精彩视频| 特级丰满少妇一级aaaa爱毛片| 国产jizzjizz一区二区| 亚洲自拍欧美另类| 精品二区在线观看| 丁香五精品蜜臀久久久久99网站| av一区二区三区四区电影| 99在线观看免费| 国产ts人妖一区二区| 国产精品日韩欧美一区二区三区| 色窝窝无码一区二区三区成人网站| youjizz国产精品| 久草热久草热线频97精品| 色综合久久网女同蕾丝边| 久久免费美女视频| 亚洲ai欧洲av| 91黄色在线| 亚洲最新在线观看| 人妻少妇精品久久| 超碰一区二区| 欧美剧在线免费观看网站| 国产成人av免费观看| 99香蕉久久| 亚洲美女激情视频| 91成人精品一区二区| 91精品久久久久久久久久不卡| 欧美黑人极品猛少妇色xxxxx| 日韩免费一级片| 日本在线不卡视频| 3d动漫啪啪精品一区二区免费| 色呦呦中文字幕| 中文字幕欧美激情| 亚洲国产一二三精品无码| 理论不卡电影大全神| 欧美亚洲免费在线一区| 亚洲最大视频网| 久操精品在线| 久久av红桃一区二区小说| 亚洲日本韩国在线| 久久成人免费电影| 精品国产乱码久久久久久蜜柚| 992tv免费直播在线观看| 亚洲影院在线观看| 成年人视频在线免费| 国产一区二区高清在线| 国产视频在线观看一区二区| 黄色录像免费观看| 国产日韩欧美一区在线| 91麻豆桃色免费看| 久草在现在线| 亚洲成a人在线观看| 亚洲精品www.| 天海翼精品一区二区三区| 久久亚洲综合国产精品99麻豆精品福利| 国产成人无码一区二区三区在线| 极品少妇xxxx精品少妇| 欧美一二三区| 91jq激情在线观看| 在线播放一区二区三区| 摸摸摸bbb毛毛毛片| 国产精品s色| 成人免费高清完整版在线观看| 欧美在线一卡| 精品女厕一区二区三区| 国产999免费视频| 91视频综合| 日本不卡高字幕在线2019| 黄色av网站免费在线观看| 中文字幕亚洲欧美在线不卡| 国产色综合天天综合网| 久草视频在线免费| 国产成人日日夜夜| 一本色道婷婷久久欧美| av一区在线播放| 日韩精品极品视频免费观看| 深夜视频在线观看| 成人福利片在线| 欧美高清视频www夜色资源网| 欧美黑人欧美精品刺激| 在线观看不卡| 日本视频久久久| 男男电影完整版在线观看| 欧美日韩国产丝袜美女| 国产女人18毛片水真多18| 久久www人成免费看片中文| 成人av三级| 亚洲大尺度美女在线| 久久久久久久久久99| 国产精品99在线观看| 一区二区在线看| 久久精品在线免费视频| 精品久久亚洲| 亚洲第一级黄色片| 手机av在线不卡| 国产一区导航| 欧美日产一区二区三区在线观看| 欧美片第一页| 国产亚洲欧洲在线| 国产精品亚洲精品| 欧美激情一区二区三区免费观看| 国产视频视频一区| 久久99中文字幕| 成功精品影院| 色综久久综合桃花网| 福利一区二区三区四区| 91在线一区二区三区| 欧美黄色一级片视频| 国产欧美日韩视频在线| 国产精品丝袜久久久久久高清 | 精品少妇一区二区三区在线播放 | 97伦理在线四区| 在线你懂的视频| 精品国产乱子伦一区| 成人毛片18女人毛片| 国产成人丝袜美腿| 鲁一鲁一鲁一鲁一澡| 亚洲丝袜啪啪| 欧美极品少妇xxxxⅹ免费视频| 国产又黄又粗又长| 亚洲午夜成aⅴ人片| 国产人妖在线观看| 国产色综合网| 亚洲mv在线看| 变态另类丨国产精品| 女厕嘘嘘一区二区在线播放| 国产精品极品美女粉嫩高清在线| 色视频在线免费观看| 日韩欧美国产成人一区二区| 日韩欧美亚洲视频| 国产精品私人影院| 两女双腿交缠激烈磨豆腐| 国产深夜精品| 五月天在线免费视频| 亚洲精品aaaaa| 亚洲永久免费观看| 男人皇宫亚洲男人2020| 久久精品美女视频网站| 日韩一级在线播放| 欧美日韩国产在线播放网站| 久久免费小视频| 国产精品色哟哟网站| 国产真实乱人偷精品| 麻豆成人久久精品二区三区小说| 日韩一区二区高清视频| 不卡中文字幕| 狠狠干一区二区| 高清一区二区中文字幕| 日本国产欧美一区二区三区| 牛牛在线精品视频| 中文字幕亚洲天堂| 青青草免费在线| 日韩精品一区在线| 中文在线观看免费高清| 天天av天天翘天天综合网色鬼国产| 亚洲色图27p| 久久网站最新地址| 日本中文字幕精品| 久久电影国产免费久久电影| 国产精品无码av在线播放| 亚洲欧美在线专区| 日本精品一区二区| 国产精品115| 97久久人人超碰caoprom欧美| 玖玖精品在线| 国产精品久久久久久久久久免费| 蜜桃麻豆av在线| 午夜精品久久久99热福利| 91精品国产91久久久久久青草| 最近2019中文字幕第三页视频| 欧美新色视频| 亚洲美女在线视频| 国产91久久久| 精品国产一区久久| 国产成人免费看一级大黄| 欧美精品九九99久久| 伊人成人在线观看| 日韩一区日韩二区| 疯狂撞击丝袜人妻| 国产精品麻豆视频| 色www亚洲国产阿娇yao| 国产女同互慰高潮91漫画| 成年人免费观看视频网站 | 欧美丝袜第三区| 青青草视频在线观看免费| 欧美性极品少妇精品网站| 精品欧美一区二区三区免费观看| 亚洲高清免费在线| 国产亚洲精品久久久久久打不开| 亚洲一区二区三区中文字幕| 免费看一级一片| 亚洲一区二区三区不卡国产欧美 | 色欧美片视频在线观看| 欧美性猛交bbbbb精品| 欧美视频免费在线| 日韩在线 中文字幕| 日本精品视频一区二区三区| 波多野结衣日韩| 欧美色精品天天在线观看视频| 亚洲精品一区二区二区| 欧美日韩精品免费观看视频| 国产又粗又猛又黄又爽| 日韩三级精品电影久久久| 国产色综合视频| 精品日韩在线观看| 天天爱天天干天天操| 日韩精品免费视频| 国产毛片在线| 日韩在线小视频| 成人福利在线观看视频| 久久久久久国产免费 | 国产精品自拍小视频| 97精品资源在线观看| 99在线免费观看视频| 人人精品视频| 亚洲精品成人自拍| 亚洲精品久久久| 国产男女免费视频| 久久99伊人| caoporm在线视频| 成人黄色一级视频| 美女久久久久久久久久| 国产精品国产三级国产aⅴ原创| 黄页网站免费观看| 色婷婷久久久亚洲一区二区三区| 91国内精品久久久| 亚洲аv电影天堂网| 国产在线资源| 欧美肥老妇视频| 成人免费毛片嘿嘿连载视频…| 91情侣在线视频| 欧美精品第一区| 2022中文字幕| 日本美女视频一区二区| 久久久久无码国产精品一区李宗瑞| 久久久久亚洲综合| 欧美日韩黄色网| 狠狠色香婷婷久久亚洲精品| 怡红院男人的天堂| 亚洲国产成人久久综合一区| 9191在线观看| 欧洲中文字幕国产精品| 精品中文视频| 日本亚洲自拍| 99精品国产福利在线观看免费 | 美女999久久久精品视频 | 91精品国产综合久久久久久蜜臀 | 精品国产欧美一区二区五十路| 97人人爽人人澡人人精品| 国产欧美日韩中文字幕| 亚洲aa在线| 丰满的少妇愉情hd高清果冻传媒| 老色鬼精品视频在线观看播放| 中文字幕在线观看网址| 亚洲图片自拍偷拍| 一区二区日韩视频| 亚洲欧美成人精品| 丁香花视频在线观看| 91网在线免费观看| 日韩片欧美片| 国产一二三四在线视频| 91在线精品一区二区三区| 青娱乐国产盛宴| 欧美乱妇20p| 成年女人的天堂在线| 日韩av电影在线免费播放| 国产精品成人自拍| 男人的天堂avav| 国产精品88888| avtt天堂在线| 日韩一区二区麻豆国产| 日本在线视频站| 国产日本欧美视频| 波多野结衣在线观看一区二区三区| 日韩欧美xxxx| 久久久不卡网国产精品二区| 国产专区第一页| 精品视频www| 亚洲淫成人影院| 欧美另类视频在线| 亚洲一区日韩在线| 亚洲黄色在线网站| 国产手机av在线| 亚洲精品99久久久久中文字幕| 亚洲小说区图片| 成人性生交xxxxx网站| 欧美疯狂party性派对| 成人免费毛片播放| 久久午夜羞羞影院免费观看| 中文字幕在线欧美| 亚洲精品第一页| 午夜av不卡| 日韩视频在线播放| 日韩精品成人一区二区在线| 国产全是老熟女太爽了| 91久久久免费一区二区| 1769视频在线播放免费观看| 国产免费一区视频观看免费| 水蜜桃久久夜色精品一区| 一级做a免费视频| 亚洲狠狠丁香婷婷综合久久久| 成人免费视频国产| 91精品国产91久久久| 免费黄色成人| 五月激情婷婷在线| 一区二区三区四区国产精品| av黄色在线免费观看| 亚洲天天做日日做天天谢日日欢| 国产三级三级在线观看| 午夜精品福利视频| 国产综合久久久| 中文字幕22页| 亚洲亚洲人成综合网络| 欧美一级黄视频| 亚洲精品www久久久| 超薄肉色丝袜脚交一区二区| a级黄色片网站| www.亚洲国产| 91丨九色丨海角社区| 久久综合电影一区| 黑色丝袜福利片av久久| 88av.com| 亚洲综合色自拍一区| 青青草av免费在线观看| 俺去了亚洲欧美日韩| 忘忧草在线影院两性视频| 天堂精品一区二区三区| 国产福利视频一区二区三区| 国偷自拍第113页| 色七七影院综合| 第四色在线一区二区| 国产aaaaa毛片| 亚洲激情中文1区| 免费毛片在线| 国产精品对白刺激久久久| 国产美女诱惑一区二区| 国产精品国产三级国产传播| 亚洲精品福利在线| 成人1区2区| 亚洲国产午夜伦理片大全在线观看网站 |