精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為啥集群小文件治理那么重要,你真的懂嗎?

大數(shù)據(jù) Hadoop
小文件對于計算的影響就是需要大量節(jié)點之間頻繁建立聯(lián)系,數(shù)據(jù)傳輸?shù)?,浪費資源,消耗時間長。其次小文件相關(guān)大量的任務初始化時間甚至比計算時間還長,造成計算資源的使用浪費,降低集群的吞吐量。?

小文件是 Hadoop 集群運維中的常見挑戰(zhàn),尤其對于大規(guī)模運行的集群來說可謂至關(guān)重要。如果處理不好,可能會導致許多并發(fā)癥。Hadoop集群本質(zhì)是為了TB,PB規(guī)模的數(shù)據(jù)存儲和計算應運而生的。為啥大數(shù)據(jù)開發(fā)都說小文件的治理重要,說HDFS 存儲小文件效率低下,比如增加namenode負載等,降低訪問效率等?究竟本質(zhì)上為什么重要?以及如何從本質(zhì)上剖析小文件,治理小文件呢?今天就帶你走進小文件的世界。

1.什么是小文件?

日常生產(chǎn)中HDFS上小文件產(chǎn)生是一個很正常的事情,有些甚至是不可避免,比如jar,xml配置文件,tmp臨時文件,流式任務等都是小文件的組成部分。當然更多的是因為集群設置不合理,造成一些意料之外的小文件產(chǎn)生。實際公司生產(chǎn)中對于小文件的大小沒有一個統(tǒng)一的定義。一般公司集群的blocksize的大小在128/256兩者居多。首先小文件大小肯定是要遠小于blocksize的文件。一般公司小文件的大小定義如1Mb,8Mb,甚至16Mb,32Mb更大。根據(jù)公司實際集群狀態(tài)定義,因為有些情況合并小文件需要消耗額外的資源。

既然剖析小文件,那么不可避免的要先剖析hdfs的存儲原理。眾多周知了,HDFS上文件的數(shù)據(jù)存儲分為namenode元數(shù)據(jù)管理和實際數(shù)據(jù)文件。hdfs上的數(shù)據(jù)文件被拆分成塊block,這些塊block在整個集群中的datanode的本地文件系統(tǒng)上存儲和復制,每個塊也維護者自己的blockmeta信息。namenode主要維護這些文件的元數(shù)據(jù)信息,具體namenode的解析參考我的其他博客。

如下一個某個文件的某個block在data上存儲的情況。


2.小文件的產(chǎn)生

1.流式數(shù)據(jù),如flume,kafak,sparkstreaming,storm,flink等,流式增量文件,小窗口文件,如幾分鐘一次等。

2.MapReduce引擎任務:如果純map任務,大量的map;如果mapreduce任務,大量的reduce;兩者都會造成大量的文件。出現(xiàn)這種情況的原因很多,果分布表的過度分區(qū),輸入大量的小文件,參數(shù)設置的不合理等,輸出沒有文件合并等。

3.spark任務過度并行化,Spark 分區(qū)越多,寫入的文件就越多。

4.文件的壓縮與存儲格式不合理;一般生產(chǎn)公司很少使用textfile這種低效的文件格式了。

使用壓縮,降低文件的大小,同時也會降低文件的總塊數(shù)。注意文件存儲格式和壓縮不合理只是加劇小文件問題,不是產(chǎn)生小文件的本質(zhì)。

3.小文件的危害

3.1小文件對namenod的影響

如下圖1,一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為2個block。

圖1


如下圖2,同樣一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為192個block

圖2

namenode的namespace中主要占存儲對象是文件的目錄個數(shù),文件(文件名長度)以及文件block數(shù)。根據(jù)namenode實際使用經(jīng)驗來看,一個存儲對象大概占用150字節(jié)的空間。HDFS上存儲文件占用的namenode內(nèi)存計算公式如下:

Memory=150bytes*(1個文件inode+(文件的塊數(shù)*副本個數(shù)))

如上圖1 ,一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為2個block,需要namenode內(nèi)存=150*(1+2*3)=1050 Bytes

同理,圖2 一個文件192Mb,默認blocksize=128Mb,副本個數(shù)為3,存儲為192個block,需要namenode內(nèi)存=150 x (192 + (192 x 3)) = 115200 Bytes

尖叫總結(jié):

1 .從上面可以看出,同樣的一個文件,大小不同形態(tài)的存儲占用namenode的內(nèi)存之比相差了109倍之多。所以如果對于單namenode的集群來說,大量的小文件的會占用大量的namenode堆內(nèi)存空間,給集群的存儲造成瓶頸。有些人可能會說我們聯(lián)邦,多組namenode不就沒有這個問題了,其實不然,且往下看

2.當 NameNode 重新啟動時(雖然生產(chǎn)上這種情況很少),它必須將文件系統(tǒng)元數(shù)據(jù)fsimage從本地磁盤加載到內(nèi)存中。這意味著如果 namenode 元數(shù)據(jù)很大,重啟會更慢(以我們公司3億block,5萬多個文件對象來說,重啟一次1.5小時,期間應用不可用)其次,datanode 還通過網(wǎng)絡向 NameNode 報告塊更改;更多的塊意味著要通過網(wǎng)絡報告更多的變化,等待時間更長。

3.更多的文件,更多的block,意味著更多的讀取請求需要由 NameNode 提供服務,這將增加 RPC 隊列和處理延遲,進而導致namenode性能和響應能力下降。官方介紹說接近 40K~50K RPCs/s 人為是極高的負載。實際使用來看比這低時對于namenode來說性能都會打很大的折扣。

3.2 小文件對datanode影響

文件的block存儲是存儲在datanode本地系統(tǒng)上,底層的磁盤上,甚至不同的掛載目錄,不同的磁盤上。大量的小文件,意味著數(shù)據(jù)著尋址需要花費很多時間,尤其對于高負載的集群來說,磁盤使用率50%以上的集群,花費在尋址的時間比文件讀取寫入的時間更多。這種就違背了blocksize大小設計的初衷(實踐顯示最佳效果是:尋址時間僅占傳輸時間的1%)。這樣會造成磁盤的讀寫會很慢,擁有大量小文件會導致更多的磁盤搜索。如下磁盤延遲:

3.3小文件對計算的影響

基于HDFS文件系統(tǒng)的計算,blokc塊是最小粒度的數(shù)據(jù)處理單元。塊的多少往往影響應用程序的吞吐量。更多的文件,意味著更多的塊,以及更多的節(jié)點分布。

比如以MapReduce任務為例(hive等),在 MapReduce 中,會為每個讀取的塊生成一個單獨的 Map 任務,如果大量小文件,大量的塊,意味著著更多任務調(diào)度,任務創(chuàng)建開銷,以及更多的任務管理開銷(MapReduce 作業(yè)的 application master 是一個 Java 應用,它的主類是 MRAppMaster。它通過創(chuàng)建一定數(shù)量的bookkeeping object跟蹤作業(yè)進度來初始化作業(yè),該對象接受任務報告的進度和完成情況)。雖然可以開啟map前文件合并,但是這也需要不停地從不同節(jié)點建立連接,數(shù)據(jù)讀取,網(wǎng)絡傳輸,然后進行合并,同樣會增加消耗資源和增加計算時間,成本也很高。

同樣,如果是spark計算引擎,executor的一次讀取和處理一個分區(qū),默認情況下,每個分區(qū)是一個 HDFS 塊,如果大量的小文件,每個文件都在不同的分區(qū)中讀取,這將導致大量的任務調(diào)度開銷,同時每個 CPU 內(nèi)核的吞吐量降低。

簡單總結(jié)一下:小文件對于計算的影響就是需要大量節(jié)點之間頻繁建立聯(lián)系,數(shù)據(jù)傳輸?shù)?,浪費資源,消耗時間長。其次小文件相關(guān)大量的任務初始化時間甚至比計算時間還長,造成計算資源的使用浪費,降低集群的吞吐量。

本文轉(zhuǎn)載自微信公眾號「滌生大數(shù)據(jù)」,作者「滌生大數(shù)據(jù)」,可以通過以下二維碼關(guān)注。

轉(zhuǎn)載本文請聯(lián)系「滌生大數(shù)據(jù)」公眾號。

責任編輯:武曉燕 來源: 滌生大數(shù)據(jù)
相關(guān)推薦

2022-06-21 09:53:03

FedoraUbuntuLinux

2023-06-08 07:34:19

HDFS小文件壓縮包

2021-03-30 09:59:52

支付寶加密數(shù)據(jù)泄露

2019-11-13 23:33:16

工業(yè)物聯(lián)網(wǎng)IIOT物聯(lián)網(wǎng)

2019-07-24 10:11:51

jdkjreJava

2021-01-20 10:40:16

緩存固態(tài)硬盤SSD

2016-07-21 17:11:18

操作系統(tǒng)Windows升級

2020-09-10 14:33:18

計算機

2018-05-10 09:06:24

2019-02-01 09:38:16

2019-12-11 10:07:02

緩存架構(gòu)數(shù)據(jù)庫

2023-05-11 00:17:44

分區(qū)HiveReduce

2020-03-31 10:58:38

2025-06-17 08:35:00

2021-02-01 20:35:49

Kafka大數(shù)據(jù)數(shù)據(jù)

2019-12-18 15:11:42

數(shù)組集合數(shù)據(jù)

2021-04-12 06:00:01

MongoDB數(shù)據(jù)庫存儲

2011-06-14 10:57:31

SQL Server管理

2017-09-07 16:32:05

華為

2021-10-15 10:26:56

代碼項目Mapper
點贊
收藏

51CTO技術(shù)棧公眾號

日本一区二区三区在线观看| 97视频精品| 色诱亚洲精品久久久久久| 日韩欧美电影一区二区| jizz中国女人| 久久精品123| 久久综合五月天| 精品一区二区视频在线观看| 国产毛片精品久久| 亚洲国产成人va在线观看天堂| 欧美1o一11sex性hdhd| 亚洲一级在线播放| 在线观看一区| 色多多国产成人永久免费网站 | 久久国产人妖系列| 久久久免费观看视频| 亚洲av毛片基地| 精品五月天堂| 欧美一级在线观看| 亚洲最大综合网| 极品视频在线| 亚洲精品国产a| 一区二区免费在线观看| 色吊丝在线永久观看最新版本| 捆绑调教一区二区三区| 777精品视频| 欧美日韩偷拍视频| 99久久亚洲精品蜜臀| 亚洲人成77777在线观看网| 亚洲熟女乱综合一区二区| 欧洲av一区二区| 精品久久久久久久久久ntr影视| av动漫免费观看| 国产在线资源| 91免费视频网| 国产一区二区三区黄| 国产高清免费观看| 国产真实乱子伦精品视频| 日韩69视频在线观看| 成年人免费看毛片| 亚洲国产免费| 午夜精品福利电影| 亚洲国产精一区二区三区性色| 久久久久久久久久久久久久| 在线丨暗呦小u女国产精品| 天天躁日日躁aaaxxⅹ| 欧美一性一交| 亚洲精品国产品国语在线| 无码人妻丰满熟妇啪啪网站| 国产亚洲精aa在线看| 欧美日韩精品一区二区三区| 国产理论在线播放| 欧美日韩亚洲国产| 欧美性高清videossexo| 欧美三级午夜理伦三级富婆| 欧美成人app| 欧美性大战久久| 182午夜在线观看| 亚洲热av色在线播放| 这里只有精品视频在线观看| 超碰在线免费av| 婷婷视频一区二区三区| 精品国产1区二区| 捆绑凌虐一区二区三区| 亚洲宅男一区| 中文字幕无线精品亚洲乱码一区 | 视频在线这里都是精品| 亚洲综合偷拍欧美一区色| 国产1区2区3区中文字幕| 色呦呦久久久| 欧美日韩免费在线观看| 国产在线观看福利| 九七电影院97理论片久久tvb| 欧美三级韩国三级日本三斤| 日本在线播放一区二区| 日本少妇精品亚洲第一区| 精品国产在天天线2019| 国产又黄又粗又猛又爽的视频| 欧美wwwsss9999| 亚洲欧洲日产国产网站| 91导航在线观看| 欧美激情成人在线| 97不卡在线视频| 中文区中文字幕免费看| 国产美女主播视频一区| 精品国产一区二区三区四区精华 | 国产人妻精品一区二区三| 东方欧美亚洲色图在线| 欧美日韩国产三区| 看黄网站在线| 精品人伦一区二区三区蜜桃免费| 黄色三级视频在线| 亚洲国产欧美国产第一区| 日韩av影视综合网| 色欲人妻综合网| 国产精品毛片在线看| 国产欧美日韩中文字幕| 国产香蕉在线观看| 日本一二三不卡| 丁香花在线影院观看在线播放| 欧美美女日韩| 精品sm捆绑视频| 五月婷婷婷婷婷| 99国产精品视频免费观看一公开| 国产精品十八以下禁看| 欧美视频一二区| 中文字幕五月欧美| 国产成人久久婷婷精品流白浆| 欧美一级做a| 亚洲色图第一页| 国产成人啪精品午夜在线观看| 免费欧美在线视频| 美女一区视频| 7777kkk亚洲综合欧美网站| 欧美日韩国产小视频在线观看| 蜜臀视频在线观看| 午夜精品一区二区三区国产| 国产91精品青草社区| 精品国产免费无码久久久| 久久精品一区四区| 黄色免费视频大全| 成人av动漫| 欧美精品日韩三级| 怡红院成永久免费人全部视频| 99久久精品国产精品久久| 日韩不卡一二区| 亚洲国产伊人| 色哟哟入口国产精品| 99超碰在线观看| www.亚洲精品| 中国丰满熟妇xxxx性| 久久国产精品美女| 日韩少妇与小伙激情| 中文字幕免费视频观看| 91麻豆高清视频| 免费无码毛片一区二三区| 欧美区一区二区| 久久激情五月丁香伊人| 一个人看的www日本高清视频| 国产亚洲欧美色| 欧美精品第三页| 少妇精品久久久一区二区| 国产69精品久久久久久| 五月婷婷丁香网| 精品久久久国产| 亚洲成人日韩在线| 久久久亚洲一区| 日本亚洲自拍| jizzjizz少妇亚洲水多| 色七七影院综合| 国产在成人精品线拍偷自揄拍| 国产精品人成在线观看免费| 午夜激情av在线| 亚欧美无遮挡hd高清在线视频| 国产精品视频一区二区高潮| aaa日本高清在线播放免费观看| 欧美性淫爽ww久久久久无| 日日操免费视频| 欧美日韩国产麻豆| 日韩中文字幕一区| 电影在线观看一区二区| 中文字幕一精品亚洲无线一区| 亚洲免费视频二区| 国产精品第四页| 一级片免费在线观看视频| 综合国产精品| 精品欧美一区二区在线观看视频| 国产理论在线| 国产小视频91| 国产精品爽爽久久| 亚洲国产aⅴ天堂久久| 免费a v网站| 日韩黄色免费电影| 久久久一二三四| aaa国产精品| 日韩av片电影专区| 麻豆视频在线| 亚洲国产成人久久综合一区| 日日摸天天添天天添破| 国产精品女主播在线观看| 伊人成人免费视频| 国产精品社区| 国产日产欧美一区二区| 欧美成人一区在线观看| 国产精品中文字幕在线| 欧美人与禽性xxxxx杂性| 日韩精品视频中文在线观看| 中文字幕二区三区| 亚洲国产裸拍裸体视频在线观看乱了| 国产偷人妻精品一区| 看电视剧不卡顿的网站| 999久久欧美人妻一区二区| 亚洲综合图色| 97久草视频| 日韩一级二级| 久久久之久亚州精品露出| 国产h视频在线观看| 欧美sm美女调教| 综合久久中文字幕| 亚洲第一福利一区| 欧美肥妇bbwbbw| 久久亚洲一区二区三区明星换脸| www.国产福利| 久久久久.com| 99色这里只有精品| 99久久夜色精品国产亚洲96| 久久影院理伦片| 4438全国亚洲精品观看视频| 国产精品网站视频| 亚洲深夜视频| 欧美精品国产精品日韩精品| 137大胆人体在线观看| 亚洲精品美女在线观看播放| 99草在线视频| 欧美日本乱大交xxxxx| 亚洲天堂视频网站| 亚洲国产精品久久人人爱蜜臀| 欧美xxxx精品| 国产午夜精品一区二区三区视频| a级片在线观看视频| 国产美女主播视频一区| 91高清国产视频| 奇米影视一区二区三区| 久久婷婷五月综合色国产香蕉| 欧美搞黄网站| 四虎精品欧美一区二区免费| 精品久久中文| 欧美久久在线| 天堂av一区二区三区在线播放| 国产福利一区二区三区在线观看| 国产精品一区二区精品| 国产欧美在线观看| av成人在线播放| 国产精品青青在线观看爽香蕉 | 成人在线免费观看网站| 欧美国产综合视频| 免费国产自久久久久三四区久久| 国内精品二区| 欧美网色网址| 久久久久久久有限公司| 色婷婷综合久久久久久| 精品无码久久久久国产| 九色丨蝌蚪丨成人| 国产精品加勒比| 精品精品国产毛片在线看| 国产伦精品一区二区三区照片 | 亚洲缚视频在线观看| 亚洲av无码乱码国产精品久久| 日韩一级二级三级精品视频| 99久久精品免费看国产交换| 欧美放荡的少妇| 国产农村妇女毛片精品| 日韩一区二区在线看| 午夜精品一区二区三| 欧美成人免费网站| 天天操天天干天天爱| 亚洲精品丝袜日韩| 国产福利片在线| 爱福利视频一区| 污污视频在线| 欧美一级片在线播放| 久久毛片亚洲| 成人国产精品一区二区| 国产日韩一区二区三免费高清| 99中文字幕| 亚洲婷婷丁香| 自拍偷拍一区二区三区| 欧美激情第二页| 国产中文字幕视频在线观看| 久久国产欧美| 亚洲一级片免费观看| 99麻豆久久久国产精品免费 | 一本一道久久a久久精品蜜桃| 91大学生片黄在线观看| 最新日韩av| 亚洲狼人综合干| 国产一区二区三区综合| 中文字幕99页| 国产欧美一区二区精品性| 四虎影视一区二区| 午夜一区二区三区视频| 国产精品露脸视频| 精品成人a区在线观看| 国产福利片在线| 久久久免费精品视频| 欧美va在线观看| 99re在线视频观看| 欧美日韩xxxx| 日韩黄色短视频| 免费xxxx性欧美18vr| 在线xxxxx| 国产精品美女一区二区三区 | 免费99视频| 亚洲成人一区| 久草精品在线播放| 成人手机在线视频| 亚洲伦理一区二区三区| 欧美特级www| 性生交生活影碟片| 中文字幕日韩在线观看| 桃色av一区二区| **亚洲第一综合导航网站| 久久不见久久见中文字幕免费 | 超碰在线资源| 91在线视频一区| 国产精选一区| 阿v天堂2017| 国产v日产∨综合v精品视频| 国产精品成人无码免费| 午夜电影网一区| 国产黄色片免费观看| 在线性视频日韩欧美| 老司机深夜福利在线观看| 亚洲free性xxxx护士hd| 波多野结衣一区| 爱福利视频一区二区| 成人av电影免费观看| 九九精品视频免费| 欧美亚洲综合久久| 国产在线中文字幕| 欧美亚洲国产成人精品| 成人性生交大片免费看96| 99久久久无码国产精品性色戒| 日韩国产欧美视频| 国产精品手机在线观看| 一区二区欧美国产| 国产高清视频免费| 欧美美最猛性xxxxxx| 24小时成人在线视频| 亚洲人久久久| 蜜桃av一区二区在线观看| 亚洲日本精品视频| 91黄色小视频| h网站视频在线观看| 国产精品99久久久久久久久久久久| 午夜欧洲一区| 日本精品久久久久中文字幕| 久久这里只精品最新地址| 国产成人愉拍精品久久 | 99青草视频在线播放视| 国产精品99久久久久久人 | 欧美视频二区欧美影视| 中文字幕日韩一区二区三区| 另类中文字幕网| 黄色精品视频在线观看| 91精品国产综合久久精品性色| 巨大荫蒂视频欧美大片| 99re热精品| 亚洲日产国产精品| 一区二区视频观看| 色悠久久久久综合欧美99| 福利在线午夜| 国产啪精品视频网站| 欧美/亚洲一区| 欧美做受高潮中文字幕| 岛国av一区二区三区| 久蕉依人在线视频| 国产在线不卡精品| 黑人一区二区三区四区五区| 鲁大师私人影院在线观看| 91福利精品视频| 老司机午夜在线| 国产伦精品一区二区三区四区免费| 日韩午夜在线| 级毛片内射视频| 欧美一级搡bbbb搡bbbb| av岛国在线| 天堂√在线观看一区二区| 精品午夜一区二区三区在线观看 | 国模大胆一区二区三区| 亚洲一区二区在线免费| 在线观看免费一区| fc2ppv国产精品久久| 国产一区二区三区黄| 日本一区中文字幕| 欧美国产精品一二三| 精品一区二区三区三区| av成人在线播放| 777av视频| 国产精品沙发午睡系列990531| 国产chinasex对白videos麻豆| 午夜免费久久久久| 日韩1区在线| 日本精品一二三| 91久久精品午夜一区二区| av网站免费在线观看| 欧美日韩综合另类| 国产麻豆精品theporn| 欧美一级片免费在线观看| 色婷婷综合成人av| 免费日韩一区二区三区| 蜜臀一区二区三区精品免费视频| 亚洲国产视频一区| 男人和女人做事情在线视频网站免费观看| 成人av资源| 九色porny丨国产精品| 日韩在线观看第一页| 久久精品亚洲一区| 精品国产午夜| 国产人妻人伦精品1国产丝袜|