精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

HDFS小文件治理總結,你學會了嗎?

大數據 Hadoop
對于大量的小文件,可以使用壓縮工具將多個小文件壓縮為一個壓縮包,以減少存儲空間。例如,使用gzip或bzip2壓縮工具壓縮文件,在HDFS上存儲壓縮文件,以減少存儲空間和文件數量.

隨著大數據時代的到來,數據量不斷增長,HDFS也成為了數據存儲和處理的重要組成部分。然而,由于HDFS的設計原理和文件存儲方式,HDFS系統中存在大量的小文件,這些小文件會導致HDFS的性能下降,增加管理和維護的難度,嚴重影響數據處理效率和數據質量。因此,HDFS小文件的治理變得越來越重要。 

一、HDFS小文件的問題影響

HDFS小文件通常指文件大小小于HDFS塊(Block)大小(默認為128MB)的文件。在HDFS系統中,小文件會帶來以下問題:

1.占用過多的存儲空間:由于HDFS文件系統的特點,每個文件都會占用一個獨立的Block,因此大量的小文件會導致內存空間的浪費,增加HDFS系統的內存開銷;

2.影響數據處理效率:HDFS是為大量的數據處理而設計的,而小文件會導致數據處理效率下降,增加數據處理時間和開銷;

3.增加管理和維護難度:當HDFS系統中存在大量的小文件時,管理和維護變得更加困難,需要耗費更多的精力和時間來維護系統。

二、HDFS小文件的治理方法

針對HDFS小文件的問題,有以下幾種治理方法:

1.合并小文件:將多個小文件合并為一個大文件,減少文件數量。這種方法需要注意文件的內容和格式,以免合并后的文件無法使用或者存在數據丟失等問題;

2.壓縮文件:將多個小文件壓縮為一個壓縮包,減少存儲空間。這種方法可以使用Hadoop自帶的壓縮工具,如gzip、bzip2等;

3.刪除無用文件:刪除不再需要的小文件,釋放存儲空間;

4.設置文件過期時間:對于不再需要的文件,可以設置其過期時間,自動刪除過期文件;

5.使用SequenceFile:使用Hadoop自帶的SequenceFile格式存儲小文件,將多個小文件合并到一個SequenceFile中,以減少文件數量,提高處理效率。

3、HDFS小文件治理的實踐案例

以下是一些HDFS小文件治理的實踐案例:

1.合并小文件:對于日志文件等大量的小文件,可以使用Hadoop自帶的合并工具將多個小文件合并為一個大文件。下面是通過hive的重寫方式合并小文件,核心參數如下;

set hive.input.format = org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
set hive.merge.mapfiles = true;
set hive.merge.mapredfiles = true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.size.per.task=12800000;
set mapred.max.split.size=256000000;
set mapred.min.split.size=64000000;
set mapred.min.split.size.per.node=64000000;
set mapred.min.split.size.per.rack=64000000;

2.壓縮文件:對于大量的小文件,可以使用壓縮工具將多個小文件壓縮為一個壓縮包,以減少存儲空間。例如,使用gzip或bzip2壓縮工具壓縮文件,在HDFS上存儲壓縮文件,以減少存儲空間和文件數量;

3.刪除無用文件:對于不再需要的小文件,可以使用Hadoop自帶的命令hadoop fs -rm命令刪除文件,或者使用定時任務腳本定期刪除過期文件; 

4.設置文件過期時間:使用hadoop fs -touchz命令設置文件的過期時間,當文件過期后,自動刪除文件。例如,使用hadoop fs -touchz命令設置文件的過期時間為30天,當文件超過30天未被訪問時,自動刪除文件;

5.使用SequenceFile:對于大量的小文件,可以使用SequenceFile格式存儲文件,將多個小文件合并成一個SequenceFile文件。例如,使用Hadoop自帶的SequenceFile.Writer類將多個小文件寫入SequenceFile文件中,以減少存儲空間和文件數量。

4、HDFS小文件監控

HDFS的fsimage是HDFS文件系統的一個重要組成部分,記錄了HDFS文件系統的元數據信息,包括文件、目錄、權限、塊等信息。通過監控HDFS的fsimage,可以了解HDFS文件系統的整體情況,包括文件數量、文件大小、文件類型等信息,進而實現對HDFS小文件的監控和治理。

具體來說,可以通過以下步驟對HDFS小文件進行監控:

1.獲取HDFS的fsimage:使用Hadoop自帶的命令hdfs oiv -p XML -i fsimage命令獲取HDFS的fsimage文件。該命令會將HDFS的fsimage文件以XML格式輸出,包括HDFS中所有文件和目錄的元數據信息;

2.解析fsimage文件:使用Python等腳本語言解析獲取到的fsimage文件,提取其中的文件、目錄、塊等信息。可以使用Python的ElementTree模塊等工具對XML文件進行解析,提取需要的信息;

3.統計文件數量和文件大小:根據解析后的文件信息,統計HDFS中小文件的數量和大小。通常可以根據文件大小和文件數量的閾值來定義小文件,例如文件大小小于128MB或文件數量小于1000個等;

4.可視化展示:使用可視化工具,如Grafana、Kibana等將統計結果進行可視化展示,以便于對HDFS小文件的監控和管理。

5、HDFS小文件監控案例

下面是解析HDFS的fsimage文件,導入hive表進行分析得到最終結果表導入clickhouse通過grafana進行數據展示;

解析fsimage文件為txt文件:

hdfs oiv -i  fsimage_0000000192578352133 -o /data2/data/fsimage/$day/fsimage.txt -p Delimited -t /data2/data/fsimage/$day/tmp

fsimage文件重要的字段釋義:

INODE_ID:文件或目錄的唯一標識符;
NAME:文件或目錄的名稱;
PARENT_ID:父目錄的INODE_ID;
MODIFICATION_TIME:最后修改時間;
ACCESS_TIME:最后訪問時間;
BLOCK_IDS:文件的數據塊ID列表;
BLOCK_SIZE:數據塊大小;
NUM_BLOCKS:數據塊數量;
PERMISSIONS:文件或目錄的權限信息;
USER_NAME:文件或目錄所屬用戶;
GROUP_NAME:文件或目錄所屬用戶組;
SYMLINK:如果是符號鏈接,則包含符號鏈接的目標路徑;
UNDER_CONSTRUCTION:如果文件正在寫入中,則為true;
UNDER_RECOVERY:如果文件正在恢復中,則為true;
FILE_LENGTH:文件長度;
NS_QUOTA:命名空間配額;
DS_QUOTA:磁盤配額;
STORAGE_POLICY:存儲策略。

下面是基于解析后的文件映射到hive表最終處理后的數據表和最終數據樣例:

CREATE TABLE `tmp_fsimage_info_log_clean`(
  `path` string, 
  `replication` int, 
  `db` string, 
  `table_name` string, 
  `parttition_nm1` string, 
  `parttition_nm2` string, 
  `parttition_nm3` string, 
  `file_name` string, 
  `modificationtime` string, 
  `accesstime` string, 
  `preferredblocksize_mb` decimal(20,5), 
  `blockscount` int, 
  `filesize_mb` decimal(20,5), 
  `filesize_gb` decimal(20,5), 
  `username` string, 
  `groupname` string)
PARTITIONED BY ( 
  `stat_day` string COMMENT '分區時間:yyyy-mm-dd')
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.ql.io.orc.OrcSerde' 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'

圖片

同步hive數據到CK的工具使用的是seatunnel,下面貼一份相關的配置文件:

env {
  spark.app.name = "hive_to_clickhouse"
  spark.executor.instances = 10
  spark.executor.cores = 4
  spark.executor.memory = "12g"
}


source {
  file {
    path = "hdfs://ds01:8020/user/hive/warehouse/paas_test.db/db_table_file_all/stat_day="${day}""   
    result_table_name = "db_table_file_all"
    format = "orc"
  }
}


transform {
 sql {
    sql = "SELECT  '"${dayStr}"' as stat_day, _col0 as db, _col1 as table_name,_col2 as sum_filesize,_col3 as count_filesize,_col4 as count_filesize_less_10,_col5 as count_filesize_less_50,_col6 as count_filesize_less_150,_col7 as count_filesize_less_250,_col8 as count_filesize_less_300,_col9 as count_filesize_less_10_diff,_col10 as count_filesize_less_50_diff,_col11  as count_filesize_less_150_diff,_col12 as count_filesize_less_250_diff,_col13 as count_filesize_less_300_diff,_col14 as table_storage_increase,_col15 as count_filesize_diff,_col16 as latest_accesstime  from db_table_file_all"
 }
}




sink {
  clickhouse {
    host = "ds03:8123"
    clickhouse.socket_timeout = 50000
    database = "fsimage_info"
    table = "db_table_file_all"
    fields = ["db","table_name","sum_filesize","count_filesize","count_filesize_less_10","count_filesize_less_50","count_filesize_less_150","count_filesize_less_250","count_filesize_less_300","count_filesize_less_10_diff","count_filesize_less_50_diff","count_filesize_less_150_diff","count_filesize_less_250_diff","count_filesize_less_300_diff","table_storage_increase","count_filesize_diff","latest_accesstime","stat_day"]
    username = ""
    password = ""
  }


}

最終展示在grafana中效果:

圖片

本文轉載自微信公眾號「滌生大數據」,作者「滌生-強哥」,可以通過以下二維碼關注。轉載本文請聯系「滌生大數據」公眾號。

責任編輯:武曉燕 來源: 滌生大數據
相關推薦

2022-12-26 07:48:04

敏捷項目

2022-10-18 17:59:46

Bootstrap源碼父類

2022-07-26 00:25:57

PandasQuery索引器

2023-01-26 00:28:45

前端測試技術

2024-01-19 08:25:38

死鎖Java通信

2023-01-10 08:43:15

定義DDD架構

2024-02-04 00:00:00

Effect數據組件

2023-07-26 13:11:21

ChatGPT平臺工具

2023-08-01 12:51:18

WebGPT機器學習模型

2024-01-02 12:05:26

Java并發編程

2022-08-09 08:25:44

Stream創建流流計算

2024-02-06 08:33:54

文件系統SSD

2023-01-30 09:01:54

圖表指南圖形化

2022-07-08 09:27:48

CSSIFC模型

2024-08-06 09:47:57

2023-10-10 11:04:11

Rust難點內存

2024-07-31 08:39:45

Git命令暫存區

2023-12-12 08:02:10

2024-05-06 00:00:00

InnoDBView隔離

2023-06-06 07:50:07

權限管理hdfsacl
點贊
收藏

51CTO技術棧公眾號

精品国产网站地址| 成人综合激情网| 在线观看中文字幕亚洲| 在线观看岛国av| 制服丝袜中文字幕在线| 99re8在线精品视频免费播放| 国产成人精品日本亚洲专区61| 911国产在线| 日韩aaa久久蜜桃av| 欧美三级电影一区| av免费看网址| 欧美成年黄网站色视频| 91美女片黄在线观看91美女| 成人网在线视频| 日本特黄特色aaa大片免费| 精品国产欧美日韩| 亚洲国产成人在线视频| 中国黄色片免费看| 电影在线观看一区| 亚洲精品美国一| 日本一区二区三区www| 免费国产黄色片| 免费人成在线不卡| 热久久免费国产视频| 欧美成人手机视频| 999久久久亚洲| 亚洲性日韩精品一区二区| 欧美日韩一区二区区| 欧美91在线|欧美| 日韩欧美亚洲成人| 日韩日韩日韩日韩日韩| 1区2区3区在线视频| 国产精品区一区二区三| 欧美日韩在线不卡一区| 污污网站在线免费观看| 成人午夜伦理影院| 91在线观看免费高清| 中文字幕一区二区免费| 午夜亚洲一区| 4438全国成人免费| 中文字幕日韩一级| 亚洲黄色成人| 欧美激情精品久久久久久免费印度| 二区三区四区视频| 999久久久精品国产| 丝袜亚洲欧美日韩综合| 精品丰满少妇一区二区三区| 精品久久不卡| 国产亚洲精品久久久久久牛牛| 免费中文字幕av| 欧美激情极品| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 后进极品白嫩翘臀在线视频| 国产麻豆精品久久一二三| 国产区亚洲区欧美区| 又骚又黄的视频| 久久电影网站中文字幕| 国产日韩欧美自拍| 国产精品无码久久久久成人app| 久久99久久99| 99re在线观看视频| 丰满人妻熟女aⅴ一区| 丰满亚洲少妇av| 国产一区二区三区av在线 | 亚洲欧美三级伦理| 中文字幕第4页| 日韩理论电影院| 按摩亚洲人久久| 国内偷拍精品视频| 亚洲激情不卡| 青青精品视频播放| 中文字幕av无码一区二区三区| 激情欧美日韩一区二区| 91久久偷偷做嫩草影院| 色屁屁草草影院ccyycom| 91在线观看免费视频| 欧美极品日韩| 免费av毛片在线看| 亚洲一区二区三区四区五区黄 | 456亚洲精品成人影院| 欧美日韩精品三区| 日本黄色www| 日韩av不卡一区| 在线观看国产欧美| 超碰手机在线观看| 午夜宅男久久久| 国产精品稀缺呦系列在线 | 日韩麻豆第一页| 农村老熟妇乱子伦视频| 国产一区美女| 欧美自拍视频在线观看| 在线观看免费视频一区| 懂色中文一区二区在线播放| 日本不卡二区高清三区| av免费在线免费观看| 欧美午夜女人视频在线| 999在线精品视频| 欧美亚洲色图校园春色| 日韩最新中文字幕电影免费看| 国产亚洲成人精品| 日本伊人午夜精品| 国产自产精品| 国产精品刘玥久久一区| 欧美日韩一区二区在线| 在线视频日韩欧美| 久久91精品| 欧美激情极品视频| 欧美一级做a爰片免费视频| 国产电影一区二区三区| 日本一区二区精品视频| 91高清视频在线观看| 欧美人xxxx| 亚洲bbw性色大片| 91精品国产色综合久久不卡98口| 亚洲精品二三区| 国产成人精品综合在线观看| 日韩免费成人网| 精品国产av色一区二区深夜久久| 久久五月天小说| 51色欧美片视频在线观看| 国产91视频在线| 欧美国产成人精品| 精品中文字幕av| 亚洲视频国产| 色老头一区二区三区在线观看| 国产成人无码精品| 国产精一品亚洲二区在线视频| 日韩久久在线| 欧亚av在线| 欧美zozozo| 91 在线视频| 免费成人av在线| 欧美xxxx黑人又粗又长密月| 国产羞羞视频在线播放| 日韩欧美资源站| 男人的午夜天堂| 免费的国产精品| 亚洲精品国产精品国自产| 日本免费一区二区六区| 日韩av在线资源| 国产一级一片免费播放| 国产激情一区二区三区四区| 亚洲毛片aa| 日韩在线电影| 久久精品国产亚洲7777| 一区二区不卡视频在线观看| 中文一区二区在线观看| jizz欧美激情18| 欧美色图在线播放| 国产精品久久久久久久久男| 国产露出视频在线观看| 在线观看成人小视频| 亚洲a v网站| 免费日韩精品中文字幕视频在线| 美国av一区二区三区| 亚洲女同志freevdieo| 日韩精品欧美国产精品忘忧草| www成人在线| 久久久av毛片精品| 亚洲综合在线网站| sdde在线播放一区二区| 国产女人18毛片水18精品| 18视频免费网址在线观看| 欧美色倩网站大全免费| 日韩激情小视频| 国产成人在线色| 69sex久久精品国产麻豆| 林ゆな中文字幕一区二区| 51色欧美片视频在线观看| 精品av中文字幕在线毛片| 欧美视频在线观看一区二区| 精品国产国产综合精品| 国产乱码精品1区2区3区| 国产精品va在线观看无码| 欧美理论电影在线精品| 国产成人涩涩涩视频在线观看| 爱久久·www| 91麻豆精品国产91久久久久久久久 | av在线播放亚洲| 国产乱码精品一区二区亚洲 | 国产精品美日韩| 成人免费播放视频| 亚洲伦理精品| 欧美在线一二三区| 91久久青草| 国外成人性视频| 国产小视频在线观看| 欧美精选午夜久久久乱码6080| 久久久一二三区| 久久久青草青青国产亚洲免观| 亚洲美女性囗交| 在线成人欧美| 亚洲国产欧洲综合997久久 | 日本在线视频一区| 人人爱人人干婷婷丁香亚洲| 热99久久精品| 日本高清成人vr专区| 亚洲欧美福利视频| 国产99视频在线| 色婷婷综合久久久久中文| 成年人午夜剧场| 久久久久久久久久看片| 亚洲综合在线一区二区| 久久免费国产| 欧美又粗又长又爽做受| 精品国产91久久久久久浪潮蜜月| 99久久99久久精品国产片| 欧美亚洲大片| 国内精品模特av私拍在线观看| 免费网站成人| 亚洲欧美综合另类中字| 国产 欧美 自拍| 欧美精品三级在线观看| 婷婷激情五月综合| 午夜电影一区二区三区| 欧美片一区二区| 国产精品你懂的在线欣赏| 青青草成人免费视频| 国产成人亚洲综合a∨婷婷| 五月天激情视频在线观看| 亚洲一区日韩在线| 欧美一区二区激情| 欧美在线首页| 人人妻人人澡人人爽精品欧美一区| 国模精品一区| 久久国产精品高清| 成人午夜大片| 97人人模人人爽人人喊38tv| 成人污污视频| 国产综合视频在线观看| 日韩在线观看不卡| 国产精品999| 欧美大胆成人| 欧美一级高清免费播放| 欧美激情网站| 欧美一级电影免费在线观看| 久久青草伊人| 6080yy精品一区二区三区| 91jq激情在线观看| 欧美黑人极品猛少妇色xxxxx | 欧美一区二区三区免费视| heyzo在线播放| 欧美激情欧美激情| 丁香花电影在线观看完整版| 欧美国产在线电影| 超碰在线网站| 69久久夜色精品国产69乱青草| 97天天综合网| 2019中文在线观看| 成人性生交大片免费网站| 国产国语刺激对白av不卡| 婷婷六月国产精品久久不卡| 国产精品久久久久久久久久久久 | 久久国产一区| 亚洲精品动态| 日韩欧美精品一区二区| 日本激情一区| 黄色高清视频网站| 午夜精品电影| 欧美视频在线观看网站 | 午夜精品久久久久久久99热影院| 久久99精品国产.久久久久久| 91av视频免费观看| 国产一区二区三区免费播放| 色诱av手机版| 91视频xxxx| 精品人妻中文无码av在线| 中文字幕一区二区三中文字幕| 午夜精品福利在线视频| 亚洲一区免费在线观看| 亚洲视频免费播放| 欧美性感一类影片在线播放| 91资源在线视频| 精品久久久久久亚洲综合网| 亚洲欧洲精品视频| 中文字幕欧美日韩va免费视频| 浪潮av一区| 久久久久亚洲精品国产| 国产另类xxxxhd高清| 91精品免费看| 加勒比色综合久久久久久久久| 免费久久久一本精品久久区| 999国产精品永久免费视频app| 欧美黄网在线观看| 久久一区亚洲| 在线播放免费视频| 337p粉嫩大胆噜噜噜噜噜91av | 亚洲一二三专区| 中文字幕免费观看| 日韩欧美一级二级| 国产毛片在线| 欧美激情视频网| 成人在线观看免费视频| 成人三级视频在线观看一区二区| 久草成人在线| 国产欧美123| 奇米在线7777在线精品| 男人添女人荫蒂国产| 日本一区二区在线不卡| 久久丫精品久久丫| 欧美日韩黄色影视| 亚洲日本国产精品| 久热精品视频在线观看| 久久91导航| 国产一区二区在线网站| 久久久久久久久99精品大| 欧美日韩第二页| 高清在线观看日韩| 99久久久无码国产精品不卡| 粉嫩老牛aⅴ一区二区三区| 国产jzjzjz丝袜老师水多| 亚洲图片欧美午夜| 麻豆免费版在线观看| 99久久精品久久久久久ai换脸| 欧美中文字幕一区二区| 日本久久久精品视频| 国产91精品入口| 中文字幕五月天| 欧美性大战久久久久久久| 男女视频在线观看| 亚洲97在线观看| 综合久久成人| 视色,视色影院,视色影库,视色网| 日韩高清中文字幕一区| 成人免费看片载| 亚洲精品美腿丝袜| 国产男女猛烈无遮挡| 色偷偷噜噜噜亚洲男人| 亚洲成人短视频| 欧美激情论坛| 久久精品麻豆| 国产三级视频网站| 婷婷六月综合网| 女人18毛片一区二区三区| 色综合久久天天综线观看| 成人在线啊v| 吴梦梦av在线| 精品无人码麻豆乱码1区2区| 麻豆视频免费在线播放| 精品视频资源站| 137大胆人体在线观看| 国产精品福利在线| 欧美自拍偷拍| 超碰在线97免费| 国产精品人妖ts系列视频| 亚洲特级黄色片| 日日噜噜噜夜夜爽亚洲精品| 日韩欧乱色一区二区三区在线| 亚洲精品国产一区| 激情五月婷婷综合| av成人免费网站| 欧美成人综合网站| 成人在线黄色电影| 欧美成人蜜桃| 日本不卡视频一二三区| 任你操精品视频| 69精品人人人人| 欧美videosex性极品hd| 国产乱人伦精品一区二区| 性欧美暴力猛交另类hd| 中文字幕成人动漫| 欧美乱熟臀69xxxxxx| 调教一区二区| 国产主播一区二区三区四区| 久热国产精品| 亚洲欧美精品久久| 欧美精品一区二区三区蜜臀| 成入视频在线观看| 手机在线观看国产精品| 国产伦精品一区二区三区免费迷| 激情小说中文字幕| 日韩精品中文字幕在线观看| 91久久久久久白丝白浆欲热蜜臀| 黄色一级视频播放| 91在线免费播放| 姑娘第5集在线观看免费好剧| 另类视频在线观看| 久9re热视频这里只有精品| 91香蕉视频污版| 亚洲综合在线五月| 欧美zozo| 91精品网站| 久久国产精品久久久久久电车| 色www亚洲国产阿娇yao| 欧美成人伊人久久综合网| 成人软件在线观看| 91成人在线视频观看| 26uuu国产在线精品一区二区| 在线观看视频二区| 9.1国产丝袜在线观看| 99久久夜色精品国产亚洲96| 玖玖爱在线精品视频| 欧美日韩一区小说| 欧美少妇网站| 老司机午夜网站| 久久久精品国产99久久精品芒果| 99在线精品视频免费观看20| 欧美在线一级视频| 在线成人直播| 精品人妻中文无码av在线|