精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大多數(shù)開發(fā)人員都弄錯(cuò)的Hive與MapReduce小文件合并問題

大數(shù)據(jù) 數(shù)據(jù)分析
因?yàn)樵O(shè)置上面四個(gè)參數(shù),看上去規(guī)定了map結(jié)束,MR結(jié)束合并文件,如果文件平均小于smallfiles.avgsize啟動(dòng)一個(gè)新的MRj進(jìn)行文件的二次合并。如果啟動(dòng)mr合并文件,沒有問題。

0.背景

近來我們公司搞小文件治理(小于10Mb),小文件太多的危害就不此贅述了。公司的開發(fā)人員提供的合并小文件治理配置如下:

-- 設(shè)置小文件合并
set hive.merge.mapfiles=true;
set hive.merge.mapredfiles=true;
set hive.merge.size.per.task = 256000000 ;
set hive.merge.smallfiles.avgsize= 256000000 ;


看上去配置的沒啥問題,不管是Map-only,還是MapReduce都考慮到了,只要輸出的文件小于這個(gè)值,就重新啟動(dòng)一個(gè)MR去執(zhí)行文件合并。看也符合Hive官網(wǎng)的配置解釋


然而現(xiàn)實(shí)并非如此,廢話不多說,you can you code,no can no bb.

原分析表數(shù)據(jù)在HDFS存儲(chǔ)為551個(gè)小文件,下面所有的測(cè)試都是基于這個(gè)文件。

1.測(cè)試代碼方案1

設(shè)置啟動(dòng)map前文件合并,先使用官方默認(rèn)配置,實(shí)現(xiàn)文件合并測(cè)試

set  hive.input.format = org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.smallfiles.avgsize=16000000; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.size.per.task=256000000; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.mapfiles =true ; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.mapredfiles = true ; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值

drop table if exists FDM_SOR.T_FSA_BHVR_NEW_EXPO_D_tmp_tmp;
create table FDM_SOR.t_fsa_bhvr_new_expo_d_tmp_tmp
stored as orc
as
select
*
from FDM_SOR.t_fsa_bhvr_new_expo_d
where stat_date = '20200630'


結(jié)果:只產(chǎn)生了438個(gè)文件,看樣子效果不錯(cuò),文件變少了,但是發(fā)現(xiàn)還是有很多小于16Mb的文件,為啥設(shè)置了不管用呢,是不是set
hive.merge.smallfiles.avgsize官方的默認(rèn)值給的太小了。需要加大。看實(shí)驗(yàn)2.



2.測(cè)試代碼方案2

設(shè)置啟動(dòng)map前文件合并,將set
hive.merge.smallfiles.avgsize值加大,增加文件合并的Size。按照官方的說法當(dāng)輸出的文件平均小于16Mb時(shí)系統(tǒng)會(huì)再啟動(dòng)一個(gè)MR進(jìn)行文件合并。這下該管用了吧,請(qǐng)看:

set  hive.input.format = org.apache.hadoop.hive.ql.io.CombineHiveInputFormat; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.smallfiles.avgsize=256000000; --改了這個(gè)值,由默認(rèn)的16Mb,改成256Mb
set hive.merge.size.per.task=256000000; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.mapfiles =true ; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值
set hive.merge.mapredfiles = true ; --官方默認(rèn)值,也是當(dāng)前平臺(tái)默認(rèn)值

drop table if exists FDM_SOR.T_FSA_BHVR_NEW_EXPO_D_tmp_tmp;
create table FDM_SOR.t_fsa_bhvr_new_expo_d_tmp_tmp
stored as orc
as
select
*
from FDM_SOR.t_fsa_bhvr_new_expo_d
where stat_date = '20200630'

廢話不多說,上結(jié)果請(qǐng)看


結(jié)果分析:沒錯(cuò),第一次MR因?yàn)镃ombinetext啟動(dòng)了438個(gè)map和上面一樣,果然接著又啟動(dòng)了一個(gè)MR,進(jìn)行輸出后的文件合并。看樣子很DIAO。合并要求文件大小不小256Mb,然后實(shí)際呢?pappa。文件雖然減少了很多到351個(gè),但依然有很多小文件,很多小于10Mb的文件,這個(gè)時(shí)候心里肯定一句

3.測(cè)試代碼方案3

放大招,功夫有沒有,代碼走一走,加上split參數(shù)

set mapred.max.split.size=256000000;  
set mapred.min.split.size.per.node=100000000;
set mapred.min.split.size.per.rack=100000000;
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
set hive.merge.mapfiles = true ;
set hive.merge.mapredfiles = true ;
set hive.merge.size.per.task = 256000000 ;
set hive.merge.smallfiles.avgsize=160000000 ;

drop table if exists FDM_SOR.T_FSA_BHVR_NEW_EXPO_D_tmp_tmp;
create table FDM_SOR.T_FSA_BHVR_NEW_EXPO_D_tmp_tmp
stored as orc
as
select
*
from FDM_SOR.T_FSA_BHVR_NEW_EXPO_D
where stat_date = '20200630'

廢話不多說,上結(jié)果請(qǐng)看:


結(jié)果分析:這下好了,全是大文件,44大文件,每個(gè)大文件都是辣么大,最小的都是48Mb。為啥加了split參數(shù)以后就生效了呢。前面單獨(dú)合并小文件參數(shù)沒啥效果呢?網(wǎng)上隨便搜一下,都是這種配置這種參數(shù)的?

-- 設(shè)置小文件合并
set hive.merge.mapfiles=true;
set hive.merge.mapredfiles=true;
set hive.merge.size.per.task = 256000000 ;
set hive.merge.smallfiles.avgsize= 256000000 ;

4.答案揭曉

因?yàn)樵O(shè)置上面四個(gè)參數(shù),看上去規(guī)定了map結(jié)束,MR結(jié)束合并文件,如果文件平均小于smallfiles.avgsize啟動(dòng)一個(gè)新的MRj進(jìn)行文件的二次合并。如果啟動(dòng)mr合并文件,沒有問題。但是忽略了一個(gè)問題,你重新啟動(dòng)一個(gè)mr合并文件,這個(gè)mr是不是需要進(jìn)行文件split,你這個(gè)參數(shù)搞小了,那就會(huì)產(chǎn)生很多task,很多map,比如很多小文件就是一個(gè)map,最終還是產(chǎn)生很多小文件(因?yàn)楹喜⑿∥募膍r只有map)。所以必須要配合split參數(shù)才有用。具體split參數(shù)使用,參考我其他博客。

本文轉(zhuǎn)載自微信公眾號(hào)「滌生大數(shù)據(jù)」,作者「滌生大數(shù)據(jù)」,可以通過以下二維碼關(guān)注。

轉(zhuǎn)載本文請(qǐng)聯(lián)系「滌生大數(shù)據(jù)」公眾號(hào)。

責(zé)任編輯:武曉燕 來源: ·滌生大數(shù)據(jù)
相關(guān)推薦

2023-02-27 15:44:17

Java開發(fā)技巧

2023-07-12 07:56:13

CSS規(guī)則元素

2023-01-17 16:25:18

前端開發(fā)JSON

2025-07-07 00:00:00

MCPA2AAPI

2020-04-20 18:15:46

開發(fā)自信技術(shù)

2020-07-05 08:01:44

SOC威脅檢測(cè)漏洞

2024-08-22 18:53:51

2025-02-25 10:21:12

2009-07-14 15:39:34

Swing大多數(shù)控件

2010-08-09 16:09:25

2020-05-17 16:10:36

開發(fā)人員軟件開發(fā)開發(fā)

2013-04-02 10:04:17

iCloud蘋果

2009-11-23 20:07:51

ibmdw開發(fā)

2021-02-19 09:33:01

kubernetesJAVA服務(wù)

2009-12-11 14:50:14

Visual Basi

2012-05-30 15:15:42

ibmdw

2023-03-15 07:12:53

企業(yè)開發(fā)人員提供商

2022-06-21 10:34:56

芯片短缺供應(yīng)鏈問題

2020-09-15 12:45:17

智慧城市數(shù)據(jù)城市

2011-05-26 10:50:31

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色播久久人人爽人人爽人人片视av| 亚洲国产精品欧美一二99| 国产精品久久久久av免费| 国产一区二区三区四区五区六区| 日本肉肉一区| 成人欧美一区二区三区白人| 91aaaa| 国产精品黄色网| 国产中文精品久高清在线不| 777午夜精品视频在线播放| 国产乱子伦精品无码专区| 亚洲欧美自偷自拍| 激情综合一区二区三区| 91精品成人久久| 在线观看免费小视频| 亚洲五码在线| 欧美亚州韩日在线看免费版国语版| 99中文字幕在线观看| 亚洲人妻一区二区三区| 韩国精品久久久| 欧美亚洲第一页| 在线免费观看亚洲视频| 免费看成人哺乳视频网站| 91精品国产综合久久精品| 日韩视频第二页| 老司机在线视频二区| 91啪亚洲精品| 99国产超薄肉色丝袜交足的后果| 无码免费一区二区三区| 激情成人综合| 不卡av电影院| 夫妇交换中文字幕| 香蕉视频一区| 亚洲第一精品久久忘忧草社区| 2025韩国理伦片在线观看| 日韩影院在线| 午夜视频在线观看一区二区三区| 天堂一区二区三区| 日本免费一区二区三区最新| 国产精品一色哟哟哟| 成人免费大片黄在线播放| 九九热精品视频在线| 欧美欧美天天天天操| 色吧影院999| 欧美黄色高清视频| 国产欧美日韩| 日韩久久免费电影| xxxx黄色片| 亚洲五码在线| 欧美大胆一级视频| 国产不卡的av| 国产日韩中文在线中文字幕| 欧美色图片你懂的| 亚洲黄色av网址| 欧美色999| 欧美自拍丝袜亚洲| 午夜视频你懂的| 国产一区一一区高清不卡| 在线精品视频免费播放| 国产无套粉嫩白浆内谢的出处| 美女高潮视频在线看| 午夜日韩在线观看| www国产精品内射老熟女| 女人高潮被爽到呻吟在线观看 | 欧美一级久久久| 国产大片一区二区三区| 国产在线不卡一区二区三区| 7777精品伊人久久久大香线蕉的 | 国产成人av| 亚洲无av在线中文字幕| 69精品无码成人久久久久久| 日本一区二区三区视频| www.欧美三级电影.com| 欧美一区免费观看| 国产精品大片| 国产91精品久久久久| 中文字幕一区在线播放| 美国十次了思思久久精品导航 | 一级黄色片在线| 久久草av在线| 成人欧美一区二区| 日本aaa在线观看| 国产亚洲精品久| 亚洲一区二区三区精品动漫| 国产网站在线免费观看| 亚洲伊人伊色伊影伊综合网| 日本午夜激情视频| 日本中文字幕一区二区| 欧美精品xxxxbbbb| 99re这里只有| 波多野结衣的一区二区三区 | 午夜影院在线播放| 欧美影院一区二区三区| 国产999免费视频| 同性恋视频一区| 色综合影院在线| 国产精品99无码一区二区| 久久久久国产精品一区三寸 | 一区二区美女视频| av电影在线观看完整版一区二区| 日韩黄色影视| 在线三级电影| 欧美亚洲动漫制服丝袜| 涩视频在线观看| 成人在线电影在线观看视频| 欧美国产日韩一区二区在线观看 | 91免费在线看片| 亚洲精品三级| 成人激情电影一区二区| 日韩有码电影| 樱桃国产成人精品视频| 欧美精品一区二区三区免费播放| 日韩三级网址| 自拍偷拍亚洲精品| 欧美三日本三级少妇99| 国产一区中文字幕| 日韩精品第一页| av资源在线播放| 91精品国产综合久久精品麻豆 | 在线免费观看av网| av资源久久| 91精品国产高清久久久久久久久| 97caocao| 国产欧美日韩三区| 国产高清精品在线观看| 视频二区欧美| 久久精品国产亚洲精品| 日本免费精品视频| 91污片在线观看| 日韩精品在线视频免费观看| 欧美一级网址| 中文字幕久久久av一区| 岛国av中文字幕| xfplay精品久久| 中文字幕无码精品亚洲资源网久久| 国产精品久久久久久久久免费高清| 精品捆绑美女sm三区| 成人免费毛片xxx| 国内精品久久久久影院薰衣草| 日本成人看片网址| 希岛爱理一区二区三区av高清| 亚洲第一精品夜夜躁人人爽| 国产在线视频你懂的| 国产精品一区二区x88av| 色乱码一区二区三区熟女| av成人在线播放| 亚洲国产精品va| 国产成人亚洲欧洲在线| av高清不卡在线| www在线观看免费| 国产精品2023| 97久久久免费福利网址| 日韩一区二区三区不卡| 午夜国产精品一区| 中文字幕丰满孑伦无码专区| 美女诱惑一区| 日本成人三级电影网站| 免费观看成人性生生活片 | 四虎永久免费在线观看| 免费亚洲网站| 日本电影一区二区三区| 成人不卡视频| www国产91| 国产高清不卡视频| 亚洲一区二区欧美激情| 大尺度做爰床戏呻吟舒畅| 国产农村妇女精品一二区| 欧美精品二区三区四区免费看视频 | 日韩欧美在线番号| 色综合中文字幕| 欧洲美熟女乱又伦| 韩国成人福利片在线播放| 成人免费看片视频在线观看| 亚洲视频三区| 欧美一级黄色网| 成年人在线观看| 日韩欧美在线观看一区二区三区| 国产亚洲欧美久久久久| 91色乱码一区二区三区| 九一精品在线观看| 欧美一区二区三区另类| 久久久精品有限公司| 91精品xxx在线观看| 日韩视频―中文字幕| 成人av一区二区三区在线观看| 婷婷丁香激情综合| 亚洲aaa视频| 成人免费av在线| www.天天射.com| 亚洲网站在线| 日韩经典在线视频| 一区二区三区免费在线看| 51ⅴ精品国产91久久久久久| 永久免费av在线| 亚洲国产私拍精品国模在线观看| 欧美性猛交xxxx乱大交hd| 亚洲色图制服丝袜| 97人妻精品一区二区免费| 激情久久五月天| 国产在线青青草| 欧美91大片| 日本一区二区三区在线视频| 日韩免费精品| 国产精品丝袜久久久久久不卡| 色噜噜狠狠狠综合欧洲色8| 亚洲欧美日韩国产中文| 国产夫妻性生活视频| 在线观看日韩国产| 久久免费视频精品| 国产精品久久久久影视| 免费成人深夜夜行p站| 国产成人亚洲综合a∨猫咪| 一本久道综合色婷婷五月| 亚洲福利久久| 成年人黄色在线观看| 婷婷综合一区| 国产一区二区自拍| 国产精久久久| 国产精品第七十二页| 成人bbav| 欧美国产乱视频| www红色一片_亚洲成a人片在线观看_| 亚洲精品中文字幕有码专区| 亚洲高清精品视频| 91精品欧美久久久久久动漫| 青青国产在线视频| 狠狠躁天天躁日日躁欧美| 国产亚洲精久久久久久无码77777| 国产精品理伦片| av永久免费观看| 久久麻豆一区二区| 国产精品三级在线观看无码| 国产寡妇亲子伦一区二区| 亚洲天堂网2018| 美女一区二区视频| 日日噜噜夜夜狠狠| 日日摸夜夜添夜夜添国产精品| 狠狠干 狠狠操| 亚洲黑丝一区二区| 国产免费一区二区视频| 亚洲午夜精品久久久久久app| 自拍偷拍视频在线| 97精品国产一区二区三区| 亚洲欧洲精品一区| 欧美xxxxx视频| 中文字幕免费在线不卡| 日韩精品永久网址| 亚洲制服中文| 91精品亚洲| 国产一二三四五| 午夜激情一区| 国产一区二区三区小说| 黄色综合网站| 国产免费黄视频| 欧美资源在线| 国产精品人人妻人人爽人人牛| 久久亚洲风情| 国产一级不卡毛片| 久久国产生活片100| aaa一级黄色片| 国产精品亚洲第一| 成人做爰69片免费| 99久久伊人久久99| 日本激情小视频| 国产精品久久一卡二卡| 欧美在线视频第一页| 亚洲国产欧美在线| 国产精品999在线观看| 欧洲生活片亚洲生活在线观看| 免费在线不卡av| 欧美一级日韩一级| 全国男人的天堂网| 亚洲人成电影网站色www| 一级毛片视频在线| 欧美乱大交xxxxx| 筱崎爱全乳无删减在线观看| 国产脚交av在线一区二区| 亚洲色图综合| 国产精品一区二区欧美| 国产一区99| 成人黄色片免费| 久久精品五月| 国产欧美一区二| 99久久婷婷国产精品综合| 日本一级免费视频| 亚洲综合丁香婷婷六月香| 中文字幕视频网| 欧美人妖巨大在线| 日韩中文字幕免费在线观看| 在线观看欧美日韩| 精品日韩av| 国产精品人成电影| 国产成人一二| 中文字幕在线亚洲三区| 亚洲深夜影院| 想看黄色一级片| 久久久久国产一区二区三区四区| www日韩在线| 色狠狠av一区二区三区| 国产成人精品av在线观| 亚洲日韩第一页| 欧美韩日亚洲| 国产精品爽爽爽爽爽爽在线观看| 成人在线tv视频| 亚洲精品一区二区三| 日韩视频在线一区二区三区 | 国产一区二区欧美日韩| 色爱综合区网| 国产精自产拍久久久久久蜜| 欧美一区二区三区红桃小说| 欧美 日韩 国产 在线观看| 日日嗨av一区二区三区四区| 国产精品果冻传媒| 国产精品电影院| 免费污污视频在线观看| 精品国产欧美一区二区| 美女隐私在线观看| 国产精品va在线播放我和闺蜜| jizz国产精品| 操bbb操bbb| 久88久久88久久久| 蜜桃av乱码一区二区三区| 欧美性猛交xxxx久久久| 黄色av中文字幕| 美女av一区二区| 欧美黄色网络| 日韩免费毛片| 视频一区免费在线观看| 黄色正能量网站| 亚洲成人av一区| 亚洲免费不卡视频| 精品综合久久久久久97| www.久久草.com| 国产三级中文字幕| 国产在线视频一区二区| 午夜国产福利视频| 欧美天堂亚洲电影院在线播放| 青青草视频免费在线观看| 欧美一级片久久久久久久| 老司机在线精品视频| 国产精品久久久久7777| 成人一级片在线观看| 麻豆国产尤物av尤物在线观看| 欧美精品在线视频| 黄在线免费看| 92福利视频午夜1000合集在线观看| 清纯唯美日韩| 五月婷婷六月丁香激情| 国产精品不卡一区| 国产三级午夜理伦三级| 久久不射热爱视频精品| 日韩精品视频中文字幕| 国产精品免费看久久久无码| 粉嫩av亚洲一区二区图片| 久久久久免费看| 亚洲精品v天堂中文字幕| 深夜成人在线| 日本一区二区视频| 美女一区二区三区在线观看| 一区二区国产精品精华液| 日韩欧美在线不卡| 极品在线视频| 日本一区二区免费看| 六月丁香婷婷色狠狠久久| 希岛爱理中文字幕| 精品国产人成亚洲区| **欧美日韩在线观看| 一本色道婷婷久久欧美| 国产精品影视网| 久久青青草原亚洲av无码麻豆| 一区二区三区久久精品| 久久久久久爱| 高清在线观看免费| 国产精品美女久久久久久久久| a级片在线播放| 18久久久久久| 天天影视欧美综合在线观看| 久久久久无码国产精品一区李宗瑞| 欧美日韩亚洲激情| 欧美精品电影| 国产一区二区在线网站| 九九视频精品免费| 日韩精品在线不卡| 中文字幕亚洲在线| 久久365资源| 欧美日韩一区二区三区69堂| 亚洲一区二区三区四区在线观看 | www.爱爱.com| 热久久这里只有| 亚洲欧美亚洲| 日韩av片在线| 亚洲а∨天堂久久精品9966| 日本一区免费网站| 日韩欧美猛交xxxxx无码| 国产三级精品三级| 少妇一区二区三区四区| 91精品久久久久久久久久久| 国产日韩专区| 久久久久久激情| 日韩中文字幕av|