精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據治理實踐 | 網易某業務線的計算資源治理

大數據 數據分析
對于調度優化一開始會無從下手,統計凌晨2-5點區間下大概600+任務難梳理,同時存在任務依賴,修改起來可能會對下游整體有大的影響,因此我們選擇循序漸進先梳理再改善。

?本文從計算資源治理實踐出發,帶大家清楚認識計算資源治理到底該如何進行,并如何應用到其他項目中。

01前言

由于數據治理層面可以分多個層面且內容繁多(包括模型合規、數據質量、數據安全、計算/存儲資源、數據價值等治理內容),因此需要單獨拆分為6個模塊單獨去闡述其中內容。

筆者作為數倉開發經常會收到大量集群資源滿載、任務產出延時等消息/郵件,甚至下游數分及其他同學也會詢問任務運行慢的情況,在這里很多數倉同學遇到這類問題第一想到的都是加資源解決,但事實真不一定是缺少資源,而是需要優化當前問題任務。所以本期從團隊做計算資源治理視角出發,帶大家清楚認識計算資源治理到底該如何進行。

02問題出現

在做計算治理之前(2022.12)我們團隊盤點了下當前計算資源存在的幾個問題:

(1)30+高消耗任務:由于數倉前中期業務擴張,要覆蓋大量場景應用,存在大量問題代碼運行時數據傾斜,在消耗大量集群計算資源下,產出時間也久;

(2)200w+的小文件:當前任務存在未合并小文件、任務Reduce數量過多、上游數據源接入(尤其是API數據接入)會造成過多小文件出現,小文件過多會開啟更多數據讀取,執行會浪費大量的資源,嚴重影響性能;

(3)任務調度安排不合理:多數任務集中在凌晨2-5點執行且該區間CPU滿載,導致該時間段資源消耗成了重災區,所有核心/非核心任務都在爭搶資源,部分核心任務不能按時產出一直在等待階段;

(4)線上無效DQC(數據質量監控)&監控配置資源過小:存在部分歷史任務沒下線表及DQC場景,每日都在空跑無意義DQC浪費資源,同時DQC資源過少導致DQC需要運行過長時間;

(5)重復開發任務/無用任務:早期協助下游做了較多煙囪數據模型,因為種種原因,部分任務不再被使用,煙囪模型分散加工導致資源復用率降低;

(6)任務缺少調優參數&部分任務仍然使用MapReduce/Spark2計算引擎:任務缺少調優參數導致資源不能適配及動態調整,甚至線上仍有早期配置MapReduce/Spark2計算引擎導致運行效率較低。

03思考與行動

3.1 治理前的思考:?

在治理之前我想到一個問題,切入點該從哪里開始最合適?

經過與團隊多次腦暴對當前治理優先級/改動成本大小/難度做了一個排序,我們先選擇從簡單的參數調優&任務引擎切換開始->小文件治理->DQC治理->高消耗任務治理->調度安排->下線無用模型及沉淀指標到其他數據資產,同時在初期我們完成各類元數據接入搭建治理看板以及團隊治理產出統計數據模型,并通過網易數帆提供的數據治理平臺解決具體細節問題。

圖片

(數據治理平臺截圖)

3.2 治理行動:

(1)大部分任務切換至Spark3計算引擎&補充任務調優參數

補充Spark調優參數(參數內容詳見文末),任務統一使用Spark3引擎加速,并充分利用Spark3的AQE特性及Z-Order排序算法特性。

AQE解釋:Spark 社區在 DAG Scheduler 中,新增了一個 API 在支持提交單個 Map 階段,以及在運行時修改 shuffle 分區數等等,而這些就是 AQE,在 Spark 運行時,每當一個 Shuffle、Map 階段進行完畢,AQE 就會統計這個階段的信息,并且基于規則進行動態調整并修正還未執行的任務邏輯計算與物理計劃(在條件運行的情況下),使得 Spark 程序在接下來的運行過程中得到優化。

Z-Order解釋:Z-Order 是一種可以將多維數據壓縮到一維的技術,在時空索引以及圖像方面使用較廣,比如我們常用order by a,b,c 會面臨索引覆蓋的問題,Z-Order by a,b,c 效果對每個字段是對等的

(2)小文件治理

在這里我們使用內部數據治理平臺-數據治理360對存在小文件較多表提供內容展示(本質采集HDFS對應路徑下文件數的日志去顯示)

當前小文件處理:

對于分區較多使用Spark3進行動態分區刷新,(Spark3具備小文件自動合并功能,如未使用Spark3可配置Spark3/Hive小文件合并參數刷新,參數詳見文末),代碼如下:

set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table xxx.xxx partition (ds)
select column
,ds
from xxx.xxx

對于分區較少或未分區的表采用重建表,補數據方法回刷。

小文件預防:

  • 使用Spark3引擎,自動合并小文件
  • 減少Reduce的數量(可以使用參數進行控制)
  • 用Distribute By Rand控制分區中數據量
  • 添加合并小文件參數 
  • 將數據源抽取后的表做一個任務(本質也是回刷分區合并小文件任務)去處理小文件保障從數據源開始小文件不向下游流去

(3)DQC治理

無效DQC下線:難點在于需要查找所有DQC對應的線上任務,查看該DQC任務是否與線上任務一一匹配,從而找到無效DQC任務下線,內容繁雜耗時較多。

DQC資源:由于之前DQC配置資源為集群默認參數,效率極低導致所有DQC運行時長均超過10min,從而使得整體任務鏈路運行時長過久,調整Driver內存為2048M,Executor個數為2,Executor內存為4096M

(4)高消耗任務調優

這里存在2個難點:優化效果不可控、高消耗任務調整到何種程度算合適,針對這個這個難點我們取所有核心數據資產任務均值,保障單個任務消耗小于平均消耗,同時我們針對當前高消耗任務列舉出如下可優化的方式:

  • 關聯表過多,需拆分
  • 關聯時一對多,數據膨脹
  • 資源配置過多,運行時資源嚴重浪費,需要將配置調小(包括Driver內存、Executor個數、Executor內存)
  • 代碼結尾添加Distribute By Rand(),用來控制Map輸出結果的分發
  • 查詢中列和行未裁剪、分區未限定、Where條件未限定
  • SQL中Distinct切換為Group by(Distinct會被hive翻譯成一個全局唯一Reduce任務來做去重操作,Group by則會被hive翻譯成分組聚合運算,會有多個Reduce任務并行處理,每個Reduce對收到的一部分數據組,進行每組聚合(去重))
  • 關聯后計算切換為子查詢計算好后再關聯
  • 使用Map Join(Map Join會把小表全部讀入內存中,在Map階段直接拿另外一個表的數據和內存中表數據做匹配,由于在Map是進行了Join操作,省去了Reduce運行的效率也會高很多)可用參數代替

(5)任務調度合理優化

對于調度優化一開始會無從下手,統計凌晨2-5點區間下大概600+任務難梳理,同時存在任務依賴,修改起來可能會對下游整體有大的影響,因此我們選擇循序漸進先梳理再改善。

  • 找到所有表的輸出輸入點即啟始ODS與末尾ADS
  • 劃分其中核心表/非核心表,及對應任務開始時間與結束時間
  • 按照梳理內容把非核心的任務穿插在當前集群資源非高峰時期(2點前與5點后),同時把核心任務調度提前,保障CDM層任務及時產出
  • 對實踐后內容再度調優,達到資源最大利用率

(6)煙囪任務下沉&無用任務下線

煙囪表過多,需下沉指標到DWS中提升復用性,對于無用任務也需要及時下線(這里需要拿到元數據血緣最好到報表層級的數據血緣,防止任務下線后導致可視化內容問題產生),減少開發資源消耗。

04治理效果

(1)Hive與Spark2任務升級Spark3.1,總計升級任務137個,升級任務后總體任務執行效率提升43%,cpu資源消耗降低41%,內存資源消耗降低46%

(2)治理小文件數大于10000+以上的數倉表總計30+張,小文件總數由216w下降至67w

(3)下線無效DQC任務總計50+,修改DQC配置資源降低運行時長,由原來10min優化至3min內

(4)完成線上20+個任務優化及10+個任務下線及10+表指標下沉,優化后節省任務耗時146分鐘,減少CPU損耗800w+,降低內存消耗2600w+(相當于節省了8個200+字段1億數據量任務消耗)

(5)調度重新分配后2-5點資源使用率由90+%降低至50+%,保障日用資源趨勢圖無大突刺波動

05小結

計算資源治理核心在于降本增效,用有限資源去運行更多任務,通過一系列治理操作也讓數倉同學積累技術經驗同時規范化自身開發標準,讓治理反推進組內技術進步。

計算資源治理是一件長久之事,并不能因為資源緊張才去治理,而要將計算治理常態化,可通過周/月資源掃描內容及時推送給每個同學,并為之打分,讓每個任務都有源可循,有方法可優化。

參數內容

參數并不是設置越多任務性能越好,根據數據量、消耗、運行時間進行調整達到合理效果。

Hive:

(1)set hive.auto.convert.join = true; (是否自動轉化成Map Join)

(2)set hive.map.aggr=true; (用于控制負載均衡,頂層的聚合操作放在Map階段執行,從而減輕清洗階段數據傳輸和Reduce階段的執行時間,提升總體性能,該設置會消耗更多的內存)

(3)set hive.groupby.skewindata=true; (用于控制負載均衡,當數據出現傾斜時,如果該變量設置為true,那么Hive會自動進行負載均衡)

(4)set hive.merge.mapfiles=true;  (用于hive引擎合并小文件使用)

(5)set mapreduce.map.memory.mb=4096;      (設置Map內存大小,解決Memory占用過大/小)

(6)set mapreduce.reduce.memory.mb=4096;(設置Reduce內存大小,解決Memory占用過大/小)

(7)set hive.exec.dynamic.partition.mode=nonstrict;(動態分區開啟)

Spark:

(1)set spark.sql.legacy.parquet.datetimeRebaseModeInRead=LEGACY;(用于spark3中字段類型不匹配(例如datetime無法轉換成date),消除sql中時間歧義,將Spark .sql. LEGACY . timeparserpolicy設置為LEGACY來恢復Spark 3.0之前的狀態來轉化)

(2)set spark.sql.adaptive.enabled=true;(是否開啟調整Partition功能,如果開啟,spark.sql.shuffle.partitions設置的Partition可能會被合并到一個Reducer里運行。平臺默認開啟,同時強烈建議開啟。理由:更好利用單個Executor的性能,還能緩解小文件問題)

(3)set spark.sql.hive.convertInsertingPartitinotallow=false;(解決數據無法同步Impala問題,使用Spark3引擎必填)

(4)set spark.sql.finalStage.adaptive.advisoryPartitinotallow=2048M;(Spark小文件合并)?

責任編輯:武曉燕 來源: 網易有數
相關推薦

2023-06-12 07:44:21

大數據數據治理

2023-02-08 19:32:27

大數據

2022-12-06 17:52:57

離線數倉治理

2022-05-13 11:24:09

數據美團

2023-06-19 07:27:50

網易嚴選全鏈路

2023-07-27 07:44:07

云音樂數倉平臺

2023-01-31 15:27:13

數據治理數據管理

2023-08-07 08:40:24

2024-03-26 06:46:52

大數據數據治理大數據資產治理

2022-12-30 15:27:13

2024-04-22 07:56:32

數據倉庫數據中臺數據服務

2023-04-10 07:34:30

2024-01-11 08:15:52

大數據成本治理Hadoop

2025-03-20 10:50:08

RedisCaffeine緩存監控

2022-12-21 12:05:40

網易云音樂用戶畫像

2024-05-22 15:31:56

2023-04-14 15:50:29

元數據數據治理

2023-10-24 14:48:23

數據治理大數據

2021-07-19 10:06:30

數據治理數字化轉型CIO

2023-06-27 07:26:36

汽車之家敏感數據治理
點贊
收藏

51CTO技術棧公眾號

水蜜桃精品av一区二区| 日韩不卡免费高清视频| 99久久精品99国产精品| 欧美亚洲成人xxx| 少妇太紧太爽又黄又硬又爽小说 | 国产在线观看91精品一区| 午夜剧场免费在线观看| 老司机成人在线| 欧美日韩一级二级| 欧洲精品一区二区三区久久| 国产精品免费播放| 国产成人精品一区二| 国产91露脸中文字幕在线| 国精品无码一区二区三区| 欧美freesex8一10精品| 欧美日本视频在线| 黄色片视频在线免费观看| 欧美天天影院| 97se狠狠狠综合亚洲狠狠| 国产美女直播视频一区| 亚洲国产成人精品激情在线| 日韩在线观看电影完整版高清免费悬疑悬疑| 日韩手机在线导航| 色播五月综合网| 345成人影院| 亚洲国产视频在线| 亚洲欧洲精品在线| 免费人成在线观看网站| 成人国产一区二区三区精品| 国产精品自产拍高潮在线观看| 日韩欧美成人一区二区三区| 欧美日韩一卡| 久久久91精品国产| 国产精品成人无码免费| 日本一区福利在线| 欧美本精品男人aⅴ天堂| 免费涩涩18网站入口| 午夜伦理福利在线| 亚洲成av人综合在线观看| 国产又大又长又粗又黄| 9191在线| 国产精品美女www爽爽爽| 日本日本精品二区免费| 神马久久精品| 91免费国产视频网站| 国模一区二区三区私拍视频| 亚洲AV无码精品自拍| 国产一区二区三区日韩| 91精品国产综合久久男男| 超碰在线免费97| 久久婷婷av| 欧美壮男野外gaytube| 伊人久久综合视频| 国产精品久久久久久模特| 久久久在线观看| 久久免费精彩视频| 亚洲精品在线二区| 68精品久久久久久欧美| 成人精品免费在线观看| 国产视频久久| 人妖精品videosex性欧美| 9i看片成人免费看片| 久久最新视频| 国产va免费精品高清在线观看| 免费视频久久久| 日本特黄久久久高潮 | 日韩欧美久久| 欧美zozo另类异族| 欧美大片免费播放器| 青青草这里只有精品| 国产视频亚洲精品| 毛片视频免费播放| 夜间精品视频| 久久久久久国产精品| 日本一级淫片色费放| 午夜综合激情| 国产精品一区久久久| 国产av精国产传媒| 本田岬高潮一区二区三区| 欧美日韩一区在线播放| 欧美日本高清| 亚洲永久精品国产| 亚洲精品乱码久久久久久自慰| 日韩欧美精品电影| 91精品国产日韩91久久久久久| 亚洲少妇一区二区三区| 欧美人与牛zoz0性行为| 久久综合久久88| 欧美三级韩国三级日本三斤在线观看| 久久婷婷av| 91麻豆精品秘密入口| 婷婷丁香花五月天| 成人免费在线视频| 国产主播自拍av| 国产亚洲精品精品国产亚洲综合| 日韩三级视频在线看| 自拍偷拍亚洲天堂| 欧美aⅴ99久久黑人专区| 91精品国产色综合久久不卡98| 国产女优在线播放| 99国产欧美另类久久久精品| 亚洲精品国产一区| 多野结衣av一区| 欧美日韩精品一区二区在线播放| 成人区人妻精品一区二 | 久久久99精品视频| 666av成人影院在线观看| 欧美一级黄色大片| 亚洲一二三四视频| 国产手机视频一区二区| 91久久国产婷婷一区二区| 水莓100在线视频| 亚洲码国产岛国毛片在线| 亚洲色图久久久| 天天操综合520| 欧美激情视频一区| 亚洲熟女乱色一区二区三区久久久 | 污视频网站观看| 日韩黄色网络| 欧美激情精品久久久久| 亚洲无码精品在线播放| 久久免费的精品国产v∧| 99久热在线精品视频| 国产精品麻豆成人av电影艾秋| 亚洲国产成人精品女人久久久| 精品人妻伦九区久久aaa片| 日韩精品亚洲专区| 九九九九精品| xxx.xxx欧美| 91精品国产综合久久精品图片| 中文字幕成人动漫| 国产精品日韩精品欧美精品| 国产精品二区在线| a视频在线观看免费| 欧美日韩国产一级二级| 亚洲午夜精品久久久久久高潮| 中国女人久久久| 国产精品对白刺激久久久| 91精品久久久| 日韩欧美国产wwwww| 99鲁鲁精品一区二区三区| 毛片av一区二区三区| 亚洲欧洲免费无码| 四虎精品永久免费| www亚洲精品| 伊人网站在线观看| 国产精品久久久久永久免费观看| 久草福利视频在线| 成人高清电影网站| 国产精品视频自拍| 香蕉视频网站在线观看| 欧美精选在线播放| 国产va在线播放| 国产激情视频一区二区在线观看 | 在线成人性视频| 色婷婷成人网| 欧美成人免费小视频| 国产高清免费av| 亚洲午夜在线观看视频在线| 亚洲麻豆一区二区三区| 日韩一级网站| 欧美极品视频一区二区三区| 韩国成人动漫| 中文字幕精品久久久久| 国产精品欧美久久久久天天影视| 亚洲三级小视频| 95视频在线观看| 亚洲欧美大片| 亚洲国产一区二区在线| 99国内精品久久久久| 色综合久久久888| 色视频免费在线观看| 在线免费观看视频一区| 中文字幕资源站| 国产宾馆实践打屁股91| 国产 福利 在线| 久久高清精品| 国产精品久久久久久久免费大片| 亚洲欧美电影| 久久精品久久久久电影| 成人免费视频国产| 色综合中文字幕| 成人免费视频国产免费观看| 99久久精品国产一区二区三区| 日韩在线xxx| 在线精品视频在线观看高清| 精品国产乱码一区二区三区四区 | 性色av一区二区怡红| 亚洲一区二区自拍偷拍| 国产精品久久久久久久久久白浆| 国产91九色视频| 色综合999| 亚洲一品av免费观看| 精品人妻伦一区二区三区久久| 精品久久久久久电影| 97在线观看视频免费| eeuss影院一区二区三区| 色播五月激情五月| 亚洲影院在线| 超碰超碰超碰超碰超碰| 久操精品在线| 国产精品加勒比| 欧美亚洲黄色| 日本高清视频精品| 蜜乳av一区| 久久黄色av网站| 精品福利视频导航大全| 亚洲成人av在线播放| 一卡二卡三卡在线观看| 色综合久久综合中文综合网| 欧美日韩在线视频免费播放| 亚洲国产成人一区二区三区| 国产女人18毛片水真多18| 精品系列免费在线观看| 黑森林精品导航| 久久福利一区| 黄色一级视频在线播放| 伊人色**天天综合婷婷| 亚洲国产成人不卡| 久久97视频| 久久99久久精品国产| 91精品啪在线观看国产手机| 成人性生交大片免费看视频直播| jizz免费一区二区三区| 国产91在线高潮白浆在线观看| 国产黄大片在线观看| 欧美激情免费在线| 日本大片在线播放| 久久综合五月天| 黄av在线免费观看| 久久精品视频99| 精品自拍一区| 久久九九有精品国产23| 免费在线看黄| 久久综合九色九九| 中文在线手机av| 久久亚洲国产成人| 黄色小网站在线观看| 裸体女人亚洲精品一区| 久久日韩视频| 欧美大肥婆大肥bbbbb| 久久久久久久久免费视频| 色青青草原桃花久久综合| 成年人在线看| 最近免费中文字幕视频2019| 91精品大全| 最新国产精品拍自在线播放| 午夜视频成人| 日韩视频亚洲视频| 国产欧美久久久久久久久| 欧美成人一二三| 性欧美video高清bbw| 久久久久国产精品免费网站| 国产偷倩在线播放| 91精品国产91久久久久久久久| √最新版天堂资源网在线| 91精品国产精品| 韩国美女久久| 国产免费亚洲高清| 亚洲视频国产| 欧美高清性xxxxhdvideosex| 国产精品探花在线观看| 亚洲成人自拍| 欧美三级不卡| 怡红院av亚洲一区二区三区h| 免播放器亚洲| 亚洲人视频在线| 成人激情免费电影网址| 丰满少妇一区二区三区| 欧美国产日韩亚洲一区| 中文字幕在线有码| 精品高清美女精品国产区| 国产视频1区2区| 欧美一三区三区四区免费在线看| 亚洲免费成人在线| 亚洲视频在线观看网站| 久草资源在线观看| 4444欧美成人kkkk| 91亚洲精品在看在线观看高清| 国产精品yjizz| 大片网站久久| 91免费国产精品| 久久中文在线| 人妻巨大乳一二三区| 91视视频在线观看入口直接观看www | 欧美一区二区三区喷汁尤物| 色欲av永久无码精品无码蜜桃| 亚洲视频在线观看| 欧美草逼视频| 国产精品视频大全| 国产欧美三级电影| 一区二区精品视频| 国产九九精品| 亚洲天堂网站在线| 国产日韩精品一区二区浪潮av | 久久77777| 日韩av快播网址| 亚洲精品一区二区三区中文字幕| 看欧美日韩国产| 欧美一区高清| 一本色道久久亚洲综合精品蜜桃 | 蜜桃av一区二区| a天堂视频在线观看| 综合电影一区二区三区| 国产精品视频一区在线观看| 日韩视频在线观看一区二区| jzzjzzjzz亚洲成熟少妇| 久久久欧美一区二区| 精品一区二区三区四区五区| 欧美综合激情| 香蕉精品999视频一区二区| 蜜桃视频无码区在线观看| 欧美韩国日本不卡| 免费看毛片网站| 亚洲成人av片| 欧美人与禽猛交乱配| 成人黄色生活片| 色综合天天爱| 黄色aaa级片| 国产日产欧美一区二区三区| 日韩男人的天堂| 精品久久人人做人人爱| 爆操欧美美女| 91精品啪aⅴ在线观看国产| 欧美在线色图| 成人性生生活性生交12| 26uuu国产日韩综合| 不卡的免费av| 精品第一国产综合精品aⅴ| 最近中文字幕免费mv2018在线| 国产精品爽黄69| 成人同人动漫免费观看| 成人性生生活性生交12| 国产亚洲福利社区一区| 日本中文字幕在线| 亚洲欧美自拍一区| 韩国久久久久久| 色之综合天天综合色天天棕色| 久久高清国产| 成人性生交大免费看| 黑人巨大精品欧美一区免费视频| 色欲av永久无码精品无码蜜桃| 久久久在线免费观看| 精品中国亚洲| 男人操女人逼免费视频| 97精品视频在线观看自产线路二| 日本va欧美va国产激情| 亚洲国产精品久久久久秋霞蜜臀| 波多野结衣中文字幕久久| 国产精品av一区| 先锋影音久久| 九一在线免费观看| 91精品欧美综合在线观看最新| 超鹏97在线| 国产女主播一区二区| 亚洲免费播放| 中文字幕网站在线观看| 精品视频免费在线| 大地资源网3页在线观看| 亚洲自拍偷拍网址| 亚洲黑丝一区二区| 人妻体内射精一区二区| 欧美性三三影院| caoporn免费在线| 国外成人在线视频网站| 久久精品麻豆| 婷婷综合在线视频| 日韩欧美一区二区久久婷婷| av成人影院在线| 日韩欧美在线电影| 国产制服丝袜一区| 久久精品国产亚洲av高清色欲 | 农村老熟妇乱子伦视频| 日韩午夜小视频| 亚洲最大网站| 黄色一级片网址| 91在线视频观看| 一级片一区二区三区| 久久久久久久久久婷婷| 国产剧情一区| 国产资源中文字幕| 欧美午夜影院在线视频| 日本在线看片免费人成视1000| 成人激情直播| 免费看欧美美女黄的网站| 久久精品免费av| 色琪琪综合男人的天堂aⅴ视频| 99久久免费精品国产72精品九九| 日本精品www| 亚洲激情综合网| 国产永久免费高清在线观看| 亚洲综合av影视| 日韩精品午夜视频| 日本熟妇色xxxxx日本免费看| 主播福利视频一区| 天天躁日日躁狠狠躁欧美巨大小说| 欧美大片久久久| 日本韩国一区二区三区视频| 日韩另类在线| 亚欧精品在线|