精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節跳動開源自研 Shuffle 框架——Cloud Shuffle Service

原創 精選
開源
字節跳動宣布,正式開源 Cloud Shuffle Service。目前,CSS 已在 Github 上開源,歡迎感興趣的同學一起參與共建!
今天,字節跳動宣布,正式開源 Cloud Shuffle Service。

Cloud Shuffle Service(以下簡稱CSS) 是字節自研的通用 Remote Shuffle Service 框架,支持 Spark/FlinkBatch/MapReduce 等計算引擎,提供了相比原生方案穩定性更好、性能更高、更彈性的數據 Shuffle 能力,同時也為存算分離/在離線混部等場景提供了 Remote Shuffle 解決方案。

目前,CSS 已在 Github 上開源,歡迎感興趣的同學一起參與共建!

項目地址:

https://github.com/bytedance/CloudShuffleService

開源背景

在大數據計算引擎中,Pull-Based Sort Shuffle 是一種常見的 Shuffle 方案,比如 Spark/MapReduce/FlinkBatch (高于1.15版本)等都將 Sort Shuffle 作為引擎默認方案,但是 Sort Shuffle 實現機制有一定的缺陷,在大規模生產環境下經常因為 Shuffle 問題影響作業穩定性。

以 Spark 的 Sort Shuffle 為例:

圖片

如上圖所示鏈路,Sort Shuffle 會存在以下一些問題:

  • 將多個 Spill 文件合并成一個文件,會額外消耗讀寫 IO;

假設有 m 個 MapTask & n 個 ReduceTask,會產生 m*n 個網絡鏈接,當數量特別多時:

  • 大量的網絡請求會導致 Shuffle Service 容易形成積壓;
  • Shuffle Service 會產生大量的隨機讀取,容易導致 IO 瓶頸,特別是 HDD 集群;
  • Shuffle Service 無法做到 Application 的資源隔離,當有一個異常作業時,可能會影響同一個 Shuffle Service 節點上其它所有作業,問題容易放大;
  • MapTask 生成的 Shuffle Data File 只存儲一份到本地,當磁盤壞了也會導致數據丟失,同樣引起 FetchFailed 問題;
  • Shuffle Data File 寫到本地磁盤的方式,依賴計算節點上的磁盤,無法做到存算分離

這些都很容易導致 ShuffleRead 慢或者超時,引起 FetchFailed 相關錯誤,嚴重影響線上作業的穩定性,ShuffleRead 慢也會大大降低資源利用率(CPU&Memory),同時 FetchFailed 也會導致 Stage 中相關 Task 重算,浪費大量資源,拖慢整個集群作業運行;無法存算分離的架構,在在離線混部(在線資源磁盤不足)/Serverless 云原生等場景下,也很難滿足要求。字節跳動使用 Spark 作為主要的離線大數據處理引擎,每天線上運行作業數過百萬,日均 Shuffle 量 300+PB。在 HDFS 混部&在離線混部等場景,Spark 作業的穩定性經常無法得到保障,影響業務 SLA:

  • 受限 HDD 磁盤 IO 能力/磁盤壞等情況,導致大量的 Shuffle FetchFailed 引起的作業慢/失敗/Stage 重算等問題,影響穩定性&資源利用率
  • External Shuffle Service (以下簡稱ESS)  存算無法分離,遇到磁盤容量低的機器經常出現磁盤打滿影響作業運行

在此背景下,字節跳動自研了 CSS,用來解決 Spark 原生 ESS 方案的痛點問題。自 CSS 在內部上線一年半以來,當前線上節點數 1500+,日均 Shuffle 量 20+PB,大大提高了 Spark 作業的 Shuffle 穩定性,保障了業務的 SLA。

Cloud Shuffle Service 介紹

CSS 是字節自研的 Push-Based Shuffle Service,所有 MapTask 通過 Push 的方式將同一個 Partition 的 Shuffle 數據發送給同一個 CSS Worker 節點進行存儲,ReduceTask 直接從該節點通過 CSS Worker 順序讀取該 Partition 的數據,相對于 ESS 的隨機讀取,順序讀的 IO 效率大大提升。

CSS 架構

圖片Cloud Shuffle Service(CSS) 架構圖CSS Cluster 是獨立部署的 Shuffle Service 服務,主要涉及的組件為:

CSS Worker

CSS Worker 啟動后會向 ZooKeeper 節點注冊節點信息,它提供 Push/Fetch 兩種服務請求,Push 服務接受來自 MapTask 的 Push 數據請求,并將同一個 Partition 的數據寫到同一個文件;Fetch 服務接受來自 ReduceTask 的 Fetch 數據請求,讀取對應 Partition 數據文件返回;CSS Worker還負責 Shuffle 數據清理的工作,當 Driver 進行 UnregisterShuffle 請求刪除 ZooKeeper 對應 ShuffleId 的 Znode 時,或者 Application 結束刪除 ZooKeeper 中 ApplicationId 的 Znode 時,CSS Workers 會 Watch 相關事件對 Shuffle 數據進行清理。

CSS Master

作業啟動后會在 Spark Driver 中啟動 CSS Master,CSS Master 會從 ZooKeeper 中獲取到 CSS Worker 的節點列表,然后為后續 MapTask 產生的各個 Partition 分配 n 個副本(默認為2)的 CSS Worker 節點,并對這些 Meta 信息進行管理,供 ReduceTask 獲取 PartitionId 所在的 CSS Worker 節點進行拉取,同時在 RegisterShuffle/UnregisterShuffle 過程中會在 ZooKeeper 中創建對應的 ApplicationId/ShuffleId 的 Znode,CSS Worker 會 Watch Delete 事件對 Shuffle 數據進行清理。

ZooKeeper

如前描述,用來存儲 CSS Worker 節點信息以及 ShuffleId 等信息。

CSS 特性

多引擎支持

CSS除了支持 Spark(2.x&3.x) 之外,也可以接入其他引擎,目前在字節跳動內部,CSS 還接入了 MapReduce/FlinkBatch 引擎。

PartitionGroup 支持

為了解決單個 Partition 太小,Push 效率比較低的問題,實際會將多個連續的 Partition 組合成更大的 PartitionGroup進行 Push。

高效統一的內存管理

跟 ESS 類似,MapTask 中的 CSS Buffer 將所有 Partition 的數據都存儲在一起,在 Spill 之前會對數據按照 PartitionId 進行排序,然后按照 PartitionGroup 維度進行數據推送;同時 CSS Buffer 完全納入 Spark 的 UnifiedMemoryManager 內存管理體系,內存相關參數由 Spark 統一管理。

容錯處理

Push 失敗:當觸發 Spill 進行 Push PartitionGroup 數據時,每次 Push 的數據大小為 4MB(一個Batch),當某次 Push batch 失敗時,并不影響之前已經 Push 成功的數據,只需要重新分配節點(Reallocate)繼續 Push 當前失敗的數據以及后續還未 Push 的數據,后續 ReduceTask 會從新老節點讀取完整的 Partition 數據;多副本存儲:ReduceTask 從 CSS Worker 讀取某個 Partition 數據是按照 Batch 粒度進行拉取的,當 CSS Worker 異常(如網絡問題/磁盤壞等)導致無法獲取該 Batch 數據,可以繼續選擇另外一個副本節點繼續讀取該 Batch 以及后續 Batch 的數據;數據去重:當作業開啟 Speculative 推測執行會有多個 AttempTask 并發跑,需要在讀取的時候進行去重。在 Push Batch 的時候,會給 Batch 數據加上 Header 信息,Header 信息中包含  MapId + AttempId + BatchId 等信息,ReduceTask 讀取時可以根據這些 ID 信息進行去重。

Adaptive Query Execution(AQE) 適配

CSS 完整支持 AQE 相關的功能,包括動態調整 Reduce 個數/ SkewJoin 優化/Join 策略優化。對于SkewJoin,CSS做了更多的適配優化工作,解決了 Skew Partition 數據被多個 ReduceTask 重復讀取問題,大大提高了性能。

CSS 性能測試

我們將 CSS 與開源的 ESS 使用獨占 Label 計算資源進行 1TB 的 TPC-DS Benchmark 測試對比,整體端到端的性能提升15%左右,部分 Query 有30%以上的性能提升。同時我們也使用線上混部資源隊列(ESS 穩定較差)進行 1TB 的 TPC-DS Benchmark 測試對比,整體端到端性能提升4倍左右。

圖片

CSS 1TB 測試提升 30% 以上的 Query

未來規劃

CSS 目前開源了部分 Feature,還有一些 Feature & 優化后續會陸續開放:

  • 支持 MapReduce/FlinkBatch 引擎;
  • CSS 集群增加 ClusterManager 服務角色,管理 CSS Worker 的狀態&負載信息,同時將當前 CSS Master 分配 CSS Worker 的功能提到 ClusterManager;
  • 基于異構機器(如磁盤能力不同)/負載 等維度的 CSS Worker 分配策略。
責任編輯:未麗燕 來源: 字節跳動技術團隊
相關推薦

2023-11-20 07:27:00

云原生Spark

2018-06-29 09:01:51

開源技術 深度學習

2022-06-22 06:49:39

Hertz開源HTTP 框架

2022-09-19 10:40:36

deepin開源Unilang

2022-01-17 09:36:20

阿里云小米EMR

2022-05-17 17:18:40

Kite字節跳動微服務框架

2023-10-18 11:56:17

開源AI

2023-04-19 16:51:54

分布式Primus開源

2022-05-09 09:30:06

框架開源模型

2009-12-07 13:50:10

PHP函數shuffl

2022-04-07 16:35:59

PGO 優化profile 數據編譯優化

2022-03-21 17:56:59

大模型訓練訓練框架

2022-03-21 15:06:10

模型字節跳動框架

2021-09-17 13:05:55

模型人工智能框架

2024-11-07 11:46:41

2025-09-15 06:25:00

2022-11-02 10:02:24

BitSail字節跳動數據集成

2020-05-20 10:25:43

華為谷歌開源

2018-06-12 07:15:18

阿里巴巴技術語音識別
點贊
收藏

51CTO技術棧公眾號

亚洲国产精品狼友在线观看| 欧美日韩在线一区二区三区| 高h视频免费观看| 亚洲高清在线一区| 亚洲成人tv网| 日韩国产伦理| 精品久久久久中文慕人妻| 亚洲激情精品| 中文字幕v亚洲ⅴv天堂| 99热这里只有精品2| 极品av在线| 国产精品理论片在线观看| 91精品国产99久久久久久红楼| 久热这里只有精品在线| www.欧美.com| 亚洲视频你懂的| 国产精品国产亚洲精品看不卡15| 中文字幕超碰在线| 91麻豆精品国产91久久久平台| 日韩一区二区电影网| 国产白丝袜美女久久久久| 国产经典自拍视频在线观看| 国产精品888| 国产成人涩涩涩视频在线观看| 黑鬼狂亚洲人videos| 天天久久夜夜| 欧美成va人片在线观看| 亚洲一区二区在线免费观看视频 | 国产在线观看高清视频| 国产精品一区二区久久精品爱涩| 青青久久av北条麻妃海外网| 麻豆视频在线观看| 欧美3p在线观看| 亚洲美女av在线播放| 亚洲av无一区二区三区久久| 国产精品亚洲成在人线| 亚瑟在线精品视频| 9色视频在线观看| 在线免费看黄网站| 久久久久久久久久久电影| 国产一区视频观看| www国产一区| 美洲天堂一区二卡三卡四卡视频 | 最新欧美电影| 午夜电影网一区| 丁香六月激情婷婷| 欧美人与牲禽动交com| 综合激情成人伊人| 一区不卡字幕| 嫩草在线视频| 国产精品福利一区二区| 神马欧美一区二区| 成人三级黄色免费网站| 国产欧美一区二区精品性色| 麻豆亚洲一区| 国产尤物视频在线| 国产欧美一区二区精品久导航 | 日韩精品诱惑一区?区三区| 亚洲欧美日韩第一区| 欧美一区二区三区成人精品| 久本草在线中文字幕亚洲| 精品国精品自拍自在线| 岛国av免费观看| 牲欧美videos精品| 亚洲欧美一区二区三区在线| aaaaa一级片| 亚洲欧美成人vr| 国产午夜精品全部视频播放 | 亚洲欧美日韩在线播放| 自拍偷拍亚洲色图欧美| 在线观看中文| 午夜精品久久一牛影视| 免费在线激情视频| 91tv亚洲精品香蕉国产一区| 欧美日韩视频不卡| 日韩欧美中文在线视频| 中文字幕日韩在线| 日韩大陆欧美高清视频区| 国产男女猛烈无遮挡a片漫画| 亚洲香蕉视频| 日韩在线小视频| 国产免费无码一区二区视频| 亚洲黄色毛片| 国产精品444| 99久久精品国产成人一区二区| 国产一区二区在线观看视频| 国产经典一区二区三区| 色天堂在线视频| 国产精品乱码一区二区三区软件| 免费成人深夜夜行网站视频| sm性调教片在线观看 | 国产一二三四在线视频| 国产精品一区二区精品| 亚洲电影在线看| 日本成人午夜影院| 欧美91大片| 26uuu另类亚洲欧美日本一| 91青青草视频| 国产精品一级黄| 久久久精品动漫| 欧美一区二区三区| 午夜久久久久久久久| 亚洲一区二区三区四区五区xx| 日韩国产在线不卡视频| 亚洲日本中文字幕免费在线不卡| 色欲人妻综合网| 羞羞视频在线观看欧美| 91精品啪aⅴ在线观看国产| 视频污在线观看| 亚洲人精品午夜| 日韩久久一级片| 一区二区日韩| 综合网中文字幕| 日本一级片免费看| 国模大尺度一区二区三区| 久久伊人一区| 丁香高清在线观看完整电影视频| 欧美日韩亚洲丝袜制服| 国产老熟女伦老熟妇露脸| 911精品美国片911久久久 | 无码无套少妇毛多18pxxxx| 国产精品原创巨作av| 四虎影院一区二区三区| 高清视频在线观看三级| 欧美一区二区三区不卡| 免费看一级黄色| 久久天堂成人| 精品久久精品久久| 日韩av官网| 91精品国产综合久久久久久久| 六月婷婷七月丁香| 制服诱惑一区二区| 国产精品青青草| 26uuu亚洲电影在线观看| 欧美三级电影一区| 人成免费在线视频| 丝袜美腿亚洲一区二区图片| 久久青青草综合| 9765激情中文在线| 精品国产99国产精品| 国产精品 欧美激情| 经典三级在线一区| 亚洲欧洲另类精品久久综合| 日本欧美韩国| 亚洲午夜久久久久久久| 亚洲成人av影片| 久久久不卡网国产精品一区| 国产99久久九九精品无码| 国产色噜噜噜91在线精品| 欧美夫妻性生活xx| 丰满人妻一区二区三区四区53 | 中文字幕一级片| 国产欧美日韩在线观看| 国产最新免费视频| 天天久久夜夜| 国产成人久久精品| 色影院视频在线| 91精品免费在线观看| 国产a免费视频| 国产91富婆露脸刺激对白| 高清无码一区二区在线观看吞精| 欧美国产中文高清| 欧美精品国产精品日韩精品| 东京干手机福利视频| 亚洲成人资源网| v8888av| 久久精选视频| 五码日韩精品一区二区三区视频| 国产电影一区二区三区爱妃记| 中文字幕国产精品久久| 国产精品一级视频| 亚洲综合一区在线| 亚洲成人日韩在线| 国产日韩亚洲欧美综合| 夜夜躁日日躁狠狠久久88av| 二区视频在线观看| 福利视频在线播放| 日本国产一区二区| 黄色激情小视频| 国产乱码精品一区二区三区忘忧草| 免费的av在线| 好吊妞国产欧美日韩免费观看网站 | www.com污| 欧美日本二区| 久久精品日韩| 日本久久久久| 欧美激情亚洲自拍| 黄色在线网站| 欧美成人一区二区三区片免费 | 国产日韩久久| 欧美日韩视频免费观看| 精品中文字幕在线2019| 日本一二三区在线视频| 69久久夜色精品国产69蝌蚪网| 日韩激情一区二区三区| 国产日韩av一区| 无人码人妻一区二区三区免费| 亚洲一区二区三区四区五区午夜| 一区二区不卡视频| 欧美黄色影院| 91在线国产电影| 亚洲涩涩在线| 九九视频直播综合网| 亚洲色大成网站www| 91精品在线免费| 麻豆视频在线观看| 国产精品国产三级国产普通话99| 高清中文字幕mv的电影| 美女www一区二区| 精品视频免费在线播放| 亚洲精品成人无限看| 久久久久九九九| 日韩视频在线直播| 国产精品免费网站| 欧美裸体视频| 久久久久女教师免费一区| av色图一区| 精品一区二区三区四区在线| 精品人妻少妇AV无码专区| 欧美日韩一区在线观看| 国产www在线| 亚洲电影一区二区| 欧美精品久久久久久久久46p| 久久精品免视看| www.日本高清| 丁香激情综合五月| 搡的我好爽在线观看免费视频| 青青草一区二区三区| 免费无码不卡视频在线观看| 国产综合色产| 青青视频免费在线观看| 日韩激情在线| 日本一区二区高清视频| 欧美三级电影在线| 国产高清在线一区| 综合成人在线| 91精品久久久久久久久久久| 97人人做人人爽香蕉精品| 日韩av理论片| 日韩精品影院| 日韩免费视频在线观看| 中文字幕在线视频久| 97久久久久久| 日韩av影片| 欧美亚洲国产精品| 国产高潮在线| 午夜精品一区二区三区在线播放| 羞羞视频在线观看免费| 色综合久综合久久综合久鬼88 | 亚洲同性gay激情无套| 国产三级短视频| 国产欧美一区在线| 国产探花视频在线播放| 亚洲国产精品99久久久久久久久 | 一个色在线综合| 久久免费视频精品| 亚洲福利电影网| 在线能看的av| 色欧美乱欧美15图片| 中文在线观看免费高清| 在线不卡免费av| a天堂在线观看视频| 欧美v日韩v国产v| 蜜桃91麻豆精品一二三区| 亚洲精品一线二线三线无人区| 蜜桃av噜噜一区二区三区麻豆| 亚洲国产精品热久久| 欧美美乳在线| 中文字幕在线看视频国产欧美| 亚洲图片88| 欧美乱大交xxxxx| 国产高潮在线| 国产精品吴梦梦| 日本少妇精品亚洲第一区| 国产伦精品一区二区三区视频免费 | 一级片aaaa| 欧美日韩国产色站一区二区三区| 国产又大又粗又长| 精品国产3级a| 免费a在线观看| 日日狠狠久久偷偷四色综合免费| 成年视频在线观看| 91精品成人久久| 懂色aⅴ精品一区二区三区| 91在线观看免费高清完整版在线观看 | 国产伦精品一区二区三区妓女 | 亚洲国产精品热久久| 国产片在线观看| 萌白酱国产一区二区| 国产777精品精品热热热一区二区| 日本精品中文字幕| 国模大尺度视频一区二区| 91视频免费在线观看| 希岛爱理av免费一区二区| 曰韩不卡视频| 国产精品美女久久久| 小早川怜子一区二区三区| 91色porny在线视频| www深夜成人a√在线| 色综合视频在线观看| 国产91视频在线| 亚洲午夜未满十八勿入免费观看全集| 免费av不卡| 日本久久91av| 大型av综合网站| 在线视频欧美一区| 亚洲欧美不卡| 韩国黄色一级片| 中文字幕免费不卡在线| 亚洲精品77777| 欧美一区二区三区免费视频| 国产三级视频在线| 午夜精品久久久久久99热软件| 国产国产一区| 国产精品久久久一区二区三区| 久久精品国产亚洲夜色av网站| 免费看一级大黄情大片| 国产精品一品二品| 波兰性xxxxx极品hd| 色综合久久久网| 亚洲美女福利视频| www.久久久久| 国产精品99久久久久久董美香| 精品国产_亚洲人成在线| 欧美一区二区三区另类| 欧美男女交配视频| 久久久亚洲综合| 成人精品在线看| 精品日韩一区二区三区免费视频| a视频网址在线观看| 日韩av不卡电影| 欧美成人基地| 霍思燕三级露全乳照| 国产福利一区二区三区| 影音先锋男人资源在线观看| 日本福利一区二区| 日韩欧美电影在线观看| 亚州欧美日韩中文视频| 亚洲精选av| 国产一级大片免费看| 国产美女主播视频一区| 亚洲二区在线播放| 欧美丰满美乳xxx高潮www| 婷婷视频在线| 国产精品一区二区三区久久| 欧美色女视频| 欧美伦理片在线看| 国产日产欧产精品推荐色 | 日本91福利区| 日本一二三不卡视频| 欧洲一区在线观看| 成av人电影在线观看| 国产欧美欧洲在线观看| 无需播放器亚洲| 天堂在线精品视频| 亚洲精品一二三四区| 亚洲国产www| 久久人人爽人人爽人人片av高请| 都市激情亚洲欧美| 你懂的av在线| 久久久久久99久久久精品网站| 欧美国产一级片| 日韩亚洲第一页| 免费一级欧美在线大片| 成人在线国产视频| 99久精品国产| 免费黄色片视频| 日韩亚洲成人av在线| 1204国产成人精品视频| 国产 日韩 欧美在线| 久久综合久久综合九色| 亚洲午夜在线播放| 久久久av网站| 久久免费视频66| 免费看a级黄色片| 亚洲三级在线免费| 韩国av电影在线观看| 欧美专区在线视频| 区一区二视频| 91丨porny丨九色| 欧美日韩视频在线| xxxxx日韩| 91在线播放视频| 午夜亚洲伦理| 国产老头老太做爰视频| 亚洲国产成人久久| 亚洲成av在线| 三上悠亚免费在线观看| 91一区二区三区在线观看| 中文在线a天堂| 97视频在线观看网址| 久久国产精品成人免费观看的软件| 色偷偷中文字幕| 欧美日韩视频免费播放| 精品孕妇一区二区三区| 久久99精品久久久久久青青日本| 蜜桃视频在线观看一区二区| 欧美精品一级片| 中文字幕免费国产精品| h视频久久久|