精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

騰訊燈塔融合引擎的設計與實踐

大數據
本次分享的主題是騰訊燈塔融合引擎的設計與實踐,騰訊燈塔是一款端到端的全鏈路數據產品套件,旨在幫助產品、研發、運營和數據科學團隊 30 分鐘內做出更可信及時的決策,促進用戶增長和留存。

一、背景介紹

騰訊燈塔是一款端到端的全鏈路數據產品套件,旨在幫助產品、研發、運營和數據科學團隊 30 分鐘內做出更可信及時的決策,促進用戶增長和留存。

圖片

2020 年后數據量仍然呈爆炸性增長的趨勢,且業務變化更加迅速、分析需求更加復雜,傳統的模式無法投入更多的時間來規劃數據模型。我們面臨一個海量、實時和自定義的三角難題。不同引擎都在致力于去解決這個問題。谷歌等博客中曾提到,也是我們很認可的一個觀點是以卓越的性能可直接訪問明細數據(ODS/DWD)成為下一代計算引擎的必然趨勢。

圖片

下圖展示了燈塔融合分析引擎的整體技術架構:

圖片

左側對接應用系統,包括燈塔自己提供的分析模型、可視化方案和一些 API 請求;右側為融合分析引擎,包括查詢引擎層、計算層、物化存儲層、存儲層分析策略中心和產品化中心。

  • 服務層,包括查詢、接收以及治理,比如任務級別的緩存攔截等服務相關功能。
  • 計算層,不同于其他公司的自研方案,我們是在開源能力之上做增強和整合,來滿足不同場景的需求。
  • 物化存儲層,其中包含了我們構建現代物化視圖的解決方案,實現了基于 Alluxio 的塊級別緩存池,以及針對 BI 場景基于 Clickhouse 的抽取加速方案。
  • 存儲層,對接了多種存儲引擎,包括托管給燈塔的存儲層和非托管的存儲層,即業務方自己的數據。 
  • 分析策略中心,位于上述四層之上。主要負責業務方查詢的工作負載中的治理和理解執行的整體鏈路。從一個任務開始執行,到執行計劃的各個階段的計算的資源消耗、存儲的消耗、效率等表征作統一存儲,并基于這些明細的數據抽出來一些衍生的指標,以推動任務優化,比如物化模型的構建和 SQL 自動優化,旨在端到端地解決這些問題。
  • 產品化中心,除了燈塔產品套件整體作為產品對外輸出以外,融合分析引擎也可以單獨作為產品對外輸出。

二、挑戰與融合分析引擎的解法?

回到前文提到的挑戰,即以卓越的性能直接訪問明細數據,我們會從融合、內核優化和加速三個方面發力。

1、融合

同類產品的思路多為一體化,而本文的思路是取長補短,博采眾長,融合開源社區的能力實現 1+1>2 的效果。

① 多源融合前端 

前端聚焦于提供集中化的 SQL 解析、優化和執行計劃生成。它更多的承擔的是對各個底層的理解以做出更優邏輯執行計劃的角色。

前端是基于 Calcite 的兩段式。第一段為常規操作,一個 SQL 要經過 Parse、Validate、Optimizer、Planner,通過自建的統一元數據管理中心來提供了運行時的Catalog和統計信息以輔助生成更優的執行計劃;第二段為不同引擎的融合,提供統一的對外接口且進行一些定制化的增強。

圖片

② 融合后端?

前端主要解決的是 SQL 解析和執行計劃的生成優化,融合后端真正解決計算層面融合。

RDBMS面臨算力、內存不足,無法提高計算并行度;Clickhouse 數據源面臨復雜查詢效率低等問題。

針對上述問題分別有以下解決方案:

  • 通用 MPP 引擎(Presto\Impala)加上高性能 connector。
  • 增強版 JDBC Connection,基于Mysql表模型對 Split Providers 進行自適應的優化,將單個 Table Scan 轉換為多個 Table Scan 以提升計算效率。
  • 針對 Clickhouse 數據源會將分布式表運算改為基于本地表運算。
  • 對 Projection、Aggregation、Predicate 操作進行下推。

圖片

③  WLM(Workload Management)?

前端和后端解決的是多個引擎如何融合和配合的問題,除此之外是端到端的分析策略中心的實現。裸用開源引擎存在以下問題:

  • 引擎 Profile 指標無持久化,單點分析粒度太細,無法對租戶整體進行洞察;
  • 對運維人員要求高,需要足夠的工作負載的洞察與優化的能力。

本設計的解決方案是通過自研的WLM(Workload Management),自動化收集不同引擎的 Query Profile 并結合歷史查詢給出基于專家經驗給出優化建議,在策略中心基于優化建議自動設置 Query Options、Hints 等優化配置。

通過一系列的規則探查到這個 SQL 會存在大量的 Shuffle,會導致占用了大量的內存和網絡資源。該裝置會注入一些 Query Options 和 Hints,比如把它的 broadcast 換成 shuffle join,對于一些 CPU 優化器完成不了的事情基于我們的策略做一個自動優化,等 SQL 再進來就會有比較好的規劃。

圖片

2、內核優化

在商業場景下經常會遇到很消耗資源量的大查詢,如何能夠在運行時識別和隔離大查詢成為一個挑戰。 

查詢在運行前是無法斷定其查詢對資源的影響的,比如兩表 JION 后笛卡爾積的導致其輸出有上萬億記錄數的規模。于是本引擎在收集監控運行時的指標參數,結合負載中心的優化建議,自動設置優化參數,以使得查詢更高效的運行;對于無法優化且識別對資源使用有嚴重影響的查詢,會進行攔截,及時止損。

圖片

① Impala?

Impala 面臨的一個挑戰是如何充分利用計算引擎的索引加速。

  • 引擎 IO 調度內核優化,比如局部性的同文件多 DataRange 排序;通過調整權重以實現大查詢 IO 懲罰,因為有些場景更多想保小查詢,將大查詢放到慢車道。
  • 存儲特性價值發揮-索引(Pageindex、Zorder、Hillbert)。要高效查詢原始數據,就需要利用好原始數據中的索引,比如 Parquet 中的數據頁 Page Index,可以結合原始存儲數據中的索引信息,在運行時進行數據過濾。如果要達到很高的效率,往往不是算法本身,而是底層的數據分布。比如一個謂詞的列都是隨機分布,那么一個值分布在每個數據頁,就無法進行跳過,我們會通過負載中心查看歷史查詢去優化 Zorder 或者 Hillbert 索引。

圖片

② Presto

云架構 Presto 在大規模集群下如何保持高效的 Scalabaility Coordinator 單點問題是一個公認的挑戰,這部分優化并非我們獨創,而是業界的一個 feature。

第一種方案是 Coordinator HA 方案,但其并沒有從根源解決問題,一旦 Active 節點失活,過不久 stand by 節點也會掛掉。

第二種方案是多 Cluster 聯邦方案,部署多個集群,通過 Presto Gateway 路由不同的集群。但是路由策略管理是一個很大的難點,如果路由策略不當會帶來嚴重的資源碎片化。

第三種方案是 Disaggregated Coordinator 方案,引入了 ResouceManager 聚合分布式資源狀態,每個 RM 內存中維護一份狀態數據,RM 之間通過心跳達成狀態數據的最終一致。Coordinator 可以正常的 Parse、Validate、Plan,準入時 RM 統一獲取資源視圖,判斷是執行還是等待等狀態。

圖片

③ Kudu?

這是一個不常見的問題,在一個運行很久的大集群,有一臺機器要裁撤,由于大集群長時間運行元信息負債嚴重,導致 Tablet Server 無法優雅下線(需要重啟 master),耗時可能高達幾小時。

在一次實際生產 Case 中,幾十萬 Tablet,占用內存 50G 以上,Master 啟動和Leader 切換都非慢。經排查,集群一直在加載元數據,并發現以前刪除的表和數據集群還在維護。通過源碼級別的增強,Master 內存消耗降低 10 倍。

圖片


3、加速

考慮到集群的算力和引擎本身的瓶頸上限,除了融合和內核優化,我們還需要做各種各樣的加速手段。

除了引擎優化,Databrick 商業版的 OLAP 引擎添加了緩存層和索引層;Snowflake 支持了物化視圖的能力;Google 的 BigQuery 提供了多級緩存,以進一步的加速。緩存、計算優化、索引與數據分布、物化、云化是業界的主攻方向,本次分享主要介紹三種手段。

圖片

① 緩存?

實際場景中經常會遇到重復的查詢,我們需要解決如何通過多級緩存機制避免“硬查”集群,加速“SQL 內”的數據掃描性能。該引擎的緩存設計借鑒了 Databrick 的內核緩存、Snowflake 的數倉緩存的緩存設計理念,研發了預計算與多級緩存的技術。

  • 預計算(固定圖卡):通過“增量緩存”只刷最新天數據,避免大量數據掃描
  • 統一緩存(重復查詢判+非固定圖卡緩存):深耕 Calcite 源碼,基于 SQL 常量折疊(變更檢測)、SQL改寫、SQL規則判斷。
  • 內核緩存(大 SQL 內存緩存):通過遠程告訴緩存+SQL磁盤溢寫緩存(Alluxio),加速大查詢,減輕 HDFS IO 壓力。
  • Alluxio(HDFS 熱數據緩存->SSD):通過對歷史 SQL 性能數據分析,緩存熱表(如大左表)。

圖片

② BI Engine?

由于 BI 場景不用其他的查詢分析場景,BI 場景下的看板對出數的時延要求很高,所以需要 BI 場景進行了特殊的優化。借鑒以 BigQuery 為例,它是有一塊單獨的內存池,它會根據歷史查詢判斷出熱數據并以列式的緩存下來。該引擎除了使用到上述的默認策略,還會添加一個 Clickhouse 的緩存層,基于歷史記錄判斷那些數據是可加速并透明的將可加速的表移動到 Clickhouse 中作為緩存數據。這一整套策略可以讓億級數據運行至毫秒級。

圖片

③ 現代的物化視圖?

如何更高效利用好物化視圖面臨著三個問題:如何達到用最少成本達到最高性能;如何低成本維護好物化視圖;查詢時,在不改變查詢語句的前提下如何將查詢路由到不同的物化視圖? 現代物化視圖就是在致力于解決上述三個問題。

  • 如何達到用最少成本達到最高性能? 一般方案是做一些領域專家模型。但是對于這樣一個平臺化的產品是無法做到這一點的, 因為業務方才是最了解業務的。所以該產品可以依賴端到端的負載中心去歷史查詢記錄來找到最大的公共子查詢來自動的實現物化視圖。同時,還會做一些其他的優化,比如添加相應的索引或者 Zorder\hillbert 排序。
  • 如何低成本維護好物化視圖? 增量刷新物化視圖,并通過負載中心來分析歷史查詢物化視圖是否起到加速的效果,刪除加速效果較差的物化視圖。
  • 查詢時,在不改變查詢語句的前提下如何將查詢路由到不同的物化視圖?  通過基于 Calcite 的自動改寫功能,用戶不需要修改原有的 SQL 語句,SQL 會透明地路由到不同的物化視圖。

圖片

三、實踐總結?

燈塔融合分析引擎,在 SQL、計算和存儲三個技術領域,做了很多的技術創新和沉淀。下圖列出了重要的優化點。

圖片

四、未來演進方向

我們未來將繼續致力于從融合、內核優化和加速三個方向,解決“以卓越性能直接訪問數據”的問題。

圖片

今天的分享就到這里,謝謝大家。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2022-04-29 10:53:37

計算實踐方案

2024-02-01 08:00:00

百川大模型角色大模型

2021-09-15 12:04:58

人工智能新基建智算中心

2021-06-07 09:33:21

企業架構驅動

2022-09-12 07:17:20

redis命令redissynce

2024-09-11 08:10:46

2023-08-02 18:48:23

Flowable工作流引擎

2024-02-19 08:12:15

DIKW 模型指標系統數據倉庫

2023-12-18 08:44:54

Dragonfly基座引擎引擎框架

2021-08-06 15:06:09

騰訊開源Apache

2022-08-19 18:15:04

視頻會議音頻質量噪聲

2024-11-25 08:20:22

2023-02-20 13:45:31

數據分析騰訊 Alluxio

2021-11-03 14:05:51

騰訊云產業互聯網

2017-10-20 08:25:10

數據收集工具數據源

2017-03-15 15:45:33

MySQL存儲引擎設計與實現

2025-09-12 15:50:54

2022-07-08 09:26:45

Flink快手計算

2023-10-09 18:35:37

得物Redis架構
點贊
收藏

51CTO技術棧公眾號

色呦呦在线播放| 午夜一区二区三区四区| 成人av激情人伦小说| 午夜精品视频在线观看| 久久综合中文色婷婷| 99re热视频| 91精品电影| 亚洲国产成人精品久久久国产成人一区| 日韩av一二三四区| 九七久久人人| 26uuu精品一区二区| 国产日韩欧美日韩大片| 国产第一页第二页| 日韩成人精品一区二区| 欧美成人伊人久久综合网| 亚洲国产精品久久久久婷蜜芽| 在线观看完整版免费| 成人av网站免费观看| 国产精品一二区| 国产精品18p| 国产精品99视频| 日韩成人在线视频| 欧美视频国产视频| 在线天堂新版最新版在线8| 亚洲日本丝袜连裤袜办公室| 免费成人看片网址| 亚洲AV无码一区二区三区少妇| 污视频免费在线观看| 成人vr资源| 亚洲精品在线电影| 久久久久久综合网| 电影亚洲精品噜噜在线观看| 亚洲一区二区av电影| 小说区图片区图片区另类灬| 天天操天天爱天天干| 黄色日韩网站视频| 国产精品成人av在线| 九九热国产视频| 一二三区不卡| www.xxxx欧美| 免费一级黄色录像| 一道在线中文一区二区三区| 精品国产一区二区在线观看| caoporm在线视频| 欧美极品免费| 欧美日韩精品二区| 日韩网站在线免费观看| 日韩伦理电影网站| 亚洲免费在线播放| 五月天男人天堂| av一区在线观看| 日本一二三不卡| 日本一区高清在线视频| 久久经典视频| 2020国产精品| 欧美高清性xxxxhd| 五月婷婷丁香网| www.av精品| 国内一区在线| 色欲av永久无码精品无码蜜桃| 国产精品一二三区在线| 91在线视频一区| 国产美女主播在线观看| 国产自产v一区二区三区c| 国产在线999| 91国内精品视频| 国产在线播精品第三| 91久久精品国产91久久| 国产色视频在线| 国产成人午夜99999| 成人激情直播| 日本中文字幕在线2020| 久久免费激情视频| 日韩伦理一区| 不卡毛片在线看| 国产av无码专区亚洲av毛网站| 亚洲有吗中文字幕| 久久久久久久国产精品视频| 日本一级淫片色费放| 亚洲免费综合| 国产精品高潮呻吟久久av无限| 中文字幕在线观看第二页| 精品一区二区三区免费| 97se国产在线视频| 午夜成人鲁丝片午夜精品| 久久久久久日产精品| 色中色综合成人| 国内精品久久久久久野外| 亚洲在线成人精品| 黑人糟蹋人妻hd中文字幕| 粉嫩一区二区三区| 日韩一区二区电影网| 国产人妖在线观看| 欧美人与拘性视交免费看| 日韩在线精品视频| 国产在线成人精品午夜| 另类天堂av| 91精品视频一区| 人妻无码中文字幕| 国产欧美日本一区视频| 久久福利一区二区| 日韩制服诱惑| 精品国产sm最大网站| 国产jk精品白丝av在线观看| 中文字幕一区二区三三| 欧美在线性视频| 国产精品天天操| 99re热这里只有精品免费视频| 亚洲国产精品一区二区第四页av| 日本中文字幕中出在线| 91久久精品网| 中文字幕在线国产| 久久综合国产| 欧美一区第一页| 国产情侣自拍小视频| 久久毛片高清国产| 97碰在线视频| 在线高清欧美| 亚洲男人的天堂网站| 国产精品久久一区主播| 欧美日韩一二三四区| 久久99国产精品久久99果冻传媒| 精品久久久久久综合日本| 国产美女在线观看| 91成人在线精品| 久久久久亚洲无码| 欧美a级片网站| 国产日韩欧美另类| av资源网在线观看| 欧美日韩一区二区在线| 成人三级做爰av| 国产精品久久久乱弄| 国产精品第一区| 日韩av免费观影| 亚洲成人资源网| 韩国三级hd中文字幕有哪些| 久久亚洲成人| 国产精品成久久久久三级| 日韩电影免费| 精品人伦一区二区三区蜜桃免费| 97超碰免费在线观看| 国产精品毛片久久| 91精品久久久久久久久久入口| 户外极限露出调教在线视频| 亚洲成av人片| 手机免费看av片| 韩国自拍一区| 国产成人亚洲欧美| 美女精品导航| 精品动漫一区二区三区在线观看 | 国产丶欧美丶日本不卡视频| 一本一本a久久| 成人全视频在线观看在线播放高清| 亚洲免费视频网站| 日本中文字幕第一页| 91亚洲大成网污www| 欧美日韩成人免费视频| 精品淫伦v久久水蜜桃| 久久久久久久一区二区| 蜜桃av中文字幕| 天天综合网天天综合色| 97伦伦午夜电影理伦片| 日韩av一二三| 在线一区高清| 视频在线观看免费影院欧美meiju| 欧美成人精品在线| 黄色一级大片在线免费看国产| 夜夜操天天操亚洲| 性欧美丰满熟妇xxxx性久久久| 日韩精品一区二区亚洲av性色| 亚洲精品一级| 欧美大陆一区二区| 日本成人福利| 久久亚洲成人精品| 亚洲乱码国产乱码精品精软件| 香蕉av福利精品导航| 播金莲一级淫片aaaaaaa| 日本午夜精品视频在线观看| 一区二区冒白浆视频| 日韩在线观看一区二区三区| 久久久久久久久中文字幕| 欧美高清电影在线| 欧美人与性动xxxx| 久久一区二区三| 久久久久国产精品麻豆| 成人黄色一级大片| 激情文学一区| 日韩免费电影一区二区| 国产精品777777在线播放| 久久久免费电影| 天堂在线中文字幕| 69久久99精品久久久久婷婷| 国产精品99精品无码视| 欧美经典一区二区三区| 亚洲综合中文网| 性8sex亚洲区入口| 永久免费看av| 国产精品一区二区三区av麻| 91欧美激情另类亚洲| 亚洲最新无码中文字幕久久| 久久精品中文字幕电影| 飘雪影视在线观看免费观看| 欧美一级二级三级乱码| 久久久久久在线观看| 亚洲精品成人在线| 日韩女同一区二区三区| www.亚洲色图.com| 日韩欧美亚洲另类| 久久婷婷av| 黄页网站在线观看视频| 91精品1区| 日韩精品成人一区二区在线观看| 99re8这里有精品热视频8在线 | 成人在线观看免费播放| 久久久久亚洲精品| 国产在线高清视频| 中文字幕日韩av电影| 亚洲三区在线播放| 日韩久久久精品| 亚洲专区在线播放| 色国产精品一区在线观看| 国产一级淫片a| 亚洲男人的天堂在线观看| 国产精品久久久对白| 久久午夜鲁丝片| 亚洲综合免费观看高清完整版 | 亚洲伦理在线精品| 亚洲毛片亚洲毛片亚洲毛片| 91丝袜高跟美女视频| 国产精久久久久| 国产一区二区三区高清播放| 午夜在线观看av| 日韩精品欧美成人高清一区二区| 日本xxxxxxxxxx75| 欧美日韩国产一区精品一区| 亚洲综合激情五月| 欧美电影三区| 亚洲欧美国产精品桃花| 精品日韩欧美一区| 欧美日韩在线不卡一区| 亚洲精品推荐| 九9re精品视频在线观看re6| 国产精品久久久网站| 国产精品久久久对白| 国产三级精品三级在线观看国产| 91免费观看| 超碰97久久| 国产精品久久波多野结衣| 一区二区三区在线资源| av在线亚洲男人的天堂| baoyu135国产精品免费| 豆国产97在线| 国产精品宾馆| 久久久精品动漫| 美日韩中文字幕| 欧美精品久久久| 超碰成人久久| 正义之心1992免费观看全集完整版| 色琪琪久久se色| 欧美精品一区二区性色a+v| 一区二区不卡| 99在线免费视频观看| 99在线热播精品免费99热| 激情综合在线观看| 久热精品在线| 不卡的在线视频| 国产一区二区三区免费| 亚洲高清av一区二区三区| 国产电影精品久久禁18| 免费a v网站| 久久亚洲二区三区| 青青草自拍偷拍| 亚洲精品国产第一综合99久久| 国产精品 欧美 日韩| 欧美日韩黄色大片| 中文字幕视频二区| 日韩三级高清在线| 熟妇人妻av无码一区二区三区| 亚洲人av在线影院| 日本中文在线观看| 久久久久久12| 手机看片久久| 成人免费网视频| 久久久精品国产sm调教| 国产麻豆9l精品三级站| 插我舔内射18免费视频| 国产欧美精品一区二区色综合朱莉| 中国一级片在线观看| 午夜精品123| 在线免费观看视频网站| 精品人在线二区三区| 黄色毛片在线观看| 欧美美女15p| 综合在线影院| 国产精品一 二 三| 大色综合视频网站在线播放| 成人免费观看在线| 蜜臀久久99精品久久久久久9| 午夜视频在线免费看| 国产女人18毛片水真多成人如厕| 欧美被狂躁喷白浆精品| 一本久道中文字幕精品亚洲嫩| 国产露脸91国语对白| 日韩成人高清在线| bt在线麻豆视频| 日本久久久久久| 日韩精品一级| 亚洲高清资源综合久久精品| 在线免费高清一区二区三区| 啊啊啊国产视频| 成人黄页在线观看| 少妇高潮一区二区三区喷水| 欧美日韩在线免费| 国产黄色美女视频| 色av吧综合网| 亚洲精品永久免费视频| 波多野结衣成人在线| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 亚洲高清123| 久久99伊人| 国产在线不卡av| 亚洲精品国产成人久久av盗摄| 亚洲中文一区二区三区| 亚洲乱码一区二区| 91九色国产在线播放| 亚洲最大av在线| 久久影视一区| 91香蕉视频污版| 久久综合久久综合亚洲| 日本一区二区免费在线观看| 欧美一级二级在线观看| 浪潮av一区| 成人免费福利在线| 手机在线一区二区三区| 男人女人黄一级| 久久精品夜色噜噜亚洲a∨| 日韩 欧美 中文| 亚洲第一区在线| 欧美xxxxhdvideosex| av成人午夜| 欧美日韩理论| 色综合久久久无码中文字幕波多| 亚洲欧美偷拍三级| 国产成人精品毛片| 久久中文字幕国产| 精品国产一级| 黄色网址在线免费看| 国产尤物一区二区| 精品自拍偷拍视频| 精品国产亚洲一区二区在线观看 | 日韩视频免费在线播放| 91视频一区二区| 精品国产xxx| 亚洲人成电影网站色www| 伊人久久在线| 日韩欧美第二区在线观看| 日韩av高清在线观看| 99久久99久久精品免费| 欧美日韩国产美女| 永久免费在线观看视频| 成人免费福利视频| 欧美日韩99| 野花社区视频在线观看| 欧美性猛交99久久久久99按摩| 黄色片在线播放| 成人黄色免费看| 黄页网站一区| 亚洲天堂网一区二区| 欧美性生活大片视频| 日本福利在线| 99国产在线视频| 羞羞答答国产精品www一本| 男人舔女人下部高潮全视频| 欧美日韩一区视频| 18av在线播放| 九九九九九九精品| 奇米一区二区三区| 久草成人在线视频| 亚洲免费人成在线视频观看| 日韩综合av| 日韩xxxx视频| 国产日韩欧美综合在线| 国产一区二区在线视频聊天| 欧美国产乱视频| 美日韩中文字幕| 国产又粗又猛大又黄又爽| 精品色蜜蜜精品视频在线观看| 国产黄色在线| 产国精品偷在线| 日韩一区欧美二区| 九九视频免费在线观看| 国产偷亚洲偷欧美偷精品| 亚洲午夜国产成人| 男人日女人逼逼| 亚洲视频香蕉人妖| 欧美 日韩 人妻 高清 中文| 国产精品美女午夜av| 黄色国产精品| 欧美波霸videosex极品| 日韩免费高清av|