精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

攻破主流數倉缺陷,字節跳動基于Doris的湖倉分析探索實踐

數據庫 新聞
在數倉業務中,隨著業務對數據實時性的要求越來越高,T+1數倉業務逐漸往小時級、分鐘級,甚至秒級演進。

Doris是一種MPP架構的分析型數據庫,主要面向多維分析、數據報表、用戶畫像分析等場景。自帶分析引擎和存儲引擎,支持向量化執行引擎,不依賴其他組件,兼容MySQL協議。

一、Doris簡介

Apache Doris具備以下幾個特點:

1)良好的架構設計,支持高并發低延時的查詢服務,支持高吞吐量的交互式分析。多FE均可對外提供服務,并發增加時,線性擴充FE和BE即可支持高并發的查詢請求。

2)支持批量數據load和流式數據load,支持數據更新。支持Update/Delete語法,unique/aggregate數據模型,支持動態更新數據,實時更新聚合指標。

3)提供了高可用,容錯處理,高擴展的企業級特性。FE Leader錯誤異常,FE Follower秒級切換為新Leader繼續對外提供服務。

4)支持聚合表和物化視圖。多種數據模型,支持aggregate, replace等多種數據模型,支持創建rollup表,支持創建物化視圖。rollup表和物化視圖支持動態更新,無需用戶手動處理。

5)MySQL協議兼容,支持直接使用MySQL客戶端連接,非常易用的數據應用對接。

Doris 由 Frontend(以下簡稱FE)和 Backend(以下簡稱BE)組成,其中FE負責接受用戶請求、編譯、優化、分發執行計劃、元數據管理、BE節點的管理等功能,BE負責執行由FE下發的執行計劃,存儲和管理用戶數據。

圖片

二、數據湖格式Hudi簡介

Hudi是下一代流式數據湖平臺,為數據湖提供了表格式管理的能力,提供事務,ACID,MVCC,數據更新刪除,增量數據讀取等功能。支持Spark、Flink、Presto、Trino等多種計算引擎。

圖片

Hudi根據數據更新時行為不同分為兩種表類型:

圖片

針對Hudi的兩種表格式,存在3種不同的查詢類型:

圖片

三、Doris分析Hudi數據的技術背景

在數倉業務中,隨著業務對數據實時性的要求越來越高,T+1數倉業務逐漸往小時級、分鐘級,甚至秒級演進。實時數倉的應用也越來越廣,也經歷了多個發展階段。目前存在著多種解決方案。

1、Lambda架構

Lambda將數據處理流分為在線分析和離線分析兩條不同的處理路徑,兩條路徑互相獨立,互不影響。

離線分析處理T+1數據,使用Hive/Spark處理大數據量,不可變數據,數據一般存儲在HDFS等系統上。如果遇到數據更新,需要overwrite整張表或整個分區,成本比較高。

在線分析處理實時數據,使用Flink/Spark Streaming處理流式數據,分析處理秒級或分鐘級流式數據,數據保存在Kafka或定期(分鐘級)保存到HDFS中。

該套方案存在以下缺點:

  • 同一套指標可能需要開發兩份代碼來進行在線分析和離線分析,維護復雜。
  • 數據應用查詢指標時可能需要同時查詢離線數據和在線數據,開發復雜。
  • 同時部署批處理和流式計算兩套引擎,運維復雜。
  • 數據更新需要overwrite整張表或分區,成本高。

2、Kappa架構

隨著在線分析業務越來越多,Lambda架構的弊端就越來越明顯,增加一個指標需要在線離線分別開發,維護困難,離線指標可能和在線指標對不齊,部署復雜,組件繁多。于是Kappa架構應運而生。

Kappa架構使用一套架構處理在線數據和離線數據,使用同一套引擎同時處理在線和離線數據,數據存儲在消息隊列上。

Kappa架構也有一定的局限:

  • 流式計算引擎批處理能力較弱,處理大數據量性能較弱。
  • 數據存儲使用消息隊列,消息隊列對數據存儲有有效性限制,歷史數據無法回溯。
  • 數據時序可能亂序,可能對部分在時序要求方面比較嚴格的應用造成數據錯誤。
  • 數據應用需要從消息隊列中取數,需要開發適配接口,開發復雜。

3、基于數據湖的實時數倉

針對Lambda架構和Kappa架構的缺陷,業界基于數據湖開發了Iceberg、Hudi、DeltaLake這些數據湖技術,使得數倉支持ACID、Update/Delete,數據Time Travel、Schema Evolution等特性,使得數倉的時效性從小時級提升到分鐘級,數據更新也支持部分更新,大大提高了數據更新的性能。兼具流式計算的實時性和批計算的吞吐量,支持的是近實時的場景。

以上方案中其中基于數據湖的應用最廣,但數據湖模式無法支撐更高的秒級實時性,也無法直接對外提供數據服務,需要搭建其他的數據服務組件,系統較為復雜。基于此背景下,部分業務開始使用Doris來承接,業務數據分析師需要對Doris與Hudi中的數據進行聯邦分析,此外在Doris對外提供數據服務時既要能查詢Doris中數據,也要能加速查詢離線業務中的數據湖數據,因此我們開發了Doris訪問數據湖Hudi中數據的特性。

四、Doris分析Hudi數據的設計原理

基于以上背景,我們設計了Apache Doris中查詢數據湖格式Hudi數據,因Hudi生態為java語言,而Apache Doris的執行節點BE為C++環境,C++ 無法直接調用Hudi java SDK,針對這一點,我們有四種解決方案。

1)實現Hudi C++ client,在BE中直接調用Hudi C++ client去讀寫Hudi表。

該方案需要完整實現一套Hudi C++ client,開發周期較長,后期Hudi行為變更需要同步修改Hudi C++ client,維護較為困難。

2)BE通過thrift協議發送讀寫請求至Broker,由Broker調用Hudi java client讀取Hudi表。

該方案需要在Broker中增加讀寫Hudi數據的功能,目前Broker定位僅為fs的操作接口,引入Hudi打破了Broker的定位。第二,數據需要在BE和Broker之間傳輸,性能較低。

3)在BE中使用JNI創建JVM,加載Hudi java client去讀寫Hudi表。

該方案需要在BE進程中維護JVM,有JVM調用Hudi java client對Hudi進行讀寫。讀寫邏輯使用Hudi社區java實現,可以維護與社區同步;同時數據在同一個進程中進行處理,性能較高。但需要在BE維護一個JVM,管理較為復雜。

4)使用BE arrow parquet c++ api讀取hudi parquet base file,hudi表中的delta file暫不處理。

該方案可以由BE直接讀取hudi表的parquet文件,性能最高。但當前不支持base file和delta file的合并讀取,因此僅支持COW表Snapshot Queries和MOR表的Read Optimized Queries,不支持Incremental Queries。

綜上,我們選擇方案四,第一期實現了COW表Snapshot Queries和MOR表的Read Optimized Queries,后面聯合Hudi社區開發base file和delta file合并讀取的C++接口。

五、Doris分析Hudi數據的技術實現

Doris中查詢分析Hudi外表使用步驟非常簡單。

1、創建Hudi外表

建表時指定engine為Hudi,同時指定Hudi外表的相關信息,如hive metastore uri,在hive metastore中的database和table名字等。

建表僅僅在Doris的元數據中增加一張表,無任何數據移動。

建表時支持指定全部或部分hudi schema,也支持不指定schema創建hudi外表。指定schema時必須與hiveMetaStore中hudi表的列名,類型一致。

Example:
Plaintext
CREATE TABLE example_db.t_hudi
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);
CREATE TABLE example_db.t_hudi (
column1 int,
column2 string)
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);

2、查詢Hudi外表

查詢Hudi數據表時,FE在analazy階段會查詢元數據獲取到Hudi外表的的hive metastore地址,從Hive metastore中獲取hudi表的schema信息與文件路徑。

  • 獲取hudi表的數據地址。
  • FE規劃fragment增加HudiScanNode。HudiScanNode中獲取Hudi table對應的data file文件列表。
  • 根據Hudi table獲取的data file列表生成scanRange。
  • 下發HudiScan 任務至BE節點。
  • BE節點根據HudiScanNode指定的Hudi外表文件路徑調用native parquet reader進行數據讀取。

圖片

六、后期規劃

目前Apche Doris查詢Hudi表已合入社區,當前已支持COW表的Snapshot Query,支持MOR表的Read Optimized Query。對MOR表的Snapshot Query暫時還未支持,流式場景中的Incremental Query也沒有支持。

后續還有幾項工作需要處理,我們和社區也在積極合作進行中:

  • MOR表的Snapshot Query。MOR表實時讀需要合并讀取Data file與對應的Delta file,BE需要支持Delta file AVRO格式的讀取,需要增加avro的native讀取方式。
  • COW/MOR表的Incremental Query。支持實時業務中的增量讀取。
  • BE讀取Hudi base file和delta file的native接口。目前BE讀取Hudi數據時,僅能讀取data file,使用的是parquet的C++ SDK。后期我們和聯合Hudi社區提供Huid base file和delta file的C++/Rust等語言的讀取接口,在Doris BE中直接使用native接口來查詢Hudi數據。
責任編輯:張燕妮 來源: DataFunTalk
相關推薦

2022-07-18 16:02:10

數據庫實踐

2022-08-22 17:46:56

虛擬數倉Impala

2023-03-27 21:24:18

架構數據處理分析服務

2023-08-15 08:12:12

數倉建模數倉建設

2022-08-21 21:28:32

數據庫實踐

2023-10-13 07:25:50

2022-05-23 13:30:48

數據胡實踐

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink

2024-09-23 08:15:11

2023-10-30 07:25:37

數據湖數據處理

2021-06-07 10:45:16

大數據數據倉庫數據湖

2022-06-24 10:41:53

日志數據

2023-06-28 07:28:36

湖倉騰訊架構

2023-12-14 13:01:00

Hudivivo

2024-06-12 07:30:08

2024-12-16 08:34:13

2024-09-11 14:47:00

2022-12-06 17:52:57

離線數倉治理

2023-05-26 06:45:08

點贊
收藏

51CTO技術棧公眾號

一级一级黄色片| 给我免费观看片在线电影的| 在线视频婷婷| 国产成人午夜视频| 欧美一级bbbbb性bbbb喷潮片| 波多野结衣 在线| 亚洲高清国产拍精品26u| 亚洲精品日韩综合观看成人91| 国产精品久久久久久免费观看| 日本高清不卡码| 婷婷久久国产对白刺激五月99| 欧美xxxx在线观看| 99视频免费播放| 26uuu亚洲电影在线观看| 97se狠狠狠综合亚洲狠狠| 国产精品久久二区| 国产乱码久久久久久| 欧美三级伦理在线| 精品国产凹凸成av人网站| 欧美伦理视频在线观看| 黑人玩欧美人三根一起进| 国产日产欧美一区| 国产精品手机在线| 国产精品欧美亚洲| 日韩国产精品久久久| 欧美日本国产在线| 亚洲欧美精品久久| 国产探花在线精品| 日韩av在线一区二区| 亚洲最大综合网| 91福利在线免费| 亚洲美腿欧美偷拍| 亚洲一区二区在线看| 亚洲精品18p| 国内成+人亚洲+欧美+综合在线 | 天堂8中文在线| 国产精品美女久久久久久 | 久久精品国产大片免费观看| 亚洲国产99精品国自产| 少妇性l交大片7724com| 亚洲日本免费电影| 欧美美女一区二区三区| 亚洲色图久久久| 欧美粗大gay| 色综合天天综合在线视频| 黄色一级片在线看| 毛片在线导航| 亚洲一区二区在线免费观看视频| 亚洲精品偷拍视频| 午夜在线观看视频| 国产精品国产a| 亚洲国产精品一区二区第一页| 国产高清一区在线观看| 久久久高清一区二区三区| 久久婷婷开心| 无码精品视频一区二区三区| 成人97人人超碰人人99| 国产伦精品一区二区三区在线| 性做久久久久久久久久| 高清不卡在线观看| 国产精品国产精品国产专区蜜臀ah| 亚洲成人黄色片| 成熟亚洲日本毛茸茸凸凹| av免费精品一区二区三区| www.国产精品视频| 成人午夜电影久久影院| 国产一区高清视频| 人妻妺妺窝人体色www聚色窝| 成人福利视频网站| 欧美三级网色| 亚洲精品承认| 亚洲在线中文字幕| 国产精品宾馆在线精品酒店| 电影在线观看一区| 色8久久精品久久久久久蜜| 在线观看av日韩| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 国产一区二区中文| 欧美性在线观看| 又污又黄的网站| 国产精品99久久久久| 极品日韩久久| 高清av电影在线观看| 亚洲女同女同女同女同女同69| 成人短视频在线观看免费| 国产高潮在线| 欧美日韩免费高清一区色橹橹| 亚洲一级片免费观看| 麻豆精品少妇| 国产亚洲视频在线观看| 中国毛片直接看| 亚洲一区二区三区高清| 国产欧美亚洲视频| 色婷婷激情五月| 国产丝袜欧美中文另类| 青青草免费在线视频观看| 国产福利电影在线播放| 欧美老年两性高潮| 久久久久久久久免费看无码 | 毛片在线视频观看| 亚洲精品mv| 欧美一区三区二区| 中文字幕被公侵犯的漂亮人妻| 97久久视频| 欧美在线视频免费| 国产成人免费看一级大黄| 国产亚洲短视频| 成年人网站国产| 成人福利一区二区| 日韩电影中文 亚洲精品乱码 | av免费观看不卡| 日本一区二区在线看| 91精品国产91久久久久| 国产美女无遮挡永久免费| 久久久无码精品亚洲日韩按摩| 波多野结衣 作品| 免费视频观看成人| 亚洲欧美制服中文字幕| 久久亚洲AV无码| 久草精品在线观看| 欧美一级爽aaaaa大片| 欧洲性视频在线播放| 欧美日韩精品福利| 亚洲一区二区三区日韩| 国产一区二区三区成人欧美日韩在线观看| 成人欧美一区二区三区在线湿哒哒| 牛牛影视精品影视| 欧美日韩中文在线观看| 国产伦精品一区二区三区精品| 91亚洲自偷观看高清| 国产91在线播放精品91| 色天堂在线视频| 亚洲成a人v欧美综合天堂| 丰满饥渴老女人hd| 久久久久久美女精品| 国产精品视频yy9099| 美女做暖暖视频免费在线观看全部网址91| 亚洲国产精品尤物yw在线观看| 在线a免费观看| 一区二区三区国产精华| 成人黄色av播放免费| 97视频精彩视频在线观看| 欧美三级xxx| v8888av| 在线一区欧美| 久久精品二区| 国产精欧美一区二区三区蓝颜男同| 亚洲国产精久久久久久久| 国产在线视频99| 丁香婷婷综合色啪| 欧美午夜小视频| 日韩极品在线| 欧美做受高潮电影o| 日本一区视频| 在线观看欧美精品| 黑人と日本人の交わりビデオ| 日韩av中文字幕一区二区| 香蕉久久夜色| 亚洲综合视频| 久久久人成影片一区二区三区观看| 亚洲AV无码一区二区三区少妇 | 人人草在线观看| 国产日韩欧美精品综合| 免费看涩涩视频| 91精品一区二区三区综合| 亚洲最大av在线| 大桥未久在线播放| 亚洲精品一区在线观看香蕉| 亚洲 国产 日韩 欧美| 国产精品国产三级国产有无不卡 | 久久久久久免费看| 亚洲桃色综合影院| 国产精品视频内| 伊人精品影院| 亚洲精品美女免费| 国产裸体美女永久免费无遮挡| 国产精品国产a级| 人妻av一区二区| 日韩影院在线观看| 91免费视频黄| 日韩美女国产精品| 国产精品亚洲综合天堂夜夜| 八戒八戒神马在线电影| 日韩av最新在线观看| 在线观看国产精品视频| 一个色在线综合| 亚洲无人区码一码二码三码的含义| 精品一区二区日韩| 国内精品在线观看视频| 成人av二区| 国产精品一区二区三区在线| 日韩三区免费| 国模私拍视频一区| 午夜视频在线观看免费视频| 欧美精品一区视频| 中文字幕日本人妻久久久免费| 亚洲在线视频免费观看| 阿v天堂2014| 不卡电影免费在线播放一区| 成人免费在线观看视频网站| 在线免费观看欧美| 在线观看欧美激情| 综合国产视频| 国产精品嫩草在线观看| 国产香蕉久久| 欧美中文字幕在线视频| 亚洲区欧洲区| 在线观看亚洲区| 青青草免费在线视频| 日韩一级大片在线| 中文无码精品一区二区三区| 天天操天天干天天综合网| 小早川怜子一区二区的演员表| 91视频.com| 亚洲美女精品视频| 国产最新精品精品你懂的| 日韩一级在线免费观看| 在线亚洲自拍| 97视频在线免费| 欧美a级片网站| 一区二区三区不卡在线| 国产精品一国产精品| 久久99精品久久久久久水蜜桃| 一区二区三区亚洲变态调教大结局| 国产精品专区h在线观看| 性高爱久久久久久久久| 91av视频在线免费观看| 成人爽a毛片免费啪啪动漫| 成年人精品视频| 国产原创精品视频| 色婷婷av一区二区三区在线观看| 国产精品一区二区三区四区色| 日韩电影视频免费| 天堂在线视频免费| 亚洲国产成人久久综合| 国产刺激高潮av| 日韩精品中文字幕一区| а√天堂资源在线| 日韩欧美电影在线| а√中文在线资源库| 日韩免费电影一区| 精品国产亚洲av麻豆| 欧美一区二区三区性视频| 国产精品高潮呻吟AV无码| 欧美精品丝袜中出| 国产又粗又猛又黄又爽| 91精品啪在线观看国产60岁| 国产美女www爽爽爽视频| 在线电影国产精品| 99久久精品国产一区二区成人| 欧美酷刑日本凌虐凌虐| 99热这里只有精品66| 精品久久国产字幕高潮| 亚洲国产成人精品一区二区三区| 欧美mv日韩mv国产网站| 欧美 日韩 国产 在线| 亚洲国产欧美一区二区丝袜黑人 | 9色porny自拍视频一区二区| 亚洲精品乱码久久| 久久亚洲欧美国产精品乐播| 天天躁日日躁aaaa视频| 中文字幕在线不卡一区二区三区| 黄色录像一级片| 一个色妞综合视频在线观看| 国产手机在线视频| 色噜噜狠狠成人网p站| 中文字幕福利视频| 91精品久久久久久久久99蜜臂| www三级免费| 亚洲精品一区二区久| av网在线观看| 美女国内精品自产拍在线播放| 男人天堂亚洲| 国产精品扒开腿做| 成人51免费| 精品久久久久久乱码天堂| 视频一区中文| 男女啪啪的视频| 日韩视频在线一区二区三区 | 亚洲最新免费视频| 亚洲性色视频| 污视频免费在线观看网站| 国产很黄免费观看久久| 日本高清www| 亚洲欧美另类久久久精品| 国产精品黄色网| 欧美日韩精品一区二区三区| 国产小视频免费观看| 亚洲性生活视频| av网站在线免费看推荐| 日本久久久久久久久久久| 国产精品日本一区二区不卡视频| 精品欧美一区二区精品久久| 日韩欧美高清在线播放| 国产白丝袜美女久久久久| 麻豆91在线播放| av鲁丝一区鲁丝二区鲁丝三区| 国产精品久线在线观看| 国产又色又爽又黄的| 51精品久久久久久久蜜臀| 神马久久高清| 欧美黄色片在线观看| 色猫猫成人app| 国产在线欧美日韩| 91精品国产成人观看| 五月婷婷狠狠操| 99久久99久久精品国产片果冻 | xxxx黄色片| 亚洲女同一区二区| 欧美 亚洲 另类 激情 另类| 欧美精品一区二区久久婷婷| 麻豆网站在线| 国产精品高潮视频| 欧美日韩导航| 成人午夜视频在线观看免费| 精品一区二区三区在线视频| 白白色免费视频| 黑人巨大精品欧美一区免费视频 | 亚洲欧美激情四射在线日| 青青在线视频| 成人在线精品视频| 日韩激情一区| 狠狠热免费视频| 久久精品亚洲精品国产欧美| 日本天堂网在线| 日韩国产高清视频在线| 黄网av在线| 成人动漫在线观看视频| 一区二区三区在线电影| 国产aⅴ爽av久久久久| 日本一区二区免费在线| 无码人妻精品一区二区三区蜜桃91 | 少妇一区二区三区四区| 欧美高清无遮挡| 7m精品国产导航在线| 人妻互换免费中文字幕| 国产精品一区二区在线观看不卡 | 国产农村妇女精品一二区| 国产日韩视频一区| 亚洲五码中文字幕| 国产香蕉在线观看| 国内精品小视频| 卡通动漫精品一区二区三区| 欧美一级欧美一级| 91影院在线免费观看| 欧美日韩精品区| 日韩精品在线观看网站| 大胆人体一区| 日韩av一区二区三区在线观看| 久久精品天堂| 亚洲第一视频区| 欧美日韩成人综合天天影院 | 97精品视频在线| 99香蕉久久| 久在线观看视频| 国产人久久人人人人爽| 在线免费观看视频网站| 久久精品99久久久香蕉| 人人九九精品视频| 日韩黄色短视频| 久久综合色之久久综合| 久久久999久久久| 久久久99免费视频| heyzo欧美激情| 亚洲国产精品久久久久婷蜜芽| 久久久久久久久久美女| 糖心vlog精品一区二区| 久色乳综合思思在线视频| 97久久精品| 国产亚洲天堂网| 国产精品久久久久久久裸模| 国产农村老头老太视频| 久久久女女女女999久久| 九色精品91| 嫩草视频免费在线观看| 亚洲综合清纯丝袜自拍| 亚洲 精品 综合 精品 自拍| 国产成人综合av| 欧美国产先锋| 爱爱免费小视频| 日韩一二三四区| 国产综合色区在线观看| 久久久无码中文字幕久...| 91一区二区三区在线播放| 亚洲无码精品在线播放| 久久久欧美一区二区| 久久在线视频| 日本黄色网址大全| 这里只有精品电影| 午夜激情电影在线播放| www亚洲国产| 91麻豆国产香蕉久久精品| 999av视频| 日本久久中文字幕| 综合色一区二区| 日本理论中文字幕| 亚洲福利视频久久| 95精品视频| 别急慢慢来1978如如2| 亚洲一区二区三区在线|