精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節跳動基于Doris的湖倉分析探索實踐

數據庫 新聞
Doris是一種MPP架構的分析型數據庫,主要面向多維分析、數據報表、用戶畫像分析等場景。自帶分析引擎和存儲引擎,支持向量化執行引擎,不依賴其他組件,兼容MySQL協議。

01 Doris簡介

Apache Doris具備以下幾個特點:

  • 良好的架構設計,支持高并發低延時的查詢服務,支持高吞吐量的交互式分析。多FE均可對外提供服務,并發增加時,線性擴充FE和BE即可支持高并發的查詢請求。
  • 支持批量數據load和流式數據load,支持數據更新。支持Update/Delete語法,unique/aggregate數據模型,支持動態更新數據,實時更新聚合指標。
  • 提供了高可用,容錯處理,高擴展的企業級特性。FE Leader錯誤異常,FE Follower秒級切換為新Leader繼續對外提供服務。
  • 支持聚合表和物化視圖。多種數據模型,支持aggregate, replace等多種數據模型,支持創建rollup表,支持創建物化視圖。rollup表和物化視圖支持動態更新,無需用戶手動處理。
  • MySQL協議兼容,支持直接使用MySQL客戶端連接,非常易用的數據應用對接

Doris 由 Frontend(以下簡稱FE)和 Backend(以下簡稱BE)組成,其中FE負責接受用戶請求、編譯、優化、分發執行計劃、元數據管理、BE節點的管理等功能,BE負責執行由FE下發的執行計劃,存儲和管理用戶數據。

圖片?

02 數據湖格式Hudi簡介

Hudi是下一代流式數據湖平臺,為數據湖提供了表格式管理的能力,提供事務,ACID,MVCC,數據更新刪除,增量數據讀取等功能。支持Spark, Flink, Presto, Trino等多種計算引擎。

圖片?

Hudi根據數據更新時行為不同分為兩種表類型

圖片

針對Hudi的兩種表格式,存在3種不同的查詢類型

圖片

03

Doris分析Hudi數據的技術背景

在數倉業務中,隨著業務對數據實時性的要求越來越高,T+1數倉業務逐漸往小時級、分鐘級,甚至秒級演進。實時數倉的應用也越來越廣,也經歷了多個發展階段。目前存在著多種解決方案。

1. Lambda架構

Lambda將數據處理流分為在線分析和離線分析兩條不同的處理路徑,兩條路徑互相獨立,互不影響。

離線分析處理T+1數據,使用Hive/Spark處理大數據量,不可變數據,數據一般存儲在HDFS等系統上。如果遇到數據更新,需要overwrite整張表或整個分區,成本比較高。

在線分析處理實時數據,使用Flink/Spark Streaming處理流式數據,分析處理秒級或分鐘級流式數據,數據保存在Kafka或定期(分鐘級)保存到HDFS中。?

該套方案存在以下缺點

  • 同一套指標可能需要開發兩份代碼來進行在線分析和離線分析,維護復雜。
  • 數據應用查詢指標時可能需要同時查詢離線數據和在線數據,開發復雜。
  • 同時部署批處理和流式計算兩套引擎,運維復雜。
  • 數據更新需要overwrite整張表或分區,成本高。

2. Kappa架構

隨著在線分析業務越來越多,Lambda架構的弊端就越來越明顯,增加一個指標需要在線離線分別開發,維護困難,離線指標可能和在線指標對不齊,部署復雜,組件繁多。于是Kappa架構應運而生。

Kappa架構使用一套架構處理在線數據和離線數據,使用同一套引擎同時處理在線和離線數據,數據存儲在消息隊列上。?

Kappa架構也有一定的局限

  • 流式計算引擎批處理能力較弱,處理大數據量性能較弱。
  • 數據存儲使用消息隊列,消息隊列對數據存儲有有效性限制,歷史數據無法回溯。
  • 數據時序可能亂序,可能對部分在時序要求方面比較嚴格的應用造成數據錯誤。
  • 數據應用需要從消息隊列中取數,需要開發適配接口,開發復雜。

3. 基于數據湖的實時數倉

針對Lambda架構和Kappa架構的缺陷,業界基于數據湖開發了Iceberg, Hudi,  DeltaLake這些數據湖技術,使得數倉支持ACID, Update/Delete,數據Time Travel, Schema Evolution等特性,使得數倉的時效性從小時級提升到分鐘級,數據更新也支持部分更新,大大提高了數據更新的性能。兼具流式計算的實時性和批計算的吞吐量,支持的是近實時的場景。

以上方案中其中基于數據湖的應用最廣,但數據湖模式無法支撐更高的秒級實時性,也無法直接對外提供數據服務,需要搭建其他的數據服務組件,系統較為復雜。基于此背景下,部分業務開始使用Doris來承接,業務數據分析師需要對Doris與Hudi中的數據進行聯邦分析,此外在Doris對外提供數據服務時既要能查詢Doris中數據,也要能加速查詢離線業務中的數據湖數據,因此我們開發了Doris訪問數據湖Hudi中數據的特性。

04 Doris分析Hudi數據的設計原理

基于以上背景,我們設計了Apache Doris中查詢數據湖格式Hudi數據,因Hudi生態為java語言,而Apache Doris的執行節點BE為C++環境,C++ 無法直接調用Hudi java SDK,針對這一點,我們有三種解決方案。

1.實現Hudi C++ client,在BE中直接調用Hudi C++ client去讀寫Hudi表。?

該方案需要完整實現一套Hudi C++ client,開發周期較長,后期Hudi行為變更需要同步修改Hudi C++ client,維護較為困難。

2.BE通過thrift協議發送讀寫請求至Broker,由Broker調用Hudi java client讀取Hudi表。

該方案需要在Broker中增加讀寫Hudi數據的功能,目前Broker定位僅為fs的操作接口,引入Hudi打破了Broker的定位。第二,數據需要在BE和Broker之間傳輸,性能較低。

3.在BE中使用JNI創建JVM,加載Hudi java client去讀寫Hudi表。

該方案需要在BE進程中維護JVM,有JVM調用Hudi java client對Hudi進行讀寫。讀寫邏輯使用Hudi社區java實現,可以維護與社區同步;同時數據在同一個進程中進行處理,性能較高。但需要在BE維護一個JVM,管理較為復雜。

4.使用BE arrow parquet c++ api讀取hudi parquet base file,hudi表中的delta file暫不處理。?

該方案可以由BE直接讀取hudi表的parquet文件,性能最高。但當前不支持base file和delta file的合并讀取,因此僅支持COW表Snapshot Queries和MOR表的Read Optimized Queries,不支持Incremental Queries。

綜上,我們選擇方案四,第一期實現了COW表Snapshot Queries和MOR表的Read Optimized Queries,后面聯合Hudi社區開發base file和delta file合并讀取的C++接口。

05 Doris分析Hudi數據的技術實現

Doris中查詢分析Hudi外表使用步驟非常簡單。

1. 創建Hudi外表

建表時指定engine為Hudi,同時指定Hudi外表的相關信息,如hive metastore uri,在hive metastore中的database和table名字等。

建表僅僅在Doris的元數據中增加一張表,無任何數據移動。

建表時支持指定全部或部分hudi schema,也支持不指定schema創建hudi外表。指定schema時必須與hiveMetaStore中hudi表的列名,類型一致。

Example:

Plaintext
CREATE TABLE example_db.t_hudi
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);


CREATE TABLE example_db.t_hudi (
column1 int,
column2 string)
ENGINE=HUDI
PROPERTIES (
"hudi.database" = "hudi_db",
"hudi.table" = "hudi_table",
"hudi.hive.metastore.uris" = "thrift://127.0.0.1:9083"
);

2. 查詢Hudi外表

查詢Hudi數據表時,FE在analazy階段會查詢元數據獲取到Hudi外表的的hive metastore地址,從Hive metastore中獲取hudi表的schema信息與文件路徑。

  • 獲取hudi表的數據地址。
  • FE規劃fragment增加HudiScanNode。HudiScanNode中獲取Hudi table對應的data file文件列表。
  • 根據Hudi table獲取的data file列表生成scanRange。
  • 下發HudiScan 任務至BE節點。
  • BE節點根據HudiScanNode指定的Hudi外表文件路徑調用native parquet reader進行數據讀取。

圖片?

06 后期規劃

目前Apche Doris查詢Hudi表已合入社區,當前已支持COW表的Snapshot Query,支持MOR表的Read Optimized Query。對MOR表的Snapshot Query暫時還未支持,流式場景中的Incremental Query也沒有支持。

后續還有幾項工作需要處理,我們和社區也在積極合作進行中:

  • MOR表的Snapshot Query。MOR表實時讀需要合并讀取Data file與對應的Delta file,BE需要支持Delta file AVRO格式的讀取,需要增加avro的native讀取方式。
  • COW/MOR表的Incremental Query支持實時業務中的增量讀取。
  • BE讀取Hudi base file和delta file的native接口目前BE讀取Hudi數據時,僅能讀取data file,使用的是parquet的C++ SDK。后期我們和聯合Hudi社區提供Huid base file和delta file的C++/Rust等語言的讀取接口,在Doris BE中直接使用native接口來查詢Hudi數據。

今天的分享就到這里,謝謝大家。

責任編輯:張燕妮 來源: DataFunTalk
相關推薦

2022-09-15 09:32:42

數據倉處理

2022-08-21 21:28:32

數據庫實踐

2022-05-23 13:30:48

數據胡實踐

2023-03-27 21:24:18

架構數據處理分析服務

2022-06-08 13:25:51

數據

2024-01-03 16:29:01

Agent性能優化

2024-09-25 15:57:56

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink

2021-06-07 10:45:16

大數據數據倉庫數據湖

2022-06-24 10:41:53

日志數據

2023-10-13 07:25:50

2024-04-23 10:16:29

云原生

2023-01-10 09:08:53

埋點數據數據處理

2023-10-30 07:25:37

數據湖數據處理

2024-11-01 17:00:03

2023-06-28 07:28:36

湖倉騰訊架構

2023-12-14 13:01:00

Hudivivo

2023-05-26 06:45:08

2022-11-24 10:01:10

架構分布式
點贊
收藏

51CTO技術棧公眾號

97免费中文视频在线观看| 欧美大片在线观看| 宅男噜噜99国产精品观看免费| 亚洲天天综合网| 欧美日韩一区二区高清| 亚洲精选在线观看| 在线一区二区不卡| 三级在线观看视频| 国产精品护士白丝一区av| 亚洲影院污污.| 91视频免费网址| 91久久电影| 国产婷婷成人久久av免费高清| 日本黄色福利视频| 天堂电影一区| 亚洲激情自拍视频| 午夜精品一区二区在线观看的 | 在线观看免费版| 成人午夜电影网站| 成人免费视频网| 日本a级c片免费看三区| 国产精品www994| 综合136福利视频在线| 亚洲成av人片在线观看无| 日本午夜免费一区二区| 日韩欧美精品在线观看| 第九区2中文字幕| www亚洲人| 91影院在线观看| 国产精品对白一区二区三区| 一级全黄少妇性色生活片| 国产一区91| 国内精品美女av在线播放| 精品在线观看一区| 国模精品一区| 日韩精品在线私人| 亚洲婷婷在线观看| 欧美三级一区| 91麻豆精品国产91久久久| 亚洲五月天综合| 超碰aⅴ人人做人人爽欧美| 亚洲一区二区三区视频在线播放| 中文字幕av日韩精品| 电影在线一区| 国产三区在线成人av| 欧美人与性禽动交精品| 日韩一区免费视频| 成人深夜福利app| 国产经品一区二区| 亚洲精品无amm毛片| 国产成人精品www牛牛影视| 91精品啪在线观看麻豆免费| 一区精品在线观看| 蜜臀av一区二区| 国产精品吴梦梦| 伊人网视频在线| 美女在线一区二区| 国产精品自拍视频| 91久久精品无码一区二区| 蜜桃精品视频在线观看| 国产精品网址在线| 国产精品一区二区av白丝下载| 九九九久久久精品| 91亚洲精华国产精华| 国产熟女一区二区丰满| 国产美女在线观看一区| 97se视频在线观看| 日本国产在线观看| 久久久噜噜噜久久中文字幕色伊伊 | 国产免费久久久| 国产精品一卡二卡| 国产精品一区免费观看| 香蕉av在线播放| 久久亚洲精华国产精华液| 欧洲亚洲一区二区| 免费观看成人高潮| 一区二区三区**美女毛片| 99在线免费视频观看| 黑森林国产精品av| 欧美性xxxxxxxx| 做a视频在线观看| 亚洲一区二区三区日本久久九| 精品久久久久久久久久久院品网 | 女同久久另类99精品国产| 亚洲精品综合精品自拍| 手机免费观看av| 欧美一区影院| 日韩暖暖在线视频| 6—12呦国产精品| 成人福利视频网站| 日本一区免费| 久久久久黄久久免费漫画| 欧美日韩国产色视频| 久久撸在线视频| 国产精品久久久久久久久久白浆| 亚洲美女又黄又爽在线观看| 激情高潮到大叫狂喷水| 影音国产精品| 国产情人节一区| 天堂在线视频观看| 国产精品蜜臀av| 日本a在线免费观看| av亚洲一区| 日韩av在线网址| 91免费公开视频| 久久高清一区| 99热99热| 男女啪啪在线观看| 一本大道久久a久久综合婷婷| 在线播放av中文字幕| 久久精品国产亚洲blacked| 中文字幕亚洲综合| 国产又色又爽又黄的| 久久99精品视频| 欧美日韩一区二区三区在线视频 | 欧美一区二区三区免费视频| 国产吞精囗交久久久| 一区二区三区在线| 国产精品网红福利| 色天堂在线视频| 亚洲国产精品麻豆| www.国产福利| 欧美亚洲在线日韩| 欧美孕妇孕交黑巨大网站| 国产v在线观看| 国产精品久久久久久户外露出| 浮妇高潮喷白浆视频| 欧美日韩黄色| 乱亲女秽乱长久久久| 自拍偷拍色综合| 久久精品日产第一区二区三区高清版 | 在线观看国产精品一区| 亚洲黄页一区| 国产精品免费一区二区三区四区| 国产在线观看a视频| 欧美日韩视频在线观看一区二区三区| 国产精品1000部啪视频| 亚洲三级影院| 久久国产精品一区二区三区| 后进极品白嫩翘臀在线播放| 欧美一区二区三区精品| 日韩精品123区| 久草中文综合在线| japanese在线视频| 91成人小视频| 久热精品在线视频| jizz国产视频| 一级女性全黄久久生活片免费| 香蕉视频色在线观看| 99久久综合狠狠综合久久aⅴ| 国产精品免费视频xxxx| 在线免费黄色| 欧美精品久久久久久久多人混战| 国精产品一区一区二区三区mba| 精品午夜久久福利影院| 资源网第一页久久久| 中文成人激情娱乐网| 久久国产精品久久久久| av片免费播放| 亚洲国产视频网站| 日本免费福利视频| 性欧美videos另类喷潮| 日本高清不卡三区| 免费成人高清在线视频| 欧美精品性视频| 欧美 日韩 国产 在线| 懂色av中文一区二区三区天美| 一级性生活大片| 蜜臀va亚洲va欧美va天堂 | 99福利在线| 精品国产乱码久久久久久图片| 日韩精品在线不卡| 国产三级精品在线| 中文字幕第三区| 99在线精品视频在线观看| 欧美一区二区影视| 一区二区三区日本视频| 久久久人成影片一区二区三区观看| 午夜av免费观看| 欧美日韩国产一二三| 麻豆视频在线观看| 91麻豆swag| 三区视频在线观看| 亚洲看片免费| 亚洲国产精品日韩| 91蜜桃臀久久一区二区| 国产成人精品久久二区二区| 久草免费在线观看| 亚洲第一网中文字幕| 中文字幕欧美在线观看| 亚洲午夜在线观看视频在线| 亚洲自拍偷拍一区二区| 国产乱国产乱300精品| 99爱视频在线| 亚洲精品一二三区区别| 欧美激情第一页在线观看| a一区二区三区亚洲| 欧美亚洲一区在线| 亚洲丝袜一区| 中文字幕亚洲综合久久| 污视频在线免费| 3d动漫精品啪啪一区二区竹菊| 国产成人在线免费观看视频| 国产精品国产精品国产专区不蜜| 欧美极品jizzhd欧美仙踪林| 久久狠狠亚洲综合| 夫妻免费无码v看片| 欧美激情麻豆| 亚洲精品高清国产一线久久| 九色丨蝌蚪丨成人| 91精品久久久久久久久| 中国色在线日|韩| 久久久久久高潮国产精品视| 日本电影全部在线观看网站视频| 日韩精品一区二区三区第95| 国产黄色免费大片| 欧美午夜影院一区| 台湾佬中文在线| 亚洲第一主播视频| 91麻豆精品成人一区二区| 国产性做久久久久久| 日韩精品视频一区二区| 国产精品自拍三区| 天天综合天天添夜夜添狠狠添| 麻豆精品网站| 欧美 日韩 国产在线观看| 欧美日韩免费观看一区=区三区| 亚洲一区二区三区在线观看视频| 大伊香蕉精品在线品播放| 91传媒在线免费观看| 色8久久久久| 国产剧情日韩欧美| 777午夜精品电影免费看| 欧美一区二区三区图| av中文在线资源库| 久久频这里精品99香蕉| 四季久久免费一区二区三区四区| 久久精品男人天堂| 免费a级在线播放| 精品国产一区av| 无遮挡的视频在线观看| 中文字幕久久精品| 中文字幕在线免费| 日韩中文在线中文网在线观看| 国产51人人成人人人人爽色哟哟| 国产视频精品一区二区三区| 亚洲欧美日韩免费| 精品视频www| 六十路在线观看| 亚洲香蕉av在线一区二区三区| 毛片在线播放网址| 中文日韩在线视频| 国产欧美久久久久久久久| 欧美理论电影在线观看| 国产网红女主播精品视频| 97国产真实伦对白精彩视频8| 爱搞国产精品| 欧洲成人在线观看| 456成人影院在线观看| 国产精品视频资源| 亚洲ww精品| y111111国产精品久久婷婷| 超碰地址久久| 欧美日韩精品免费在线观看视频| 黑丝美女一区二区| 中文字幕一区二区三区四区五区| 综合在线视频| 欧美精品自拍视频| 老司机午夜免费精品视频 | 成人国产精品免费观看视频| 91玉足脚交白嫩脚丫| 久久亚洲精品国产精品紫薇| 日本午夜精品视频| 亚洲精品va在线观看| 特一级黄色大片| 欧美三级一区二区| 亚洲av无码乱码国产精品| 亚洲美女喷白浆| 国产写真视频在线观看| 97人洗澡人人免费公开视频碰碰碰| 欧美xx视频| 91久久精品视频| 欧美重口另类| 欧美aaa在线观看| 亚洲精品黄色| 亚洲午夜激情影院| 91丨porny丨最新| 国产精品视频一区二区在线观看| 亚洲成人av一区二区三区| 瑟瑟视频在线免费观看| 精品国产乱码久久久久久浪潮| 国产资源在线播放| 欧美巨乳美女视频| 日韩a**中文字幕| 国产精品二区在线观看| 精品国产精品| av在线观看地址| 黑人巨大精品欧美一区| 免费a级黄色片| 一区二区三区四区av| 亚洲 国产 日韩 欧美| 精品久久人人做人人爰| h视频网站在线观看| 国内精品久久影院| 99久热在线精品视频观看| 蜜桃狠狠色伊人亚洲综合网站| 中文字幕日韩欧美精品高清在线| 亚洲熟妇av一区二区三区 | 国产在线观看h| 夜夜嗨av一区二区三区中文字幕 | 亚洲欧美另类在线观看| 影音先锋男人资源在线| 国产精品久久久久久久久久久新郎| 国产精品调教视频| 最近中文字幕免费mv| 日韩精品一二三| 亚洲av成人片无码| 亚洲欧美经典视频| 最近中文字幕在线视频| 亚洲精品成a人在线观看| 中文字幕在线观看播放| 国产美女久久精品香蕉69| 美女网站一区| 无码播放一区二区三区| 成人小视频免费观看| 五月天激情丁香| 欧美日韩国产在线观看| 国产乱视频在线观看| 欧日韩不卡在线视频| 日韩理论电影中文字幕| 91九色丨porny丨国产jk| 国产精品12区| 欧美成人精品一区二区免费看片| 欧美日韩不卡一区二区| 国产三级在线观看| 日韩av电影国产| 日韩高清一级| 男人操女人免费软件| 26uuu精品一区二区三区四区在线| 久草网在线观看| 日韩欧美精品三级| 宅男网站在线免费观看| 亚洲在线第一页| 欧美~级网站不卡| 精品人妻一区二区乱码| 一区二区在线电影| 午夜精品在线播放| 欧美激情第三页| 米奇精品关键词| 欧美成人一区二区在线观看| 97久久精品人人爽人人爽蜜臀| 日本天堂网在线观看| 亚洲国产一区二区三区在线观看| 黄色漫画在线免费看| 久久免费看av| 肉丝袜脚交视频一区二区| 精品人体无码一区二区三区| 欧美私人免费视频| 麻豆影视国产在线观看| 亚洲一区二区少妇| 国产综合精品一区| 国产精品扒开腿做爽爽爽a片唱戏 亚洲av成人精品一区二区三区 | 啪啪一区二区三区| 91精品国产91久久综合桃花 | 中文字幕18页| 精品欧美激情精品一区| 国产高清在线| 亚洲a中文字幕| 精品91视频| 成人网站免费观看| 欧美午夜精品一区| 2024最新电影在线免费观看| 国产精品日韩二区| 天堂成人国产精品一区| sm捆绑调教视频| 精品国产三级a在线观看| 在线天堂新版最新版在线8| 亚洲欧美一区二区原创| 国产福利一区二区三区视频| 九九九在线观看| 久久久久www| 亚洲69av| 日韩av片免费观看| 福利视频导航一区| 免费av网站在线看| 国产一区二区视频在线免费观看 | 一本大道综合伊人精品热热 | 91人妻一区二区三区| 岛国精品视频在线播放| 五月天婷婷在线视频| 激情视频一区二区| 经典三级在线一区| 超碰中文字幕在线| 欧美另类极品videosbestfree| 美女精品一区最新中文字幕一区二区三区 | 国产一区二区黄| 国产精品毛片视频| 91 视频免费观看| 欧美日韩一区二区精品| 在线免费av导航|