精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據湖三劍客,大數據時代的新范式?

大數據 數據湖
目前的數據倉庫技術出現了一定的局限性,比如單一不變的 schema 和模型已經無法滿足各類不同場景和領域的數據分析的要求、流批一體的數據存儲引擎和計算引擎適配問題以及Hadoop體系文件系統的ACID能力缺失等問題急需要解決,但就目前的技術棧而言,打破這些技術的桎梏,似乎多少有些力不從心,這個過程中,一項重大變革似乎在破曉前顯得尤為必要。

隨著互聯網高速發展,大數據技術快速發展和迅速迭代,降低了用戶處理海量數據的門檻,越來越多的應運場景出現在我們的身邊存儲和處理需求越來越多樣化,逐漸呈現出數據倉庫往數據湖方向發展、批處理往流式處理發展、本地部署往云模式發展的趨勢。

但在技術發展層面,逐漸出現了諸多的掣肘,不斷有新的問題出現,僅僅就存儲方面來講,與數據庫這樣高度優化的技術相比,大數據技術的抽象和實現還是太原始和初級。

目前的數據倉庫技術出現了一定的局限性,比如單一不變的 schema 和模型已經無法滿足各類不同場景和領域的數據分析的要求、流批一體的數據存儲引擎和計算引擎適配問題以及Hadoop體系文件系統的ACID能力缺失等問題急需要解決,但就目前的技術棧而言,打破這些技術的桎梏,似乎多少有些力不從心,這個過程中,一項重大變革似乎在破曉前顯得尤為必要。

在不停地探索和思考中,大數據人開始慢慢醒悟,回頭看向成名已久的數據庫,將更多數據庫的成熟技術和理念借鑒到大數據中,似乎是一條高效又穩健的道路。至此,數據湖技術應運而生,在諸多方面向數據庫看齊,你可以說是學習,當然,也可以說是致敬,是業界針對這些問題的一種解決方案。

那么,什么是數據湖技術呢?

計算引擎之下、數據存儲之上,處于中間層的數據湖。

簡單地說,這類新技術是介于上層計算引擎和底層存儲格式之間的一個中間層,我們可以把它定義成一種“數據組織格式”。其最核心的點便是將事務能力帶到了大數據領域,并抽象成統一的中間格式供不同引擎適配對接。

為此,Uber開源了Apache Hudi,Databricks提出了Delta Lake,而 Netflix 則發起了 Apache Iceberg 項目,一時間這種具備 ACID 能力的表格式中間件成為了大數據、數據湖領域炙手可熱的方向。

Iceberg 將其稱之為“表格式”也是表達類似的含義。它與底層的存儲格式(比如 ORC、Parquet 之類的列式存儲格式)最大的區別是,它并不定義數據存儲方式,而是定義了數據、元數據的組織方式,向上提供統一的“表”的語義。它構建在數據存儲格式之上,其底層的數據存儲仍然使用 Parquet、ORC 等進行存儲。

Apache Iceberg、Hudi 和 Delta Lake 誕生于不同公司,需要解決的問題存在差異,因此三者在設計初衷上稍有不同。

其中,Iceberg 的設計初衷更傾向于定義一個標準、開放且通用的數據組織格式,同時屏蔽底層數據存儲格式上的差異,向上提供統一的操作 API,使得不同的引擎可以通過其提供的 API 接入;Hudi 的設計初衷更像是為了解決流式數據的快速落地,并能夠通過 upsert 語義進行延遲數據修正;Delta Lake 作為 Databricks 開源的項目,更側重于在 Spark 層面上解決 Parquet、ORC 等存儲格式的固有問題,并帶來更多的能力提升。

雖然這三個項目在設計初衷上稍有不同,但實現的思路和提供的能力卻非常相似,他們都提供了 ACID 的能力,都基于樂觀鎖實現了沖突解決和提供線性一致性,同時相應地提供了 time travel 的功能。

但是因為設計初衷的不同,三個項目當前的能力象限各有不同,Iceberg 在其格式定義和核心能力上最為完善,但是上游引擎的適配上稍顯不足;Hudi 基于 Spark 打造了完整的流式數據落地方案,但是其核心抽象較弱,與 Spark 耦合較緊;Delta Lake 同樣高度依賴于 Spark 生態圈,與其他引擎的適配尚需時日。

那么,當下數據湖技術呈現的三足鼎立的技術場面,優劣點如何看待,技術選型如何去做,當然是我們最關心的問題,下文逐步解析。

Delta Lake,spark生態圈急先鋒

傳統的 lambda 架構需要同時維護批處理和流處理兩套系統,資源消耗大,維護復雜。

基于 Hive 的數倉或者傳統的文件存儲格式(比如 parquet / ORC),都存在一些難以解決的問題:小文件問題、并發讀寫問題、有限的更新支持及海量元數據(例如分區)導致 metastore 不堪重負問題等。

如上圖,Delta Lake 是 Spark 計算框架和存儲系統之間帶有 Schema 信息的存儲中間層。

它集中解決了傳統hive數倉的諸多問題,使得實時數據湖變得優雅又絲滑,不見了天生的慵懶,只看到輕盈又婀娜的身姿。重要變化如下:

  1. 設計了基于 HDFS 存儲的元數據系統,解決 metastore 不堪重負的問題;
  2. 支持更多種類的更新模式,比如 Merge / Update / Delete 等操作,配合流式寫入或者讀取的支持,讓實時數據湖變得水到渠成;
  3. 流批操作可以共享同一張表;
  4. 版本概念,可以隨時回溯,避免因為一次誤操作或者代碼邏輯而無法恢復的災難性后果。

基于Parquet的列式存儲層,在多并發寫入之間提供 ACID 事務保證。每次寫入都是一個事務,并且在事務日志中記錄了寫入的序列順序。

但是,Delta Lake定位于spark流批一體的數據處理工具,地主家的公子,自己家的事情如數家珍,輕松搞定,但走出家門后,難免會有些水土不服。

Apache Hudi,有天生缺陷的優等生

Apache Hudi 代表 Hadoop Upserts and Incrementals,能夠使HDFS數據集在分鐘級的時延內支持變更,也支持下游系統對這個數據集的增量處理。

Hudi數據集通過自定義的inputFormat 兼容當前 Hadoop 生態系統,包括 Apache Hive,Apache Parquet,Presto 和 Apache Spark,使得終端用戶可以無縫的對接。

如下圖,基于 Hudi 簡化的服務架構,分鐘級延遲。

Hudi 會維護一個時間軸,在每次執行操作時(如寫入、刪除、合并等),均會帶有一個時間戳。

通過時間軸,可以實現在僅查詢某個時間點之后成功提交的數據,或是僅查詢某個時間點之前的數據。

這樣可以避免掃描更大的時間范圍,并非常高效地只消費更改過的文件(例如在某個時間點提交了更改操作后,僅 query 某個時間點之前的數據,則仍可以 query 修改前的數據)。

如上圖的左邊,Hudi 將數據集組織到與 Hive 表非常相似的基本路徑下的目錄結構中。

數據集分為多個分區,每個分區均由相對于基本路徑的分區路徑唯一標識。

如上圖的中間部分,Hudi 以兩種不同的存儲格式存儲所有攝取的數據。

讀優化的列存格式(ROFormat):僅使用列式文件(parquet)存儲數據。在寫入/更新數據時,直接同步合并原文件,生成新版本的基文件(需要重寫整個列數據文件,即使只有一個字節的新數據被提交)。此存儲類型下,寫入數據非常昂貴,而讀取的成本沒有增加,所以適合頻繁讀的工作負載,因為數據集的最新版本在列式文件中始終可用,以進行高效的查詢。

寫優化的行存格式(WOFormat):使用列式(parquet)與行式(avro)文件組合,進行數據存儲。在更新記錄時,更新到增量文件中(avro),然后進行異步(或同步)的compaction,創建列式文件(parquet)的新版本。此存儲類型適合頻繁寫的工作負載,因為新記錄是以appending 的模式寫入增量文件中。但是在讀取數據集時,需要將增量文件與舊文件進行合并,生成列式文件。

Apache Iceberg,基礎扎實,后生可畏

Iceberg 作為新興的數據湖框架之一,開創性地抽象出“表格式”table format)這一中間層,既獨立于上層的計算引擎(如Spark和Flink)和查詢引擎(如Hive和Presto),也和下層的文件格式(如Parquet,ORC和Avro)相互解耦。

此外 Iceberg 還提供了許多額外的能力:

  • ACID事務;
  • 時間旅行(time travel),以訪問之前版本的數據;
  • 完備的自定義類型、分區方式和操作的抽象;
  • 列和分區方式可以進化,而且進化對用戶無感,即無需重新組織或變更數據文件;
  • 隱式分區,使SQL不用針對分區方式特殊優化;
  • 面向云存儲的優化等;

Iceberg的架構和實現并未綁定于某一特定引擎,它實現了通用的數據組織格式,利用此格式可以方便地與不同引擎(如Flink、Hive、Spark)對接。

所以 Iceberg 的架構更加的優雅,對于數據格式、類型系統有完備的定義和可進化的設計。

綜合而言,三個引擎的初衷場景并不完全相同,Hudi 為了 incremental 的 upserts,相對而言最為成熟,但底層架構設計較差,擴展性及生態延續方面難度較大;Iceberg 定位于高性能的分析與可靠的數據管理,底層架構的抽象及架構的開放性方面做的很好,數據湖upsert和compaction兩個關鍵的功能也趨于完善,正在快速發展期;Delta 定位于流批一體的數據處理,無縫對接Spark生態。

我們在技術選型的時候,不僅要知到要到哪里去,更要明確我們從哪里來,選擇適合自己當下業務需求的技術,才能更快速、更高效輔助業務開發。


責任編輯:華軒 來源: 今日頭條
相關推薦

2011-03-28 16:04:44

nagios

2010-02-04 16:22:21

2019-06-27 10:06:54

Linux 性能工具

2014-12-25 11:40:25

云計算企業軟件Docker

2023-10-04 00:20:31

grepLinux

2009-02-26 18:22:49

桌面虛擬化Linux

2024-06-04 00:20:00

Python函數

2017-07-25 08:53:14

CorrectLinkCCA-SD算法

2019-08-20 14:29:45

grepsedawk

2021-05-13 10:25:29

Linuxgrep命令

2014-11-26 10:18:32

Cloud Setupwindows在線打包工具

2018-05-04 15:18:01

DockerDocker Comp容器

2021-03-15 07:39:48

LinuxAwk 語言

2011-08-06 23:58:34

愛普生投影機

2011-07-04 09:07:54

2023-11-25 17:08:47

ChatbotLLAMALangChain

2011-04-11 11:01:03

AndroidHTC蘋果

2009-03-19 20:52:58

LinuxPHPCMS

2025-04-22 09:39:46

Python爬蟲網頁數據抓取

2025-10-24 14:29:04

vivo前端三劍客前端
點贊
收藏

51CTO技術棧公眾號

国产剧情一区二区| 亚洲精品国产动漫| 亚洲国产成人av| 精品久久久久久一区| 在线观看 中文字幕| 日韩激情毛片| 欧美在线你懂得| 永久免费在线看片视频| 丰满熟女一区二区三区| 首页综合国产亚洲丝袜| 久久精品2019中文字幕| 老司机av网站| 中文不卡1区2区3区| 国产精品国产a| 成人性色av| www.五月婷婷.com| 国产精品www.| 亚洲一区二区黄| 樱花草www在线| 色一区二区三区| 亚洲日本在线视频观看| 久久久久久久久久久久久久一区| 亚洲天堂网在线视频| 在线日本高清免费不卡| 久久久国产精品一区| 亚洲精品视频大全| 在线一区二区三区视频| 欧美视频三区在线播放| 欧日韩免费视频| 国产精品88a∨| 亚洲精品卡一卡二| 自拍自偷一区二区三区| 欧美一二三区精品| 欧美性猛交xxx乱久交| av中文字幕在线看| 亚洲嫩草精品久久| 亚洲黄色成人久久久| 五月天激情开心网| 国产高清亚洲一区| 成人妇女淫片aaaa视频| 天天天天天天天干| 久久蜜桃资源一区二区老牛| 韩国美女主播一区| 中文字幕av免费在线观看| 欧美日韩精品在线一区| 日韩精品免费在线| 久久久老熟女一区二区三区91| 自拍偷拍亚洲| 欧美日韩精品一区二区三区蜜桃 | 黄色片视频网站| 亚洲影视一区二区三区| 深夜福利一区二区| 色噜噜噜噜噜噜| 欧美男同视频网| 亚洲精品自在久久| 天天躁日日躁aaaxxⅹ| 日本午夜精品| 日韩精品视频在线免费观看| 国产成人av无码精品| 都市激情亚洲| 亚洲韩国欧洲国产日产av| 成人欧美精品一区二区| 日韩免费高清视频网站| 日韩一区二区三区观看| 特黄特黄一级片| 视频在线亚洲| 日韩欧美亚洲国产精品字幕久久久| 中文字幕第17页| 亚洲综合伊人| 91麻豆精品国产91| 欧美日韩一区二区区| 亚洲综合网站| 亚洲成人中文字幕| www.久久av| 极品美女一区二区三区| 在线观看91久久久久久| 日日噜噜夜夜狠狠久久波多野| 99久久99久久精品国产片果冰| 日韩中文字幕在线精品| 永久看片925tv| 国内精品美女在线观看| 51视频国产精品一区二区| 一级做a爰片久久毛片| 日韩精品91亚洲二区在线观看| 国产精品对白刺激| 99国产精品久久久久久久成人 | 被黑人猛躁10次高潮视频| 国精产品一区一区三区免费视频| h视频在线免费观看| 一区二区三区在线视频免费观看| av在线观看地址| 韩漫成人漫画| 欧美精品自拍偷拍| 北京富婆泄欲对白| 国产欧美日韩| 欧美激情久久久| 久久国产视频一区| 精品亚洲porn| 精品免费国产| 99re在线视频| 亚洲一区二区成人在线观看| 日本成年人网址| 久久91超碰青草在哪里看| 日韩欧美你懂的| 亚洲天堂视频一区| 欧美激情亚洲| 国产精品99久久久久久人| jizz中国少妇| 国产日韩综合av| av在线com| 成人精品一区二区三区电影| 亚洲精品在线观看视频| 蜜桃av免费在线观看| 亚洲美女一区| 亚洲xxxx做受欧美| 国产视频网址在线| 亚洲午夜精品网| 中文字幕永久有效| 精品在线91| 久久久久久久色| 一区二区 亚洲| 久久综合精品国产一区二区三区| 最近免费观看高清韩国日本大全| 免费观看欧美大片| 欧美大片免费久久精品三p| 阿v天堂2014| 国产精品一页| 91在线在线观看| 色开心亚洲综合| 色老汉一区二区三区| 又色又爽又黄18网站| 99久久久久国产精品| 日本国产精品视频| 午夜视频免费看| 一区二区三区四区av| 伊人色在线观看| 国内亚洲精品| 日韩免费观看在线观看| 亚洲人视频在线观看| 一区二区三区国产豹纹内裤在线| 欧美激情第3页| 国产精品一在线观看| 日本不卡高字幕在线2019| 日韩中文字幕免费在线观看| 亚洲男同性恋视频| 亚洲xxx在线观看| 久久精品国产68国产精品亚洲| 欧美又大又粗又长| 五月婷婷深深爱| 午夜精品久久久久影视| 好吊操视频这里只有精品| 午夜精品国产| 99re国产视频| 婷婷在线播放| 欧美v日韩v国产v| 久久久久久国产精品视频 | 日韩av卡一卡二| 日韩激情免费| 国产日韩在线精品av| 在线免费看黄网站| 欧美高清dvd| 国产黄色录像片| 国产伦精品一区二区三区在线观看| 亚洲精品高清国产一线久久| 久久伊人国产| 日韩一区二区三区xxxx| 国产精品区在线观看| 亚洲品质自拍视频| 黑人无套内谢中国美女| 国产一区观看| 久久久www免费人成黑人精品| 日本10禁啪啪无遮挡免费一区二区| 午夜视频在线观看网站| 欧美日韩中字一区| 天天操夜夜操av| 国产精品资源网| 97在线免费视频观看| 成人盗摄视频| 欧洲成人免费视频| 超碰97在线免费观看| 884aa四虎影成人精品一区| 久久福利免费视频| 成人av手机在线观看| aaaaaa亚洲| 久久精品国产亚洲夜色av网站| 91在线免费看网站| 国产h片在线观看| 亚洲天堂男人的天堂| 在线视频 91| 亚洲午夜私人影院| 中文字幕在线看高清电影| 日本va欧美va瓶| 亚洲一区 在线播放| 欧美亚洲国产日韩| 国产精品久久一区| 天堂va在线| 亚洲精品一区二区三区婷婷月| jizz国产在线| 一区二区三区在线视频免费观看| 野花社区视频在线观看| 精品一区二区免费在线观看| 婷婷五月综合缴情在线视频| 欧美精选视频在线观看| 91久久嫩草影院一区二区| 嗯啊主人调教在线播放视频 | 国产黄色一区二区三区| 在线日韩电影| 在线一区日本视频| 窝窝社区一区二区| 成人欧美在线视频| 欧美大胆a人体大胆做受| 精品国产一区二区三区久久狼5月 精品国产一区二区三区久久久狼 精品国产一区二区三区久久久 | 91精品国产麻豆| 国产精品一区二区三区四| 中文字幕一区二区三区色视频 | 日韩一区二区三区精品| 日本精品一区二区三区在线| av免费网站在线观看| 亚洲欧美国产一本综合首页| 国产成人麻豆精品午夜在线| 日本乱人伦一区| 日韩精品一区二区三| 亚洲人成网站影音先锋播放| 成人在线一级片| 成人av资源站| 杨幂一区二区国产精品| 日本人妖一区二区| 337p粉嫩大胆噜噜噜鲁| 欧美日本三区| 国产日本欧美在线| 欧美在线色图| 欧美日韩亚洲免费| 欧美18免费视频| 成人综合色站| 精品国产三区在线| 国产免费观看久久黄| 国产免费不卡| 欧美亚洲免费电影| caoporn视频在线| 欧美成人手机在线| 麻豆视频在线| 日韩在线视频网站| chinese偷拍一区二区三区| 日韩电影网在线| 日韩亚洲一区在线播放| 超免费在线视频| 欧美成aaa人片在线观看蜜臀| 第一福利在线| 国产一区二区三区欧美| 久草在线青青草| 精品视频中文字幕| 亚州av在线播放| 亚洲精品国产电影| 天天射天天色天天干| 亚洲成人久久一区| 日本黄色大片视频| 亚洲精品久久在线| 香蕉视频网站在线| 亚洲人成电影网| 加勒比一区二区三区在线| 亚洲欧美日韩中文在线| 涩爱av在线播放一区二区| 日韩精品在线观看网站| 久蕉在线视频| 色噜噜国产精品视频一区二区| jzzjzzjzz亚洲成熟少妇| 国产一区二区三区视频免费| 18免费在线视频| xxxxxxxxx欧美| 91高清在线观看视频| 欧美国产日韩在线| 成人免费网站观看| 青青草国产精品一区二区| 国产经典一区| 国产欧美精品日韩精品| 九九九九九九精品任你躁| 99re视频在线| 小嫩嫩12欧美| 色播五月综合| 一区二区影视| 五月丁香综合缴情六月小说| 香蕉久久夜色精品国产| 国产福利影院在线观看| 极品少妇xxxx精品少妇| 男男受被啪到高潮自述| 91香蕉视频污| 日韩影视一区二区三区| 亚洲欧美一区二区三区极速播放| 国产一级在线观看视频| 一本大道综合伊人精品热热| 中文字幕av网站| 欧美一级电影网站| 日韩毛片在线一区二区毛片| www.亚洲男人天堂| h片在线观看视频免费免费| 国产精品jvid在线观看蜜臀| 国产日本亚洲| 欧美日本亚洲| 雨宫琴音一区二区三区| 欧美 日韩 国产 高清| 日韩高清在线一区| 女人扒开双腿让男人捅| 久久免费午夜影院| 在线观看成人毛片| 色又黄又爽网站www久久| 97精品人妻一区二区三区| 亚洲精品国产拍免费91在线| 99re在线视频| 欧美与欧洲交xxxx免费观看| 91亚洲精品在看在线观看高清| 韩国精品一区二区三区六区色诱| 久久在线播放| 国产免费黄色av| 国产精品亚洲专一区二区三区| 三上悠亚ssⅰn939无码播放| 亚洲欧美色一区| 三级网站在线播放| 亚洲成人免费在线视频| 黄色成年人视频在线观看| 日本精品性网站在线观看| 一区二区三区在线资源| 亚洲日本精品| 久久九九精品| www.黄色网| 国产精品久线在线观看| 亚洲欧美自拍视频| 精品不卡在线视频| 18加网站在线| 国产欧美va欧美va香蕉在线| 久久久精品毛片| 成人免费黄色大片| 欧美xxxooo| 91国产丝袜在线播放| 色偷偷在线观看| 欧美日韩电影在线观看| 午夜不卡一区| 日韩欧美激情一区二区| 夜夜精品视频| 无码国产69精品久久久久网站 | 777精品伊人久久久久大香线蕉| 欧美日本韩国一区二区| 97视频com| 激情亚洲另类图片区小说区| 97精品国产97久久久久久粉红| 麻豆精品视频在线观看| 亚洲国产日韩一区无码精品久久久| 香蕉影视欧美成人| 日本激情一区二区| 久久久久久久97| 99精品国产高清一区二区麻豆| 中国女人做爰视频| 国内精品国产成人| 18岁成人毛片| 日韩一区二区三区在线| av在线播放观看| 91沈先生播放一区二区| 欧美黄色一级视频| 国产成人av片| 亚洲成人综合网站| 亚洲日本香蕉视频| 日本精品一区二区三区在线播放视频 | 精品久久久久久久久久久| 国产 日韩 欧美 综合| 久久久久久综合网天天| 黄色软件在线观看| 综合电影一区二区三区| 337p粉嫩色噜噜噜大肥臀| 亚洲一区www| 国产精品4hu.www| 91免费视频黄| 国产ts人妖一区二区| 日韩高清免费av| 精品香蕉一区二区三区| 日韩电影免费观| 亚洲欧美日韩不卡一区二区三区| 激情深爱一区二区| 九九热精彩视频| 亚洲激情视频在线播放| 九九热线视频只有这里最精品| 亚洲欧美日韩另类精品一区二区三区| 久久成人麻豆午夜电影| 久久精品国产亚洲av麻豆色欲| 亚洲精品国精品久久99热| 欧美精品总汇| 综合色婷婷一区二区亚洲欧美国产| 国产成人av一区二区三区在线观看| xxxx 国产| 一本久久综合亚洲鲁鲁| 国产一区2区在线观看| aa视频在线播放| 国产欧美日韩在线| 国产成年妇视频| 91av在线免费观看视频| 四虎8848精品成人免费网站| 中文字幕无人区二| 欧美性猛交xxxx黑人交| 欧美性video| 日本黑人久久| 成人福利在线看| 亚洲自拍偷拍另类|