精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于 Apache Paimon 流式數據湖提升數據處理的時效性

原創
大數據
在近日舉辦的WOT全球技術創新大會2023·北京站的《大數據技術創新》專場中,來自阿里云的高級技術專家李勁松帶來了主題為《Apache Paimon 流式數據湖 V0.4與后續展望》的精彩分享,從理論、實踐和未來發展方面詳細介紹了Apache Paimon 流式數據湖。?

隨著結構化數據、半結構化數據和非結構化數據的不斷增加,越來越多的企業選擇將數據存儲在數據湖中,便于更好地管理和利用數據資產。但是企業對數據更新處理時效性的要求越來越高,數據湖無法實現高吞吐、低延遲的數據攝入、流式訂閱以及實時查詢。因此流式數據湖存儲技術誕生了。

在近日舉辦的WOT全球技術創新大會2023·北京站的《大數據技術創新》專場中,來自阿里云的高級技術專家李勁松帶來了主題為《Apache Paimon 流式數據湖 V0.4與后續展望》的精彩分享,從理論、實踐和未來發展方面詳細介紹了Apache Paimon 流式數據湖。

Apache Paimon 流式數據湖是什么?

Apache Paimon是一個從準實時出發的流式數據湖,也是專門為CDC處理流計算而生的數據湖。Apache Paimon的創新之處在于采用了湖存儲+ LSM的文件組織架構,基于分布式文件系統管理元數據。

在管理元數據之前,首先需要處理元數據。當元數據流入Apache Paimon后,其處理流程分為寫入、壓縮、清理和讀取。寫入和壓縮都在Flink Job中完成,用戶無需創建Spark的離線作業再做異步聚簇(Clustering)。基于這樣的設計,Apache Paimon的優勢之一就是Append 寫入,所以吞吐大;局部壓縮減少了寫入放大,所以消耗低。最后在Flink Sink中自動清理、有序合并。

而對于任何一個創新的技術來說,沒有良好的生態體系就無法走得長遠。雖然Apache Paimon目前的生態體系還不及傳統數據湖,但也已經支持或部分支持Flink、Hive、Trino、Spark和Presto。

其中,Apache Paimon對Flink的支持最佳,可以支持Flink的所有特征。其次是Spark,目前能夠支持讀寫,也基本支持Create Table。StarRocks、DORIS、網易Arctic,阿里云大數據計算(MaxCompute)和實時數倉(Hologres)等產品也正在積極對接中。

流式數據湖新場景

“實時”是流式數據湖的核心。所以Apache Paimon最大的特點就是能讓數據實時流入,做到實時數據流讀和實時字段打寬,不再是每天或每小時更新離線數倉的數據。但是目前在實時入湖、打寬和流讀中也面臨許多痛點,比如吞吐量低和資源消耗高、存在亂序等等。在本次分享中,李勁松詳細介紹了數據湖新場景中的痛點,以及Apache Paimon是如何解決這些難題的。

實時數據入湖

想要處理數據,首先需要讓數據入湖。而實時數據入湖是實時更新來自數據庫的 CDC 數據。但是在實時數據入湖時存在著三類問題。首先,是吞吐量低和資源消耗高的問題。第二,在管理方面,數據湖需要管理好壓縮、清理歷史文件和清理過期分區,并且不需要額外的管理成本。最后在模型演進方面,數據湖不會跟隨模型的變化而變化,僅僅只是存儲數據。

針對這些問題,Apache Paimon從架構和功能兩方面雙管齊下。從架構方面來說,當數據湖結合LSM Append后,形成了高效寫入吞吐的優勢;結合LSM的Minor Compaction后,可以有效減少寫入放大,從而解決吞吐量小和資源消耗高的問題。而LSM是按照組件排序的,所以Apache Paimon的寫入性能較原有的Hudi表提升了3倍以上;部分查詢性能則提升了7倍。

在功能方面,李勁松重點介紹了Apache Paimon的CDC入湖功能:表同步和整庫同步。

表同步可以同步表的結構,包括增列、刪列、類型變更和重命名列,還可以新增計算力、定義分區力和定義組件,甚至做到分庫分表的同步。整庫同步可以指定表、增加前后綴,也可以動態新增表。在這兩個功能基礎上,Apache Paimon還提供了CDC Data Schema API,基于Data Schema API便能同步更多的數據,甚至在分級的流計算中做到模型同步。

實時字段打寬

數據入湖存儲后,如果不用則會變成數據沼澤。實時打寬維表的字段能夠給下游提供查詢及流讀,讓數據流動起來。但是實時字段打寬同樣存在三類問題。第一個問題也是吞吐量低和資源消耗高。第二,在讀取方面,如果無法支持列裁剪,則無法達到高效的讀時合并(Merge On Read)。最后是亂序的處理問題,Apache Paimon是基于分布式文件系統管理元數據的,但是分布式處理的亂序場景非常多,亂序如何處理?

Apache Paimon通過支持部分更新來解決這些問題。Apache Paimon基于LSM的部分更新(Partial-Update)功能,從而在讀時合并和合并(Merge)時做到部分更新。這就意味著在查詢時可以做到列裁剪,并且在寫入達到高吞吐時,也能保證查詢有非常好的性能。

而針對亂序問題,Apache Paimon支持定義Sequence Field處理亂序。Apache Paimon V0.5版本引入了一個新的概念——Sequence Group。Sequence Group是讓每個流定義自己的序列組應對多流亂序,從而真正做到部分更新,而不是non-null Update。

實時數據流讀

實時數據流讀是提供消息隊列體驗的流讀,并能根據主鍵生成變更日志。數據湖流讀的痛點之一在于沒有全量數據。如果沒有以前的數據,數據只能完全從零開始生成,那么結果可能就會很不理想。除此之外,數據湖還有生成變更日志成本較高、文件清理與流讀的矛盾(FileNotFound)以及不支持Flink的Lookup Join的問題。

Apache Paimon著重增強了流讀。Apache Paimon首先支持流讀原始數據,實現全增量數據一體流讀。而在生成變更日志方面,Apache Paimon是以Full-compaction的方式生成變更日志,同時也支持多種生成方案,其中就包括Flink的Lookup Join。通過Apache Paimon生成的變更日志,時延也有所降低:Lookup 模式時延在1-3分鐘;Full-compaction 模式時延在3-10分鐘。

此外,Apache Paimon還有一個新的功能——Consumer-ID。Consumer-ID類似Kafka的GroupID,確保數據不會被淘汰,保證流讀的安全性。Consumer-ID也支持流讀無狀態重啟,解決流讀恢復時的FileNotFound的問題。

Apache Paimon在社區中的應用實踐

以上都是從理論方面介紹Apache Paimon的獨特之處。而在實踐應用中,Apache Paimon的表現又如何?接下來,李勁松主要介紹了Apache Paimon在阿里云計算平臺、字節跳動、同程旅行及其它社區中的應用實踐,展現出Apache Paimon出色的實踐能力。

阿里云計算平臺目前已達到了計算全集成,Apache Paimon替代Hudi成為實時入湖的首選。計算平臺可以通過實時計算Flink入湖,或通過CTAS、CDAS命令達到模型同步入湖,并進行實時計算流讀。

而字節跳動集成了Apache Paimon + Flink,解決了血緣管理和一致性管理問題,實現了真正意義上的Streaming Warehouse生產體系,讓每個數據流動并沉淀。

同程旅行引入Apache Paimon,優化了原有的Hudi近實時數倉,整體規模達到了上百個作業,最大的表有90億+的數據。

除此以外,中原銀行、米哈游、Bilibili、塵鋒信息、汽車之家、巴別時代、海蘭寰宇等企業都在用Apache Paimon + Flink探索流式數倉,甚至是向流批一體近實時數倉的方向前進。

Apache Paimon未來規劃

通過從理論和應用實踐方面的介紹,不難看出Apache Paimon已經解決了很多目前數據湖存在的問題。但是Apache Paimon的創新不止于此。在演講的最后,李勁松提到了Apache Paimon短期和長期的發展規劃,表明了未來的發展方向。

首先在短期內,Apache Paimon需要加強CDC場景、實現動態 Bucket 全自動、創建Immutable Tag從而提供Immutable的離線版本、增強Append-Only處理以及Spark集成。

從長期發展來看, CDC實時數據湖需要在Apache Paimon中達到完全成熟的狀態;其次,Append離線表達到生產可用的狀態;最后,生態能夠達到全面對接,Spark集成完全成熟。

以上內容整理自阿里云高級技術專家李勁松在WOT全球技術創新大會2023·北京站《大數據技術創新》專場中的精彩分享。獲取完整PPT請關注51CTO技術棧公眾號,后臺發送【WOT2023PPT】即可直接領取。

責任編輯:劉睿暄 來源: 51CTO
相關推薦

2024-08-27 09:12:36

2025-02-05 08:13:48

Go語言范式

2022-10-17 10:48:50

Hudi大數據Hadoop

2021-04-02 12:55:14

數據處理Apache Falc開發

2013-04-27 10:32:51

大數據全球技術峰會大數據流計算

2021-08-31 10:07:16

Flink Hud數據湖阿里云

2018-11-05 15:15:38

大數據流式數據互聯網

2013-08-05 00:38:11

個性化搜索個性化時效性

2025-03-11 14:09:04

2025-02-28 09:05:38

2009-10-14 14:27:44

DataPlatforInformatica數據平臺

2017-08-31 16:36:26

2021-02-18 09:54:37

數據湖框架數據

2024-02-04 16:22:13

Python流式輸出開發

2017-07-21 14:22:17

大數據大數據平臺數據處理

2015-03-16 14:54:06

大數據流式大數據大數據處理

2022-02-15 09:30:29

庫表分布式Redis

2024-04-01 12:33:19

PyCudaGPUPython

2025-09-03 08:21:03

點贊
收藏

51CTO技術棧公眾號

六九午夜精品视频| 亚洲高清精品视频| 国产成人精品三级高清久久91| 亚洲va欧美va人人爽| 美女被啪啪一区二区| 特级毛片www| 成人精品电影| 日韩视频国产视频| 欧美,日韩,国产在线| 精品影院一区| 久久99精品久久久久婷婷| 久久精品最新地址| 欧美美女性视频| 欧美大胆的人体xxxx| 91丨porny丨国产入口| 国产精品1区2区在线观看| 狂野欧美性猛交| 国产一区调教| 欧美挠脚心视频网站| 野外做受又硬又粗又大视频√| 欧美拍拍视频| 免费在线观看日韩欧美| 欧美精品videofree1080p| 99久久久久久久久久| 欧美影视资讯| 亚洲高清免费视频| 午夜老司机精品| 国产高清免费在线观看| 久久午夜激情| 欧美精品在线观看| 国产又黄又粗视频| 风间由美性色一区二区三区四区| 欧美三级欧美一级| 黄色影视在线观看| 猫咪在线永久网站| 成人网在线免费视频| 91精品国产综合久久香蕉最新版 | 草莓视频成人appios| 亚洲黄色尤物视频| 亚洲区一区二区三区| 天天干免费视频| 极品尤物av久久免费看| 青青在线视频一区二区三区| 黄色录像二级片| 国产精品中文字幕亚洲欧美| 亚洲精品一区二区三区99| 五月天av在线播放| 五月天av在线| 亚洲成人激情av| 免费看黄色a级片| 日韩精品成人av| 久久美女艺术照精彩视频福利播放| 91九色国产视频| 在线免费看av片| 久久一区激情| 97国产精品视频| 黄色在线观看免费| 欧美成人有码| 久久福利网址导航| 无码人妻精品一区二区中文| 欧美丝袜足交| 日韩午夜激情免费电影| 一起操在线视频| 日本亚洲欧洲无免费码在线| 在线视频一区二区三| 美女av免费在线观看| 阿v视频在线| 精品国产91久久久久久老师| 欧美日韩在线不卡视频| 日本一道高清亚洲日美韩| 欧美性一区二区| 天天视频天天爽| 成人久久精品| 欧美精品一区二区三区蜜桃 | 久热爱精品视频线路一| 极品盗摄国产盗摄合集| 亚洲婷婷免费| 日韩av毛片网| 国产麻豆免费观看| 成人动漫一区二区在线| 欧美性xxxx69| 国产小视频免费在线观看| 亚洲欧美在线另类| 精品人妻大屁股白浆无码| 免费h在线看| 欧美天堂亚洲电影院在线播放| 久久久久xxxx| 国产精品毛片视频| 在线电影欧美日韩一区二区私密| 免费观看特级毛片| 亚洲国产高清一区| 国产精品91免费在线| 99在线精品视频免费观看20| bt7086福利一区国产| 亚洲欧洲精品一区二区三区波多野1战4 | 高清免费成人av| 欧美综合77777色婷婷| 欧美jizz18性欧美| 天天亚洲美女在线视频| 亚洲36d大奶网| 动漫视频在线一区| 色偷偷噜噜噜亚洲男人的天堂| 精品97人妻无码中文永久在线| 久久av一区| 91在线在线观看| 浮生影视网在线观看免费| 亚洲电影一级黄| 天天干天天av| 亚洲午夜久久| 久久久久久国产免费| 中文天堂在线资源| 91蜜桃传媒精品久久久一区二区| 二级片在线观看| 亚洲精品一区| 精品国产自在久精品国产| 国产精品成人无码免费| 一区在线观看| 亚洲在线视频福利| 国产私拍精品| 婷婷综合久久一区二区三区| 91免费视频污| 日韩理论在线| 国产精品jizz在线观看麻豆| 空姐吹箫视频大全| 亚洲精品写真福利| 亚洲怡红院在线| 国产亚洲第一伦理第一区| 97在线观看视频国产| 亚洲av无码片一区二区三区| 亚洲欧洲日产国码二区| 亚洲福利精品视频| 亚洲精品aaaaa| 97久久精品国产| 午夜精品久久久久久久99老熟妇 | 精品久久久久久中文字幕动漫| 国产精品一级伦理| 午夜精品福利视频网站| 亚洲自拍第三页| 国产精品成人a在线观看| 国产999精品久久久| 三级在线播放| 欧美色视频日本版| 免费黄色在线视频| 国产精品久久777777毛茸茸 | 精品一二三区视频| 欧美体内谢she精2性欧美| 亚洲美女精品视频| 欧美精品色网| 国产98在线|日韩| 欧美极品少妇videossex| 日韩三级视频中文字幕| 国产大片免费看| 国产在线一区二区综合免费视频| 在线观看免费91| 日本在线一区二区| 欧美不卡视频一区发布| 国产ts人妖调教重口男| 亚洲欧美一区二区三区孕妇| 国产一级片中文字幕| 欧美久久九九| 国产欧美一区二区视频| 日本不卡1234视频| 亚洲人免费视频| 在线免费看av的网站| 亚洲丝袜制服诱惑| av免费观看不卡| 亚洲综合二区| 日韩精品伦理第一区| 久久天天久久| 欧美大片在线看免费观看| 色丁香婷婷综合久久| 色综合久久综合网欧美综合网 | 亚洲色图视频免费播放| 四川一级毛毛片| 一本久久综合| 亚洲v欧美v另类v综合v日韩v| 亚洲一区二区av| 久久久久久久久综合| 欧洲视频在线免费观看| 欧美三级视频在线| 成人免费看片98| 久久亚洲欧美国产精品乐播 | 成人免费看片98欧美| 久久这里只精品最新地址| 蜜臀一区二区三区精品免费视频| 综合日韩在线| 欧美日韩精品免费看| 高清在线一区二区| 欧美亚洲国产日本| 黄色视屏免费在线观看| 亚洲第一免费网站| 在线观看xxxx| 亚洲v精品v日韩v欧美v专区| 欧美日韩精品一区二区天天拍小说 | 久久人人爽国产| 国产香蕉在线| 精品av久久707| 中文字幕在线播放不卡| 亚洲国产欧美在线人成| av手机在线播放| 成人高清伦理免费影院在线观看| 国产一级特黄a大片免费| 国精品一区二区| 亚洲成人一区二区三区| 在线视频亚洲欧美中文| 国产精品99蜜臀久久不卡二区| 四虎影院观看视频在线观看 | 国产欧美一级| 99亚洲精品视频| 九九亚洲精品| 国产91免费视频| 国产高清亚洲| 国产精品免费视频久久久| 国模私拍视频在线播放| 综合激情国产一区| 天天干天天色天天| 欧美一区二区三区免费视频| 波多野结衣激情视频| 香蕉成人伊视频在线观看| 在线观看黄网址| 欧美经典三级视频一区二区三区| 大尺度做爰床戏呻吟舒畅| 精品一区二区在线播放| 午夜dv内射一区二区| 99国产一区| 在线观看17c| 亚洲一区二区| 亚洲在线视频一区二区| 欧美精品第一区| 国产亚洲精品久久飘花| 亚洲不卡在线| 亚洲精品日产aⅴ| 在线观看亚洲精品福利片| 国产精品9999| 日韩国产激情| 日韩美女在线看| 自拍偷拍亚洲视频| 91精品国产色综合| 91在线超碰| 欧美国产精品人人做人人爱| 黄色小网站在线观看| 日韩视频一区在线| 免费网站黄在线观看| 在线视频欧美性高潮| 国产中文字幕在线看| 亚洲视频免费一区| 福利在线观看| 日韩视频―中文字幕| 中文日本在线观看| 播播国产欧美激情| 国产黄色在线网站| 欧美日本国产在线| 国产黄色大片在线观看| 欧美极品xxxx| 超碰在线公开| 热久久这里只有精品| 免费成人动漫| 国产精品旅馆在线| 日韩成人一区| 99电影网电视剧在线观看| 91欧美极品| 欧美成熟毛茸茸复古| 久久99国产精一区二区三区| 日本精品二区| 国产精品97| 91免费黄视频| 老司机午夜精品视频| 五月婷婷之综合激情| 精油按摩中文字幕久久| 亚洲欧美激情一区二区三区| 成人午夜在线播放| 日韩av一二区| 国产精品久久久久久久岛一牛影视 | 色诱视频在线观看| 久久99久久久欧美国产| 中文字幕一二三| 99r国产精品| 免费看91的网站| 有码一区二区三区| 可以免费在线观看的av| 欧美日韩中文精品| 超碰在线播放97| 亚洲欧洲在线播放| 久操视频在线播放| 欧美一区二区大胆人体摄影专业网站| 希岛爱理一区二区三区av高清| 国产主播精品在线| 国产日韩三级| 亚洲欧洲精品一区二区三区波多野1战4| 一个色综合网| av免费观看网| 精品一区二区久久久| 日本人添下边视频免费| 欧美高清在线精品一区| 免费人成视频在线| 欧美色综合网站| 丰满肥臀噗嗤啊x99av| 亚洲人成网站777色婷婷| 二区三区在线观看| 国产精品白丝jk喷水视频一区| 欧美中文高清| 丝袜足脚交91精品| 最新成人av网站| 日本中文字幕观看| 91欧美一区二区| 国产一区二区三区在线视频观看| 欧美日韩免费在线| 99精品免费观看| 亚洲日韩欧美视频| av电影在线地址| 91影视免费在线观看| 精品日韩毛片| 欧美日韩在线一| 国产精品亚洲人在线观看| 女女互磨互喷水高潮les呻吟| 亚洲国产aⅴ成人精品无吗| 中文字幕一区2区3区| 亚洲国产成人一区| 91麻豆国产福利在线观看宅福利| 国产精品ⅴa在线观看h| 西野翔中文久久精品字幕| 800av在线免费观看| 看片网站欧美日韩| 女尊高h男高潮呻吟| 亚洲网友自拍偷拍| 亚洲AV无码乱码国产精品牛牛 | 深夜福利影院在线观看| 欧美性生交片4| 毛片在线播放网址| 欧美亚洲另类在线| 欧美亚洲大陆| 欧美成人免费在线观看视频| 粉嫩蜜臀av国产精品网站| 四虎884aa成人精品| 欧美高清dvd| 黄色网在线播放| 亚洲iv一区二区三区| 忘忧草精品久久久久久久高清| 手机在线免费观看毛片| 国产午夜精品久久久久久免费视 | 阿v视频在线| 韩国成人av| 国产精品入口| 国产偷人妻精品一区| 大荫蒂欧美视频另类xxxx| 香蕉视频免费看| 日韩免费观看高清| 少妇一区二区视频| 男人搞女人网站| 国产精品久久久爽爽爽麻豆色哟哟| 一区二区视频网| 精品国产一区二区三区久久久狼| 国产精品伦一区二区| 一区国产精品| 国产成人午夜99999| 精品处破女学生| 精品国产成人系列| 国产99在线| 久久66热这里只有精品| 99热这里只有成人精品国产| 国产ts丝袜人妖系列视频| 亚洲3atv精品一区二区三区| 秋霞av在线| 国产极品jizzhd欧美| 国产精品7m凸凹视频分类| 中文字幕视频三区| 亚洲综合自拍偷拍| 91精品国产乱码久久| 精品国内自产拍在线观看| 久久91视频| 久草视频这里只有精品| 暴力调教一区二区三区| 99久久精品国产亚洲| 亚洲人成免费电影| www.欧美视频| 国产亚洲黄色片| 国产欧美一区二区三区在线老狼| 亚洲视屏在线观看| 中文字幕精品国产| 中文在线а√天堂| 久久精品一区二区三区不卡免费视频| 国产日韩欧美三区| 最近中文字幕无免费| 色婷婷久久一区二区三区麻豆| 美州a亚洲一视本频v色道| 日韩免费高清在线观看| 欧美日韩伦理在线免费| 久久精品99国产| 国产欧美一区二区三区鸳鸯浴| 国产日本精品视频| 午夜免费日韩视频| 日韩欧美高清在线播放| 伊人色在线视频| 第一福利永久视频精品| 在线观看av的网站| 国产一区高清视频| 日韩av午夜在线观看| 青青草手机在线视频| 精品视频在线播放免| 久久精品一级|