精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據湖在快手的應用實踐

大數據 數據湖
本文將分享數據湖在快手的應用實踐。文章從業務使用方的視角,全面回顧了數據湖(Hudi)在快手內部的應用推廣歷程,給業務開發帶來的效率提升和成本優化,以及在實際應用中如何與技術團隊緊密配合將 Hudi 打造為覆蓋全公司、賦能多場景的核心基礎設施。

一、數據湖在快手的應用歷程

1. 業務面臨的問題與挑戰

圖片

(1)數倉規模的持續膨脹

快手業務發展迅速,對數據精細化運營的要求越來越高。隨之而來,數倉的數據模型持續快速增長。這帶來了兩個主要問題:

其一,計算和存儲成本也隨之線性增長。在當前降本增效的大背景下,持續的成本增長與團隊的目標戰略相悖。

其二,龐大的數據模型給治理和運維帶來了挑戰。多套數據模型迭代節奏不一致,容易導致數據一致性的質量問題,運維成本越來越高。

(2)協作效率有待提升

快手是一家多元化的業務公司,不可避免地會涉及到跨部門的數據協作。以計算ROI 為例,就需要匯總收入和支出兩部分數據,而這些數據掌握在不同的業務部門手中。跨部門協作時,主要會遇到兩個問題:

其一,時間的匹配。由于不同部門的業務側重點不一樣,在排期上難免會有差異,影響協作效率。

其二,數據異動追蹤不夠敏捷。當數據發生異動時,由于聯動上下游多方排查時數據連環依賴加工,造成牽連廣泛、排查周期較長。

(3)實時與離線數據差異

對數據時效性要求高的場景,比如活動效果監控、策略快速驗證等,存在實時和離線數據誤差的問題。如,實時數據顯示當天目標達成或未達成,但次日離線數據結果相反,這就會影響到業務決策的及時性和準確性。

圖片

對于數倉規模為什么會持續擴漲,接下來基于真實的案例做分析。從需求交付的視角,最細粒度的目標是基于[公共模型 3]同時交付核心日報、增長錢效、增長日報 3 個需求;這樣看起來最合理的數倉模型只需要 1 個模型即可;但,實際為什么不行。我個人認為原因有二,其一:面向數據應用的視角,時效 SLA 是繞不開的話題,因為用到多個數據來源,將結果整合到一起,數據的時效 SLA = 最晚的數據源就緒時間 + 任務執行時間,那么為了滿足數據時效 SLA 的訴求,會建設[公共模型 1&2&3];其二:如果將大量的業務過程的指標和緯度整合到一個模型,當前的計算引擎(Hive、Spark)的執行時長過長&優化難度較大;從而進一步帶來時效 SLA 的保障壓力。

那么有沒有辦法實現純面向領域模型、業務過程、數據建模理論,滿足計算性能要求,滿足時效 SLA 要求的解決方案。經過思考,我們需要一個引擎,它支持對數倉模型的更新寫。

2. 架構演進:從 Hive 到 Hudi 的技術變革之路

圖片

經過調研,數據湖技術支持對數倉模型的更新寫。市面上有多個引擎該如何選擇?主要的評判標準有三:第一,引擎的功能豐富度,功能越豐富,就可以適配更多的業務場景,適用性更強;第二,與快手現有大數據架構和技術棧的契合度,契合度越高,引入新引擎的投入越小、時間越短,解決問題的效率越高;第三,引擎的自動化程度,自動化程度越高帶來的運維成本越低。

綜合對比后,Hudi 憑借其豐富的功能、與現有架構的良好適配性,以及相對較低的運維成本,成為快手大數據團隊的首選。

選定引擎后,對數倉架構的規劃藍圖是:按照業務實體整體設計大寬表,實現跨領域的打通(增長、商業化、電商),跨業務的并行協作;單領域(增長)的多業務過程的團隊內并行協作;業務間&團隊內實施的同學關注于實體粒度下實現。依據 SLA 的訴求將模型拆成合理的子任務,通過更新的方式補充模型數據內容。

下邊我們基于問題看下如何應用。

3. 快手 Hudi 數據庫應用推廣歷程

圖片

我們依賴引擎的更新能力,可以從純數倉架構最理想模型的視角設計數倉模型。比如,我們將[數據統計]的所有指標和緯度 + 實體 ID 整合,建設跨主題的明細表,具體方案:

(1)基于時效SLA 的訴求,將子任務拆成 4、5、6、7 點執行的 4 個任。

(2)不用時間點執行的子任務,更新數據內容到跨主題的明細表。

(3)上層應用基于時效 SLA 抽取部分字段計算滿足業務訴求。

綜上,可以滿足數據架構的合理性、數據時效 SLA 的訴求、不同數據域(團隊)的協作。

對比傳統的一次性更新的模型,子任務邏輯更簡單、數量更小,因此任務的計算&執行效率更高,進一步提升了數據的 SLA 時效。

針對上述的建設過程,經過真實業務驗證取得了一些成效。

4. 快手Hudi 應用實踐初見成效

圖片

(1)從數倉模型視角:引擎更新能力的支持,可以將我們過往散落的模型中的業務過程做有效的整合。能更聚焦和詳細的通過數據描述業務;同時在數據的查找、使用、應用(計算)效率上有顯著提升。

(2)從數倉規模視角:去掉了因時效 SLA 帶來的非必要中間模型,因計算能力不足拆分的優化模型;數據規模有顯著下降;規模的下降帶來運維壓力的減輕、存儲、計算成本的下降。

(3)從數倉增量視角:除必要的新實體,絕大部分工作體現在對實體資產的迭代;使得公共數據的完備度持續完善,復用度持續提升;從而間接提升研發效率。

從結果來看,數據湖技術在生產、應用、效率、成本上是有收益的,那實際的推廣策略是什么,如何評估新引擎推廣的 ROI?

圖片

推廣策略、生態建設。

圖片

在推廣策略上分為幾個階段。

(1)功能&場景的覆蓋驗證

要推廣一款新的基礎組件,要找準切入點。我們重點聚焦在當前 Hive 和 Spark 生態無法有效解決的"老大難"問題:活動的分鐘級時效問題、狀態演變的全量回刷場景、DAU 點擊的時效優化場景。通過解決“老大難"問題,從業務的視角可以驗證引擎可以解決過往的不可能,體現其增量價值。

(2)論證點到面的普適性

在增長業務驗證其 100% 支持業務的可能性,從歷史任務的改造遷移、增量任務的直接應用,結果如上數據。通過整個業務方向的論證,可以認為:引擎在解決業務問題上具有普遍適用性。

(3)工具鏈生態建設、提升研發效率

技術落地的關鍵在于復用。快手內部擁很多業務部門,要做到全面普及,必須標準化使用范式,沉淀出一整套工具鏈。同時,我們在不斷地實踐中探索總結出了一些技術最佳實踐,以 ShowCase 的形式推廣到各個業務部門,實現了經驗的快速復制。

(4)廣泛應用

在引擎技術的可能性基礎上,加上工具生態的效率加持;公司各個團隊根據自己的業務場景和業務痛點進行針對性的應用與優化;目前已經得到廣泛的應用。

二、數據湖在快手的應用案例

1. 業務賦能:Hudi 在快手的典型場景

(1)CDC 數據同步

圖片

在數據同步方面,Hudi 展現出了不錯的效果。通過將小時或者天的定時觸發同步,迭代成實時的數據同步;這種數據同步模式,為許多實時性要求高的業務提供了有力保障。業務方不必再受限于夜間批處理的時間窗口,而是可以隨時消費到最新的數據,極大地提升了數據應用的靈活性。在時效上收益明顯,比如,一些核心的場景有60~90 分鐘的提升。

(2)批流結合業務加速

圖片

在某些場景下,僅有批處理還不夠,還需要實時的流式計算能力。Hudi 通過無縫集成批處理引擎和流處理引擎,很好地滿足了這一訴求。比如,除夕的紅包雨,需要在兩輪紅包雨之間完成下一輪 Push 推送的計算,使用歷史的小時計算需要 4~5 個小時的時間,但使用 Hudi 可以在上一輪紅包雨期間完成參與用戶的更新標記。Hudi 從技術上滿足了業務的場景訴求。在活動期間高頻應用,拿到了顯著的結果收益。

(3)架構升級數倉優化

圖片

基于寬表數據建設,將歷史基于時效&計算優化的 71 個模型,設計整合為基于設備&用戶為實體的 3 個模型,同時基于 SLA 的訴求拆分不同的子任務,最終在模型規模、計算成本、存儲成本都拿到不錯的收益。

圖片

基于引擎的更新能力,對數倉模型的設計思路和實現方式也有根本上的改變;比如,在計算 N 留存的設計,從過完多次重復的笛卡爾積計算轉為簡單更新計算,在時效和成本上取得顯著收益。

2. 快手 Hudi 應用實踐的一些思考

(1)需求引領,技術驅動

企業級服務的推廣切忌閉門造車,一定要深入了解一線的業務需求,找準痛點,才能真正發揮技術的驅動作用。快手的例子充分說明,Hudi 之所以能夠在較短時間內取得驕人的成績,正是得益于其直指業務痛點的能力。從這個意義上說,Hudi 在快手的成功首先應歸功于需求的精準引領。

(2)制度先行,奠定規范基礎

Hudi 在快手的推廣之所以能夠做到體系化,與其完善的配套制度是分不開的。通過建立統一的數據分層規范,快手為 Hudi 構建了一個蓬勃發展的良好生態。同時,將 Hudi 的最佳實踐以制度的形式固化下來,又為后續的推廣應用掃清了障礙。這為我們提供了一個很好的借鑒:任何新技術的引入都要考慮與現有的制度規范相配套,二者相輔相成,才能創造奇跡。

(3)打破壁壘,集體智慧方顯威力

Hudi 在快手的成功應用離不開各方的通力協作。從最初由基礎架構團隊主導,到后來獲得越來越多BU 的青睞和使用,我們越來越意識到要打破部門壁壘,讓集體智慧發揮出最大的威力。正如開源界流行的 "Given enough eyeballs,all bugs are shallow" 法則,新技術能否真正落地,關鍵在于能否調動起全員的積極性,在實踐中不斷打磨,集眾人之所長,補己之所短。

總而言之,快手在 Hudi 的引入和推廣過程中積累了豐富的經驗,也收獲了不菲的回報。其成功的要義在于需求引領、制度先行、破除壁壘,我們期待 Hudi 在快手能夠為業務創新和增長提供源源不斷的動力。也希望我們的實踐能給業界帶來一些啟示,為同行提供一些可資借鑒的范式。技術的進步永無止境,讓我們攜手共進,共創美好未來!

三、Q&A

Q:新的 Hudi 架構后,查詢速度優化可以從哪些方面來考慮?

A:對 Hudi 的查詢有兩種模式,第一種是在生產完成數據更新后即可以讀,第二種是數據需要 merge 之后才能使用,這種情況下需要等待 merge 之后再讀取數據。從生產讀的話,可以基于 Hudi 無增量來消費上游的變更數據,通過變更數據加上增量計算減少開銷提高性能。分析查詢的話,可以加上二級索引來快速進行查詢。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-07-12 16:07:50

鏈路數據湖技術

2023-05-16 07:24:25

數據湖快手

2023-06-28 07:47:34

Iceberg數據湖

2022-05-23 13:30:48

數據胡實踐

2023-10-13 07:25:50

2023-02-13 14:01:32

2019-05-31 12:03:06

SQLHadoop大數據

2022-06-09 14:19:46

順豐數據集成Flink

2021-09-13 13:46:29

Apache HudiB 站數據湖

2024-04-22 07:56:32

數據倉庫數據中臺數據服務

2016-08-22 15:15:14

數據實踐

2015-06-11 10:09:04

大數據HBase

2023-04-07 07:31:17

渠道數據

2024-02-07 09:25:52

數據處理快手大模型

2018-09-30 15:05:38

數據湖數據倉庫Hadoop

2024-07-12 11:40:13

2023-11-14 14:25:09

數據湖大數據

2022-07-08 09:26:45

Flink快手計算

2020-09-28 10:05:57

數據工具技術

2023-12-14 13:01:00

Hudivivo
點贊
收藏

51CTO技術棧公眾號

av一区和二区| 久久夜精品va视频免费观看| 亚洲国产精品久久久久婷蜜芽| 香蕉视频免费在线看| 爽爽淫人综合网网站| 在线国产精品播放| aaaaa黄色片| www在线观看黄色| 国产喂奶挤奶一区二区三区| 成人美女免费网站视频| 国产精品自拍视频一区| 日韩在线观看一区 | 日本一级淫片演员| 亚洲第九十九页| 石原莉奈在线亚洲二区| 欧美老女人在线视频| 欧美丰满少妇人妻精品| 亚洲成人1区| 狠狠干狠狠久久| 欧美精品一区二区性色a+v| 日本福利午夜视频在线| 国产精品99精品久久免费| 欧美在线视频网站| 美女毛片在线观看| 久久社区一区| 亚洲欧美一区二区三区在线| 6080国产精品| 91综合国产| 欧美性极品xxxx做受| 97超碰人人爱| 成年人免费在线视频| 北岛玲一区二区三区四区| 成人激情免费在线| 久草热在线观看| 国产精品一区毛片| 久久全球大尺度高清视频| 女同久久另类69精品国产| 欧美激情15p| 日韩欧美一区电影| 思思久久精品视频| 成人在线免费| 欧美在线观看视频一区二区三区| 国产精品专区在线| 污污的网站在线免费观看| 国产精品久久久久久久久图文区| 免费精品视频一区二区三区| 欧美一区二区三区黄片| 国产一区二区三区观看| 国产精品永久在线| 涩涩视频在线观看| 老司机久久99久久精品播放免费| 91国内精品久久| 国产在线欧美在线| 亚洲五月婷婷| 欧美精品电影在线| 国产极品在线播放| 一区二区亚洲| 午夜精品久久久99热福利| 久久久.www| 国产精品啊啊啊| 欧美高清电影在线看| 波多野结衣亚洲色图| 一本到12不卡视频在线dvd| 久久久999精品免费| 三级影片在线观看| 亚洲免费二区| 欧美国产日韩一区| 日韩美女黄色片| 亚洲承认在线| 国产91精品久久久久久| 一二三区免费视频| 免费观看久久久4p| 91久久国产综合久久91精品网站| 国产美女主播在线观看| 国产激情91久久精品导航| 北条麻妃高清一区| 午夜激情在线视频| 久久先锋影音av鲁色资源| 日本午夜精品一区二区三区| 国产福利免费在线观看| 国产精品国产三级国产| 国产a级黄色大片| 97人澡人人添人人爽欧美| 一本大道av伊人久久综合| www欧美激情| 国产精品成人3p一区二区三区| 精品国产制服丝袜高跟| 800av在线播放| av在线不卡免费观看| 日韩视频在线免费| 四虎永久在线精品| 青青草91视频| 国产精品麻豆免费版| 韩国中文免费在线视频| 亚洲品质自拍视频网站| 激情伊人五月天| 日韩免费福利视频| 欧美一区二区黄| 老鸭窝一区二区| 香蕉国产精品| 国产91精品高潮白浆喷水| 一本大道伊人av久久综合| 成人少妇影院yyyy| 性欧美精品一区二区三区在线播放 | 天堂av中文在线| 日韩欧美福利视频| 男人午夜视频在线观看| 天天久久夜夜| 久久综合久久八八| 国产中文字幕视频| 国产精一区二区三区| 你懂的网址一区二区三区| 成码无人av片在线观看网站| 色偷偷久久人人79超碰人人澡| 天天av天天操| 狠狠色丁香婷婷综合影院| 欧美福利视频网站| 国产一区二区波多野结衣 | 午夜理伦三级做爰电影| 欧美一区不卡| 国产精品嫩草影院久久久| 色网站免费观看| 亚洲精品五月天| 国产精品乱码久久久久| 欧美自拍一区| 欧美日韩999| 一级特黄录像免费看| 久久影视一区二区| 丰满少妇大力进入| 欧美区一区二区| 宅男66日本亚洲欧美视频| 影音先锋亚洲天堂| 国产成人在线视频播放| 中日韩在线视频| 精品免费av在线 | 中文字幕一区二区三区乱码不卡| 日韩激情在线| 国产精品久久999| 欧美性孕妇孕交| 精品福利樱桃av导航| www.黄色网| 欧美久久一级| 91亚洲精品久久久久久久久久久久 | 国产综合色在线| 视频一区国产精品| 日本精品不卡| 精品无码久久久久久国产| 国产精品 欧美 日韩| 国产+成+人+亚洲欧洲自线| 欧美 国产 精品| 精品国产18久久久久久二百| 久久激情视频免费观看| 亚洲最大成人av| 国产精品久久久久久久久快鸭 | 亚洲熟女www一区二区三区| 蜜桃视频在线观看一区二区| 日韩国产精品一区二区| 最新日韩三级| 国产亚洲欧洲在线| 又骚又黄的视频| 国产精品午夜久久| 欧美美女性视频| 91影院成人| 91免费看国产| 羞羞的视频在线看| 精品国产一区二区精华| 国产香蕉视频在线| 久久伊人蜜桃av一区二区| 无人在线观看的免费高清视频| av中字幕久久| 91精品在线播放| 色yeye免费人成网站在线观看| 精品99999| 久久久久99精品成人片我成大片| 国产日本一区二区| 奇米影视四色在线| 欧美~级网站不卡| 国产另类自拍| 日韩不卡在线| 久久久精品999| 囯产精品久久久久久| 欧美视频精品一区| 日本午夜精品视频| 精品视频97| 欧美另类久久久品| 天堂а√在线中文在线鲁大师| 黑人精品欧美一区二区蜜桃| 国产一二三四五| 欧美偷窥清纯综合图区| 日韩av免费在线| 幼a在线观看| 日韩欧美视频一区| 日韩精品视频免费看| 国产三级三级三级精品8ⅰ区| 极品粉嫩美女露脸啪啪| 亚洲精品乱码久久久久久蜜桃麻豆| 欧美日韩一区在线观看视频| 4438五月综合| 91国内免费在线视频| 成人精品一区二区| 日韩免费观看高清完整版在线观看| 日韩精品1区2区| 国产精品久久久久久一区二区三区| 农村末发育av片一区二区| 校园激情久久| 日本精品福利视频| 国产午夜一区| 高清不卡日本v二区在线| 电影天堂国产精品| 欧美激情在线观看| 午夜视频成人| 日韩国产一区三区| 99精品国产99久久久久久97| 色综合色综合色综合色综合色综合 | 欧美日韩一区高清| 日韩精品成人一区| 中文字幕亚洲一区二区av在线| 2一3sex性hd| 久久69国产一区二区蜜臀| 成年人视频观看| 在线看片不卡| 亚洲 日韩 国产第一区| 欧美色图婷婷| 国产99视频精品免费视频36| 亚洲综合资源| 国产成人综合亚洲| segui88久久综合9999| 久久视频在线直播| 成人全视频高清免费观看| 亚洲国语精品自产拍在线观看| 国产精品熟女久久久久久| 一本久久综合亚洲鲁鲁五月天| 久久免费公开视频| 综合色中文字幕| 中字幕一区二区三区乱码| 91在线观看地址| 在线播放第一页| 国产一区二区视频在线播放| 欧美在线aaa| 奇米色一区二区三区四区| 国产a级一级片| 影音先锋中文字幕一区| 久久久久久久香蕉| 亚洲精品97| 综合色婷婷一区二区亚洲欧美国产| 亚洲综合图色| 久久综合九色综合网站| 久久久久97| 好吊色欧美一区二区三区视频| 国产美女撒尿一区二区| 国产高清在线一区| www国产精品| 国产欧美一区二区视频| 成人动漫视频| 电影午夜精品一区二区三区| 18国产精品| 国产伦精品一区二区三| 激情小说一区| 精品无码久久久久国产| 丝袜av一区| 欧美日韩国产精品一卡| 欧美精品一区二区久久| 亚洲成人一区二区三区| 日韩精品久久| 国产日韩视频在线播放| 欧美阿v一级看视频| 91免费国产精品| 亚洲国产一区二区三区高清| 免费无码不卡视频在线观看| 久久大逼视频| 日本xxxx黄色| 国产一区二区看久久| 亚洲乱妇老熟女爽到高潮的片| 成人小视频在线观看| 亚洲专区区免费| 国产欧美综合在线观看第十页| 欧美成人短视频| 一区二区三区日韩| 亚洲黄色一区二区| 欧美色手机在线观看| 国产裸体无遮挡| 精品国精品自拍自在线| 美丽的姑娘在线观看免费动漫| 在线播放日韩专区| 成人日韩欧美| 欧美性受xxxx白人性爽| 国产精品黄色片| 99九九电视剧免费观看| 精品在线手机视频| 无码毛片aaa在线| 国产亚洲成人一区| 欧美成人福利在线观看| 成人免费av资源| 中文字幕第24页| 一区二区三区日韩精品| 天天干天天操天天操| 91精品免费在线| 午夜激情在线视频| 久久在线免费观看视频| 热色播在线视频| 91亚洲精华国产精华| 亚洲传媒在线| 国产女主播av| 水野朝阳av一区二区三区| 日本黄色www| 欧美激情一区二区三区蜜桃视频| 动漫性做爰视频| 色先锋资源久久综合| 性生活视频软件| 中文字幕亚洲自拍| 韩国精品一区| 96sao精品视频在线观看| 色棕色天天综合网| 亚洲理论电影在线观看| 美国十次了思思久久精品导航| 一级特黄a大片免费| 亚洲免费观看高清完整版在线观看熊| 人妻 日韩精品 中文字幕| 日韩精品资源二区在线| 天堂资源在线中文| 人妖精品videosex性欧美| 911亚洲精品| 超碰在线免费观看97| 天堂蜜桃一区二区三区| 亚洲男女在线观看| 一区二区欧美国产| 国产在成人精品线拍偷自揄拍| 亚洲欧美日韩图片| 97天天综合网| 亚洲一区二区免费在线| 成人黄色小视频| 日韩av资源在线| 成人黄页毛片网站| 欧美人妻精品一区二区三区| 在线成人小视频| www.亚洲资源| 国产成人av在线| 日韩成人午夜| 亚洲精品综合久久中文字幕| 欧美性生交大片| 福利一区视频在线观看| 精品国产区一区二| 日韩性生活视频| 婷婷激情一区| 免费看污久久久| 一本色道久久综合亚洲精品不卡 | 男女全黄做爰文章| 在线观看日产精品| shkd中文字幕久久在线观看| 国产va免费精品高清在线观看| 亚洲成人一品| 国产淫片免费看| 久久久午夜电影| 无码人妻丰满熟妇精品| 一级做a爰片久久毛片美女图片| 欧美人体一区二区三区| 日本一区免费在线观看| 日韩成人精品在线观看| 国产午夜精品福利视频| 欧美日韩一区成人| 免费a级在线播放| 91精品在线国产| 欧美日韩午夜| 9.1在线观看免费| 天天色图综合网| 青青久在线视频免费观看| 国产成人激情小视频| 成人嘿咻视频免费看| 老司机午夜性大片| 亚洲免费观看高清完整版在线观看熊| 国产黄色片免费| 性欧美亚洲xxxx乳在线观看| 亚洲人亚洲人色久| 九色91popny| 中文字幕五月欧美| www.激情五月.com| 91精品国产99久久久久久| 国产欧美高清视频在线| 制服丝袜中文字幕第一页| 亚洲一区二区在线播放相泽| 天堂av在线资源| 国产精品免费观看在线| 一区二区三区午夜视频| 制服丝袜第一页在线观看| 91福利区一区二区三区| 黄色免费在线网站| 久久精品magnetxturnbtih| 日本网站在线观看一区二区三区| 亚洲精品卡一卡二| 亚洲国产精品久久久久秋霞蜜臀 | 男人的天堂免费| 色综合色综合色综合 | 久久久久久999| 精品国产91乱码一区二区三区四区 | 亚洲激情 欧美| 欧美日韩一区二区三区不卡| 色呦呦视频在线观看| 欧美日韩在线观看一区二区三区 | 国产精品中文在线| 欧美日韩一区二区三区四区在线观看 |