精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

騰訊數(shù)據(jù)治理技術實踐

大數(shù)據(jù)
隨著公司業(yè)務方規(guī)模的增長,面對大量不同類型的數(shù)據(jù),如何治理這些來源不同、數(shù)據(jù)量大的數(shù)據(jù)是一個值得思考的問題。本次分享結(jié)合騰訊內(nèi)部數(shù)據(jù)管理方法,圍繞數(shù)據(jù)治理技術實踐,展開介紹騰訊在數(shù)據(jù)治理領域中做的相關工作。

一、數(shù)據(jù)治理簡介

首先介紹一下數(shù)據(jù)治理相關理論知識和概念,以便大家對數(shù)據(jù)治理有一定了解和認識。

1、什么是數(shù)據(jù)治理

個人理解的數(shù)據(jù)治理是整個數(shù)據(jù)相關組織架構(gòu)以及各種活動能力的集合,因此,數(shù)據(jù)治理并不是單一組織或者系統(tǒng)能夠完成的事情。數(shù)據(jù)治理和數(shù)據(jù)管理是分不開的,數(shù)據(jù)治理的職能是指導其他數(shù)據(jù)管理職能的執(zhí)行,數(shù)據(jù)治理是在高層上執(zhí)行的數(shù)據(jù)管理。

圖片

2、數(shù)據(jù)治理目的

數(shù)據(jù)治理的目的有很多,比如數(shù)據(jù)共享、提升數(shù)據(jù)資產(chǎn)價值、提升數(shù)據(jù)質(zhì)量等等,從下圖中的某機構(gòu)調(diào)查結(jié)果可以看到,提升數(shù)據(jù)質(zhì)量是數(shù)據(jù)治理的最大動機。除此之外,國家對數(shù)據(jù)相關法律規(guī)定,各個公司也有相關的規(guī)范要求,數(shù)據(jù)合規(guī)也是數(shù)據(jù)治理需要考慮的問題。

圖片

3、數(shù)據(jù)治理面臨的困難

數(shù)據(jù)治理面臨著諸多挑戰(zhàn):比如數(shù)據(jù)多樣化缺乏統(tǒng)一標準、多種異構(gòu)類型的數(shù)據(jù)源、數(shù)據(jù)鏈路長、數(shù)據(jù)合規(guī)保障、數(shù)據(jù)價值如何評估等等。

圖片

4、數(shù)據(jù)治理方法

了解了數(shù)據(jù)治理面臨的問題后,該如何解決這些問題?我們的方法就是知治管(先知后治再管)。

先知就是要知道治理的數(shù)據(jù)對象,知道數(shù)據(jù)的形式,存儲位置等;后治是使用相關技術進行治理比如規(guī)范化、標準化等處理;再管就是盡力去提升新數(shù)據(jù)的質(zhì)量,這樣才算是真正把整個數(shù)據(jù)治理按體系做好。數(shù)據(jù)治理其實是一個閉環(huán)的體系,所以還需要將數(shù)據(jù)治理反饋到整個數(shù)據(jù)管理流程上。

圖片

5、數(shù)據(jù)治理過程

數(shù)據(jù)治理由圖示的四個步驟構(gòu)成:

一是現(xiàn)在盤點,理清楚數(shù)據(jù)現(xiàn)狀,確定歸屬和職能。

二是數(shù)倉建設,這里的數(shù)倉包含了傳統(tǒng)意義上的數(shù)倉和元數(shù)據(jù)數(shù)倉,對這些數(shù)據(jù)進行統(tǒng)一采集和保存。

三是質(zhì)量檢測,確定評估標準,輸出數(shù)據(jù)質(zhì)量報告。

四是持續(xù)改進,根據(jù)數(shù)據(jù)質(zhì)量報告推動數(shù)據(jù)持續(xù)改進,比如建立數(shù)據(jù)地圖、分析血緣關系、持續(xù)監(jiān)控數(shù)據(jù)質(zhì)量、優(yōu)化數(shù)據(jù)使用流程。將數(shù)據(jù)的產(chǎn)生和治理相結(jié)合結(jié)合,形成閉環(huán),從而保證數(shù)據(jù)的采集和數(shù)據(jù)治理變得更好。

圖片

二、騰訊數(shù)據(jù)治理體系簡介

這部分主要介紹騰訊內(nèi)部數(shù)據(jù)治理體系的建設思路和策略。

1、組織管理體系

在騰訊內(nèi)部,我們建立了統(tǒng)一組織,規(guī)劃和協(xié)調(diào)整個公司的數(shù)據(jù)治理、數(shù)據(jù)安全工作,以 OTeam 形式規(guī)劃和實施整個相關領域的平臺建設和規(guī)范協(xié)同;建立企業(yè)級標準,規(guī)范測評體系;構(gòu)建平臺協(xié)同,建設開箱即用的一站式數(shù)據(jù)治理工具平臺;形成社區(qū)運營,通過分享或宣傳的方式,讓大家意識到數(shù)據(jù)治理以及數(shù)據(jù)質(zhì)量的重要性。

圖片

2、騰訊數(shù)據(jù)治理業(yè)務框架

騰訊這樣量級的公司,動輒幾千萬上億甚至百億級別的數(shù)據(jù),數(shù)據(jù)的采集和存儲都是很大的問題。在上億量級的數(shù)據(jù)治理建設過程中,我們一步步實踐,踩過很多坑。通過制定數(shù)據(jù)治理標準,搭建了以資產(chǎn)創(chuàng)建、資產(chǎn)評估、資產(chǎn)運營、資產(chǎn)管控四部分構(gòu)成的數(shù)據(jù)治理平臺,構(gòu)建全域元數(shù)據(jù)服務,形成了元數(shù)據(jù)采集、存儲、數(shù)倉、數(shù)據(jù)血緣的整個數(shù)據(jù)生命周期鏈路,結(jié)合底層采用多種存儲方式,逐步建設了一個可以管理和區(qū)分優(yōu)質(zhì)資產(chǎn)與數(shù)據(jù)垃圾、相對較好的元數(shù)據(jù)管理體系平臺。

圖片

3、元數(shù)據(jù)管理

我們從如何采、怎么存、引導治出發(fā),來思考和逐步完善元數(shù)據(jù)的管理。

圖片

4、數(shù)據(jù)資產(chǎn)管理

我們建立區(qū)分優(yōu)質(zhì)資產(chǎn),減少垃圾數(shù)據(jù)的數(shù)據(jù)資產(chǎn)管理平臺,由四個部分組成:

首先是確定數(shù)據(jù)歸屬,如果數(shù)據(jù)歸屬都沒明確,則數(shù)據(jù)治理工作是很難展開,像騰訊這樣級別的大公司,經(jīng)過多次組織架構(gòu)的變更,數(shù)據(jù)歸屬問題尤其凸顯,比如說經(jīng)過組織調(diào)整,單個 BG 的數(shù)據(jù)拆成了多個 BG 的數(shù)據(jù)導致,數(shù)據(jù)管理問題在組織架構(gòu)變遷變得非常混亂,因此確定歸屬關系是數(shù)據(jù)治理一個非常關鍵的環(huán)節(jié)。

其次是價值分析,通過業(yè)務屬性和數(shù)據(jù)訪問這兩個維度對數(shù)據(jù)進行評估數(shù)據(jù)的價值,業(yè)務屬性也即是公司在各個領域的業(yè)務比如賬號體系等等。如數(shù)據(jù)訪問的量或者訪問頻次越高,就認為該數(shù)據(jù)重要或者具有更高的價值。

然后是數(shù)據(jù)清理,為了避免數(shù)據(jù)清理或者減少權(quán)限變更影響的范圍,需要進行影響分析判斷,同時結(jié)合自動化清理工具完成整個數(shù)據(jù)清理或是權(quán)限變更。只是做好數(shù)據(jù)清理工作是不夠,因為在實際操作數(shù)據(jù)過程中,可能會出現(xiàn)誤刪或故意刪除的情況;為了保證數(shù)據(jù)數(shù)據(jù)情況的可靠性,我們還建立一套數(shù)據(jù)可恢復的機制,從而保證出現(xiàn)上述情況時,能夠快速進行數(shù)據(jù)恢復,盡可能地降低影響范圍。

最后是生命周期,結(jié)合數(shù)據(jù)血緣和訪問頻次等學習,為用戶設置數(shù)據(jù)生命周期時,對該數(shù)據(jù)的生命周期進行智能化推薦;當然,這只是推薦的生命周期,數(shù)據(jù)最終的生命周期要結(jié)合著人工審核判斷,給定一個比較合理的周期。

圖片

5、騰訊數(shù)據(jù)治理測評體系:元數(shù)據(jù)管理成熟度

我們對元數(shù)據(jù)管理制定了測評體系,用于對公司整個數(shù)據(jù)管理和評估,可以看到圖中從下到上分為五個等級,一二級是一些初始或基本管理方法,第三級則是相對來說已經(jīng)比較成熟,但是完全不夠的,還需要將數(shù)據(jù)驅(qū)動和數(shù)據(jù)治理與數(shù)據(jù)使用形成閉環(huán),以便做好元原數(shù)據(jù)的管理,此時已經(jīng)是第四級,是比較優(yōu)秀的程度。第五級則是比較卓越管理體系,需要具備自我完善和自我改進的功能,同時能夠在公司內(nèi)或業(yè)界有一定影響力,元數(shù)據(jù)管理真正能做到這個級別的少之又少 。

圖片

6、數(shù)據(jù)安全治理

數(shù)據(jù)安全也是數(shù)據(jù)使用過程中一個非常重要的環(huán)節(jié),在這過程中,我們首先對數(shù)據(jù)進行了分類分級處理,為數(shù)據(jù)確定安全等級和標記,并與數(shù)據(jù)資產(chǎn)進行關聯(lián)。其次在進行數(shù)據(jù)管控,根據(jù)數(shù)據(jù)的分類分級結(jié)果,定制不同數(shù)據(jù)級別的申請流程,比如動態(tài)或靜態(tài)數(shù)據(jù),數(shù)據(jù)加密和脫敏,在數(shù)據(jù)使用中對數(shù)據(jù)進行管控。最后是安全審計,支持一些安全審計相關功能比如數(shù)據(jù)權(quán)限訪問監(jiān)控、訪問記錄、下載日志等等,并可以輸出安全報告。

圖片

7、騰訊數(shù)據(jù)治理測評特征-安全管理能力成熟度

我們對數(shù)據(jù)安全能力管控也制定了評測體系,即安全管理能力成熟度,包含了 12 個管理域以及 86 個控制項。數(shù)據(jù)安全管理能力從低到高分成五個等級。

圖片

制定了數(shù)據(jù)安全管理能力標準后,數(shù)據(jù)治理通過 OTeam 進行統(tǒng)一組織和協(xié)調(diào),各個部門自行申請或者參與到整個評測的工作中。

圖片

三、數(shù)據(jù)治理技術實踐

這部分是本次分享的最核心部分:騰訊內(nèi)部元數(shù)據(jù)管理、數(shù)據(jù)血緣相關技術和相關的后臺技術實現(xiàn)。

1、技術架構(gòu)

下圖是我們內(nèi)部統(tǒng)一元數(shù)據(jù)系統(tǒng)的技術架構(gòu)。對外來說,上層可以支持不同類型元數(shù)據(jù),可以滿足各種分析引擎對元數(shù)據(jù)相關的要求,同時對接各種自定義或者標準化的數(shù)據(jù)源。這套底層統(tǒng)一的元數(shù)據(jù)服務既要滿足公司內(nèi)部的要求,同時也要滿足外部的用戶對整個數(shù)據(jù)治理的需求。目前這套元數(shù)據(jù)管理除了內(nèi)部使用外,也支持了騰訊云上的產(chǎn)品比如 WeData 等,我們統(tǒng)一元數(shù)據(jù)平臺目前對公司內(nèi)外及相關產(chǎn)品都可以提供支持。

圖片

從下往上看,整個統(tǒng)一元數(shù)據(jù)可分成兩個垂直的領域。 

左邊是數(shù)據(jù)治理體系,主要面向的是離線采集、存儲,然后做數(shù)據(jù)檢索、生命周期、數(shù)據(jù)安全、數(shù)據(jù)血緣和數(shù)據(jù)質(zhì)量的管理,這些就是數(shù)據(jù)治理提供的基礎服務。在線元數(shù)據(jù)是支持引擎?zhèn)鹊膶崟r元數(shù)據(jù)寫入,比如大數(shù)據(jù)領域最典型的 Hive、RDBMS、Strom,通過 thrift 協(xié)議,將數(shù)據(jù)實時寫入到元數(shù)據(jù)服務。離線數(shù)據(jù)治理和在線數(shù)據(jù)治理所面臨領域和技術的差異是比較大的,數(shù)據(jù)治理更關注的是大數(shù)據(jù)量基礎上,如何做好分析、檢索和工作。因此在底層存儲的選型方面結(jié)合了各種數(shù)據(jù)庫,比如 HBase、ES、圖數(shù)據(jù)庫以及關系型數(shù)據(jù)庫來支撐整個離線治理工作。在線元數(shù)據(jù)服務因為有部分事務工作,比如建庫建表,實時寫入時,需要考慮到事務、數(shù)據(jù)一致性和高可靠等因素,因此,在底層存儲時,選擇了傳統(tǒng)的關系型數(shù)據(jù)庫進行存儲。需要事務和一致性、高可靠的方式去完成。像騰訊體量的公司,數(shù)據(jù)量是非常龐大的,單純的靠單機 MySQL、PQ 是很難支持這種海量數(shù)據(jù)存儲。因此,我們在這個基礎上進行分庫分表,并利用公司內(nèi)部 TDSql 分布式數(shù)據(jù)庫存儲。

右邊在是統(tǒng)一元數(shù)據(jù)服務基礎,提供公共的平臺能力,比如認證、鑒權(quán)、任務調(diào)度、用戶租戶以及運營監(jiān)控。

2、微服務劃分

圖片

上圖是我們整個元數(shù)據(jù)治理服務后臺微服務劃分,上層是元數(shù)據(jù)產(chǎn)品、計算引擎、數(shù)據(jù)源,第二層是在第一層基礎上提供后臺能力,比如數(shù)據(jù)地圖、元數(shù)據(jù)采集、數(shù)據(jù)血緣和資產(chǎn)管理等功能,最底層就是整個支撐這套體系的技術服務。

后臺的技術服務又分成了兩層:第一層是數(shù)據(jù)層或接入層,主要由databus、center、metastores 組成,其中 hybirs 是元數(shù)據(jù)服務內(nèi)部代號。databus 的作用是統(tǒng)一消費經(jīng)過 MQ 轉(zhuǎn)發(fā)的消息并落庫,http 服務和 Thrift 服務經(jīng)過接入層服務后,通過 RPC 協(xié)議進入基礎服務層并在基礎服務層進行業(yè)務邏輯處理,最后寫入到底層存儲。

接入層分為兩層是為了底層存儲能夠提供通用的服務能力。接入層的第二層更靈活,可以支持不同產(chǎn)品和引擎,以及不同數(shù)據(jù)源對接和適配。從圖中可以看到,databus 有一條直通底層數(shù)據(jù)庫的鏈路。考慮到 databus 的職責所在,因為 databus 是對 mq 消息進行統(tǒng)一消費,考慮到數(shù)據(jù)量,databus 對寫入效率的要求非常高。http 服務和 Thrift 服務的數(shù)據(jù)量相比而言就少 很多,為了減少數(shù)據(jù)消費的延遲,我們將 databus 消費的數(shù)據(jù)直接落庫,減少 http/Thrift 服務中的 RPC 調(diào)用,縮短鏈路,進一步提升數(shù)據(jù)入效率,從而將采集的數(shù)據(jù)及時地存儲底層存儲中。

3、數(shù)據(jù)采集

首先是統(tǒng)一元數(shù)據(jù)的數(shù)據(jù)采集,數(shù)據(jù)采集可以分成兩個方向:定時采集和實時采集。

定時就是通過定時任務或調(diào)度定期連接數(shù)據(jù)源,對上游的元數(shù)據(jù)進行采集。采集的過程又分為增量采集和全量采集。因此定時采集可以分為定時增量采集和定時全量采集;定時增量就是每次只采最近一段時間的數(shù)據(jù),通過積累采集全部歷史數(shù)據(jù)。定時全量就是每次將全部數(shù)據(jù)一次性采集完,然后落地。

圖片

在實際工作中,往往是將增量采集和全量采集結(jié)合使用。數(shù)據(jù)采集并不是最初就進行全量采集,而是待數(shù)據(jù)積累到一定量后才對元數(shù)據(jù)采集或治理工作。首次采集時,通常是使用全量采集的方式將歷史數(shù)據(jù)采集,后續(xù)的數(shù)據(jù)往往是通過定時增量的方式采集。

對于那些必須要定時增量的數(shù)據(jù),為了減少后續(xù)鏈路的壓力,我們做了針對性的優(yōu)化:通過 redis 對定時增量做了過濾處理,比如采集周期內(nèi),對庫信息、表信息以及分區(qū)信息計算 md5 值并存儲在 redis,然后對采集的元數(shù)據(jù)進行 md5 計算,再與 Redis 中對應的值進行比對,在源頭過濾掉沒有差異的數(shù)據(jù),從而減少重復數(shù)據(jù)的發(fā)送。

面臨的另一個問題就是全量采集時全量刪除和全量覆蓋。在增量化處理時,數(shù)據(jù)刪除是面臨問題的:上一次是全量處理,后續(xù)則是增量處理,比如在某個周期內(nèi),有五個庫,這一次采集,需要刪了一個庫(表),增量采集的方式是沒辦法直接找到要刪除的庫(表) ,也即是刪除些信息沒辦法透徹到下游。

針對數(shù)據(jù)刪除無法發(fā)現(xiàn),我們對數(shù)據(jù)源所在庫和表做了緩存,在后續(xù)的數(shù)據(jù)采集時,與 redis 中緩存數(shù)據(jù)做全量對比取交集和差集,從而判斷數(shù)據(jù)的修改情況比如刪除、新增或修改,在源頭去掉重復的數(shù)據(jù),同時有又能發(fā)現(xiàn)刪除的情況,最后把過濾處理后的數(shù)據(jù)發(fā)到消息中間件。經(jīng)過后續(xù)的消費、分發(fā)(采集的數(shù)據(jù)源是有多種多樣的,因此會有分發(fā)器來識別和和處理不同類型元數(shù)據(jù))最終分發(fā)不同的數(shù)據(jù)存儲的流程。比如血緣信息、元數(shù)據(jù) DDL 信息、審計日志信息的數(shù)據(jù),針對不同類型信息數(shù)據(jù)有不同的處理鏈路,根據(jù)數(shù)據(jù)特點落入不同的存儲,比如血緣信息數(shù)據(jù)寫入圖數(shù)據(jù)庫,元數(shù)據(jù) DDL 信息存儲到 HBase。

數(shù)據(jù)治理產(chǎn)品前端交互是通過 ES 完成,打上寬表滿足前端交互和數(shù)據(jù)發(fā)現(xiàn)以及數(shù)據(jù)管理的需求。數(shù)據(jù)審計的日志流水,則使用內(nèi)部 hermes ,hermes 是一個類似 ES 的產(chǎn)品,但在存儲方面做了針對性優(yōu)化。

傳統(tǒng)關系數(shù)據(jù)庫都有唯一的主鍵,根據(jù)這個主鍵就可以增刪改查等處理。但是在元數(shù)據(jù)管理中,對于非采用非關系數(shù)據(jù)庫,該如何處理呢?比如上游采集好的一條元數(shù)據(jù)信息傳遞過來,我們需要對數(shù)據(jù)進行判斷,比如是否存在或者是否修改。首先是查詢,根據(jù)庫(表)名查詢是否存在,若存在則是更新操作;不存在則是新增操作。這個過程會與數(shù)據(jù)庫發(fā)生兩次交互,對整個鏈路會產(chǎn)生較大的影響 。

為了處理這個問題,我們引入了 guid 生成器(guid generator),將庫和表的信息和數(shù)據(jù)源信息輸入到 guid 生成器,生成一個統(tǒng)一編碼的 guid,作為底層存儲的唯一標識。然后用生成的 guid 對數(shù)據(jù)庫進行一個類似叫 replace into 的方式,從而實現(xiàn)通過一次跟數(shù)據(jù)庫的交互就能新增或修改操作。這樣處理對整個寫入流程是一個很大的提升。比如 hbase,直接使用 upsert,將新數(shù)據(jù)寫入數(shù)據(jù)庫,無需關心是新增還是修改。為了保證數(shù)據(jù)的最終一致性,我們將實時與周期性全量或增量的方式結(jié)合,去實現(xiàn)數(shù)據(jù)的最終一致性。在發(fā)生數(shù)據(jù)實時采集不及時或者鏈路有問題的情況下,通過全量采集的方式進行補漏處理。 

圖片

4、統(tǒng)一元數(shù)據(jù)-血緣采集分析

血緣分析對整個數(shù)據(jù)價值體驗是非常重要的,如何做血緣分析呢?首先是血緣的來源,最直接的方式就是用戶通過執(zhí)行引擎的客戶端或者直連執(zhí)行引的 server 提交的 sql。比如基于 hive 或者騰訊內(nèi)部的 thive 提交 sql 后,我們通過 hook 或者 spark 的 listener 或者 hbase 的協(xié)處理器的方式攔截到具體 query plan,query plan里面記錄了用戶提交的 sql 以及整個執(zhí)行過程中 context 的上下游信息,包括 intoput、output 等信息。對 query plan 進一步解析,從而形成了數(shù)據(jù)血緣的 mode,然后寫到 MQ,最后獲取 sql 數(shù)據(jù)進行解析,將血源信息落到圖數(shù)據(jù)庫。

另外一種就是通過定時調(diào)度產(chǎn)生的血緣,感知到用戶提交的 sql 表信息之外。還需要將用戶調(diào)度任務信息與庫和表的關系進行一個呈現(xiàn)。同時會將通過其他方式提交的歷史任務記錄的日志消息存儲在 HDFS。我們會定時抓取這些日志并對日志做統(tǒng)一分析處理,比如 mr 、spark、sql 分析,形成血緣模型,發(fā)送到 mq,最終寫入數(shù)據(jù)庫。

sql 解析是血緣解析過程的關鍵技術,業(yè)界有很對 sql 解析和開源的技術,我們內(nèi)部是基于 Druid 進行封裝和改進構(gòu)建了sql guru,并進行 sql 解析。相比于 hive 的 antlr 解析器,通過實際效果對比,我們選擇了在性能穩(wěn)定性以及支持的場景更有優(yōu)勢的 Druid。Druid 處理廣泛使用的連接池之外,它數(shù)據(jù) sql 解析方面也是比較強悍的。除了常見的血緣解析能力之外,我們還擴展了一些比如像物化視圖、像臨時表 with as,join 等復雜 sql 的解析。基于相對全面元數(shù)據(jù)采集,結(jié)合強悍的 sql 解析能力以及語法支持,我們將血緣分析的場景盡可能做得完善。

5、數(shù)數(shù)據(jù)血緣存儲

圖數(shù)據(jù)庫是血緣存儲的常見方式,因此圖數(shù)據(jù)庫也作為了我們內(nèi)部血緣存儲的一種方式。當數(shù)據(jù)量級比較小時,圖數(shù)據(jù)庫并不是血緣存儲的唯一方式,基于傳統(tǒng)的關系數(shù)據(jù)庫可以表達出來血緣的關系,血緣無非就是各種實體以及它們之間關系的記錄。

以圖中的 case 所示,圖中有兩個調(diào)度任務,第一個調(diào)度任務里面有兩段 sql,執(zhí)行第一個 task 是會執(zhí)行兩個獨立的 sql,第一個 sql 是 a 和 b 的關系,第二個 sql 是 d 和 c 的關系。第二個 task 只有一個 sql,它是 a 和 b 的關系,那這個時候就會有一個問題:數(shù)據(jù)血緣圖數(shù)據(jù)庫里面怎么呈現(xiàn)的呢?

圖數(shù)據(jù)庫存儲的無非就是點和邊以及中間的線,橫向來看,我們把表和任務作為點來存儲,可以看到左邊這種情況 那我們看 比如像 task A 把 a 和 b 關聯(lián),同時將 c 和 d 關聯(lián)。因此,它們的血緣關系如圖左上角所示。因為是通過同一個 task 關聯(lián),當我們?nèi)ふ遗c c 有關聯(lián)的血緣時,會找到 b 和 d 都找到了。從圖中可以看到 task A 一個特性里面看到有兩段的 sql,但 a 和 b 才有真正但血緣關系,c 和 b 之間是沒血緣關系的。c 與 b 之間有血緣關系是因為錯亂導致的。

圖片

因此我們做了針對性優(yōu)化,如右上圖所示,可以看到右邊這種情況。將任務節(jié)點拆成兩個節(jié)點,雖然兩個節(jié)點輸入同一個任務,但是每個節(jié)點都有唯一的標識記錄,這樣就可以區(qū)分出來,建立關系清晰的血緣鏈路。從 a 出發(fā),就只會知道與它有血緣關系的 b,這樣就解決了上面所說的錯亂的問題。

另一種思路就是將表作為點,任務去作為邊,那這種情況會有什么問題呢?可以看到 a 和 b 通過 task A 和 taskB 分別建立這個血緣關系。除了這個表的血緣關系之外還需要體現(xiàn)任務的血緣關系。而在圖數(shù)據(jù)庫中兩個相同的點之間,只能有唯一的一條邊,按這種方式處理前面提到的情況,是首先是 a 和 b 建立血緣關系,后面 b 則會再和 a 建立血緣關系。這樣就會將出現(xiàn)任務信息覆蓋的情況,導致整個血緣關系的不完整。結(jié)合在血緣關系處理過程中可能出現(xiàn)的各種情況以及它們帶來的問題,我們最終選擇圖數(shù)據(jù)庫的方式將表和任務均作為點,然后用邊建立血緣關系,記錄整個血緣。

以上就是本次分享的內(nèi)容。本次分享主要是我們騰訊內(nèi)部數(shù)據(jù)治過程遇到的問題以及處理方法。希望通過本次分享能夠給在做數(shù)據(jù)治理和建設的同學一些指導,幫助大家規(guī)避一些在日常工作中可能出現(xiàn)的問題。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2023-11-24 07:10:44

數(shù)據(jù)治理PCG

2024-04-22 07:56:32

數(shù)據(jù)倉庫數(shù)據(jù)中臺數(shù)據(jù)服務

2023-04-10 07:34:30

2024-01-11 08:15:52

大數(shù)據(jù)成本治理Hadoop

2023-08-07 08:40:24

2024-03-26 06:46:52

大數(shù)據(jù)數(shù)據(jù)治理大數(shù)據(jù)資產(chǎn)治理

2022-12-30 15:27:13

2023-06-12 07:44:21

大數(shù)據(jù)數(shù)據(jù)治理

2024-09-29 08:40:34

2020-10-14 10:01:47

零信任

2023-06-27 07:26:36

汽車之家敏感數(shù)據(jù)治理

2018-09-30 15:05:38

數(shù)據(jù)湖數(shù)據(jù)倉庫Hadoop

2023-03-15 18:34:26

資源治理數(shù)據(jù)治理業(yè)務線

2023-10-24 14:48:23

數(shù)據(jù)治理大數(shù)據(jù)

2024-10-15 08:14:51

2024-02-22 08:51:46

大數(shù)據(jù)白盒化治理數(shù)據(jù)治理

2021-07-19 10:06:30

數(shù)據(jù)治理數(shù)字化轉(zhuǎn)型CIO

2022-12-09 09:39:01

數(shù)據(jù)治理

2021-05-21 16:26:46

數(shù)據(jù)安全治理

2022-08-26 13:12:01

數(shù)據(jù)治理實踐
點贊
收藏

51CTO技術棧公眾號

国产在线观看免费av| 人妻av中文系列| 国产精品久久久久久久免费| 亚洲精品小说| 亚洲黄一区二区| 精品久久久久久久无码| 黄色网页在线免费看| 福利91精品一区二区三区| 懂色av一区二区三区蜜臀| 国产精品传媒入口麻豆| 4444kk亚洲人成电影在线| 天堂中文在线网| 小小影院久久| 亚洲欧美在线x视频| 91亚洲一区二区| 欧美xxx网站| 一区二区三区四区蜜桃| 亚洲精品一区二区三区蜜桃久| 精品人妻一区二区三区换脸明星 | 欧美xxxx黑人xyx性爽| 少妇精品导航| 精品国产免费久久| 欧美日韩一区二区三区69堂| 日韩伦理在线| 一区二区免费看| 亚洲一区二区在线观| 午夜福利视频一区二区| 国产一区二区中文字幕| 国产精品福利在线观看| 国产精品老女人精品视频| 香蕉视频禁止18| av在线视屏| 亚洲柠檬福利资源导航| 天天爽天天狠久久久| 天天在线女人的天堂视频| 国产制服丝袜一区| 国产精品久久久久久久久久久不卡 | 人人精品久久| 91国产免费观看| 日本欧美黄色片| 日韩成人伦理| 国产精品国产三级国产三级人妇 | 日韩在线看片| 亚洲视频在线播放| aaaaa一级片| 国产乡下妇女做爰视频| 影院在线观看全集免费观看| 欧美国产日韩精品免费观看| 麻豆精品传媒视频| 视频一区二区三区在线看免费看| 国产成人在线视频网址| 亚洲一区二区免费在线| 国产乱码精品一区二区三区精东| 麻豆国产精品官网| 国产免费一区二区三区在线能观看| www.五月婷婷.com| 视频一区在线视频| 国产精品美女午夜av| 波多野结衣影片| 免费观看在线综合| 国产免费一区视频观看免费| 中文字幕在线观看1| 免费观看成人av| 国产综合久久久久| 国产又黄又猛又爽| 国产伦精品一区二区三区在线观看| 成人激情午夜影院| 久久久噜噜噜久久久| 国产大片中文字幕| 亚洲精华国产欧美| 91po在线观看91精品国产性色| 韩国av中文字幕| 久久综合九色| 国产精品久久久久久久久久东京| 91精品国自产| 东方aⅴ免费观看久久av| 国产欧美日韩综合精品二区| 亚洲色图欧美视频| 亚洲国产精品高清| 国产成人三级视频| 丰满诱人av在线播放| 亚洲大片在线观看| 狠狠操精品视频| 日韩一区二区三免费高清在线观看| 欧美高清dvd| 亚洲乱妇老熟女爽到高潮的片| 免费一级全黄少妇性色生活片| 一区三区在线欧| 中文综合在线观看| 久久精品www人人爽人人| 日韩午夜免费| 国产精品久久一| 国产激情久久久久久熟女老人av| av日韩在线网站| 一区二区高清视频| 日本三级在线观看网站| 狠狠躁夜夜躁人人爽天天天天97| 一本岛在线视频| 草草视频在线一区二区| 国产一区二区三区在线观看网站 | 夜色激情一区二区| 丝袜老师办公室里做好紧好爽| 欧美日韩破处视频| 亚洲国产精品国自产拍av秋霞| 国产成人亚洲综合青青| 中国毛片直接看| 国产日韩欧美一区二区三区在线观看| 国产精品免费视频xxxx| 成人午夜免费福利| 国产精品久久久久久户外露出| 九一国产精品视频| 成人亚洲免费| 国产视频精品免费播放| 国产在线一卡二卡| 麻豆9191精品国产| 国产精品播放| 日韩欧美小视频| 日韩欧美中文第一页| 人妻体体内射精一区二区| 免费看日本一区二区| 欧美日韩国产999| 亚洲综合精品视频| 国产亚洲va综合人人澡精品 | av电影高清在线观看| 偷拍欧美精品| 亚洲专区一二三| 宅男噜噜噜66国产免费观看| 91成人入口| 久久精品中文字幕电影| 久久国产香蕉视频| 91亚洲国产成人精品一区二三| 欧洲精品视频在线| 色综合视频一区二区三区日韩| 亚洲男女性事视频| 永久免费看片在线播放| 丁香天五香天堂综合| 大桥未久一区二区三区| 亚洲伊人伊成久久人综合网| 夜夜嗨av色综合久久久综合网| 亚洲男人第一av| 成人免费视频网站在线观看| 国产免费内射又粗又爽密桃视频| 青青久久精品| 日韩网站免费观看| 一级久久久久久久| 国产精品久99| 黄色一级二级三级| 国语产色综合| 国产精品看片资源| 淫片在线观看| 欧美日韩在线播放一区| 四虎国产成人精品免费一女五男| 日韩中文字幕一区二区三区| 色姑娘综合网| 国产亚洲精彩久久| 最新的欧美黄色| 91麻豆国产视频| 自拍偷拍亚洲激情| 中文字幕12页| 国产精品va| 国产一区二区三区av在线| 麻豆网站免费在线观看| 日韩精品免费综合视频在线播放| 青青青国产在线 | 3atv一区二区三区| 中文字幕在线观看成人 | www.88av| 久久福利毛片| 亚洲高清乱码| 精品国产亚洲一区二区在线观看| 美乳少妇欧美精品| 天天干天天爽天天操| 色综合久久久网| 亚洲精品视频网址| 国产精品一区二区在线播放 | 久久久久久久欧美精品| 日本日本精品二区免费| 亚洲伊人精品酒店| 97精品国产97久久久久久| 四虎精品成人免费网站| 欧美亚洲国产一卡| 欧美黄色一级网站| 久久一区二区三区四区| 我要看一级黄色大片| 欧美91大片| 蜜桃网站成人| 五月天色综合| 97精品国产aⅴ7777| 国产永久av在线| 日韩欧美一级二级三级久久久| 欧美精品亚洲精品日韩精品| 中文字幕精品三区| 四虎精品一区二区| 日本伊人午夜精品| 91免费版看片| 欧美日韩黑人| 91嫩草在线视频| 天堂а√在线最新版中文在线| 色午夜这里只有精品| 日本韩国免费观看| 欧美日韩第一区日日骚| 日韩欧美一区二区一幕| 中文字幕一区二区不卡| 亚洲最大成人网站| 国产成都精品91一区二区三| 人妻丰满熟妇av无码区app| 婷婷激情综合| 日韩高清在线播放| 红杏视频成人| 91在线高清视频| 欧美aaa大片视频一二区| 国产69精品久久久| 欧美成年黄网站色视频| 日韩成人av网址| 国产黄色一区二区| 欧美丰满美乳xxx高潮www| 欧美三日本三级少妇99| 亚洲精品视频免费观看| 亚洲一二三精品| 91啦中文在线观看| 久久性爱视频网站| 国产精品综合二区| 亚洲欧美视频二区| 久久精品一区| 亚洲高清视频免费| 国产成人福利av| 成人免费网站在线观看| 日韩三级影视| 91国产精品91| 欧美1234区| 久久精品国产亚洲精品| 9色在线观看| 国产视频久久久久久久| 殴美一级特黄aaaaaa| 日韩一区二区三区在线| 国产又粗又猛又爽又黄的视频一| 欧美系列亚洲系列| 秋霞精品一区二区三区| 欧美日韩国产精品| 午夜影院在线看| 午夜视频在线观看一区二区三区| 久久久全国免费视频| 玉足女爽爽91| 欧美成欧美va| 亚洲永久免费视频| 久一区二区三区| 亚洲电影在线播放| 国产精品23p| 亚洲影视在线观看| 国产香蕉在线视频| 香港成人在线视频| 色网站在线播放| 欧美性猛xxx| 麻豆成人免费视频| 日本道在线观看一区二区| 欧美a视频在线观看| 在线亚洲免费视频| 艳妇乳肉豪妇荡乳av无码福利| 欧洲精品一区二区| 97av免费视频| 日韩视频在线永久播放| 亚洲免费视频网| 日韩电影免费观看中文字幕| 青青草手机在线| 国产亚洲a∨片在线观看| 9191在线观看| 欧美大码xxxx| 96av在线| 国产精品久久久久久搜索| 久久91超碰青草在哪里看| 成人久久精品视频| 精品伊人久久久| 日本一区二区三不卡| 色天天综合网| 大陆av在线播放| 视频一区在线播放| 欧美专区第二页| av在线这里只有精品| 亚洲精品午夜视频| 综合分类小说区另类春色亚洲小说欧美| 免费人成在线观看| 欧美性开放视频| 国产伦精品一区二区三区免.费| 日韩欧美国产综合| 青青视频在线观| 久久精品国产一区二区三区| 91九色在线看| 国产精品色婷婷视频| 日韩不卡在线视频| 久久久久综合一区二区三区| 日韩欧美国产精品综合嫩v| youjizz.com在线观看| 视频一区视频二区在线观看| 超级砰砰砰97免费观看最新一期| 久久综合99re88久久爱| 国产性生活大片| 欧美日韩一区二区免费视频| 国产精品人人爽| 亚洲精品美女视频| 久久五月精品| 欧美综合在线第二页| 精品午夜视频| 天堂资源在线亚洲视频| 欧美日韩第一区| www.色就是色| 99久久er热在这里只有精品15| 国精产品视频一二二区| 欧美日韩国产综合视频在线观看中文| 91精品人妻一区二区三区果冻| 亚洲精品电影在线| 啪啪免费视频一区| 国产精品一区二区久久久久| 久久久亚洲欧洲日产| 一级黄色录像免费看| 日韩国产在线观看一区| 亚洲精品激情视频| 亚洲女女做受ⅹxx高潮| 中文字幕日日夜夜| 精品在线欧美视频| 久色国产在线| 亚洲精品免费av| 欧美最新另类人妖| 凹凸国产熟女精品视频| 国产福利一区二区三区视频在线| 亚洲一级黄色录像| 色综合久久中文字幕| 黄色一级a毛片| 欧美美女操人视频| 外国成人毛片| 亚洲一区在线直播| 男男视频亚洲欧美| 三上悠亚影音先锋| 黑人精品xxx一区一二区| 丰满肥臀噗嗤啊x99av| 欧美成在线视频| 国产高清视频一区二区| 一区不卡视频| 久久99精品国产麻豆婷婷洗澡| 怡红院一区二区三区| 色哟哟一区二区三区| 秋霞av在线| 国产999精品久久久影片官网| 亚洲第一论坛sis| 5月婷婷6月丁香| 99在线精品观看| 国产区在线观看视频| 亚洲精品电影网在线观看| а√天堂中文在线资源8| 国产伦精品一区二区三区四区视频| 欧美aⅴ99久久黑人专区| 欧美高清精品一区二区| 亚洲激情六月丁香| www视频在线| 国产+人+亚洲| 日韩高清一级| 人妻无码视频一区二区三区| 国产无一区二区| 超碰在线97观看| 中文字幕国产精品久久| 日韩在线激情| 日韩亚洲欧美一区二区| 国产不卡视频一区| 日本一二三区不卡| 亚洲欧美国产va在线影院| 午夜欧美巨大性欧美巨大| 视频一区视频二区视频| 精品午夜一区二区三区在线观看| 欧美爱爱小视频| 亚洲成人精品视频| 中文字幕21页在线看| 视频一区三区| 国产乱码字幕精品高清av| 国产一级免费av| 亚洲欧美一区二区三区久久| 日韩大陆av| 日本人妻伦在线中文字幕| 99久久久无码国产精品| 成人公开免费视频| yellow中文字幕久久| 亚洲国产视频二区| 69堂免费视频| 国产片一区二区| www.久久精品.com| 日本sm极度另类视频| 色综合久久一区二区三区| 岛国大片在线免费观看| 亚洲一区二区欧美| 久久久久久青草| 999视频在线观看| 久久国产精品久久w女人spa| 一本一本久久a久久| 精品国产91久久久久久久妲己| 欧美无毛视频| 综合久久国产| 91丨porny丨最新| 国产成人精品白浆久久69| 国产精品爱久久久久久久| 欧美xxx在线观看| 久久久久久久久福利| 精品国产免费久久|