精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

淘系數據模型治理優秀實踐

大數據 新聞
本次分享題目為淘系數據模型治理,主要介紹過去一年淘系數據治理工作的一些總結。

具體將圍繞以下4部分展開

  • 模型背景&問題
  • 2問題分析
  • 3治理方案
  • 4未來規劃

模型背景&問題

1.整體情況

首先介紹一下淘系的整體數據背景。

淘系的數據中臺成立至今已有7年左右,一直未作數據治理,整體數據生成構成比為:人工創建(22%)+機器生成78%。其中活躍數據占比:9%,不規范數據占比:21%。

數據活躍以倒三角形狀分布,整體分布比例為ads:dws:dwd:dim=8:2:1:1,分布還算合理。

上圖中下半部分是模型的生命周期,增長和留存情況。淘系的業務還屬于快速變化中,模型變化比較快。模型生命周期為25個月,模型年增長比例30%,模型留存44%。

2.公共層

公共層兩大核心問題為:

  • 首先,公共層表復用性不高。在2014年的時候公共層還比較規范,但可持續性不強。隨著時間流逝,業務增長和變化,復用性就逐年降低。因為大部分的數據是應用層做的,他們會開發自己的公共層,復用性降低,大部分都是無效表。
  • 另外,公共數據表在各個團隊分布不合理。這是由于數據團隊多,為了滿足業務開發效率,每個團隊都有自己的公共表,容易出現公共表復用占比低,重復建設的場景。其中淘寶數據團隊負責最多的公共數據表。

3.應用層分析

應用層的主要問題包括:

  • 第一,公共層建設不足或公共層透出不足。隨著時間增長,公共層的指標不能滿足ads層的業務需要,ads復用指標邏輯沒有下層,引用cdm層的ads表占比逐年降低,引用ads的ads表占比逐年增高。
  • 第二,較多的ads表共性邏輯未下沉,統計顯示超過17.63%ads表被下游ads復用。
  • 第三,跨集市依賴嚴重,統計顯示,整體跨集市依賴占比為30%,特別是大進口和淘寶數據跨集市依賴達到了40%,影響模型的穩定性,影響了模型的下線、修改。

問題分析

1.問題匯總

以上這副圖是簡化后的數據模型,我們可以發現存在很多不規范問題影響了模型的穩定性。業務在快速發展的情況下,為了快速響應業務需求,產生模型問題是必然的。日常工作中,數據研發流程大致如下,接到業務需求,直接引用ODS層表開發ADS數據,待數據需要復用的時候就把邏輯沉淀到公共層,同理指標也會有類似情況。主要問題可以歸納為七點:

  • 系統臨時表多,只增不刪,對于消費側影響較大,因為表量巨大,有效比例低,很難檢索到;
  • 命名不規范;
  • 公共層過度設計;
  • ADS重復建設;
  • ADS跨集市依賴;
  • ADS共性未下沉;
  • ADS穿透依賴ODS。

2.原因分析

從問題分類上看,主要有三大類問題:規范性問題,公共層復用性問題和應用層復用性問題。

從問題原因上看,主要有四大類原因:架構規范,流程機制,產品工具,以及研發能力。

3.模型治理的問題

模型治理的挑戰:

  1. 業務價值不明顯,治理帶來的是長期價值,短期對業務影響不大。
  2. 治理協作復雜,治理需要ODS、CDM、ADS層多人多團隊協作
  3. 問題治理難根治,容易出現新模型依賴有問題模型
  4. 模型平均生命周期不長(25個月)

綜上所述,模型治理的ROI比較低,我們的問題就是如何模型治理才最高效?

治理方案

1.整體方案

基于以上的問題原因分析,我們制定了如下治理方案。

核心策略為以下三點:

1:盤點存量,掌握數據的整體情況

2:規范增量,避免新增模型走老路,重復出現相同問題,考慮到數據的生命周期,歷史數據可以先不管。

3:日常治理保健康,以數據化驅動長期治理

2.機制規范

架構分層標準

往年我們關注的是數據視角,今年關注的是業務視角,業務視角核心訴求主要有四點,交付效率、產出時效、質量可靠、成本可控。過去OneData定義了每一層的作用,但每個層次的分工定位不清晰,針對這些問題重新做了清晰的定義。

應用層核心是專注支持業務,需要考慮研發效率、交付數據口徑一致性和穩定性。

通過集市規范來控制復雜度,通過輕度聚合的中間層確保口徑統一,通過扁平化設計確保穩定。

公共層的核心是抽象復用來提升效率,需要考慮易用性和穩定性。通過規范和冗余寬表提升復用性,通過解耦來確保穩定性。

ODS層的核心是合規高效,需要考慮接入效率和性能穩定。通過工具化提升效率、優化治理確保性能的穩定。特別是在數據達到一定量之后要考慮采用merge的方式接入數據。

集市劃分規范

數據集市,是用來滿足特定部門或者用戶的需求,按照多維的方式進行存儲。通過對相似數據業務場景內聚進行抽象分類,以降低ADS層重復建設和數據管理復雜度,讓應用研發更聚焦更高效。

集市劃分的原則有以下兩點:

原則一:以業務場景或者服務對象作為劃分原則,對相似數據業務場景內聚抽象進行分類。

原則二:集市劃分需要統一標準,盡量符合MECE原則。

公共層共建機制

在建設公共層的建設過程中,我們通常會遇到以下兩個痛點:

  • 應用研發的痛點:公共層相應效率低。
  • 公共層研發的痛點:如果統一承接開發工作,涉及的業務很廣泛,研發資源不足。

為了解決以上兩個痛點,我們通過以下核心原則來解決:

原則一:公共層開放共建,事后審計治理

應用開發整理需求,把需要下沉的公共維度提給公共層研發,公共開發需求評估。

原則二:以應用需求驅動,設計開發共建 以需求為驅動,拆分出核心模型和非核心模型,核心模型公共研發負責,非核心模型由業務開發進行,共同開發以提高效率。

原則三:公共層研發統一運維保障

非核心模型上線并完成相關測試(準確性、確定性、治理)后轉交給公共層研發,由公共層統一運維。

3.智能建模

在數據治理中有數據規范與共建機制依然是不夠的,還需要結合自動化工具來提升效率、保障規范。我們是從以下4個方面入手的(詳情可以體驗DataWorks的產品):

  • 數據體系目錄結構化
  • 模型設計線上化
  • 打通研發流程(自動化生成簡代碼)
  • 對接地圖數據專輯

數據目錄體系結構化

形成數據體系目錄有利于了解掌握數據,分門別類的方式降低了大家的使用成本。

首先要對表命名做一些管控,我們做了可視化的表命名檢測器,來確保規范性。另外,淘系不是一個單空間的數據體系,因此要解決跨多個空間的復雜數據體系的統一建模問題。

模型設計線上化

改變模型設計方式,由線下設計遷移到線上,通過一些自動化工具,提升效率,保證規范。

打通研發流程(自動化生成簡代碼)

模型遷移到線上后,打通研發流程自動生成簡代碼,生成代碼框架,建表語句,顯著提高了研發效

對接地圖數據專輯

形成相應的地圖數據專輯,方便其他用戶使用數據。

4.模型治理

打分模型

模型治理需要量化,如果沒有量化全靠專家經驗效率是非常低的,我們通過模型的指標形成到表級別的模型分。通過多維度對模型進行打分。

打分機制

精細化的打分機制,針對團隊、數據域、核心進行打分,形成相應的標簽。

整體流程

以數據驅動,上圖左邊,以模型評估數據為出發點,通過各個維度對模型進行評估,得到各個域、各個團隊的評分,形成相應的問題標簽。

以產品驅動,上圖右邊,通過專家經驗判斷新上線模型升級搜索權限、下線模型降權限,讓業務迅速感知數據變化,引導業務。

未來規劃

應用層效率

在整個數據體系中,應用層的數據體量是最大的,投入了大量的人力。OneData缺少對應用層的數據建設指導,集市高度耦合,給運維效率帶來了不少問題,如跨集市依賴、依賴深度的問題。過去都是以業務為主導,為了保障研發效率放棄了部分研發規范,以后要完善應用層的研發規范,同時通過工具做好研發效率與規范的平衡。

架構規范管控

基于分層標準落地,對研發過程規范完善,包括對設計、開發、運維、變更、治理等規范進行細化。

目前核心是表命名規范,對依賴規范、代碼規范、運維規范等管控能力尚不足。

產品工具提效

將繼續與Dataworks共建。

  • 應用層智能建模能力還不能滿足研發效率要求,因此會繼續功能提效;
  • 數據測試功能集成;
  • 數據運維功能升級;
  • 事中數據治理能力構建(開發助手);
  • 事后治理能力提效(批量刪除、主動推送優化等);
  • 數據地圖,找數用數提效。

問答環節

1:核心公共層的建設是自頂向下還是自底向上?

采用的是兩者相結合的方式。以需求為驅動,沒有需求就會導致過渡設計,在應用層有復用之后再下沉到公共層,這是自頂向下的。 在公共層設計階段是面向業務過程的,這時是自底向上的。

2:多BU公共層是否需要統一規范?怎么去做?怎么量化價值?

需要做統一的規范,規范利于數據流通,才能體現數據價值 。但是具體怎么規范需要具體去看,如電商、本地生活,業務和目標不一樣,很難做到統一的規范

3:怎么判斷指標需要下沉到公共層?

公共層的開發是需要成本的,是否需要下沉到公共層核心是看是否需要復用,可以從兩個方面入手。

專家經驗判斷:如電商交易環節數據,這類數據是核心數據,是要建設到公共層的。

事后判斷:如玩法之類的業務穩定性不強,那一開始不需要下沉到公共層,避免過度設計,事后再去判斷是否需要下沉。

4:關于表、字段的命名規范,是否需要先定義好詞根再開發?

需要分開看。對于公共層設計到的業務過程是有限的,對于公共部分要先定義好再開發。對于應用層,維度采用的是總建架構所以還需要先定義,對于指標特別是派生指標是多的,不建議先定義在開發。

5:如何解決口徑一致命名不一致,或者口徑不一致或者命名一致的場景。

模型是演變的。對于應用層,80%都是自定義的,第一次出現的時候都是不標準的,這部分如果采用先定義后開發的方式,效率是很低的,只有在下沉到公共層的時候才能夠管控。對于公共層,能做的是保障核心指標90%的規范與定義統一,剩下的那部分也無法保證。

6:跨集市依賴下沉到公共層的必要性?

短期來看,是沒影響的,新增效率高。

長期來會給數據的運維、治理帶來很多影響,在數據下線、變更、治理過程中不得不考慮到下游依賴,會影響全流程的開發效率。

責任編輯:張燕妮 來源: 阿里云云棲號
相關推薦

2018-09-30 15:05:38

數據湖數據倉庫Hadoop

2023-10-24 14:48:23

數據治理大數據

2021-07-19 10:06:30

數據治理數字化轉型CIO

2023-07-28 08:08:09

大淘寶數據模型數據治理

2021-08-07 09:32:23

數據治理數字化轉型CIO

2021-09-06 11:15:05

數據治理字節跳動埋點

2011-03-22 14:01:47

關系數據模型

2022-04-07 09:03:38

大淘系模型數據

2023-10-26 06:55:46

大數據數據倉庫

2024-03-26 00:03:50

多云治理云計算

2021-02-28 22:20:25

2010-05-26 14:37:56

Cassandra數據

2023-01-31 15:27:13

數據治理數據管理

2023-05-04 16:08:43

2023-04-07 07:14:34

2023-12-20 07:35:03

大模型數據治理機器學習

2023-09-28 08:19:57

語言模型數倉數據

2009-09-18 14:07:51

LINQ to SQL

2012-03-05 10:54:03

NoSQL

2025-01-23 08:30:41

點贊
收藏

51CTO技術棧公眾號

色妞欧美日韩在线| 国产欧美日产一区| 欧美福利视频在线| youjizz.com日本| 欧美magnet| 日韩一区在线播放| 精品无码久久久久国产| 中文字幕欧美在线观看| 国产综合网站| 国产亚洲人成a一在线v站| 视频区 图片区 小说区| 亚洲淫成人影院| 一区二区三区高清不卡| 日产精品久久久一区二区| 国产高清不卡视频| 日韩高清一区二区| 久久青草福利网站| 亚洲综合图片一区| 免费观看久久av| 制服丝袜亚洲色图| youjizzxxxx18| а√天堂8资源在线| 国产精品久久毛片a| 国产精品一区二区在线看| 91精品久久久久久蜜臀| 久久久久久久久久久久久国产精品| 欧美激情二区| 久久精品网站免费观看| 国产精品一区二区欧美黑人喷潮水| 亚洲熟妇无码久久精品| 久久精品毛片| 97成人在线视频| 免看一级a毛片一片成人不卡| 成人在线一区| 亚洲人成电影在线观看天堂色| 天堂va欧美va亚洲va老司机| 四虎地址8848精品| 欧美亚洲免费在线一区| 亚洲欧洲日产国码无码久久99| 七七久久电影网| 1024国产精品| 亚洲精品9999| 成人全视频高清免费观看| 91美女片黄在线| 国产一区二区三区四区五区在线 | 香蕉精品视频在线观看| 亚洲视频一区二区| 日韩乱码人妻无码中文字幕久久| 国产精品传媒| 精品国产一区二区三区av性色| 日本亚洲一区二区三区| 国产精品1区在线| 欧美精品成人一区二区三区四区| 黑人精品xxx一区一二区| 成人欧美在线观看 | 欧美久久久影院| 日韩大片一区二区| 黄页免费欧美| 欧美日韩1234| 韩国一区二区在线播放| 国产精品美女久久久久| 欧美一二区视频| 色诱av手机版| 国产精品毛片av| 精品国产免费人成在线观看| 北京富婆泄欲对白| 日本午夜精品| 一本色道久久综合亚洲精品小说| 成人在线观看免费高清| 91精品国产乱码久久久久久久| 久久精品国产久精国产思思| 欧美日韩在线观看免费| 亚洲婷婷免费| 日本电影亚洲天堂| 中文字幕一区二区人妻| 国产一区二区三区在线看麻豆| 91丝袜脚交足在线播放| 日本黄视频在线观看| xfplay精品久久| 亚洲欧美精品在线观看| 九七久久人人| 亚洲国产精品久久人人爱| 国产91美女视频| 91久久久久久白丝白浆欲热蜜臀| 欧美日韩激情在线| 欧美日韩一区二区区| 精品一区二区三区四区五区| 亚洲精品大尺度| 亚洲精品天堂网| 黄色精品网站| 欧洲日韩成人av| 国产精品热久久| 99久久夜色精品国产网站| 色一情一乱一伦一区二区三区| caopon在线免费视频| 精品日本美女福利在线观看| 亚洲欧美在线精品| 久久精品福利| 日韩视频免费大全中文字幕| 日韩欧美一区二区一幕| 欧美aaaaaa午夜精品| 国产高清一区二区三区| 91在线免费看| 午夜电影一区二区三区| 欧美在线aaa| 欧美大奶一区二区| 久久久精品网站| 69国产精品视频免费观看| 国产在线播放一区三区四| 久久久久久久有限公司| 伊人春色在线观看| 欧美午夜精品久久久久久超碰| 国产成人精品综合久久久久99| 青娱乐在线免费视频| 精品国产乱码一区二区三区| 日韩www在线| 青青草原国产视频| 久久精品国产99| 欧美日韩一区在线播放| 国产91足控脚交在线观看| 欧美日韩一区在线观看| 北岛玲一区二区| 一区二区免费不卡在线| 国产精品美女免费视频| 香蕉久久国产av一区二区| 一区二区在线观看视频| theporn国产精品| 怕怕欧美视频免费大全| 久久人人爽国产| av免费观看网址| 国产精品久久久久久久久搜平片 | 一本色道**综合亚洲精品蜜桃冫| www日本在线观看| 99精品视频在线| 国产精品视频午夜| а√天堂中文在线资源bt在线| 激情懂色av一区av二区av| 97中文字幕在线观看| 永久91嫩草亚洲精品人人| 成人国产精品久久久| 69视频在线| 欧美性受xxxx| 久久久精品成人| 日韩黄色小视频| 欧美一区免费视频| 第四色男人最爱上成人网| 亚洲美女免费精品视频在线观看| 国产女同在线观看| 欧美在线电影| 亚洲男人的天堂在线aⅴ视频| 丰满的少妇愉情hd高清果冻传媒| 免费观看性欧美大片无片| 日韩在线观看免费网站| 国产又粗又黄又爽视频| 亚洲丝袜制服诱惑| 1314成人网| 欧美一区亚洲| 国产精品.com| 免费成人在线电影| 亚洲乱码国产乱码精品精天堂| 久久午夜免费视频| 91免费版在线看| 久久综合久久色| 红桃成人av在线播放| 国产精品美女www| 2017亚洲天堂1024| 欧美精品在线一区二区| 久久噜噜色综合一区二区| 国产一区二区视频在线| 国产尤物av一区二区三区| 第四色在线一区二区| 欧美一级黄色网| 9色在线观看| 制服丝袜成人动漫| 日韩精品国产一区二区| 久久久久久久久久看片| 一女二男3p波多野结衣| 亚洲午夜一区| 日韩av在线电影观看| 视频91a欧美| 国语对白做受69| 福利小视频在线观看| 9191精品国产综合久久久久久 | 欧美女优在线观看| 欧美系列一区二区| 精品99久久久久成人网站免费| 91丨porny丨蝌蚪视频| 天天插天天操天天射| 欧美黄污视频| 日本在线观看不卡| 亚洲日本va| 国产成人一区三区| 日韩影视在线| 一本大道亚洲视频| 六月婷婷中文字幕| 欧美日韩一区成人| 国产无码精品一区二区| 中文字幕国产精品一区二区| 涩视频在线观看| 麻豆精品视频在线观看视频| 成人网站免费观看入口| 久久在线免费| 久久青青草综合| 国产精品3区| 国产成人久久久| 日本一级理论片在线大全| 国产亚洲a∨片在线观看| 国内精品久久久久久久久久| 日本乱人伦aⅴ精品| 国产性70yerg老太| 国产精品第一页第二页第三页| av无码一区二区三区| 韩日欧美一区二区三区| 日日碰狠狠躁久久躁婷婷| 欧美在线资源| 樱花www成人免费视频| 免费看日本一区二区| 国产高清自拍一区| 日韩成人精品| 成人福利网站在线观看11| 亚洲一区视频在线播放| 色综合天天爱| 蜜桃久久精品乱码一区二区| 在线精品自拍| 91探花福利精品国产自产在线| 日韩精品影片| 欧美诱惑福利视频| av中文字幕在线观看第一页| 久久精品国产久精国产一老狼| 国产在线视频资源| 精品亚洲一区二区三区| 天天射,天天干| 亚洲电影在线看| 高清乱码毛片入口| 日韩一区二区三区电影在线观看| 中文天堂在线资源| 欧美性猛交xxxx乱大交| 久久久久久久久久免费视频| 亚洲一区二区三区三| 免费中文字幕在线| 亚洲天堂精品视频| 欧美丰满熟妇bbbbbb| 《视频一区视频二区| 免费一级suv好看的国产网站| 久久欧美一区二区| 熟女人妻在线视频| 91小视频在线免费看| jizz日本免费| 91免费看视频| 香蕉视频久久久| 国产性做久久久久久| 舐め犯し波多野结衣在线观看| 久久伊人蜜桃av一区二区| 久久国产精品无码一级毛片| 99久久精品国产一区| 国产精品第七页| 久久在线免费观看| 在线观看国产精品一区| 国产精品热久久久久夜色精品三区| 手机看片国产日韩| 亚洲日本丝袜连裤袜办公室| 中文字幕影音先锋| 偷窥少妇高潮呻吟av久久免费| 国产精品免费精品一区| 在线视频一区二区免费| 一区二区 亚洲| 日韩午夜在线影院| 亚洲欧美色视频| 亚洲最新av在线网站| 国产剧情在线| 久久久久久国产精品美女| 极品美鲍一区| 国产精品福利在线观看网址| 亚瑟国产精品| 国产精品美女黄网| 在线看成人短视频| 伊人婷婷久久| 亚洲黄色大片| 亚洲国产精品三区| 国产激情视频一区二区在线观看| 怡红院一区二区| 国产三区在线成人av| 精品亚洲乱码一区二区| 亚洲国产一区二区三区| 丁香社区五月天| 69p69国产精品| 亚洲欧美综合在线观看| 一级做a爰片久久毛片美女图片| 国产成人在线视频免费观看| 69av成年福利视频| 婷婷激情成人| 久久亚裔精品欧美| 999久久久国产精品| 日韩a∨精品日韩在线观看| 蜜桃传媒麻豆第一区在线观看| 白丝校花扒腿让我c| 国产亚洲欧洲997久久综合 | 一区二区三区精品视频| 在线观看免费av片| 欧美一区二区啪啪| 天天操天天干天天| 久久九九亚洲综合| sm性调教片在线观看| 国产在线视频91| 偷拍一区二区| 欧美另类videos| 日韩成人伦理电影在线观看| 69久久精品无码一区二区| 久久久精品黄色| 国产第100页| 91精品国产91热久久久做人人| 日韩私人影院| 欧美激情视频在线观看| 精品女同一区二区三区在线观看| 精品久久一区二区三区蜜桃| 自拍偷拍欧美| 天天操天天爽天天射| 9久草视频在线视频精品| xxxx日本少妇| 欧美日韩一区二区三区四区五区| 深夜福利视频网站| 欧美另类暴力丝袜| 外国成人毛片| 日韩欧美在线电影| 亚洲一区日韩在线| 深田咏美中文字幕| 亚洲午夜激情网页| 99精品视频免费看| 日韩视频―中文字幕| 经典三级一区二区| 欧美日韩亚洲一区二区三区四区| 亚洲区一区二| 第一页在线视频| 1000精品久久久久久久久| 综合久久中文字幕| 亚洲欧洲一区二区三区久久| 性欧美freesex顶级少妇| 国产女人水真多18毛片18精品| 一区二区三区午夜视频| 天天综合天天添夜夜添狠狠添| 中文字幕精品—区二区四季| 中文字幕av影视| 中文字幕欧美日韩va免费视频| 日韩无码精品一区二区三区| 91精品国产色综合久久不卡电影| 欧美日韩在线资源| 国产精品亚洲视频在线观看 | 无码人妻精品一区二区三区99v| 久久精品国产网站| 天堂网中文在线观看| 欧美精选在线播放| 性欧美猛交videos| 国产激情一区二区三区在线观看| 精品96久久久久久中文字幕无| 欧美极品jizzhd欧美仙踪林| 午夜婷婷国产麻豆精品| 亚洲三级中文字幕| 国产精品成人播放| 99久久婷婷| 香蕉久久久久久av成人| 精品magnet| 成人在线观看免费| 成人a在线视频| 欧美人与禽猛交乱配视频| v天堂中文在线| 日本道色综合久久| 欧美性天天影视| 91久久精品国产| 91久久亚洲| 国产真人做爰视频免费| 欧美色图一区二区三区| 亚洲小说区图片| 久久久久久九九| 蜜桃视频一区二区三区 | 国产一区观看| 少妇光屁股影院| 欧美日韩一区久久| 美女精品导航| 中文字幕日韩欧美在线| 国产精品21p| 日韩在线精品一区| 成人动漫视频| 免费激情视频在线观看| 中文字幕日本乱码精品影院| 搡老岳熟女国产熟妇| 国产精品高潮呻吟久久av无限 | 最新中文字幕亚洲| 日本免费精品| 一本久道中文无码字幕av| 综合分类小说区另类春色亚洲小说欧美 | 国产精品视频福利| 日韩成人一级片| 欧美精品久久久久性色| 亚洲欧美中文日韩在线| 视频一区中文字幕精品| 日本999视频| 亚洲福利一二三区| 欧美极品视频| 欧美三级电影在线播放| 国产成人av一区二区|