精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數據開發,如何平衡效率與質量

大數據
數據開發的效率,是如何盡快的將產品設計、業務過程,轉換為數據模型;數據開發的質量,則是如何盡快的將數據加工過程中的問題,識別出來。向業務交付的內容,是開發的內容;而如果開發的時候,忽略質量的問題,雖然交付的時候不會有感知,但往往會在排查問題階段,把這些時間加倍的補償回來。

[[420500]]

|0x00 質量VS效率

我一直有一個觀點:“數據模型設計的是商業模式,是產品邏輯;數據結果反映的是業務實操,是實際現狀。”

數據開發的效率,是如何盡快的將產品設計、業務過程,轉換為數據模型;數據開發的質量,則是如何盡快的將數據加工過程中的問題,識別出來。向業務交付的內容,是開發的內容;而如果開發的時候,忽略質量的問題,雖然交付的時候不會有感知,但往往會在排查問題階段,把這些時間加倍的補償回來。

很多時候,開發同學會覺得,做這么多質量工作是“無效”的,因為很多問題,并不需要數據同學對業務有太深入的了解,如果發現了,會覺得業務就這么設置的,跟我有啥關系;如果沒發現,那就是開發工期太緊張了,我做不過來。

比如,按照規定,我們要向1萬用戶發放優惠券,但因為人群選擇錯了,導致發出去了10萬張優惠券;再比如,商品綁定錯了貨品,或者是發貨發錯了,但大家的第一想法是數據算錯了。這些情況的出現,導致數據和業務出現一些對立的情緒。

但幸運的是,數據質量問題的排查,要遠比業務系統問題的排查,容易不少,因為我們有章可循。

所以,如何在保證開發速度的情況下,做好質量保障,是一個很重要的問題。效率和質量,哪個都不能放棄,是數據開發的兩條生命線。

本文我們分開講講,質量體系的事情,效率體系的事情,以及兩者如何兼顧平衡。

|0x01 數據質量體系

數據的作用可以從三個比較宏觀的維度來描述,一個是豐富、一個是準確、一個是及時。豐富的數據可以為業務提供更多可以描述業務的方法,準確的數據意味著交付結果及分析結論是可靠的,及時的是數據代表我們面對市場變化所能夠做出的反應時間。因此,數據質量的體系,要以保障這三條為主。

從這個角度來講,我們能夠總結出一些常見的數據問題,而這些都是我們需要關注的。

首先是唯一性,也就是常講的“主鍵唯一”,公共層的表主鍵必須唯一,例如訂單表中的訂單號、倉庫表中的倉庫編碼,等等;如果是DWS層,那么統計的維度也是要唯一的,例如商品 + sku的統計表中,這兩個ID的組合結果就要唯一。

其次是異常值,最常見的異常值是“空值”,如果一個字段的取值都是空,那么就需要考慮廢棄該字段;同時,還有一些比較常見的場景,比如支付金額一般情況下不能是負值,這些都考驗開發對于業務的熟練掌握程度;

再次是格式類型,比如日期的格式是否都是yyyyMMdd,再比如身份證號是不是有不符合位數的情況,不一而足;

最后是波動性,對于GMV、商品數這種全局性的指標,如果波動太大那么出現問題的可能性就很大。

所以平時就要從各個數據的關鍵環節,與業務或者服務端、客戶端一起,解決這些問題。

在業務側,要規范運營的操作,比如該填寫的信息沒有寫,商品名稱沒有錄入;或者是填寫的信息存在問題,比如把小二的信息填錯了。

在工程側,問題產生的可能性最多,比如訂單號記錄重復了、數據精度轉換時出錯、數據存在空格導致與null產生差異,等等。

在消費側,同步任務重啟導致數據重復,或者是某些數據庫任務掛掉導致少同步數據,都可能造成數據缺失或者重復。

通常情況下,不論是哪個環節發現了問題,都要及時的止損,因為把錯誤數據放給了下游,導致大范圍的數據問題、數據重新刷新的成本,都是不可承受的。

當然,我們保障數據質量的方法,也都大同小異,主要包括:

數據規范:有道是“無規矩不成方圓”,規范并不是方便小二開發的,而是為了方便其他人閱讀和接手代碼的,排查問題時能夠更快的定位,因此是團隊必須遵守的規范;

項目文檔:大多數時候,僅僅通過看代碼,我們是無法還原這么設計的意圖,因此整理下項目文檔,記錄背景、需求的詳情,以及建模的思考過程與流程圖,也是團隊要強制的內容;

DQC:為每一個關鍵任務,加上基本的數據校驗,如主鍵唯一、數據字段空值校驗,等等,這也是任務自測的關鍵環節;

自動化測試:很多測試部門會寫好任務回歸用例,常見的一些問題會總結成自動化的任務,能夠有效識別一些不常見的錯誤。

以上,就是數據質量體系的常見內容。

|0x02 數據效率體系

數據開發講求產出,不光要有“量”的結果,也要有“質”的思考。如果一味的做基礎工作,被替代的可能性非常高。

因此,我們非常希望業務來提需求,因為這樣才能貼近業務去走,體現個人或者團隊的價值;但同時,我們又希望更快的交付這些需求,這樣才能有時間,來把解決問題的過程或者方法,總結并沉淀下來。

開發的效率的提升方法,大體有四種:一是借助基礎平臺提供的工具,二是憑借完善的公共層,三是良好的業務Sense,四是多方順利的合作模式。

先講一下基礎平臺提供的工具,大數據的發展,從早期的靠工程師手動搭建集群、手動運維,發展到后來CDH這種有完善管理功能的集群,再發展到以阿里云為代表的完善商業化方案,工具提供的生產力已經不同于往日。因此,市面上的崗位,也從早期的“大數據開發”,逐步的過渡到了“數據倉庫”,再到如今的“數據技術”,本質還是用數據來做需求開發,但其本質內核已經發生了比較大的變化。可以說,正是因為工具的不斷完善,使得開發從偏后臺的職能,走向了前臺業務的職能。

在這個基礎上,SQL開發有工作臺、數據分析有在線文檔、運維有監控平臺、元數據有數據地圖、任務執行有像海豚調度這種完善的工具、數據庫有TiDB這種融合了OLAP和OLTP的工具、實時開發Flink統一天下。可以講,數據開發如何使用好工具,已經成為了提升開發效率的不二法寶。

再講一下完善的公共層,公共層是互聯網數據倉庫的核心理念,將復雜的業務由專門的團隊,統一進行管理和建模,降低了下游理解數據、使用數據的難度。因此,不論團隊規模有多大、數據團隊的發展到了怎樣的一個階段,把公共層做好,都是一件非常有必要的事情。

按照分層理論,公共層是DWD/DIM/DWS三者的統稱,也正好反映了Kimball所提出的一致性維度+一致性事實。因此,公共層也是最考驗建模水平的階段,它是解決業務復雜性、保障準確性的最重要基石。

其次講一下良好的業務Sense,因為建模所反映的是業務應有的邏輯,但它不代表業務想看到的邏輯,比如在電商場景中,優惠券的發放是一件比較復雜的事情,各種優惠策略可以設置的很靈活。但因為策略設置的很靈活,因此公共層不太可能把運營的玩法記錄清楚,只是記錄發生了什么事情。因此,當你想從應用層建模的時候,會發現每年的玩法都在變,每年的模型都要改了重新做。最重要的是,如果沒有貼近業務,一不留神,數據沒按照玩法算,結果就是錯的,會被人追問數據準確性問題。

這其實也是關系到開發效率的核心因素,即你能不能準確理解業務的意圖,因為不會所有的需求都寫的一清二楚,很多邏輯還是需要自己來做判斷。

最后說一下多方順利的合作模式,雖然SQL開發是效率最高的交付語言了,但很多基礎性的工作,少不了和其他部門打交道,比如OLAP引擎、比如前端頁面、比如報表工具、比如工程業務邏輯,等等。因此,很多項目是否能夠如期完工,就需要看與其他團隊的配合情況了。

做過項目管理的同學都清楚,項目工期取決于最長關鍵路徑,但互聯網業務的現狀,往往決定了服務端在跨團隊合作中,是起到主導作用的,因此尤其要注意兩者的合作關系。

|0xFF 數據質量與開發效率的平衡

因為績效的壓力,我們需要高效率的做開發;又因為數據質量/數據安全/業務投訴這種懸在頭上的達摩克斯之劍,我們又不能忽視繁瑣的質量保障工作,怎么辦?

筆者的看法,我們有兩個突破口,來解決這個問題。首先,將質量問題控制在某個層次上,也就是抓問題抓主要矛盾,其次,要有熟練的上手流程,避免重復性的說教工作。

將質量問題控制在某個層次上。這其實要分兩個情況,一個是團隊能夠有正常的排期研發流程;另一個是野蠻成長,追求競爭的機制。

對于正常排期的研發流程,建議在流程前加入模型評審的環節,流程后加入測試的環節。對于大多數的問題,模型評審能夠解決設計混亂的問題,而測試可以有效把低級問題消滅掉。再配合自測使用的DQC,基本上95%以上的問題,都可以解決掉。這種正常研發排期的環節,對數據質量問題往往是控制的比較好的。

對于追求競爭的機制,那么公共層的設計就很重要,默認情況下,100%的表要覆蓋DQC監控,同時每個表也要配合三個以上的DQC規則。因為ADS開發節奏都很快,而且需求往往是變動性非常大的,今天改邏輯明天再改這種的,那么確保公共層是正確的的,阻斷大部分的問題,就很重要。

熟練的上手流程。其實數據開發不像工程,任務通常都是以表的形式存在,而且團隊會跨業務線進行開發工作,這些情況下,閱讀他人的代碼、熟悉他人的業務,就成了習以為常的事情。很多團隊總是出問題,大體上集中在兩個階段,一個是老人帶新人階段,新人不懂坑有哪些;一個是業務交接的階段,不熟悉業務,會導致一些看似邏輯正確的改動,引起了某些業務上的邏輯缺陷。

從這個角度看,作為數據開發,不厭其煩的整理文檔、Review模型、匯報業務線情況,都是一些非常有必要的事情。一方面可以幫助團隊其他同學了解業務,另一方面也為需求開發的背景和設計思路,留下比較充足的參考資料。從這個角度看,提供參考的規范與文檔定期Review,這件事情在工作中的占比,可以達到30%以上。

最后,我們還需要注意一點,就是要有與業務直接對話的通道,以培養業務Sense。比如,業務操作的規范性、一些常見的業務問題總結。

盡管我們是偏后臺的數據團隊,但我們要走到前臺,就要有一種宣講、同步機制。這并不是故意擴大影響力,而是確實有必要的。我們要講清楚數據背后的邏輯、數據計算的口徑、數據工具使用的方法,等等。尤其要講清楚,我們能做什么、不能做什么,有一套成熟的應對方法,以解釋很多情況下數據與經驗有偏差的原因,并把這些差異呈現出來。

雙方理解一致了,很多質量問題,也就迎刃而解了。

 

祝大家工作994,生活工作兩balance。

 

責任編輯:武曉燕 來源: 曉陽的數據小站
相關推薦

2019-09-27 12:14:15

低代碼程序平衡

2010-12-29 10:02:46

銀行軟件測試

2009-08-17 16:48:34

ASP.NET緩存機制

2023-09-07 09:46:44

程序員編程

2013-12-19 17:04:33

2013-07-04 14:54:24

Android

2022-12-12 15:36:48

2020-07-22 10:15:56

物聯網安全物聯網IOT

2013-12-13 10:30:09

2017-08-18 13:02:15

大數據數據質量

2025-04-25 08:05:00

網絡攻擊CISO安全

2025-11-19 18:34:55

2025-03-03 09:20:00

VueUseVue.js前端

2021-01-05 10:41:07

遠程工作CIO首席信息官

2010-08-17 09:55:29

2017-04-17 06:07:01

React Nativ開發性能

2010-01-18 23:14:55

IT運維管理Mocha ITOM摩卡軟件

2022-07-27 19:24:16

SQL

2020-11-16 09:19:10

程序員IT互聯網

2025-05-29 03:00:00

混合推理模型LHRMAI
點贊
收藏

51CTO技術棧公眾號

黄色一级片av| 91日本在线观看| x88av在线| 亚洲欧美一级| 亚洲午夜av在线| 欧美精品尤物在线| 一区二区三区免费在线| 欧美国内亚洲| 亚洲美女www午夜| 国产精品久久久久久久av福利| 免费av不卡在线观看| 99国产精品国产精品久久| 国产成人在线亚洲欧美| www深夜成人a√在线| 久久porn| 91精品婷婷国产综合久久性色 | xxxx在线免费观看| 黄视频在线免费看| 欧美国产日本视频| 国产精品国产亚洲精品看不卡15| 不卡av电影在线| 欧美黄污视频| 在线一区二区日韩| 精品国产av色一区二区深夜久久| 香蕉成人在线| 在线观看不卡一区| 18禁裸男晨勃露j毛免费观看| yw193.com尤物在线| 成人免费看的视频| 91免费版网站入口| 午夜一区二区三区四区| 999在线观看精品免费不卡网站| 久久精品亚洲国产| 亚洲av成人无码久久精品| 久久久久久毛片免费看 | 五月天中文字幕一区二区| 亚洲一区高清| 成人高清网站| 久久精品夜色噜噜亚洲aⅴ| 国产伦精品一区二区三区高清版| 国产毛片毛片毛片毛片毛片| 视频一区二区三区入口| 日本91av在线播放| 日韩伦人妻无码| 国产综合激情| 欧美激情一区二区三级高清视频| 特黄一区二区三区| 精品理论电影在线| 亚洲欧美综合v| 男生裸体视频网站| 欧美绝顶高潮抽搐喷水合集| 精品国产乱码久久久久久图片| 欧美日韩久久婷婷| 国产亚洲久久| 日韩一区二区精品葵司在线| 亚洲图片 自拍偷拍| 四虎影视国产精品| 91精品麻豆日日躁夜夜躁| 色91精品久久久久久久久| 成人午夜亚洲| 欧美日韩一区国产| 九九热99视频| 日韩精品视频一区二区三区| 日韩一区二区在线看| 99九九99九九九99九他书对| 999久久久国产999久久久| 91麻豆精品国产91| 成年人看片网站| 国产成人一二片| 亚洲开心激情网| 亚洲精品国产精品国自产网站| av一区二区在线播放| 中文字幕日韩精品在线观看| 黑人狂躁日本娇小| 欧美黄色免费| 欧美尤物巨大精品爽| 无码视频一区二区三区| 美国欧美日韩国产在线播放| 91精品啪aⅴ在线观看国产| 亚洲AV无码精品国产| 不卡一区中文字幕| 日韩久久精品一区二区三区| 日本视频在线免费观看| 亚洲综合清纯丝袜自拍| 91专区在线观看| 少妇精品视频一区二区免费看| 欧美日韩高清一区二区| 亚洲综合中文网| 色先锋久久影院av| 色婷婷综合久久久久中文字幕1| 91高清免费观看| 亚洲国产导航| 国产精品网址在线| 高h调教冰块play男男双性文| 91免费看`日韩一区二区| 视频一区视频二区视频| 伊人222成人综合网| 欧美视频裸体精品| 亚洲自拍第三页| 亚洲人成网亚洲欧洲无码| 色偷偷综合社区| 日韩成人高清视频| 久久国产夜色精品鲁鲁99| 国产成人亚洲欧美| av小片在线| 亚洲成年人影院| 激情五月婷婷久久| 国产成人福利av| 久久精品视频va| 无码人妻一区二区三区线| 国产精品1024| 亚洲综合第一| 中文字幕在线直播| 日韩视频一区二区| 国精产品一区一区| 中文日韩在线| 成人xxxxx色| 国产原创视频在线观看| 欧美性猛交xxxx| 佐佐木明希电影| 天堂美国久久| 国产精品久久久91| 欧美色综合一区二区三区| 亚洲精品成人少妇| 欧美精品久久久久久久久25p| 人人精品亚洲| 久久免费国产精品1| 五月天中文字幕| 久久婷婷色综合| 国内自拍在线观看| 国产毛片久久久| 欧美成人午夜激情视频| 在线观看国产成人| 国产女人水真多18毛片18精品视频 | 国产中文字幕在线观看| 亚洲va在线va天堂| 宇都宫紫苑在线播放| 欧美激情国产在线| 国产精品日韩一区| h视频在线观看免费| 欧美午夜精品久久久久久人妖| 中文字幕第九页| 欧美视频网站| 91亚洲精品丁香在线观看| 国产在线观看91| 6080yy午夜一二三区久久| 免费精品在线视频| 久久精品噜噜噜成人av农村| 日韩中文字幕一区| 亚洲成人av观看| 在线播放日韩欧美| 亚洲视频在线观看免费视频| 亚洲国产成人午夜在线一区| 波多结衣在线观看| 久久理论电影| 91视频国产精品| 污污的网站在线看| 亚洲第一视频网| 久久久久99精品成人片我成大片| 97精品超碰一区二区三区| 久久网站免费视频| 精品国产乱码久久久| 国产精品网红直播| av官网在线播放| 精品国产一区二区亚洲人成毛片| 日本少妇全体裸体洗澡| 99re这里都是精品| 粉嫩虎白女毛片人体| 欧美性感美女一区二区| 成人写真视频福利网| 性xxxfreexxxx性欧美| 精品处破学生在线二十三| 激情综合网五月婷婷| 91视频com| 无限资源日本好片| 伊人情人综合网| 韩国一区二区三区美女美女秀| 亚洲女同av| 综合av色偷偷网| www久久久久久| 欧美性猛交xxxx免费看| 欧洲性xxxx| 丁香网亚洲国际| avav在线看| 日韩免费特黄一二三区| 97人人做人人人难人人做| 中文在线8资源库| 中文字幕亚洲欧美日韩2019| 性中国古装videossex| 欧美性色视频在线| 成人在线观看高清| 99国产一区二区三精品乱码| xx欧美撒尿嘘撒尿xx| 午夜久久影院| 欧洲一区二区日韩在线视频观看免费| 香蕉久久久久久| 91成人在线视频| 毛片在线看片| 亚洲国产精品小视频| 亚洲精品国产精品国自产网站按摩| 亚洲精品免费在线播放| 亚洲熟妇一区二区三区| 国内精品写真在线观看| 国产偷人视频免费| 亚洲一本二本| 日韩欧美国产二区| 精品日产乱码久久久久久仙踪林| 国产精品自拍偷拍视频| 国产伦子伦对白在线播放观看| 中文字幕不卡av| 青青草观看免费视频在线| 日韩一级黄色片| 亚洲在线观看av| 疯狂欧美牲乱大交777| 国产a免费视频| 国产精品久久久久久久久动漫 | 国产一区二区在线免费| 麻豆理论在线观看| 欧美成人自拍视频| 国产美女性感在线观看懂色av| 精品乱人伦一区二区三区| 在线观看不卡的av| 在线观看日韩国产| 欧美特黄aaaaaa| 亚洲福利一二三区| 欧美黄色免费观看| 国产精品国产三级国产普通话蜜臀| av网页在线观看| 成人晚上爱看视频| 日韩av影视大全| 激情综合网天天干| 日本成人黄色网| 亚洲欧美日韩国产综合精品二区| 女人被男人躁得好爽免费视频| 四虎8848精品成人免费网站| 日本三级中国三级99人妇网站| 亚洲第一福利专区| 久久伦理网站| 日韩大片在线免费观看| 精品乱码一区二区三区| 伊人久久影院| 国产精品日韩欧美一区二区三区| 一区二区三区四区精品视频| 亚洲综合日韩在线| 日韩成人久久| 91超碰在线免费观看| 欧美三级一区| av免费精品一区二区三区| 日本免费精品| 99热最新在线| 粉嫩一区二区三区四区公司1| 亚洲自拍欧美色图| 日韩精品三级| 国产日韩精品推荐| 欧美精品密入口播放| 蜜桃传媒视频第一区入口在线看| 日韩欧美国产大片| 奇米精品在线| 视频在线不卡免费观看| 亚洲精品不卡| 亚洲成人精选| 日韩亚洲欧美视频| 国产精品人人爽人人做我的可爱| 女性女同性aⅴ免费观女性恋| 久久深夜福利| 一女二男3p波多野结衣| 国产精品一区三区| 亚洲精品乱码久久久久久蜜桃欧美| 成人性生交大片| 亚洲制服丝袜在线播放| 国产日本亚洲高清| 亚洲最大的黄色网址| 亚洲综合丁香婷婷六月香| 狠狠躁夜夜躁人人爽天天高潮| 色婷婷精品久久二区二区蜜臀av| 国产精品无码粉嫩小泬| 欧美一级片免费看| 熟妇人妻av无码一区二区三区| 亚洲男人的天堂在线| 欧美一区二区三区| 久久久亚洲成人| 成人看片网页| αv一区二区三区| 美女久久99| 色哺乳xxxxhd奶水米仓惠香| 亚洲区一区二| 亚洲色图 在线视频| 国产黄色91视频| 无码人妻精品一区二区三应用大全| 国产欧美日本一区二区三区| 草视频在线观看| 色综合色综合色综合| 99热这里只有精品66| 亚洲男人天堂手机在线| 黄网站在线播放| 日本久久亚洲电影| 精品视频在线观看免费观看| 久久99热只有频精品91密拍| 91影院成人| 国内外成人免费激情视频| 国产综合久久久久影院| 国产肉体xxxx裸体784大胆| 国产精品久久久久aaaa樱花| 日本三级中文字幕| 欧美高清精品3d| 欧美色图另类| 992tv成人免费影院| www久久久| 日韩资源av在线| 亚洲美女色禁图| 精品国产鲁一鲁一区二区三区| 91蜜桃免费观看视频| 青青草激情视频| 欧美丝袜丝交足nylons| 日日夜夜精品免费| 欧美大成色www永久网站婷| 四虎影视4hu4虎成人| 国模一区二区三区私拍视频| 欧美91视频| 在线观看av免费观看| 国产精品女同一区二区三区| 九九九在线观看| 亚洲国产精品va在线看黑人| 影院在线观看全集免费观看| 成人国产精品久久久| 国产精品日韩精品中文字幕| 黄网站欧美内射| 成人爽a毛片一区二区免费| 婷婷伊人五月天| 欧美日韩国产三级| 国产三级在线免费| 青青草国产精品一区二区| 欧美黑人做爰爽爽爽| 日韩精品在线观看av| 国产99久久久精品| www日韩在线| 91麻豆精品国产| 韩国中文字幕在线| 91日本在线视频| 综合国产在线| 亚洲成人av免费观看| 亚洲精品中文在线| 精品人妻一区二区三区浪潮在线 | 黄色成人在线观看网站| 日日噜噜噜噜夜夜爽亚洲精品| 水野朝阳av一区二区三区| 中文字幕高清视频| 日韩欧美主播在线| 蜜桃视频在线观看网站| 国产99久久久欧美黑人| 精品国产一级毛片| 校园春色 亚洲色图| 亚洲国产精品黑人久久久| 在线观看亚洲一区二区| 久久久av网站| 一区二区三区在线免费看| 99色这里只有精品| 91网站在线观看视频| 一级片视频在线观看| 伊人亚洲福利一区二区三区| 成人a在线观看高清电影| 中文字幕精品—区二区日日骚| 精品一区二区日韩| 免费在线视频观看| 亚洲国产中文字幕久久网| 亚洲高清黄色| 亚洲精品在线免费看| 精品在线免费视频| 国产亚洲精品码| 亚洲另类图片色| 国产精品久久久久77777丨| 欧美一级免费在线观看| 国产成人自拍网| 三级视频在线观看| 日韩中文字幕精品| 99re8这里有精品热视频免费| 男人靠女人免费视频网站| 欧美激情一区二区三区不卡| 国产农村妇女毛片精品| 97色在线观看免费视频| 国产欧美日韩免费观看| 午夜免费一级片| 色综合天天性综合| 国产精品剧情| 免费国产在线精品一区二区三区| 日本不卡一区二区三区高清视频| 欧美日韩色视频| 亚洲精品国产美女| 国产aⅴ精品一区二区四区| 欧美精品久久久久久久久久久| 久久久亚洲精品一区二区三区| 91肉色超薄丝袜脚交一区二区| 韩剧1988在线观看免费完整版| 欧美偷拍自拍| 无码精品一区二区三区在线播放| 欧美日本视频在线| 色综合亚洲图丝熟| 台湾无码一区二区| 国产视频一区不卡| 欧美 日韩 国产 成人 在线 91|