精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

王晶晶:京東零售海量日志數據處理實踐

大數據 新聞
本次分享主要從三個方面介紹京東流量場下的數據處理方案,同時也會結合京東實際場景案例,介紹京東在流量場下的一些數據應用和實踐。

01 京東零售流量數倉架構

1. 京東零售——流量簡介

① 什么是流量? 

簡單來說,流量就是用戶作用在京東頁面上,產生一系列行為數據的集合。

② 流量數據的來源

數據來源主要是移動端和PC端,以及線下店、外部采買、合作商的數據等。

圖片?

這些數據是如何流轉到數倉的呢?

2. 京東零售——流量數據處理架構

由架構圖可以看出,對不同的終端采取不同的采集模式;例如,對APP原生頁面采取SDK的采集模式,對于PC、H5頁面是JS采集,數據采集后按照實時和離線雙寫,離線直接寫到CFS分布式文件系統中,每小時從CFS拉取數據文件,同時對數據文件大小、采集ip進行監控,防止數據丟失;實時是以白名單的方式動態配置,寫到kafka中,最后將數據入倉。

圖片?

3. 京東零售——流量數倉分層介紹

圖片

數據流轉到數倉會進行一些統一化的管理,數倉是如何分層的呢?

受京東業務復雜度和數據體量的影響,整體分層較細,分為:數據緩沖層(BDM)、貼源數據層(FDM)、基礎數據層(GDM)、公共數據層(ADM)、應用數據層(APP)五層。

① BDM層

是源業務系統的一些數據,會進行永久性保存。

② FDM層

主要是從報文日志轉化成業務格式,對業務字段進行拆解、排序和數據回寫等,例如用戶逛京東時前期未登錄,最終下單時才登陸,那對用戶全鏈路回寫便是在這一層進行。

③ GDM層

按照主題域進行標準化封裝,整體會屏蔽生產系統干擾,同時會處理數據回灌事情。

④ ADM層

ADM是公共數據層,面向主題、面向業務過程的數據整合,目前劃分成兩層:ADM-D、ADM-S。

ADM-D負責統一的數據口徑封裝,提供各主題統一維度和指標的最細粒度數據;

ADM-S提供各主題統一維度和指標的聚合數據, 為各業務方提供統一口徑的共享數據。

⑤ APP層

數據看板的數據整合,也可以進行一些跨主題的聚合數據處理。

⑥ 維度層

DIM層主要就是一些通用的維度數據。

基于以上的數倉分層方案,來看下京東流量數倉架構在離線和實時上別分是如何處理的。

4. 京東零售-流量離線數倉架構

圖片

① 基礎數據層

離線數倉最下面一部分是基礎數據,主要面向實體模型建設,按照數據渠道和不同類型做數據整合,例如渠道:app、pc、m等;日志類型:瀏覽、點擊、曝光等。

② 公共數據層

這一層也是大家應用比較廣泛的一層,上面也提到了adm面向業務過程的模型建設,這層也是分成了明細和匯總兩層。在明細層,我們會把所有的業務口徑沉淀到adm明細中,封裝各種業務標識,保障數據口徑統一管理,避免口徑二義性,同時,為數據可視化管理,提供源數據依賴。

③ 應用數據層

應用層主要是面向數據看板的建設,提供預計算和OLAP兩種方式服務模式,這一層整體上會很薄,重點解決數據引擎查詢效率問題,高頻訪問的維度提供預計算、低頻應用的數據由OLAP方式提供數據服務。

④ 數據服務層

面向多維數據分析場景,進行指標和維度的統一管理,以及服務接口的可視化管理,對外提供統一的數據服務。

5. 京東零售——流量實時數倉架構

實時數倉與離線數倉的建設理念是基本一致的。

RDDM是分渠道、分站點、分日志類型的實時數據流,構建過程中主要考慮解耦,如果只消費部分數據,依然需要全量讀取,對帶寬、i/o都是一種浪費。同時,也方便下游按照業務實際情況進行數據融合。

RADM面向業務場景,在RDDM的基礎上進行整體封裝整合,例如商詳、來源去向、路徑樹等業務場景。

在整體封裝后,數據會接入到指標市場,按照統一的接口協議和元數據管理規范進行錄入,對外提供統一的數據服務。

以上主要介紹了京東流量場景的數據處理架構,接下來我們結合一個京東實際案例,講述京東特殊場景下的數據處理方案。

圖片?

02 京東零售場景的數據處理

1. 京東零售——流量挑戰

首先是數據爆炸式的增長。2015年至今,整體的數據量翻了約十幾倍,但資源情況并沒有相應成比例的增長。其次,業務的復雜度升高,包括新增了小程序、開普勒、線下店的一些數據以及并購的企業的數據等,因此整體的數據格式以及完備度上還是存在較大差異的。再次,隨著業務發展,流量精細化運營的場景增多,但數據服務的時效并沒有較大變化,需要我們在有限時間內處理一些更多更大體量的數據,以滿足更多場景化應用。特別是京東刷崗這樣的場景,對數據的范圍、需要處理的數據量,以及數據時效都是一個比較大的挑戰。

圖片?

2. 海量數據更新實踐——刷崗

什么是刷崗?將發生在該SKU的歷史事實數據,按照最新的SKU對應運營人員、崗位、部門等維度信息,進行歷史數據回刷。

圖片?

刷崗在京東也經歷了多個階段,從最初數據量較小,采取全量刷崗的模式,后續逐漸升級成增量的刷崗。后續采取OLAP的刷崗模式,也就是將數據寫到CK中,通過Local join進行關聯查詢。目前我們通過iceberg+olap的方式來實現數據刷崗。

首先構建iceberg表;其次、對流量商品表的更新處理,將所有會發生變化的字段拼接做MD5的轉化,后續每天做這種差異化的判斷,如果有變化就做upsert操作;最后,生成的流量商品表與事實表進行merge into,進而得到刷崗更新后的數據;同時在此數據基礎上,針對不同應用頻率的數據,采取了預計算和OLAP兩種數據服務模式。

通過數據湖的方式來實現數據更新,相比于hive存儲格式,支持多版本并發控制,同時支持ACID事務語義,保障他的一致性,數據在同一個批次內提交,要么全對,要么全錯,不會更新一部分。另外,支持增量數據導入和更新刪除能力,支持upsert操作,整天數據處理的復雜度要降低很多,同時在資源的消耗和性能以及數據處理范圍上較hive端模式都有了極大的提升。

基于數據湖的模式進行刷崗目前還面臨數據傾斜的問題需要解決。

圖片

3. 數據傾斜治理方案

圖片?

① 數據傾斜的原因及處理方式

數據傾斜出現的一個主要原因是數據分布不均,出現熱點key。對于數據傾斜的處理方案,比較常見的有:優化參數,如增加reduce的個數、過濾一些異常值、賦隨機值,或者按經驗值設置固定閾值,把大于某閾值的數據單獨處理。賦隨機數的處理方式,當任務執行過程中,某個節點異常,切換新節點重新執行,隨機數據會發生變化,導致數據異常。通過這種經驗值設定閾值的一個弊端是,在不同的場景下,不容易界定閾值大小,包括對于熱點key的識別,通常也只能事后發現處理。

圖片

② 數據傾斜的解決方案

基于此,我們在探索的過程中建立了一套智能監測傾斜的任務。

首先,利用實時的數據,提前對數據進行監測,針對數據分布特點,通過3倍標準差確定離群點,離群點即傾斜閾值。

其次,根據傾斜閾值計算分桶數量。

最后,按照對列資源在不同時段的健康度進行作業編排。

③ 如何尋找熱點key及傾斜閾值

熱key尋找的核心思想,就是根據數據的分布特點,通過3倍標準差確定離群點,離群點即傾斜閾值,如下圖所示,整體的數據是呈右偏分布,我們通過兩次3倍標準差得到最后的傾斜閾值X2。

第二步計算分桶的數量,根據整體的數據分布情況看,第一階段的拒絕域面積與第二階段的拒絕域面積相等。根據積分原理,頻率絕對數與頻次絕對數呈反比,因概率密度分布曲線未知,所以用兩次離群點的頻次均值比例,代表兩次抽樣數據量比例,進而得到分桶數。

圖片?

④ 數據分桶作業

最后是作業編排,一次性起多個任務會出現資源獲取不到,一直處于等待狀態,同時對其他的任務也會產生較大影響,并發少了又會帶來資源浪費,針對這類問題,我按照對列資源的健康度,對執行的任務做了編排,由整體串聯執行和固化并發,調整為按資源健康度動態擴展,實現資源利用最大化。

圖片

03 數據處理架構未來探索

?未來探索方向

首先,目前我們基于Flink+Spark的方式來做流批一體的探索。圖中可以看到傳統的Lambda數據架構有一個很大的特點:實時和離線是兩套不同的數據鏈路。整體的數據處理過程中,研發的運維成本相對較高,而且兩條不同的數據鏈路,會容易導致數據口徑上的差異。

后續通過FlinkSQL+數據湖存儲實現同一套代碼兩種計算模式,同時保證計算口徑一致性。同時也會有一些挑戰,開發模式的改變,CDC(change data capture)延遲目前是分鐘級延遲,如果調整為秒級,頻繁提交,會生成很多小版本,對數據湖的吞吐量造成影響,總體來說,在部分應用場景下存在一定局限性,但分鐘級延遲可以滿足大多數的實時應用場景,對于研發成本和效率都會有較大提升,當然,目前也在不斷的完成和探索。總體來說,目前在一些特殊場景下具有一定的局限性。

圖片?

04 問答環節

Q:分桶的應用效果?

A:總結成幾個點就是:

  • 從事后處理轉變為事前監測。
  • 不同周期、不同場景下動態計算傾斜閾值和分桶數量。
  • 根據對列資源健康度動態擴展任務并發數量,實現資源利用最大化。

Q:Spark的應用在京東場景里最小的延遲是多少? 

A:目前主要是基于小站點數據去做探索,數據處理量級比較小,目前延遲大概在分鐘級左右,如提交的頻率增大,對于io的性能會是一個很大的考驗。

Q:Spark應該是不支持行級別的upsert,京東這邊是怎么去解決這個問題的問題,分區和小文件的合并有哪些相關的經驗分享?

A:目前的版本可以支持行級更新,關于分區這部分主要還是結合業務特性,在設計分區時,盡量讓變化的數據都集中到少部分文件上,降低文件更新范圍。

今天的分享就到這里,謝謝大家。

責任編輯:張燕妮 來源: DataFunTalk
相關推薦

2021-09-17 18:40:55

京東mPaaS移動端

2022-05-18 13:24:47

京東調優實踐

2023-01-30 15:22:31

2024-07-11 08:09:21

2018-06-06 17:39:03

2024-02-07 09:25:52

數據處理快手大模型

2019-03-21 19:19:35

新零售阿里云零售云

2018-03-20 09:56:50

新零售

2017-09-30 10:00:41

2018-12-08 11:17:50

2019-07-17 05:33:33

零售物聯網IOT

2021-09-15 16:41:20

京東零售云Flutter熱重載

2012-07-23 16:22:07

Oracle

2017-09-27 10:48:31

2017-07-06 12:48:35

大數據動向新零售

2012-11-26 09:27:07

零售儀表盤大數據

2021-09-16 18:44:05

京東云PaaS平臺Android

2021-07-23 10:25:41

物聯網IOT智能零售
點贊
收藏

51CTO技術棧公眾號

乐播av一区二区三区| 国产在线拍揄自揄拍无码| 日本天堂网在线观看| 欧美人妖在线| 欧美日韩中文字幕精品| 日日噜噜噜夜夜爽爽| 后进极品白嫩翘臀在线视频| 老司机久久99久久精品播放免费 | 人妻妺妺窝人体色www聚色窝| 午夜在线精品| 久久av在线播放| 最近中文字幕无免费| 天堂久久一区| 色综合天天综合网国产成人综合天 | 少妇高潮毛片色欲ava片| yw193.com尤物在线| 高清成人免费视频| 国产日韩视频在线观看| 日本视频www| 91av精品| 中文字幕久久亚洲| 日韩aaaaa| 国产精品一区二区三区www| 岛国av一区二区在线在线观看| 在线观看成人av电影| 欧美精品久久久久久久久久丰满| 国产在线一区观看| 国产精品va在线播放| 国产精品suv一区二区69| 欧美顶级大胆免费视频| 日韩精品高清在线| 麻豆短视频在线观看| 小说区图片区亚洲| 欧美中文字幕一区二区三区亚洲| 成人精品视频在线播放| 国产传媒在线播放| 国产精品嫩草影院com| 久久这里精品国产99丫e6| 亚洲h视频在线观看| 久久99国产精品免费网站| 日本午夜在线亚洲.国产| 日韩欧美高清在线观看| 欧美日韩三级电影在线| 日韩视频永久免费观看| 一级特黄曰皮片视频| 妖精一区二区三区精品视频| 亚洲国产日韩欧美在线动漫| 在线中文字日产幕| 一区二区三区国产好| 91精品久久久久久久久99蜜臂| 男女无套免费视频网站动漫| 成人爱爱网址| 色噜噜狠狠色综合中国| 男人天堂网视频| 日韩影院在线| 丰满岳妇乱一区二区三区| av高清在线免费观看| 19禁羞羞电影院在线观看| 亚洲一区二区在线观看视频| 免费拍拍拍网站| caoporn-草棚在线视频最| 亚洲福利视频一区| 精品人妻少妇一区二区| 欧美sm一区| 欧美性猛交xxxxx免费看| 99久久久无码国产精品6| 欧美大片免费| 欧美艳星brazzers| 日韩欧美国产片| 亚洲欧洲一二区| 日韩一区二区三区精品视频| 成人在线观看一区二区| 欧美亚洲国产日韩| 亚洲免费伊人电影在线观看av| 中文字字幕码一二三区| 成人久久综合| 欧美成人在线免费视频| 国产午夜精品一区二区理论影院| 国产午夜久久| 国产精品免费一区| 99精品人妻无码专区在线视频区| 国产99久久久精品| 久久riav| 亚洲天天影视| 亚洲一区二区三区免费视频| 久久久亚洲精品无码| 97欧美成人| 日韩欧美亚洲国产另类| 人妖粗暴刺激videos呻吟| 亚洲小说图片| 日韩在线小视频| 黄色小说在线观看视频| 蜜桃久久av| 成人精品视频99在线观看免费| 亚洲va天堂va欧美ⅴa在线| av资源网一区| 中文字幕不卡每日更新1区2区| 欧美大胆的人体xxxx| 欧美日韩中文字幕综合视频| 天堂在线中文在线| 欧美日韩一本| 久久精品欧美视频| 国产成人精品一区二三区| 久久精品国产秦先生| 国产精品swag| 自拍视频在线免费观看| 亚洲丶国产丶欧美一区二区三区| 亚洲最大综合网| 国产成人tv| 色噜噜久久综合伊人一本| 日产亚洲一区二区三区| 免费观看久久久4p| 久久精品第九区免费观看| 日本成人在线播放| 欧美日韩精品在线视频| 午夜激情视频网| 精品国产乱码久久久久久果冻传媒| 美日韩在线视频| 国产91精品看黄网站在线观看| 国产不卡免费视频| 亚洲欧洲精品一区二区三区波多野1战4 | 久久综合丝袜日本网| 警花观音坐莲激情销魂小说 | 91精品在线影院| 免费成人av电影| 亚洲一二三专区| 中文字幕在线观看日| 久久av免费| 国产做受高潮69| 国产高中女学生第一次| 国产精品入口麻豆九色| 成人午夜视频免费在线观看| 国产香蕉精品| 欧美裸身视频免费观看| 国产精品伦一区二区三区| 国产欧美日韩视频一区二区| 69堂免费视频| 国产乱人伦丫前精品视频| 久久的精品视频| 亚洲在线精品视频| 中日韩av电影| 午夜视频你懂的| 美女精品一区最新中文字幕一区二区三区| 午夜精品久久久99热福利| 99视频在线观看免费| 18涩涩午夜精品.www| 一道本在线免费视频| 精品一区av| 国产精品96久久久久久又黄又硬| 神马精品久久| 亚洲一区二区三区四区在线观看| 原创真实夫妻啪啪av| 在线观看免费一区二区| 亚洲综合中文字幕在线| 91在线中文| 精品少妇一区二区三区在线播放| 青春草免费视频| 成人亚洲精品久久久久软件| 日韩成人手机在线| 国产乱人伦精品一区| 欧美亚洲另类在线| 成人不用播放器| 8v天堂国产在线一区二区| 精品国产视频一区二区三区| 国产精一品亚洲二区在线视频| 黄色录像特级片| 136福利精品导航| 高清欧美电影在线| 欧美日韩免费做爰大片| 欧美午夜不卡在线观看免费| 午夜激情福利电影| 国产a视频精品免费观看| 奇米影视亚洲色图| 亚洲精品白浆高清| 国产成人综合一区二区三区| 日本视频不卡| 欧美成人三级在线| 精品免费囯产一区二区三区| 欧美激情中文字幕一区二区| 成人性生交视频免费观看| 欧美高清一区| 欧美日韩一区二区三区在线视频| 97久久网站| 欧美激情精品久久久久久| 污视频网站在线播放| 在线免费观看视频一区| 久久久久久久久久97| 国产99久久久国产精品免费看| 日韩在线视频在线观看| 日韩www.| 好吊色欧美一区二区三区四区 | 中文字幕国产专区| 国内精品伊人久久久久影院对白| av网站大全免费| 成人在线电影在线观看视频| 成人国产一区二区| 欧美一区国产| 欧美激情a在线| 国产精品毛片一区二区三区四区| 日韩欧美中文字幕一区| 国产视频1区2区| 一区二区三区不卡视频在线观看| 人妻丰满熟妇av无码久久洗澡| 激情综合网av| 国产男女在线观看| 一个色综合网| 日韩国产欧美精品| 欧美变态挠脚心| 91午夜在线播放| 欧美大胆成人| 国内精品久久久久久久久| 秋霞午夜在线观看| 日韩经典第一页| 不卡视频免费在线观看| 欧美日韩国产三级| 亚洲av中文无码乱人伦在线视色| 夜夜嗨av一区二区三区网页| 日韩精品久久久久久久的张开腿让| av在线播放成人| 中文字幕欧美视频| 国内精品视频一区二区三区八戒| 成年人免费在线播放| 狠狠综合久久| 青青草免费在线视频观看| 欧美偷拍综合| 你懂的网址一区二区三区| 日本不卡一区二区在线观看| 国产xxxxxxxxx| 97久久夜色精品国产| 六十路精品视频| 天堂va欧美ⅴa亚洲va一国产| 国产精品久久久久久久久久免费| 麻豆mv在线看| 欧美精品电影免费在线观看| 国内精品久久久久久野外| 尤物99国产成人精品视频| 日夜干在线视频| 国产精品久久久久久久久久白浆| 亚洲大全视频| 黑人巨大精品欧美黑白配亚洲| 国产一区二区视频在线免费观看| 国产精品日本一区二区三区在线| 国产精品电影网| 日韩和的一区二在线| 91黄色免费观看| av在线播放亚洲| 国产精品xvideos88| 精品国产三级a∨在线| 久久中文字幕av一区二区不卡| 欧美一二三四五区| 国产成人1区| 欧美日韩亚洲在线| 日本午夜精品| 久久天天狠狠| 怕怕欧美视频免费大全| 欧美一级日本a级v片| 国产一区网站| 亚洲精品一区二区三区四区五区| 久久精品国产68国产精品亚洲| 亚洲成人av动漫| 天天影视综合| 日韩欧美猛交xxxxx无码| 在线看片日韩| 色综合av综合无码综合网站| 日韩精品91亚洲二区在线观看| 熟妇人妻无乱码中文字幕真矢织江| 青青草视频一区| 色姑娘综合天天| 成人免费黄色在线| 国产全是老熟女太爽了| 国产欧美精品一区二区色综合| 国产又粗又猛又爽又黄的视频四季| 中文字幕一区二区三区乱码在线| 高h视频免费观看| 亚洲va在线va天堂| 亚洲 欧美 中文字幕| 欧美另类z0zxhd电影| 精品人妻午夜一区二区三区四区| 精品久久久久久久久久久久久久久 | 日本在线视频1区| 亚洲图片在线综合| 国产黄a三级三级三级av在线看| 欧美激情一区二区久久久| 韩国美女久久| 国产在线精品成人一区二区三区| 国模大尺度视频一区二区| 九九九热999| 色欧美自拍视频| 日本十八禁视频无遮挡| 日韩精品午夜视频| 中文字幕第三区| 久久免费看少妇高潮| 色欲人妻综合网| 欧美日韩美女视频| 97在线播放免费观看| 亚洲高清在线观看| √新版天堂资源在线资源| 久久久最新网址| 四虎地址8848精品| 精品久久精品久久| 国产精品麻豆久久| 国产成人黄色片| 国产很黄免费观看久久| 男生草女生视频| 亚洲自拍偷拍综合| 在线观看毛片视频| 日韩二区三区在线| a级网站在线播放| 国产精品久久久久久亚洲影视| 成人搞黄视频| 在线免费观看成人网| 视频一区视频二区在线观看| 成年人小视频在线观看| 国产精品麻豆99久久久久久| 黄色片网站在线免费观看| 精品久久久网站| 免费网站成人| 国产精品视频区1| 伊人久久大香线蕉综合网站| 国产精品va在线观看无码| 久久99国产精品久久99果冻传媒| www.久久av| 五月婷婷综合网| 后进极品白嫩翘臀在线视频| 欧美成人免费一级人片100| av成人免费| 日本精品二区| 西西裸体人体做爰大胆久久久| 岛国av免费观看| 亚洲黄色免费电影| 国产三级小视频| 久久色精品视频| 欧美日韩激情电影| 欧美在线3区| 亚洲一区二区成人| 国产精品第七页| 婷婷丁香久久五月婷婷| 国产综合在线播放| 欧美富婆性猛交| 视频一区日韩| wwwwww欧美| 国产精品亚洲午夜一区二区三区| 蜜臀av午夜精品久久| 884aa四虎影成人精品一区| 免费大片黄在线| 成人精品在线视频| 婷婷中文字幕一区| 在线观看中文av| 亚洲综合在线视频| 高清乱码毛片入口| 久久久之久亚州精品露出| 狼人天天伊人久久| 国产精品www在线观看| 丁香天五香天堂综合| 日韩精品久久久久久久| 亚洲精品成人久久电影| 欧美极品videos大乳护士| 欧美裸体网站| 日本不卡123| 色欲一区二区三区精品a片| 日韩一级片网站| 91九色porn在线资源| 免费观看成人在线| 免费观看在线综合色| 成人免费毛片xxx| 亚洲第一精品夜夜躁人人爽| 亚洲色图官网| 亚洲mv在线看| 国产福利一区二区三区视频| 精品小视频在线观看| 亚洲精品成人久久电影| 日本另类视频| 亚洲黄色网址在线观看| 不卡一卡二卡三乱码免费网站| 久久夜靖品2区| 这里只有精品久久| 日韩精品三级| 无码播放一区二区三区| 欧美激情中文字幕| 成人av免费播放| 欧美最顶级丰满的aⅴ艳星| 色天天综合网| 污污污www精品国产网站| 欧美艳星brazzers| 男女视频在线| 亚洲va久久久噜噜噜久久狠狠 | 国产老熟女伦老熟妇露脸| 91九色最新地址| 污视频在线免费观看网站| 久久久久久99| 精品午夜久久福利影院| 日本污视频在线观看| 中文字幕免费国产精品| 动漫视频在线一区| 五月婷婷激情久久| 午夜久久久久久久久| 欧美精品hd| 免费一区二区三区在在线视频| 国产在线精品一区二区夜色| 久久精品一二区|