精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

面向行為分析的數據治理和應用

大數據 數據分析
本文將分享奇富科技-數據生態團隊如何對面向行為分析的數據進行治理和應用。

一、常見的數據分析場景

常見的數據分析就是對業務數據或者行為數據進行分析和管理。

圖片

業務數據主要是指用戶行為發生之后,實際產生的結果,我們使用數倉建模來給業務提供指標,從而指導業務進行一些正向的操作或者修改之前的一些操作。行為數據主要是指用戶使用產品上的各種行為,我們可以對面向行為分析的數據進行加工和分析,從用戶的行為中推導出來到底是哪些環節沒有做好,從而調整和優化這些環節。

二、數倉建模方法

在引入行為分析方法之前,先介紹一下數倉建模的方法。

圖片

數倉建模方法主要流程如下:

  • 用戶空間:以音樂播放為例,用戶在APP上的操作會產生行為日志,比如廣告請求、曝光、點擊,APP打開、用戶注冊和播放、下載歌曲等操作日志。
  • 數倉建模:我們將用戶的行為日志采集過來,形成ODS、DWD層的表,再往后是各個主題表。不同業務團隊會創建自己的業務寬表,從用戶空間中抽取感興趣的事件放到各自的主題業務寬表中。
  • 主題應用:再往下是這些主題寬表所支撐的業務,比如報表建設、特征挖掘、機器學習、OneID系統建設等等,最終為增長團隊、經營團隊和產品團隊等提供支持。

三、數倉建模方法的優劣勢

1、優勢

  • 方法論成熟 : 已經在無數的公司中被驗證過,更有像《阿里巴巴大數據實踐》《Building The Data Warehouse》 等優秀的指導書籍。
  • 技術棧成熟: 無論是從消息中間件、數據ETL管路,數據湖、數據倉庫、數據集市的各種選型等,工業界已經誕生了無數優秀的框架和數據庫。
  • l技術供應商支持完善:Google,Amazon,Microsoft,阿里云,騰訊云等供應都提供幾乎一站式的服務。
  • 技術人才供給: 各個互聯網公司都有數據倉庫建模的需求,人才供應充分,培養體系完備。
  • 公司推動阻力小: 數倉的重要性經歷了充分的市場教育,推動起來會比較順暢,投入產出比也比較好闡述。
  • 應用場景:適合指標類的多維分析數據運算。

2、劣勢

  • 建設鏈條長: 數據采集->ODS->DWD->DWT->數據報表和應用。
  • 數據一致性保證有挑戰:不同數據主題之間會有指標和字段的重合,在工程和業務之間,不同的工程團隊之間都可能造成理解的偏差。
  • 擴展字段流程復雜:表結構需要預先定義, 擴展新字段往往需要較長的開發周期和回溯數據周期。
  • 工程實現很難統一: 架構評估往往取決于承接的工程團隊的過往經驗和喜好,同樣需求的實現差異較大。
  • 不適合時序行為數據分析:因為需要按照用戶維度shuffle和開窗,用戶行為分析往往比較耗資源。
  • 預聚合不夠靈活:當維度不能命中預聚合的維度時,查詢會退化成全表聚合。

四、面向行為分析的分析方法-概念

圖片

基于以上數倉建模的優缺點,我們需要對行為數據進行一些不一樣的抽象,用一些不一樣的查詢方式來解決面向用戶行為數據的問題。首先來介紹一些概念:

  • 用戶空間:和數倉建模一樣,這部分不變。
  • 用戶事件序列:和數倉建模方式不同,我們這里不將用戶的行為日志抽象到ODS、DWD層,在這里將行為日志數據抽象成用戶事件序列,比如對于播放歌曲事件會包含用戶屬性和事件屬性,用戶屬性回答誰在什么樣的設備上這個問題,事件屬性回答這個人主要做了什么事, 這個事我怎么去描述它。對于所有事件,我們都可以用這兩種類型的元數據來描述這個事件,在一個時間軸上串起來,就可以知道這件事是誰做的,以及做了這件事后發生了什么。
  • 事件抽象:有了用戶序列的抽象,我們可以聚焦一下,看某個人在某個具體事件序列上的抽象。比如圖中會員升級的例子。
  • 用戶群計算:有了事件抽象之后,最重要的就是我們怎么使用這些數據,我們可以利用這些數據來獲取新增用戶群、活躍用戶群以及滿足X條件的用戶群等等。

圖片

如上圖所示,以7日Android用戶的留存率為例,左邊是傳統數倉的解決方案,右邊是行為分析的解決方案。

  • 傳統數倉的解決方案:主要是寫一個SQL來看7天前的新增用戶在今天的活躍用戶中是否有,如果有的話,7天的新增用戶作為分母,今天的活躍用戶作為分子,除出來一個比例計算留存率。但是可能在數倉里面,一條記錄并不是用用戶的ID來劃分的,所以最終想要計算出用戶ID的結果會有一個shuffle、關聯、數據傾斜的過程,這都是在傳統輸出解決方案當中我們需要去考慮的一些點。
  • 行為分析的解決方案:這是另外一種簡化的計算用戶留存的方式,本質上是在圖中的三個圈圈選的用戶中做計算,三個圈的交集就是7天前的新增用戶在今日活躍用戶中的比例。我們將復雜留存SQL轉成了三個用戶群之間并集和交集的計算。

所以我們現在已經有了兩層抽象,對于數據的抽象,是用時間線排進來的一個個的事件,對于計算的抽象,是把一個查詢拆解成一個個用戶群的計算,再根據計算的結果回答我們一個個關于用戶群相關的問題。

五、面向行為分析的分析方法-整體架構

下面是面向行為數據分析的整體架構(該架構可供參考,但并非唯一解)。

從下往上看,最下面是數據的存儲,采用列式存儲,并在其中應用一些對用戶群更友好的技術,從而減少數據的加載量和分發量。往上是文件元數據/列元數據。再上面是用戶數據訪問層,本質上就是計算層。IDMapping層主要解決不同ID對應同一用戶的問題。查詢緩存層、查詢結果聚合層,以及最上面的查詢接入層,都是為了提高查詢效率。

下圖是對于7日的Android用戶留存率,在面向行為數據分析的架構中的實現過程抽象:

接下來是對于面向行為數據分析架構中關鍵節點的介紹。

1、列存儲

圖片

首先介紹我們自定義的列存儲。我們沒有使用ORC、Parquet這些列存儲格式,主要是因為ORC、Parquet格式不會對用戶存儲做一些自定義的優化,市面上的Druid、HBase也是為了加速數據訪問引用了很多的組件。對于特定的場景,我們可以把更多的組件應用過來,比如說BloomFilter(布隆過濾器),目的是快速判斷一個用戶是否在當前文件中,因為我們所有的查詢其實都是面向用戶ID的。還有Delta encoding(差分編碼),用來對時間格式進行存儲,減少時間戳的存儲體積。

2、元數據

圖片

列存儲再往上一層就是元數據。首先是文件元數據。文件的第一級索引是按時間的,而時間是動態的,因為用戶的活躍時間可能是在晚上或者中午的休息時間,凌晨可能用戶并不活躍。這就導致我們文件中存儲的用戶數據在時間上不是平均分配的,比如想要查詢凌晨1點到早上9點的數據,有可能需要訪問多個文件。這個時候我們需要知道應該在動態時間切片文件中訪問哪些文件。因此我們就需要一個元數據的管理,基于查詢的起止時間,找出存儲的位置,這樣可以確保每個文件存儲的大小是相近的,盡可能減少數據計算過程中的數據偏移。

其次是列元數據。我們查詢的時候并不是要把所有的列都加載進來,計算的時候只加載文件中對應偏移量的列數據,這樣可以減少網絡傳輸的開銷、磁盤IO和內存使用量。

3、OneID

OneID的建設在每家公司是不一樣的,但本質上都是用來追蹤用戶的設備變化,還原用戶事件的最真實狀態,進而提供IDMapping、ID Encoding的能力。

4、緩存層

緩存層主要是對以前訪問數據的緩存,加速訪問。緩存key中有時間的版本號,數據可能會因為回填等原因引入新數據,通過時間版本號的方式可以自動刷新緩存。

5、用戶數據訪問層

圖片

用戶數據訪問層包括數據的聚合層、用戶群算子層以及元數據管理和底層時序數據的加載。首先,用戶請求會包含時間范圍、過濾條件、用戶群聚合條件等;第二步,根據用戶請求,請求元數據,確定要訪問的文件和列在哪里;第三步,知道了數據在哪后,加載數據到計算節點,并緩存到本地;第四步,用戶分區計算,最大化并行查詢效果;最后,進行聚合計算。

通過以上架構,我們希望在查詢時,只去加載最低密度的數據,在不同節點之間通訊時只去通訊最必要的用戶群的bit數組,最終也是通過bit運算的方式返回,再通過OneID將bit數組還原成所關心的用戶群的一個詳細的描述。

六、面向行為分析的分析方法-分析舉例

下面是行為分析的幾個例子。

首先是用戶留存分析。

圖片

上圖中包含了7月29日至8月8日(第5天到第10天)之間的留存率。對于行,只需要計算7月29日至8月8日之間每天的新增用戶。對于列,只需要計算行時間+偏移量的活躍用戶數。而整個表格的計算就是對兩個用戶群進行邏輯與。這樣就把表格的計算拆成了一個個單元格的獨立的計算,每一個獨立的計算都可以通過預計算保存在緩存中,還可以通過一些好的用戶交互方式,實現自助的留存率分析。

第二個常用的分析是漏斗分析。比如分析做了播放的用戶中,有多少進行了收藏,收藏的用戶又有多少進行了購買,購買的用戶中有多少下載了歌曲。漏斗分析又有時序嚴格和非嚴格之分。時序嚴格的轉化漏斗,必須是發生在時序嚴格遞增的場景下,同一個session內,一定是先播放,再收藏,再購買,最后下載。非時序嚴格的轉化漏斗常用來進行趨勢分析,有可能先購買再播放。對于非時序嚴格的轉化漏斗,采用垂直切,我們只需要去分別計算每一個事件的用戶群,再做與關系。時序嚴格的轉化漏斗,要采用水平切,計算一個session內既播放,又收藏,購買并且下載了的用戶群,再用搭積木的方式計算出來。

圖片

第三個分析的例子是路徑分析。常用于某個業務指標轉化不好時進行分析。首先定義事件的入度和出度,也就是一個事件的前一個和后一個事件。計算采用深度遍歷的方式。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2022-08-01 15:45:43

數據治理數據集成數據驅動

2024-04-12 12:01:51

人工智能AI大模型

2018-05-18 08:20:32

數據治理應用

2021-08-05 11:21:01

數據治理數據收集

2010-09-08 15:18:55

2023-09-12 13:29:39

數據治理數據分析

2022-12-07 08:31:45

ClickHouse并行計算數據

2021-09-06 15:39:00

大數據技術醫療

2021-10-07 21:05:22

數據分析治理

2021-08-03 15:09:44

數據和分析客戶體驗領導者

2017-07-24 09:18:55

大數據數據分析行為事件分析

2015-12-31 17:47:54

2013-09-05 09:33:25

大數據盧東明SAP

2017-06-26 09:59:14

圖像分析樣本過濾深度學習

2023-03-10 07:30:24

2025-09-03 02:23:00

行為分析分析流程建模思路

2023-04-14 15:50:29

元數據數據治理

2024-08-15 17:21:58

2009-11-23 09:34:05

WPF本質

2013-01-09 14:27:26

數據治理Informatica
點贊
收藏

51CTO技術棧公眾號

视频一区在线免费看| 可以免费观看的毛片| 日韩国产一区| 制服丝袜亚洲播放| 成人午夜视频在线观看免费| 免费在线视频一级不卡| 欧美a一区二区| 欧美另类99xxxxx| 噜噜噜在线视频| 成人毛片免费| 香蕉av福利精品导航| 日韩午夜视频在线观看| 亚洲精品国产av| 日韩精品成人一区二区三区| 欧美大成色www永久网站婷| 国产ts丝袜人妖系列视频| 国产精品99| 欧美日韩精品在线观看| 天天综合中文字幕| 青青青草网站免费视频在线观看| 国内精品在线播放| 欧美亚洲在线播放| 欧美精品久久久久性色| 欧美日韩色图| 日韩av中文字幕在线播放| 午夜免费看视频| 麻豆成全视频免费观看在线看| 国产精品日产欧美久久久久| 不卡一区二区三区视频| 中文字幕一区二区三区人妻四季| 在线播放亚洲| 欧美成人免费va影院高清| 精品国产av无码| www 久久久| 色久综合一二码| 97在线国产视频| 污污片在线免费视频| 国产精品色呦呦| 欧美亚洲一级二级| 人人妻人人澡人人爽人人欧美一区| 青青草视频一区| 国产成人一区二区三区小说| 国产一级av毛片| 中文字幕亚洲精品乱码 | www.色日本| 老司机一区二区| 国产精品一久久香蕉国产线看观看| 中文字幕亚洲乱码熟女1区2区| 狠狠爱综合网| 久久久久久久97| 精品少妇久久久| 亚洲视频日本| 国内精品免费午夜毛片| 久久久久无码精品国产| 欧美熟妇激情一区二区三区| 日本动漫理论片在线观看网站| 中文字幕精品—区二区四季| 日本在线观看一区| 欧洲天堂在线观看| 26uuu国产电影一区二区| 激情伦成人综合小说| 日本美女一级视频| jlzzjlzz亚洲日本少妇| 国产综合 伊人色| 特黄视频在线观看| 久久综合色播五月| 美脚丝袜一区二区三区在线观看| 四虎影院在线播放| 久久久美女毛片| 亚洲 国产 欧美一区| 91社区在线观看| 日韩美女视频19| 欧美久久久久久久久久久久久久| 亚欧精品在线| 999av视频| 粉嫩欧美一区二区三区高清影视| 国产91社区| 手机在线观看免费av| 97国产精品videossex| 日本不卡一区| 麻豆av在线导航| 亚洲一区二区三区在线播放| 国产 日韩 亚洲 欧美| 欧美色999| 欧美精品成人一区二区三区四区| 精品人妻一区二区免费| 欧美极品中文字幕| 日韩在线视频线视频免费网站| 免费在线黄色网| 妖精视频成人观看www| 国产精品久久久久7777婷婷| 国产精品伦一区二区三区| 成人免费看黄yyy456| 免费毛片一区二区三区久久久| 最新97超碰在线| 一区二区三区四区在线免费观看| 欧美成人xxxxx| 99er精品视频| 国产视频亚洲视频| 小向美奈子av| 午夜在线一区| 亚洲自拍偷拍网址| 男人天堂资源在线| 亚洲精品第1页| 久久久久狠狠高潮亚洲精品| 日本久久二区| 亚洲欧美成人网| 亚洲xxxx3d动漫| 天堂精品中文字幕在线| 成人影片在线播放| 91大神在线网站| 无码av中文一区二区三区桃花岛| 8x8x成人免费视频| 伊人成综合网伊人222| 欧美巨大黑人极品精男| 无码人妻丰满熟妇精品| 国产91精品一区二区| 日韩欧美亚洲在线| 黄色在线网站噜噜噜| 日韩一区二区三区四区五区六区| 在哪里可以看毛片| 激情国产一区| 91九色在线免费视频| www日韩tube| 欧美视频13p| 亚洲图片欧美另类| 1024精品久久久久久久久| 国产成人福利视频| 亚洲欧洲视频在线观看| 一区二区三区在线观看欧美| 九九热免费在线观看| 你懂的一区二区三区| 亚洲 日韩 国产第一| 亚洲精品成人电影| 樱桃视频在线观看一区| 97超碰成人在线| 日本一区二区三区视频| 人体精品一二三区| 午夜在线视频观看| 亚洲一区二区欧美激情| 国产精品19p| 亚洲欧美网站在线观看| 国产主播在线一区| 中文字幕在线免费| 欧美日韩国产三级| 99久久久无码国产精品不卡| 人人狠狠综合久久亚洲| 色噜噜色狠狠狠狠狠综合色一| 中文字幕在线高清| 亚洲女人被黑人巨大进入al| 青青草成人av| 95精品视频在线| 国产主播在线看| 亚州av日韩av| 日本韩国在线不卡| 激情小视频在线观看| 色国产综合视频| 91成人在线免费视频| 久久一区精品| 天堂资源在线亚洲视频| 激情欧美一区二区三区黑长吊| 中文字幕日韩免费视频| 在线免费观看一区二区| 亚洲欧洲三级电影| 午夜影院免费观看视频| 欧美福利网址| 国产精品一区二区三区在线观| f2c人成在线观看免费视频| 亚洲国产成人一区| 日本一区二区免费电影| 亚洲国产精品黑人久久久| 亚洲娇小娇小娇小| 欧美极品一区二区三区| 国产偷国产偷亚洲高清97cao| 中文字幕人成乱码在线观看| 伊人亚洲福利一区二区三区| 国产伦精品一区二区三区四区| 一区二区三区影院| www.免费av| 美腿丝袜亚洲色图| 福利在线小视频| 农村少妇一区二区三区四区五区 | 久久这里有精品15一区二区三区| 欧美日韩在线一区二区三区| 日韩福利影视| 午夜精品久久17c| 中文日本在线观看| 亚洲成人a**站| 高潮毛片又色又爽免费| 自拍偷拍亚洲综合| 久久午夜夜伦鲁鲁片| 秋霞午夜av一区二区三区| 日本成人在线不卡| 国产一区不卡| 99国产超薄肉色丝袜交足的后果| 一区二区三区电影大全| 久久久国产在线视频| 亚洲欧美色视频| 91精品午夜视频| 欧美一区二区激情视频| 亚洲欧美激情小说另类| 亚洲av无码一区二区三区观看| 久久99国产精品免费网站| 国内精品视频一区二区三区| 色中色综合网| 久久久久se| 欧美影院精品| 国产精品丝袜视频| 草草视频在线| 免费成人高清视频| 国产在线视频网址| 亚洲福利视频专区| 国产精品国产三级国产aⅴ| 欧美日韩在线第一页| 18岁成人毛片| 国产精品无码永久免费888| 国产激情视频网站| 国产精品亚洲午夜一区二区三区 | 亚洲天堂1区| 992tv成人免费视频| 日本无删减在线| 精品激情国产视频| 黄色免费在线播放| 日韩精品视频在线| 欧美 日韩 国产 成人 在线| 欧美一区二区三区日韩视频| 黄色网址中文字幕| 日韩欧美中文在线| 日韩乱码人妻无码中文字幕| 亚洲精品国产一区二区精华液| 91ts人妖另类精品系列| 91麻豆免费看片| 美女又爽又黄免费| 成人免费视频caoporn| 成人欧美精品一区二区| 国产九色精品成人porny| 欧美美女一级片| 免费日本视频一区| 蜜臀av免费观看| 日韩国产高清在线| 国产嫩草在线观看| 青青青爽久久午夜综合久久午夜| 国模杨依粉嫩蝴蝶150p| 六月丁香综合| 亚洲人成色77777| 久久亚洲二区| 日韩av手机版| 久热成人在线视频| 男女视频在线看| 日本不卡高清视频| 在线免费观看视频黄| 青青青伊人色综合久久| 成人日韩在线视频| 精品在线免费视频| www.久久com| 国产成人精品三级麻豆| 亚洲国产日韩在线一区| 国产激情一区二区三区四区| 中文字幕一二三区| 丁香婷婷综合网| 国产中文字幕一区二区| 91麻豆精品视频| 欧美黄色一级生活片| 中文字幕国产一区| 希岛爱理中文字幕| 亚洲电影一级黄| 影音先锋在线国产| 欧美日韩视频一区二区| 国产精品视频一二区| 欧美成人一区二区| 天堂在线资源库| 亚洲区在线播放| 日本中文字幕在线看| 九九九久久国产免费| av日韩中文| 国产精品久久久久99| www一区二区三区| 国产伦精品一区二区| 久久99视频| 三年中国中文在线观看免费播放| 狠狠入ady亚洲精品经典电影| 国产精品秘入口18禁麻豆免会员| 日本不卡视频一二三区| 免费欧美一级片| 91色porny| 免费一级suv好看的国产网站 | 国产 欧美 日本| 国产日韩欧美三级| 亚洲精品手机在线观看| thepron国产精品| 成年人视频软件| 亚洲成人自拍偷拍| 成人免费一区二区三区| 日韩午夜电影av| 免费在线观看一级毛片| 日韩一中文字幕| 草草在线视频| 91亚洲永久免费精品| 久久91麻豆精品一区| 成人在线免费观看视频网站| 日韩成人伦理电影在线观看| 91porn在线| 国产精品三级av| 国产又黄又爽又色| 欧美一级日韩不卡播放免费| 你懂的在线观看视频网站| 久久不射热爱视频精品| 欧美三区四区| 国内视频一区| 欧美fxxxxxx另类| 亚洲综合欧美在线| 99久久免费视频.com| 男女羞羞免费视频| 精品视频全国免费看| 天堂中文在线资| 欧美激情精品久久久久| 亚洲伦理网站| 日韩在线三级| 国产日韩综合| 香蕉视频1024| 亚洲同性gay激情无套| 亚洲无码精品一区二区三区| 亚洲精品电影网在线观看| 超碰在线观看免费版| 国产欧洲精品视频| 国产免费久久| 波多野结衣家庭教师在线| 成人亚洲一区二区一| 少妇影院在线观看| 9191久久久久久久久久久| eeuss影院在线播放| 欧洲亚洲女同hd| 欧美亚视频在线中文字幕免费| 黄色三级中文字幕| 国产成人亚洲精品狼色在线| 欧洲第一无人区观看| 6080yy午夜一二三区久久| 97超碰人人在线| 国产精品视频久久| 精品欧美久久| 国产wwwxx| 中文在线资源观看网站视频免费不卡 | 欧美劲爆第一页| 日韩三级精品| 国产在线xxxx| 成人动漫视频在线| 九九九国产视频| 亚洲精品美女在线观看| 精品人人视频| 久久久久久久久久久久久久久久av| 亚洲精品激情| 五月婷婷综合在线观看| 欧美丝袜美女中出在线| 九九九伊在人线综合| 国产精品高潮粉嫩av| 成人精品天堂一区二区三区| 亚洲一区精品视频在线观看| 亚洲色图在线视频| 国产女18毛片多18精品| 欧美激情a∨在线视频播放| 高潮久久久久久久久久久久久久| 日本在线xxx| 久久这里只有精品首页| 国产成人自拍偷拍| 日韩一区二区福利| 精品久久国产一区| 国产曰肥老太婆无遮挡| 26uuu欧美| 中日精品一色哟哟| 久久精品色欧美aⅴ一区二区| 清纯唯美激情亚洲| 日本午夜激情视频| 久久精品一区八戒影视| 97人妻精品一区二区三区视频| 欧美国产日韩视频| 婷婷五月色综合香五月| 在线观看av网页| 亚洲一区二区精品久久av| 亚洲欧美一区二区三| 国产一区深夜福利| 国产精品a久久久久| 巨胸大乳www视频免费观看| 欧美日韩三级一区二区| 麻豆av在线播放| 欧美少妇一区| 国产一区二区视频在线| www.av麻豆| 日日摸夜夜添一区| 国产一区在线电影| 天天干天天干天天干天天干天天干| 亚洲免费看黄网站| 色视频免费在线观看| 成人精品久久一区二区三区| 一本久道综合久久精品| 999精品久久久| 日韩电影在线观看永久视频免费网站| 精品三级在线| 老太脱裤子让老头玩xxxxx| 国产精品理论片| 凸凹人妻人人澡人人添|