精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從數(shù)據(jù)倉庫到數(shù)據(jù)湖——淺談數(shù)據(jù)架構(gòu)演進(jìn)(加強(qiáng)版)

開發(fā) 開發(fā)工具 數(shù)據(jù)倉庫 數(shù)據(jù)湖
我們嘗試過在數(shù)據(jù)加載過程中自學(xué)習(xí)的產(chǎn)生數(shù)據(jù)庫schema,證明這個(gè)思路是可行的?;诮Y(jié)構(gòu)化的數(shù)據(jù),這個(gè)過程非常容易。但對(duì)于非結(jié)構(gòu)化的數(shù)據(jù),還是存在很大的挑戰(zhàn)。使用機(jī)器學(xué)習(xí)的方式,模型訓(xùn)練成本恐怕和人工抽取schema的工作量是相當(dāng)?shù)?。這是開放的話題,可以討論。

 網(wǎng)管產(chǎn)品需要從數(shù)據(jù)倉庫的角度來看,才能獲得完整的視圖。數(shù)據(jù)集成真正從大數(shù)據(jù)的角度來看,才能明白其中的挑戰(zhàn)。一個(gè)運(yùn)行了近20年的數(shù)據(jù)架構(gòu),必然有其合理性。也正是因?yàn)槟甏眠h(yuǎn),存量過多,才導(dǎo)致舉步維艱。在Cloud和5G時(shí)代,超密度網(wǎng)絡(luò)集成和大數(shù)據(jù)洞察需求給電信供應(yīng)商帶來新的挑戰(zhàn),從數(shù)據(jù)倉庫到數(shù)據(jù)湖,不僅僅架構(gòu)的變革,更是思維方式的升級(jí)。本文淺談筆者在組織中看見的技術(shù)嬗變和演進(jìn)。

01

數(shù)據(jù)倉庫歷史沿革

1970年,關(guān)系數(shù)據(jù)庫的研究原型System R 和INGRES開始出現(xiàn),這兩個(gè)系統(tǒng)的設(shè)計(jì)目標(biāo)都是面向on-line transaction processing (OLTP)的應(yīng)用。關(guān)系數(shù)據(jù)庫的真正可用產(chǎn)品直到1980年才出現(xiàn),分別是DB2 和INGRES。其他的數(shù)據(jù)庫,包括Sybase, Oracle, 和Informix都遵從了相同的數(shù)據(jù)庫基本模型。關(guān)系數(shù)據(jù)庫的特點(diǎn)是按照行存儲(chǔ)關(guān)系表,使用B樹或衍生的樹結(jié)構(gòu)作為索引和基于代價(jià)的優(yōu)化器,提供ACID的屬性保證。

到1990年,一個(gè)新的趨勢(shì)開始出現(xiàn):企業(yè)為了商業(yè)智能的目的,需要把多個(gè)操作數(shù)據(jù)庫中數(shù)據(jù)收集到一個(gè)數(shù)據(jù)倉庫中。盡管投資巨大且功能有限,投資數(shù)據(jù)倉庫的企業(yè)還是獲得了不錯(cuò)的投資回報(bào)率。從此,數(shù)據(jù)倉庫開始支撐各大企業(yè)的商業(yè)決策過程。數(shù)據(jù)倉庫的關(guān)鍵技術(shù)包括數(shù)據(jù)建模,ETL技術(shù),OLAP技術(shù)和報(bào)表技術(shù)等。

目前主要的數(shù)據(jù)倉庫產(chǎn)品供應(yīng)商包括Oracle、IBM、Microsoft、SAS、Teradata、Sybase、Business Objects(已被SAP收購)等。

電信行業(yè)是最早采用數(shù)據(jù)倉庫技術(shù)的行業(yè)之一。由于電信公司運(yùn)行在一個(gè)快速變化和高速競(jìng)爭(zhēng)的環(huán)境,擁有大量的客戶基礎(chǔ),從而產(chǎn)生和存儲(chǔ)海量的高質(zhì)量數(shù)據(jù)。電信公司利用數(shù)據(jù)挖掘技術(shù)降低營(yíng)銷成本,識(shí)別欺詐,并更好地管理其電信網(wǎng)絡(luò)。

02

數(shù)據(jù)倉庫概念

數(shù)據(jù)倉庫之父Bill Inmon在1991年出版的“Building the Data Warehouse”一書中所提出的定義被廣泛接受——數(shù)據(jù)倉庫(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Support)。這是一個(gè)偏向?qū)W術(shù)的定義,卻非常準(zhǔn)確的界定了數(shù)據(jù)倉庫與其他數(shù)據(jù)庫系統(tǒng)的本質(zhì)區(qū)別。

“A data warehouseis a subject-oriented, integrated, time-variant, and nonvolatile collection ofdata in support of management’s decision-making process.”

—W. H. Inmon

要理解數(shù)據(jù)倉庫的概念,需要從與數(shù)據(jù)庫的系統(tǒng)的對(duì)比來看。

數(shù)據(jù)庫是作為“所有處理的單一數(shù)據(jù)源”出現(xiàn)和定義的。數(shù)據(jù)庫的出現(xiàn)有兩個(gè)驅(qū)動(dòng)因素,第一是70年代以前大量應(yīng)用程序和主文件的分散存放導(dǎo)致一片混亂和大量冗余數(shù)據(jù)。第二是直接存取存儲(chǔ)設(shè)備的出現(xiàn)使得按記錄尋址成為可能。基于DBMS的在線事務(wù)處理為商業(yè)發(fā)展開辟全新的視野。

數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì)目標(biāo)是事務(wù)處理。數(shù)據(jù)庫系統(tǒng)是為記錄更新和事務(wù)處理而設(shè)計(jì),數(shù)據(jù)的訪問的特點(diǎn)是基于主鍵,大量原子,隔離的小事務(wù),并發(fā)和可恢復(fù)是關(guān)鍵屬性,最大事務(wù)吞吐量是關(guān)鍵指標(biāo),因此數(shù)據(jù)庫的設(shè)計(jì)都反映了這些需求。

數(shù)據(jù)倉庫的設(shè)計(jì)目標(biāo)是決策支持。歷史的,摘要的,聚合的數(shù)據(jù)比原始的記錄重要的多。查詢負(fù)載主要集中在即席查詢和包含連接,聚合等操作的復(fù)雜查詢。相對(duì)于數(shù)據(jù)庫系統(tǒng)來說,查詢吞吐量和響應(yīng)時(shí)間比事務(wù)處理吞吐量重要的多。

數(shù)據(jù)倉庫和數(shù)據(jù)庫系統(tǒng)的區(qū)別,一言蔽之:OLAP和OLTP的區(qū)別。數(shù)據(jù)庫支持是OLTP,數(shù)據(jù)倉庫支持的是OLAP。

對(duì) OLTP 和OLAP 的區(qū)別還可以有一個(gè)維度,就是及時(shí)性需求。OLTP對(duì)事務(wù)的及時(shí)性需求較高,而OLAP 則不然。

——曹洪偉

數(shù)據(jù)倉庫一般基于數(shù)據(jù)庫實(shí)現(xiàn),但是為部署和維護(hù)上是分離的。數(shù)據(jù)倉庫可以是基于關(guān)系數(shù)據(jù)庫實(shí)現(xiàn)的,這樣的數(shù)據(jù)倉庫被稱為ROLAP。數(shù)據(jù)倉庫也可以是基于多維數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)的,這樣的數(shù)據(jù)倉庫被稱為MOLAP。

03

數(shù)據(jù)倉庫架構(gòu)

數(shù)據(jù)倉庫是一種體系結(jié)構(gòu),而不是一種技術(shù)。數(shù)據(jù)倉庫最為核心的內(nèi)容分類兩部分:

基于關(guān)系數(shù)據(jù)庫的多維建模(RDBMS-based dimensional modeling)

基于數(shù)據(jù)立方體的OLAP查詢(cube-based OLAP)

數(shù)據(jù)倉庫體系結(jié)構(gòu)包含了從外部數(shù)據(jù)源或者數(shù)據(jù)庫抽取數(shù)據(jù)的ETL工具。ETL還負(fù)責(zé)數(shù)據(jù)的轉(zhuǎn)換,清洗,然后加載到數(shù)據(jù)倉庫的存儲(chǔ)中。一般來說,數(shù)據(jù)都會(huì)加載到存取速度較慢的存儲(chǔ)中,以原始數(shù)據(jù)的方式保存下來。為了提高查詢效率,原始數(shù)據(jù)會(huì)按主題分類,以聚合的方式存儲(chǔ)到數(shù)據(jù)集市中,稱之為聚合數(shù)據(jù)。參見下圖,原始數(shù)據(jù)往往有多條聚合路徑,時(shí)間維度是一個(gè)最基本的內(nèi)置聚合路徑,行政級(jí)別劃分也是一種常見的聚合路徑,產(chǎn)品屬性也是常見的聚合路徑。

數(shù)據(jù)倉庫體系結(jié)構(gòu)中還包括前端的查詢工具,報(bào)表工具和數(shù)據(jù)挖掘工具,被稱為front-end。

最后也是最重要的是,數(shù)據(jù)倉庫體系結(jié)構(gòu)中都會(huì)包含一個(gè)構(gòu)建數(shù)據(jù)倉庫的元數(shù)據(jù)倉庫。元數(shù)據(jù)倉庫包括數(shù)據(jù)庫schema,view,用于ETL的metadata,用于數(shù)據(jù)聚合的metadata,用于報(bào)表呈現(xiàn)的metadata和SQL模板等。數(shù)據(jù)倉庫往往采用meta data driven的架構(gòu)設(shè)計(jì),這個(gè)元數(shù)據(jù)倉庫就至關(guān)重要。

下圖即是我所在的從事數(shù)據(jù)倉庫集成工具開發(fā)的團(tuán)隊(duì)(負(fù)責(zé)生成ETL metadata,Database Schema,Pre-aggregation metadata,Reporter metadata,etc.)。名字是KOALA,slogon是讓生活更簡(jiǎn)單。

[[182380]]

上文中提到的維度的概念。維度(dimension)是觀察事物的角度,也是數(shù)據(jù)庫事實(shí)表中用來描述數(shù)據(jù)分類的層次結(jié)構(gòu)。維度在數(shù)據(jù)中就是表示為列,在SQL中用作過濾和分組。

像上圖這樣對(duì)數(shù)據(jù)進(jìn)行多個(gè)維度的抽象并借助于數(shù)據(jù)庫的select,group by等基本操作形成的OLAP多維數(shù)據(jù)操作(roll up,drill down,slice and dice,pivot)被稱為多維數(shù)據(jù)模型。為了方便復(fù)雜分析和可視化呈現(xiàn),數(shù)據(jù)倉庫中數(shù)據(jù)往往以多維模型建模。每一個(gè)維度被稱為一個(gè)層級(jí),三個(gè)維度構(gòu)成一個(gè)數(shù)據(jù)立方體。維度也通常用來過濾和分組,所以數(shù)據(jù)立方體稱之為group by的并。OLAP也被稱為在基于數(shù)據(jù)倉庫多維模型的基礎(chǔ)上實(shí)現(xiàn)的面向分析的各類操作的集合。

04

數(shù)據(jù)立方體

數(shù)據(jù)立方體只是多維模型的一個(gè)形象的說法。立方體其本身只有三維,但多維模型不僅限于三維模型,可以組合更多的維度,但一方面是出于更方便地解釋和描述,同時(shí)也是給思維成像和想象的空間;另一方面是為了與傳統(tǒng)關(guān)系型數(shù)據(jù)庫的二維表區(qū)別開來,于是就有了數(shù)據(jù)立方體的稱呼(見下圖)。

 

OLAP的操作是以查詢——也就是數(shù)據(jù)庫的SELECT操作為主,但是查詢可以很復(fù)雜,比如基于關(guān)系數(shù)據(jù)庫的查詢可以多表關(guān)聯(lián),可以使用COUNT、SUM、AVG等聚合函數(shù)。OLAP的多維分析操作包括:鉆取(Drill-down)、上卷(Roll-up)、切片(Slice)、切塊(Dice)以及旋轉(zhuǎn)(Pivot),逐一解釋如下:

Roll up (drill-up): summarize data by climbing up hierarchy or by dimension reduction

Drill down (roll down): reverse of roll-up,from higher level summary to lower level summary or detailed data, or introducing new dimensions

Slice and dice: project and select

Pivot (rotate): reorient the cube, visualization, 3D to series of 2D planes

看了上圖中數(shù)據(jù)立方體的各種操作,有人覺得還是很抽象。下面給一個(gè)SQL的例子,說明數(shù)據(jù)立方體的具體操作。

select//公式必須配合group by使用

  1. tmp.time 
  2. tmp.id1, 
  3. tmp.id2, 
  4. SUM(counter1) counter1, 
  5. SUM(counter2) counter2 

from//雙層SQL,實(shí)現(xiàn)聚合路徑

(

select//trunc實(shí)現(xiàn)時(shí)間維度的變化

  1. trunc( p.time'min' ) time 
  2. "country".country_id id1,  
  3. "city".city_id id2,  
  4. SUM(p.counter1) counter1,  
  5. SUM(p.counter2) counter2  
  6. from  
  7. table "country",  
  8. table "city",  
  9. table p 

where//選擇計(jì)算的城市

  1. "city".city_id in ( '北京','上海','廣州' )  
  2. and time >= to_date('2016/01/01 00:00:00''yyyy/mm/dd hh24:mi:ss' 
  3. and time < to_date('2017/01/01 00:00:00''yyyy/mm/dd hh24:mi:ss'

group by//改變行政維度

  1. trunc( p.period_start_time, 'mi' ),  
  2. "country".country_id,  
  3. "city".city_id  
  4. ) tmp 

group by//行政維護(hù)可以不變

  1. tmp.time
  2. tmp.id1, 
  3. tmp.id2 

OLAP的優(yōu)勢(shì)是基于數(shù)據(jù)倉庫面向主題、集成的、保留歷史及不可變更的數(shù)據(jù)存儲(chǔ),以及多維模型多視角多層次的數(shù)據(jù)組織形式,如果脫離的這兩點(diǎn),OLAP將不復(fù)存在,也就沒有優(yōu)勢(shì)可言?;诙嗑S模型的數(shù)據(jù)組織讓數(shù)據(jù)的展示更加直觀,它就像是我們平??创鞣N事物的方式,可以從多個(gè)角度多個(gè)層面去發(fā)現(xiàn)事物的不同特性,而OLAP正是將這種尋常的思維模型應(yīng)用到了數(shù)據(jù)分析上。

05

數(shù)據(jù)庫建模

如果把多維數(shù)據(jù)模型映射到關(guān)系數(shù)據(jù)庫和SQL查詢上(ROLAP),數(shù)據(jù)庫該如何設(shè)計(jì)呢?

大多數(shù)數(shù)據(jù)倉庫都采用“星型模型”來表示多維數(shù)據(jù)模型。在星型模型中,只有一個(gè)事實(shí)表,并且每一個(gè)維度有一個(gè)單獨(dú)的表。事實(shí)表中的每一個(gè)元組都是一個(gè)外鍵指向維度表的主鍵。每一個(gè)維度表的列是組成這個(gè)維度的所有屬性。如下圖所示。

另外一個(gè)常見的數(shù)據(jù)庫設(shè)計(jì)方法是“雪花模型”。雪花模型通過定義單獨(dú)的維度表,改進(jìn)了星型模型中沒有明確提供維度層級(jí)的問題。是謂維度表的正則化,如下圖。但星型模型更適合瀏覽維度層級(jí)。

除了事實(shí)表和維度表,數(shù)據(jù)倉庫還需要?jiǎng)?chuàng)建pre-aggregation 表用于存儲(chǔ)挑選的摘要數(shù)據(jù)。

06

大數(shù)據(jù)架構(gòu)

1010data公司高級(jí)軟件工程師ADAM JACOBS博士在ACM通訊發(fā)表的《大數(shù)據(jù)病理學(xué)》指出大數(shù)據(jù)的病理在于分析而不在于存儲(chǔ)——我們期望從成年累月積累的數(shù)據(jù)中在幾分鐘或者幾秒內(nèi)獲得分析結(jié)果!其實(shí)作者指出了關(guān)系數(shù)據(jù)庫的在大數(shù)據(jù)時(shí)代的病理,如下圖所示一個(gè)數(shù)據(jù)倉庫分析操作的SQL在數(shù)據(jù)量超過100萬條記錄時(shí)的性能表現(xiàn)。

The pathologies of big data are primarily those of analysis

因此,數(shù)據(jù)倉庫被認(rèn)為是對(duì)數(shù)據(jù)庫查詢性能問題的一個(gè)解決方案。在90年代,人們已經(jīng)都面臨一個(gè)數(shù)據(jù)爆炸的挑戰(zhàn),為了解決那個(gè)時(shí)代的“大數(shù)據(jù)”問題,數(shù)據(jù)倉庫應(yīng)運(yùn)而生。

在1980s早期,大數(shù)據(jù)是指數(shù)據(jù)集超出了磁帶機(jī)的處理能力。

在1990s,大數(shù)據(jù)是指數(shù)據(jù)集超出了Microsoft Excel或者桌面PC的處理能力。

今天,大數(shù)據(jù)是指數(shù)據(jù)集超出了關(guān)系數(shù)據(jù)庫的處理能力。

站在大數(shù)據(jù)時(shí)代回望數(shù)據(jù)架構(gòu)的發(fā)展歷史,然后思考大數(shù)據(jù)的定義:

當(dāng)前流行的技術(shù)處理不了的數(shù)據(jù),都是大數(shù)據(jù)。

數(shù)據(jù)倉庫的本質(zhì)是把數(shù)據(jù)變小,一般有兩個(gè)方法:

第一是通過抽取,轉(zhuǎn)換,加載,清洗。

第二是通過pre-aggregation獲得數(shù)據(jù)的一份單獨(dú)拷貝。因此數(shù)據(jù)倉庫被定義為:

為了方便查詢分析,把數(shù)據(jù)從關(guān)系數(shù)據(jù)庫中單獨(dú)拷貝一份出來,然后通過ETL或者ELT轉(zhuǎn)換。

對(duì)于大數(shù)據(jù),僅僅簡(jiǎn)單構(gòu)建一個(gè)數(shù)據(jù)倉庫是不夠的。數(shù)據(jù)應(yīng)該如何結(jié)構(gòu)化才能更便于分析?數(shù)據(jù)庫和分析工具應(yīng)該如何設(shè)計(jì)才能更高效的處理大數(shù)據(jù)?

意識(shí)到大數(shù)據(jù)固有的時(shí)間屬性和空間屬性,是我們理解關(guān)系數(shù)據(jù)庫處理大數(shù)據(jù)時(shí)存在性能問題的重要前提。如果說數(shù)據(jù)是我對(duì)世界的觀察記錄的話,大數(shù)據(jù)是我們對(duì)世界在時(shí)間和/或空間維度的重復(fù)觀察。這就是大數(shù)據(jù)的時(shí)空特點(diǎn),也是數(shù)據(jù)倉庫多維模型的構(gòu)建原理。當(dāng)今的主流數(shù)據(jù)庫模型是關(guān)系數(shù)據(jù)庫,并且該模型顯式地忽略表中的行的順序。這將不可避免導(dǎo)致應(yīng)用以非順序的方式查詢數(shù)據(jù)。在這種情況下,傳統(tǒng)的數(shù)據(jù)架構(gòu)可以通過引入緩存的方式緩解性能問題,而大數(shù)據(jù)則會(huì)大大放大了次優(yōu)訪問模式對(duì)性能的影響。如下圖所示隨機(jī)訪問和順序訪問的差別。

 

因此我們要引入,也是我們要推導(dǎo)的結(jié)論:逆正則化(逆規(guī)范化)和順序存儲(chǔ),不可更改數(shù)據(jù)集(append only,immutable data set)。順著存儲(chǔ)棧往下走,直到數(shù)據(jù)存儲(chǔ)格式。

是時(shí)候放棄關(guān)系數(shù)據(jù)庫了。

簡(jiǎn)單解釋一下逆正則化(逆規(guī)范化)。經(jīng)典關(guān)系數(shù)據(jù)庫介紹的所有范式指導(dǎo)思想都是正則化,減少重復(fù)數(shù)據(jù),如果重復(fù),則單獨(dú)創(chuàng)建一個(gè)表,使用外鍵關(guān)聯(lián),目的是節(jié)省存儲(chǔ)空間(那個(gè)時(shí)候存儲(chǔ)很昂貴)。逆正則化則是允許列之間的重復(fù)。如下圖所示。

我有一個(gè)看法,NoSQL的鍵值存儲(chǔ)即是用極簡(jiǎn)的非結(jié)構(gòu)化來實(shí)現(xiàn)結(jié)構(gòu)化存儲(chǔ)的逆規(guī)范化。

鍵值是極簡(jiǎn)的結(jié)構(gòu)化,也是極簡(jiǎn)的非結(jié)構(gòu)化。

關(guān)于順序存儲(chǔ),不可更改數(shù)據(jù)集,可以參考Pat Helland《Immutability Changes Everything》,和我上面的介紹是一致的。

關(guān)于傳統(tǒng)關(guān)系數(shù)據(jù)庫的討論還有數(shù)據(jù)庫知名專家,2015年圖靈獎(jiǎng)得主Michael Stonebraker撰寫的《One Size Fits All》,分別從數(shù)據(jù)倉庫和流處理兩個(gè)方面探討了數(shù)據(jù)庫25年來一招不變的靈丹妙藥已經(jīng)不再適合現(xiàn)在的業(yè)務(wù)發(fā)展。文章的中心思想和Pat Helland提出lambda架構(gòu)也有異曲同工之妙。

  1. speed layer 
  2. (i) compensates for the high latency of updates to the serving layer  
  3. (ii) deals with recent data only 
  4. serving layer 
  5. (i) indexes the batch views  
  6. (ii) Can be queried in low-latency, ad-hoc way 
  7. batch layer 
  8. (i) managing the master dataset (an immutable, append-only set of raw data), 
  9. (ii) pre-compute the batch views 

Lambda架構(gòu)統(tǒng)一了傳統(tǒng)數(shù)據(jù)倉庫時(shí)代的半實(shí)時(shí)在線查詢,剛剛興起的實(shí)時(shí)流處理(Online ),和批處理數(shù)據(jù)分析(Offline),給數(shù)據(jù)架構(gòu)的設(shè)計(jì)人員提供了一個(gè)全面的參考。

再結(jié)合半結(jié)構(gòu)化,結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ),SQL and No-SQL混合,我們可以得到下面一個(gè)典型的數(shù)據(jù)架構(gòu):


 

上面的討論是架構(gòu)的微觀考慮,讓我們回到大數(shù)據(jù)架構(gòu)的宏觀指導(dǎo)上來。

目前業(yè)界對(duì)大數(shù)據(jù)的一個(gè)共識(shí)的定義是5個(gè)V。如下圖所示。

 

從技術(shù)的角度需要專注于其中的三個(gè)V,通過閱讀大量文獻(xiàn),我得到下面一個(gè)范型:

借力開源軟件處理數(shù)據(jù)多樣性挑戰(zhàn)

使用分布式技術(shù)解決數(shù)據(jù)容量問題

使用實(shí)時(shí)流處理技術(shù)解決數(shù)據(jù)速度問題

 

傳統(tǒng)的OLAP 而言,實(shí)時(shí)性需求不明顯,實(shí)時(shí)分析的強(qiáng)需求是導(dǎo)致大數(shù)據(jù)技術(shù)的一個(gè)原因。

——曹洪偉

基于此,我個(gè)人推薦的大數(shù)據(jù)架構(gòu)是BDAS, the Berkeley Data Analytics Stack。這個(gè)架構(gòu)中不僅包含上面提到的三個(gè)思考維度,還提供了整個(gè)大數(shù)據(jù)架構(gòu)blueprint。內(nèi)容很多,使用時(shí)各個(gè)擊破,在此不贅述。

 

談了那么多,總結(jié)一下大數(shù)據(jù)架構(gòu)的幾個(gè)要點(diǎn):

分布式計(jì)算

實(shí)時(shí)流處理

Online和Offline

SQL和No-SQL:混合架構(gòu)也是演進(jìn)路徑之一

逆正則化(逆規(guī)范化)和順序存儲(chǔ),不可更改數(shù)據(jù)集

07

數(shù)據(jù)湖架構(gòu)

Pentaho的CTO James Dixon 在2011年提出了“Data Lake”的概念。在面對(duì)大數(shù)據(jù)挑戰(zhàn)時(shí),他聲稱:不要想著數(shù)據(jù)的“倉庫”概念,想想數(shù)據(jù) 的“湖”概念。數(shù)據(jù)“倉庫”概念和數(shù)據(jù)湖概念的重大區(qū)別是:數(shù)據(jù)倉庫中數(shù)據(jù)在進(jìn)入倉庫之前需要是事先歸類,以便于未來的分析。這在OLAP時(shí)代很常見,但是對(duì)于離線分析卻沒有任何意義,不如把大量的原始數(shù)據(jù)線保存下來,而現(xiàn)在廉價(jià)的存儲(chǔ)提供了這個(gè)可能。

Nearly unlimited potential for operational insight and data discovery. As data volumes, data variety, and metadata richness grow, so does the benefit.

形象的來看,如下圖所示,數(shù)據(jù)湖架構(gòu)保證了多個(gè)數(shù)據(jù)源的集成,并且不限制schema,保證了數(shù)據(jù)的精確度。數(shù)據(jù)湖可以滿足實(shí)時(shí)分析的需要,同時(shí)也可以作為數(shù)據(jù)倉庫滿足批處理數(shù)據(jù)挖掘的需要。數(shù)據(jù)湖還為數(shù)據(jù)科學(xué)家從數(shù)據(jù)中發(fā)現(xiàn)更多的靈感提供了可能。

和數(shù)據(jù)倉庫對(duì)比來看,數(shù)據(jù)倉庫是高度結(jié)構(gòu)化的架構(gòu),數(shù)據(jù)在轉(zhuǎn)換之前是無法加載到數(shù)據(jù)倉庫的,用戶可以直接獲得分析數(shù)據(jù)。而在數(shù)據(jù)湖中,數(shù)據(jù)直接加載到數(shù)據(jù)湖中,然后根據(jù)分析的需要再轉(zhuǎn)換數(shù)據(jù)。

 

下面我整理了數(shù)據(jù)倉庫和數(shù)據(jù)湖在多個(gè)維度的詳細(xì)對(duì)比。

總結(jié)起來,數(shù)據(jù)湖架構(gòu)有一下幾個(gè)顯著的特點(diǎn):

數(shù)據(jù)存儲(chǔ):大容量低成本

數(shù)據(jù)保真度:數(shù)據(jù)湖以原始的格式保存數(shù)據(jù)

數(shù)據(jù)使用:數(shù)據(jù)湖中的數(shù)據(jù)可以方便的被使用

延遲綁定:數(shù)據(jù)湖提供靈活的,面向任務(wù)的數(shù)據(jù)綁定,不需要提前定義數(shù)據(jù)模

 

當(dāng)然,對(duì)于數(shù)據(jù)湖架構(gòu)的批評(píng)也是不絕于耳。有人批評(píng)說,匯集各種雜亂的數(shù)據(jù),應(yīng)該就是數(shù)據(jù)沼澤。Martin Fowler也對(duì)數(shù)據(jù)湖中數(shù)據(jù)的安全性和私密性提出了質(zhì)疑。

08

電信運(yùn)營(yíng)大數(shù)據(jù)特點(diǎn)

電信運(yùn)營(yíng)大數(shù)據(jù)對(duì)應(yīng)于TMN/FCAPS模型中的電信設(shè)備管理數(shù)據(jù)。如下圖所示。

Fault Management

Configuration Management

Accounting Management

Performance Management

Security Management

電信運(yùn)營(yíng)數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)多樣化要求不高,大多數(shù)數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)容量要求不是特別高,數(shù)據(jù)的實(shí)時(shí)處理要求最高。

 

電信運(yùn)行數(shù)據(jù)架構(gòu)強(qiáng)調(diào)演進(jìn)。步步為營(yíng),向前兼容,不是一蹴而就的。

09

演進(jìn)路徑實(shí)踐

現(xiàn)在的架構(gòu)是一個(gè)典型的數(shù)據(jù)倉庫架構(gòu)。如下圖所示。現(xiàn)在的架構(gòu)設(shè)計(jì)有以下幾個(gè)要點(diǎn):

ROLAP:基于Oracle數(shù)據(jù)庫,但并沒有用Oracle的數(shù)據(jù)倉庫,單獨(dú)構(gòu)建數(shù)據(jù)倉庫。

Meta Data Driven的架構(gòu)設(shè)計(jì):Meta Data覆蓋整個(gè)數(shù)據(jù)pipe。當(dāng)新的數(shù)據(jù)需要集成,只需要編輯新的Meta Data,系統(tǒng)不需要做任何改變。

Schema設(shè)計(jì):主要有兩類表:原始數(shù)據(jù)表和聚合表; 每類表都有三層結(jié)構(gòu):表,用作聚合的視圖,用作報(bào)表的視圖。不同的應(yīng)用使用不同的視圖來操作數(shù)據(jù)。當(dāng)原始的數(shù)據(jù)表結(jié)構(gòu)變化時(shí),可以根據(jù)需要更改不同層次的視圖。

Schema的演化。這是一個(gè)比較大的主題,關(guān)系數(shù)據(jù)是schema on write的,任何列的增加都需要alter表結(jié)構(gòu),這會(huì)帶來客戶系統(tǒng)很長(zhǎng)時(shí)間的downtime。因此原始表采用1000列的設(shè)計(jì)(Oracle支持的最大列數(shù)),并且列只增加,不減少,避免了數(shù)據(jù)庫schema的變化,降低不同release之間migration的成本。

數(shù)據(jù)存儲(chǔ):定期清除原始數(shù)據(jù),只保留聚合數(shù)據(jù)。

 

為什么現(xiàn)在的架構(gòu)需要演進(jìn)呢?

首先當(dāng)前架構(gòu)面臨擴(kuò)展性的挑戰(zhàn)。數(shù)據(jù)庫擴(kuò)展性主要依賴于Oracle RAC解決方案,Oracle RAC不是一個(gè)線性的擴(kuò)展方案,同時(shí)也增加了很多管理和維護(hù)成本。并且由于硬件的限制,垂直性擴(kuò)展不是一個(gè)長(zhǎng)期的解決方案。

其次,當(dāng)前的存儲(chǔ)成本太昂貴,因此去IOE成為目標(biāo)。

第三,實(shí)時(shí)處理需求也是驅(qū)動(dòng)架構(gòu)演進(jìn)的重要因素。

然后,架構(gòu)變成了這樣子:

 

傳統(tǒng) SQL 基于云平臺(tái)重新定義為 NewSQL,那么 Data Warehouse 也可以重新定義 New Data Warehouse。

——曹洪偉

這樣的架構(gòu)是不是New Data Warehouse,我不知道,可能是。在這樣的架構(gòu)下,最大的變化就是更換Oracle數(shù)據(jù)為HDFS,并使用SQL on Hadoop(比如Hive SQL,Spark SQL)等保持SQL接口,維持了前端分析引擎的不變。Meta Data部分依然保持了原來的數(shù)據(jù)建模,并沒有改變數(shù)據(jù)集成方式。這樣的架構(gòu)繼承了經(jīng)典的倉庫架構(gòu),提高系統(tǒng)擴(kuò)展性,在滿足業(yè)務(wù)需求的同時(shí),最大化的保護(hù)已有投資。

在架構(gòu)演進(jìn)這個(gè)過程中,有一些lesson learned:

SQL on Hadoop是必須的。客戶希望保持SQL接口的連續(xù)性。

混合數(shù)據(jù)倉庫架構(gòu):針對(duì)不同的業(yè)務(wù)采用不同存儲(chǔ)方案(Oracle 和 HDFS),數(shù)據(jù)量大的采用HDFS存儲(chǔ),數(shù)據(jù)量不夠大的(不存在擴(kuò)展性挑戰(zhàn)的)可以依然使用關(guān)系型數(shù)據(jù)庫。

逆規(guī)范化對(duì)性能的影響重大。通過對(duì)逆規(guī)范設(shè)計(jì),可以達(dá)到關(guān)系數(shù)據(jù)庫的查詢性能。但是對(duì)于逆規(guī)范化是否存在其他影響,還需要研究。

相對(duì)于sequence files 和RC files,ORC文件格式的性能是最好的。

實(shí)時(shí)pipe使用storm和Kafka實(shí)現(xiàn)。

就像 NewSQL 那樣,可以有 New Data Warehouse 的。就是 Data Warehouse與云計(jì)算的融合,即數(shù)據(jù)倉庫的存儲(chǔ)層在云平臺(tái),采用分布式系統(tǒng)。對(duì)應(yīng)用側(cè)而言, 原有的方式依舊有效,這樣就不會(huì)資產(chǎn)浪費(fèi),而是有效的繼承, 也是通往數(shù)據(jù)湖的一個(gè)較穩(wěn)妥的步驟。

——曹洪偉

老曹這么一說,豁然開朗。我們?cè)谡剶?shù)據(jù)倉庫架構(gòu)向大數(shù)據(jù)架構(gòu)演進(jìn)的時(shí)候,其實(shí)我們?cè)谡凬ew Data Warehouse架構(gòu)。就像當(dāng)初數(shù)據(jù)倉庫的出現(xiàn)是對(duì)數(shù)據(jù)庫系統(tǒng)存在的限制進(jìn)行補(bǔ)充一樣,目前的大數(shù)據(jù)平臺(tái)是對(duì)數(shù)據(jù)倉庫系統(tǒng)存在的問題進(jìn)行補(bǔ)充。他們的技術(shù)思路,技術(shù)架構(gòu),用戶需求某種程度上是一致,或者說核心的思想是一致的。不一致的地方僅僅是為了滿足性能而做的技術(shù)方案的調(diào)整。

首先看數(shù)據(jù)集成架構(gòu)。如下圖,基于Hadoop的數(shù)據(jù)集成架構(gòu)和基于關(guān)系數(shù)據(jù)庫的傳統(tǒng)數(shù)據(jù)集成架構(gòu)是一致的。不同地方在于由于數(shù)據(jù)量的增大,左邊的架構(gòu)采用具有逆正則化(逆規(guī)范化)和順序存儲(chǔ),不可更改數(shù)據(jù)集等特點(diǎn)的Hadoop平臺(tái)存儲(chǔ)數(shù)據(jù)。

 

其次看數(shù)據(jù)分析方法。雖然說基于Hadoop的數(shù)據(jù)集成架構(gòu)采用了Hadoop數(shù)據(jù)存儲(chǔ)平臺(tái)(內(nèi)置MapRdecue數(shù)據(jù)處理引擎),其數(shù)據(jù)操作,數(shù)據(jù)分析方法在思想上是一致的——從大量的數(shù)據(jù)集中獲得由價(jià)值的信息——如下圖所示,數(shù)據(jù)倉庫的操作語句(group-by-aggregation)與MapRdecue的操作函數(shù)對(duì)應(yīng)關(guān)系。所以MapRdecue的核心思想就是把數(shù)據(jù)倉庫中的group-by-aggregation操作轉(zhuǎn)換成分布式執(zhí)行。所謂創(chuàng)新,大概如此吧。

 

The Map-Reduce programming model provides a good abstraction of group-by-aggregation operations over a cluster of machines.

The programmer provides a map function that performs grouping and a reduce function that performs aggregation.

The underlying run-time system achieves parallelism by partitioning the data and processing different partitions concurrently using multiple machines.

在New Data Warehouse架構(gòu)的基礎(chǔ)上,向Data Lake如何演進(jìn)?

對(duì)電信行業(yè)來說,NFV和SDN正在推動(dòng)電信網(wǎng)絡(luò)設(shè)備控制平面和數(shù)據(jù)平面的分離,電信設(shè)備數(shù)據(jù)會(huì)走向數(shù)據(jù)湖架構(gòu)。電信設(shè)備數(shù)據(jù)融合,運(yùn)營(yíng)數(shù)據(jù)融合,最終會(huì)走向一個(gè)大融合。

 

總結(jié)起來,電信大數(shù)據(jù)對(duì)于數(shù)據(jù)湖架構(gòu)的擁抱,來自于以下四個(gè)方面的驅(qū)動(dòng)。我用四個(gè)推導(dǎo)公式,如下:

5G->BigData (Semi-Structured and Unstructured) -> Modern Data Architecture for Enterprise -> Data Lake Storage Architecture -> Data Lake

Cloud -> Network Function Cloudification -> Network Function Virtualization -> stateless VNF -> Distributed Sharing Storage -> Data Lake

Distributed analytics -> Data Lake

Hierarchy architecture -> Flat operations architecture -> Data Lake

 

我們嘗試過在數(shù)據(jù)加載過程中自學(xué)習(xí)的產(chǎn)生數(shù)據(jù)庫schema,證明這個(gè)思路是可行的。基于結(jié)構(gòu)化的數(shù)據(jù),這個(gè)過程非常容易。但對(duì)于非結(jié)構(gòu)化的數(shù)據(jù),還是存在很大的挑戰(zhàn)。使用機(jī)器學(xué)習(xí)的方式,模型訓(xùn)練成本恐怕和人工抽取schema的工作量是相當(dāng)?shù)?。這是開放的話題,可以討論。

【本文是51CTO專欄作者石頭的原創(chuàng)文章,轉(zhuǎn)載請(qǐng)通過作者微信公眾號(hào)補(bǔ)天遺石(butianys)獲取授權(quán)】

 

戳這里,看該作者更多好文

責(zé)任編輯:武曉燕 來源: 補(bǔ)天遺石
相關(guān)推薦

2023-11-09 15:56:26

數(shù)據(jù)倉庫數(shù)據(jù)湖

2024-09-23 21:48:57

2024-09-23 19:41:17

數(shù)據(jù)技術(shù)數(shù)據(jù)中臺(tái)數(shù)據(jù)治理

2024-10-23 10:21:41

數(shù)據(jù)飛輪數(shù)據(jù)中臺(tái)

2024-09-25 13:08:03

數(shù)據(jù)倉庫數(shù)據(jù)中臺(tái)數(shù)據(jù)飛輪

2024-09-22 11:03:11

數(shù)據(jù)倉庫數(shù)據(jù)飛輪

2024-09-23 21:44:56

2024-09-29 21:24:17

數(shù)據(jù)倉庫數(shù)據(jù)中臺(tái)數(shù)據(jù)飛輪

2024-09-19 16:11:07

2022-11-29 17:16:57

2022-12-13 09:54:52

數(shù)據(jù)倉庫

2024-09-05 16:08:52

2024-03-19 13:45:27

數(shù)據(jù)倉庫數(shù)據(jù)湖大數(shù)據(jù)

2024-09-29 11:36:29

2023-08-09 08:00:00

數(shù)據(jù)倉庫數(shù)據(jù)架構(gòu)

2024-09-20 13:11:06

數(shù)據(jù)倉庫數(shù)據(jù)中臺(tái)數(shù)據(jù)飛輪

2024-09-24 18:52:20

數(shù)據(jù)倉庫數(shù)據(jù)管理數(shù)據(jù)中臺(tái)

2024-09-24 10:56:58

2024-09-28 11:14:34

數(shù)據(jù)技術(shù)數(shù)據(jù)倉庫數(shù)據(jù)中臺(tái)

2024-09-24 18:16:24

數(shù)據(jù)倉庫數(shù)據(jù)湖數(shù)據(jù)中臺(tái)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产三级小视频| 亚洲av毛片基地| 亚洲妇女成熟| 欧美精彩视频一区二区三区| 国产在线观看一区二区三区 | 国产精品私人影院| 91网站免费观看| 国产 日韩 欧美 在线| 成人精品影院| 亚洲国产精久久久久久 | www.av视频在线观看| av资源久久| 337p日本欧洲亚洲大胆精品| 男操女免费网站| 蜜桃传媒在线观看免费进入| 久久久久久久一区| 粉嫩高清一区二区三区精品视频| 久久久久久无码精品大片| 欧美freesex交免费视频| 国产视频精品在线| 少妇熟女视频一区二区三区| 国产成人午夜性a一级毛片| 亚洲成av人影院| 在线视频不卡一区二区| 欧美一区二区三区少妇| 国产精品伊人色| 国产欧美日韩免费看aⅴ视频| 日韩精品久久久久久久酒店| 欧美日本中文| 在线成人一区二区| 亚洲人人夜夜澡人人爽| 成人福利一区| 777亚洲妇女| 国产理论在线播放| 欧美大胆成人| 欧美午夜宅男影院在线观看| 丁香六月激情婷婷| 欧美人体视频xxxxx| 亚洲天堂网中文字| 亚洲一一在线| 欧美成人二区| 中文字幕在线不卡国产视频| 亚洲国产午夜伦理片大全在线观看网站| 日本毛片在线观看| 成人在线视频一区| 99在线观看视频| 国产成人免费看一级大黄| 蜜桃久久av一区| 国产精品久久久久久久久久久久久| av图片在线观看| 亚欧美中日韩视频| 欧美孕妇毛茸茸xxxx| 色播视频在线播放| 日韩午夜一区| 欧美在线性爱视频| 在线观看免费av片| 久久九九免费| 国产精品久久久久久久天堂| 欧美 日韩 精品| 美日韩精品视频| 日本精品视频在线| 波多野结衣大片| 日本最新不卡在线| 国产一区二区视频在线观看| 国产手机精品视频| 国产在线精品免费| 不卡视频一区二区| 色综合视频在线| 久久精品男人天堂av| 色播亚洲视频在线观看| 国产乱理伦片a级在线观看| 欧美激情一区二区三区不卡| 一区二区成人国产精品| av网站导航在线观看免费| 亚洲主播在线观看| 免费欧美一级视频| jizz久久久久久| 欧美一区二区精品在线| 2一3sex性hd| 国产亚洲一卡2卡3卡4卡新区 | 美国一区二区三区在线播放| 91精品啪在线观看麻豆免费| 成人免费视频国产免费麻豆| 99国产麻豆精品| 水蜜桃亚洲一二三四在线| 岛国中文字幕在线| 午夜视频在线观看一区二区| 亚洲中文字幕久久精品无码喷水| 日本免费成人| 亚洲电影免费观看高清完整版在线| 亚洲av综合一区二区| 天天av综合| 91精品国产91| 国产精品毛片一区视频播 | 色哟哟一一国产精品| 好吊一区二区三区| 国产成人精品日本亚洲| 国产精品永久久久久久久久久| 波多野结衣精品在线| 亚洲一卡二卡三卡| 免费高潮视频95在线观看网站| 欧美日韩亚洲综合在线| 日本少妇xxxx| 久久精品国内一区二区三区水蜜桃| 97高清免费视频| 在线免费观看一区二区| 波多野结衣视频一区| youjizz.com亚洲| 成人软件在线观看| 精品国产污网站| 肉色超薄丝袜脚交69xx图片| 免费在线播放第一区高清av| 91精品国产高清久久久久久91裸体 | 亚洲精品一区二区三区福利 | 国产精品福利网站| 国产综合无码一区二区色蜜蜜| 国产精品无人区| 国产又大又硬又粗| 都市激情亚洲| 欧美成人免费视频| 中文天堂在线播放| 99国产精品久| 国产精品又粗又长| 精品国产亚洲一区二区三区在线| 一区二区三区天堂av| 国产超碰人人爽人人做人人爱| 国产乱码精品一区二区三区忘忧草| 日产精品久久久一区二区| 国产在线看片免费视频在线观看| 欧美一级免费大片| 亚洲一区电影在线观看| 免费在线观看视频一区| 欧美一区二区三区四区五区六区 | 国产裸舞福利在线视频合集| 色综合天天在线| 极品粉嫩小仙女高潮喷水久久| 欧美fxxxxxx另类| 亚洲自拍偷拍福利| 老司机精品影院| 欧美日韩一区二区三区在线| 一区二区精品免费| 视频一区二区三区中文字幕| 蜜桃久久精品乱码一区二区 | 日本精品在线| 欧美日韩电影在线| 亚洲色图27p| 久久99国产精品免费| 亚洲一区bb| 岛国精品在线| 日韩专区在线观看| 国产精品视频无码| 亚洲另类色综合网站| 四虎成人在线播放| 亚洲天堂久久| 精品无码久久久久国产| 麻豆网站免费在线观看| 精品网站999www| 青草视频在线观看免费| 久久麻豆一区二区| 成年网站在线播放| 国产精品久久久久久久免费观看 | 色片在线免费观看| 午夜精品毛片| 国产精品久久久一区二区三区| 2020日本在线视频中文字幕| 国产视频亚洲精品| 中文字幕一区二区免费| 自拍偷拍国产亚洲| 稀缺小u女呦精品呦| 小嫩嫩精品导航| 天天爽天天狠久久久| 激情久久免费视频| 97精品国产aⅴ7777| 韩国三级av在线免费观看| 欧美日韩国产综合一区二区三区| 99鲁鲁精品一区二区三区| 国产iv一区二区三区| 国产一区二区三区精彩视频 | 丝袜情趣国产精品| 99国产精品欲| 欧美小视频在线观看| 自拍偷拍你懂的| 粉嫩蜜臀av国产精品网站| 无码播放一区二区三区| 日韩一区自拍| 国模一区二区三区私拍视频| 免费在线成人激情电影| 色综合久久精品亚洲国产| 欧美精品a∨在线观看不卡 | 秋霞网一区二区| 在线一区二区三区做爰视频网站| 亚洲精品久久久久久国| 成人激情免费电影网址| 精品日韩久久久| 国产主播精品| 亚洲欧洲一区二区在线观看| 成人爽a毛片| 国产美女精品免费电影| 四虎av在线| 色婷婷久久一区二区| 人妻精品一区一区三区蜜桃91| 欧美专区亚洲专区| 日韩精品视频免费播放| 国产精品国产精品国产专区不蜜| 欧美一区二区免费在线观看| 久久精品国产亚洲高清剧情介绍| av7777777| 亚洲综合专区| 手机成人在线| 嫩草一区二区三区| 国产精品加勒比| 999精品嫩草久久久久久99| 欧美一级大片在线免费观看| 人人超在线公开视频| 日韩在线视频免费观看| 国产在线中文字幕| 日韩精品黄色网| 黑人精品一区二区三区| 8v天堂国产在线一区二区| 综合久久中文字幕| 色欧美片视频在线观看| 日本一级淫片色费放| 亚洲精品综合在线| 精品在线观看一区| 久久一区二区三区国产精品| 一级少妇精品久久久久久久| 国产成人精品免费看| aaaaaaaa毛片| 狠狠色综合日日| 天天干天天玩天天操| 日韩成人精品在线观看| 国产福利一区视频| 亚洲综合另类| 黄色片视频在线免费观看| 日韩视频三区| 激情伊人五月天| 国产毛片久久| 免费在线a视频| 亚洲一区免费| 国产日韩一区二区在线| 欧美亚洲在线| 成年网站在线免费观看| 美女日韩在线中文字幕| 精品www久久久久奶水| 天堂午夜影视日韩欧美一区二区| 97国产精东麻豆人妻电影| 国产欧美欧美| 久久久久狠狠高潮亚洲精品| 午夜亚洲精品| 日本美女高潮视频| 蜜桃传媒麻豆第一区在线观看| 免费观看成人在线视频| 免费日本视频一区| 亚洲精品mv在线观看| 狠狠色2019综合网| 亚洲热在线视频| 国产精品伊人色| 中文字幕天堂网| 久久免费视频一区| 国产又粗又长免费视频| 亚洲天堂久久久久久久| 日本少妇裸体做爰| 欧美性xxxx极品高清hd直播 | 日本不卡高清视频| www.久久91| 国产成人免费视频网站高清观看视频| 91福利视频免费观看| 处破女av一区二区| a毛片毛片av永久免费| 国产精品拍天天在线| 美女的奶胸大爽爽大片| 黑人极品videos精品欧美裸| 国产一卡二卡三卡| 欧美一区二区免费| 天堂中文在线资| 中文字幕一区电影| 欧美性猛片xxxxx免费中国| 日本精品视频网站| 精品国产一级| 国产亚洲情侣一区二区无| 精品国产视频| 国产av熟女一区二区三区| 久久精品毛片| 国产精品久久久久久9999| 成人爱爱电影网址| 快灬快灬一下爽蜜桃在线观看| 亚洲精品视频在线看| 久久精品无码av| 91精品国产乱码| 日本一区高清| 久久亚洲精品网站| 免费成人动漫| 99在线看视频| 欧美3p在线观看| 男人操女人逼免费视频| 韩国v欧美v日本v亚洲v| 亚洲av无码成人精品国产| 中文字幕av一区 二区| 日本熟妇毛茸茸丰满| 欧美日韩视频专区在线播放| 欧美一级片免费| 欧美xxxx综合视频| 国产一区二区三区影视| 国产美女精品久久久| 偷拍欧美精品| 久久久久久香蕉| 成人sese在线| 青青草精品在线视频| 在线观看日韩毛片| 亚洲三级中文字幕| 欧美美最猛性xxxxxx| 欧美特黄色片| 茄子视频成人在线观看| 亚洲美女网站| 国产精品二区视频| 最新成人av在线| 中文字幕 欧美激情| 亚洲精品国产免费| 免费毛片在线看片免费丝瓜视频| 国产视频观看一区| 成人中文视频| 91av俱乐部| 久久老女人爱爱| 精品成人av一区二区在线播放| 欧美成人a∨高清免费观看| 久草中文在线观看| 国产精品一区久久久| 国产精品一线天粉嫩av| 99爱视频在线| 91在线视频播放| 天天操天天摸天天干| 亚洲国产成人av在线| cao在线视频| 精品国产乱码久久久久久蜜柚| 一区免费在线| 国产婷婷在线观看| 亚洲成av人片在线| 黄色一级大片在线免费看国产一 | 中文字幕一区二区三区在线乱码| 日韩精品久久久久久| 级毛片内射视频| 欧美在线制服丝袜| av在线免费观看网站| 国产精品久久久久久久久久东京| 欧美精品一区二区三区精品| 丝袜制服一区二区三区| 日本一区二区免费在线观看视频| 国产乱码在线观看| 日韩中文字幕视频在线| av在线亚洲一区| 激情视频小说图片| 粉嫩一区二区三区在线看| www.天天色| 亚洲女同性videos| 成人做爰免费视频免费看| 午夜在线视频免费观看| 国产精选一区二区三区| 久久综合综合久久| 日韩二区三区在线| av在线日韩| 激情五月五月婷婷| 成人自拍视频在线| 91精品国产综合久久久蜜臀九色| 日韩黄色av网站| 亚洲电影有码| 91看片淫黄大片91| av一区二区三区四区| 无码无套少妇毛多18pxxxx| 中文字幕在线观看日韩| 精品视频一区二区三区| 婷婷无套内射影院| 国产欧美日韩在线视频| 国产视频一二三四区| 97高清免费视频| 久久综合88| 国产女主播在线播放| 一本到不卡精品视频在线观看| av在线免费一区| 国产精品免费区二区三区观看| 免费中文字幕日韩欧美| 亚洲一级黄色录像| 日韩精品专区在线影院重磅| 91av亚洲| 九九久久九九久久| 久久久精品国产免费观看同学| 亚洲系列第一页| 久久青草精品视频免费观看| 国产传媒欧美日韩成人精品大片| 人妻少妇偷人精品久久久任期| 欧美日韩亚洲精品一区二区三区| 在线免费观看黄色av| 国产精品免费一区二区三区| 日韩电影在线免费看| 久久久久无码国产精品| 国产一区二区三区视频免费| 深夜福利一区| 久热精品在线观看视频| 精品国产91乱高清在线观看 | 国产剧情一区| 韩国三级视频在线观看|