精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

小米數據工場的技術架構和小團隊如何玩轉大數據

原創
企業動態
由51CTO舉辦的WOT2016互聯網運維與開發者峰會上,來自前小米數據工場負責人、現任火線數據創始人兼CEO盧學裕做了以 “小米數據工場的技術架構和小團隊如何玩轉大數據”為主題的演講。本文章是把本次分享干貨亮點的整理成文字形式,呈獻廣大的用戶。

本文是WOT2016互聯網運維與開發者大會的現場干貨,  新一屆主題為WOT2016企業安全技術峰會將在2016年6月24日-25日于北京珠三角JW萬豪酒店隆重召開!

盧學裕的演講分為小米數據工場的技術架構和小團隊如何玩轉大數據兩部分,從中開發者可以知道小米數據工場的技術架構是怎樣的? 面對大數據的技術紛繁復雜,小團隊要如何面臨缺技術/缺分析師/缺數據等問題?在這種現狀下如何做好技術選型,如何權衡面臨的使用成本和數據隱私擔憂?盧學裕主張一半自建一半用云,然而這又要面臨哪些運維挑戰?

小米數據工場的技術架構

盧學裕表示, 小米數據工廠跟各家的大數據平臺、數據系統有很多類似之處也有自己獨特的點。工廠整個底層基礎平臺建立在Hadoop體系,除此小米跟Cloudera合作也非常緊密。小米整個底層平臺會有專門平臺組去開發,***用的HDFS,上面用的Hive、Spark和Mapreduce這些是混合到一個亞運集群上。Impala小米很早就在用,是一個很重的計算角色。

小米數據工場總體結構

如上圖, 上半部分是自研的數據工廠,是為最頂業務層提供服務的。數據工廠主要是提供數據可視化、計算任務管理、數據管理、權限管理、任務調度、數據共享等服務。盧學裕表示,公司越大就更希望數據能夠開放給公司的各個部門,數據可相互利用。但不能沒有任何限制的去使用,所以需要對數據權限做管理。任務調度是整個工廠里面最重的部分。數據共享就是類似非常火的用戶畫像類數據,還有其他公共數據如IP庫,這些數據具有公共特點,就不用重復計算,就可以通過數據共享的方式在各個團隊之間使用這些數據。

數據管理,分為數據預覽、元數據、數據源三部分。數據預覽是每個團隊用來互相了解數據的。

元數據,就是數據使用過程中要把非結構化的數據轉換結構化的數據。元數據管理就是去了解每個字段的含義和機器解析。機器解析包括Mapreduce程序可直接讀文件可解析,如用Impala、Spark和Hive同樣也能解析,而不需要每個使用者再去格式化,再去解析這個數據。但面臨的問題是數據一旦出現格式的轉變或者某些字段的調整,以前任務可能都會出現問題,故一定要統一管理的地方。數據源,數據管理非常核心的是數據集成,能夠把各個地方的數據集成到平臺上來。

HDFS目錄管理。有公共數據空間、業務數據空間、團隊數據空間、個人數據空間、Yarn計算空間五部分。

  • 公共數據空間,是用來把公共數據放到上面,把維護權限和讀的權限分開。這樣大部分都是讀這個空間,空間數據安全性等級相對來講比較低,可以付給更多人。
  • 業務數據空間,因為每個業務數據的增長量是不一樣的,甚至有些業務會出現如剛上來一個新功能,數據量迅速的增大,有的甚至會出現某個團隊的數據增加,導致把整個集群空間全吃掉,又沒有事先招呼。這種情況下做好業務間的限額配額是非常重要,防止某一個團隊的增長導致整個集群出現一些問題。
  • 團隊數據空間,就是把權限控制到個人,用來幫助做團隊之間的數據協作。如把線上任務會放到團隊賬號中去,團隊賬號的權限要做好控制,權限不隨便開放。團隊人員發生變動后,整個團隊任務不用再去切換賬戶而導致交接的復雜性。
  • 個人數據空間,數據工程師、開發工程師等是需要做一些調試或做自己的計算這就要給這些人一定空間的同時對其數據做配額。這是為了防止這些人過多的使用資源和為了空間不夠需要清理數據時,哪些數據要清理,哪些數據不能清理一目了然。這樣限制空間的情況下,這種廢文件或者垃圾文件的積累會相對較少。
  • Yarn計算空間,做配額限制呢是為了杜絕空間濫用的問題。盧學裕舉例道,“之前發生過一件事,某人在Reduce里面寫了一個死循環,不停的輸出數據,導致整個集群很快就去報警。后來才發現這個計算造成的一些問題,***差點導致那些日志上傳、數據的寫入都出問題,幸虧處理的比較及時。”所以,Yarn計算空間是需要做一個配額限制,防止對整個集群造成過大的影響。

盧學裕表示,小米數據存儲格式統一采用的Parquet,優點在于其使用的是列式存儲,支持Mapreduce、Hive、Impala、Spark和讀取快占用空間少。

客戶端數據接入兩種模式優劣勢

客戶端數據接入。客戶端指的是如說Wap、App等數據,存在方式有SDK和服務端Log兩種模式。上圖為兩種模式的優劣勢。

服務器端數據源。除前端數據源外,整個處理數據時還會有大量服務器端數據源需要處理。業務數據庫類,用ETL工具做導入。服務器端日志,用Scribe將數據寫入HDFS。

元數據管理。當公司業務變多后,每一個數據的處理方式都有可能不一樣,這時候就凸顯出元數據管理的重要性。如視頻播放日志,分析師希望用Hive,用Impala直接寫SQL去計算,但數據挖掘工程師就要去寫Mapreduce,寫Spark的方式去讀,去解析。元數據管理就是要做數據統一,既能夠滿足Hive、Spark、Impala,還能滿足Mapreduce。這樣一來節省大家對數據理解、執行的時間。

元數據管理

如上圖,小米數據工廠是每一份數據的描述都需要在數據工廠上提交,之后數據工廠會在MetaStore中做建表的同時帶上元數據的行為,供Hive、Spark、Impala使用。數據管理還會生成Jave  Class,給Mapreduce使用。當去解析用某個數據時候,可以直接用這樣的方式把它解析成Jave類。

計算管理

計算管理。盧學裕表示,計算是很重要的事情,數據管理相對來講是一次性的活,計算就是很復雜的事情。計算任務數一天達到幾千或過萬時,就會變得非常復雜。對于計算管理這快優化,小米做了如上圖的一些工作。

Docker。為了管理好這些紛繁的計算框架和模型,在計算的執行方面,小米使用Docker來解決對環境的不同需求和異構問題,并且與Hive、Impala、Spark這些不同的計算模型都進行了對接,去適配不同應用場景計算不同數據的模型。另外,在不同業務場景下,同一個計算邏輯也可以選用不同的計算模型,Docker 的使用也避免了資源的浪費。比如一個計算任務每天凌晨運行,為了追求吞吐量,可以放到Hive里跑;還是同樣一個計算模型,現在就要跑,可以不用更改,就放到Impala里運行。Docker不僅解決了環境的異構,也解決了資源問題。另外,Docker的環境適應性很強,做橫向擴展會比較容易。對于數據隱私方面,小米考慮得非常重。采用Docker與自身安全策略的綜合,小米用戶數據的隱私和安全性也得到了極其嚴格的控制。

小團隊如何玩轉大數據

 小團隊玩大數據會面臨哪些問題?小團隊會面臨人力資源不足,技術儲備不足,時間有限等問題。面對這些問題,盧學裕在技術選型上給出如下三個建議。

  1. 選擇熱門技術。因為人才比較多,相對獲取這樣人才會比較容易。技術成熟,因為小團隊沒有時間去踩坑。還有幫助多,這如說網上文檔幫助、社群幫助,朋友幫助等。
  2. 夠用。針對一些小團隊或者初創公司的特點,業務變化特別快,也不穩定,這種情況下做到夠用就好,不需要過分的設計和采用過重的系統。盡量根據業務驅動,業務需要什么數據就抓什么數據。
  3. 演進。隨著需求的變化需要不斷的演進,包括系統演進、使用方式演進。

一定要做好數據積累。盧學裕表示,無論你用什么樣的技術,用Hadoop也好,不用Hadoop也好,一定要做好數據的積累,這是對一家數據公司非常重要的部分。這就需要提前規劃好數據,還要避免邏輯孤島。還需要注意ID問題,也就是關聯的問題。當采集了數據,卻發現沒有采用戶ID,沒有提前做好這個規劃,當算到用戶級別時候那就尷尬了。

演講***,盧學裕強調:“現在越來越多業務都回到了用戶時代,以前講的是流量時代,講的是PV如何。回到用戶時代,核心問題就是我們要做好用戶的數據積累,尤其是用戶模型建立。模型包括的畫像、用戶點點滴滴行為等。這些行為在業務發展之后,尤其是要做數據挖掘,做推薦系統時,會非常非常的有幫助。建議大家做好這樣的數據積累,在數據技術上隨著變化可以不停的再做一些改變,甚至做一些混合,在不同的地方用不同的方式。

 演講視頻:http://edu.51cto.com/lesson/id-100757.html

講師簡介:

[[166688]]

現任火線數據創始人兼CEO,前小米科技小米云團隊,負責小米數據工場。之前擔任優酷土豆大數據團隊技術總監,打造了優酷土豆的大數據開放平臺、數據分析、數據挖掘、推薦系統等。最早服務于騰訊客戶端安全團隊做技術開發。

 

責任編輯:王雪燕 來源: 51CTO
相關推薦

2016-03-28 17:34:25

技術架構大數據51CTO

2016-03-22 10:02:23

WOT2016創業團隊大數據

2021-07-30 16:01:05

大數據技術應用

2015-03-17 10:24:38

2017-01-04 10:45:26

大數據商業銀行應用

2015-08-25 09:45:06

2020-08-30 16:29:12

數據科學團隊數據團隊CIO

2020-03-06 05:42:47

大數據隊架構工作指標

2013-10-21 10:56:48

微軟大數據中國石化

2014-08-21 09:28:04

出版社

2013-05-07 10:42:20

互聯網營銷大數據

2015-05-07 11:00:49

電信運營商大數據

2011-10-25 09:50:41

大數據

2018-06-25 11:20:18

LinuxPython大數據

2022-10-18 15:21:25

大數據管理技術數據倉庫

2024-02-20 13:16:00

大數據數據倉庫數據湖

2014-11-16 16:22:11

大數據

2017-07-17 16:06:58

大數據產品設計架構技術策略

2013-08-22 10:17:51

Google大數據業務價值

2016-02-22 11:39:27

亞馬遜AWS大數據
點贊
收藏

51CTO技術棧公眾號

国产98在线| 国产高清中文字幕| 成人福利免费在线观看| 亚洲va欧美va人人爽午夜| 精品久久中出| 一级片免费观看视频| 亚洲国产99| 日韩在线视频网| 波多野结衣视频播放| 国产精品久久久久久吹潮| 亚洲一区二区精品久久av| 欧美亚洲国产免费| www.五月天激情| 日韩黄色一级片| 国内精品久久久久伊人av | 蜜桃成人精品| 亚洲制服欧美中文字幕中文字幕| 欧美一区激情视频在线观看| 国产chinasex对白videos麻豆| 亚洲影视在线| 九九精品视频在线观看| 日韩精品电影一区二区三区| 久久久久观看| 欧美一级视频精品观看| 亚洲少妇第一页| 成人三级高清视频在线看| 亚洲欧美在线视频| 日韩国产欧美精品| 天天av天天翘| 国产精品一区二区在线播放| 国产精品三级在线| 99久久久久久久久| 中文在线不卡| 久久久久久久影院| 午夜少妇久久久久久久久| 久久精品国产www456c0m| 亚洲美女av在线播放| 日本黄色免费观看| 中文在线综合| 日韩一区二区三区av| 一级淫片在线观看| 日韩久久一区| 欧美视频精品在线| 99久久国产宗和精品1上映| 激情aⅴ欧美一区二区欲海潮| 一区二区三区日韩| 强开小嫩苞一区二区三区网站| 中文字幕在线播放| 国产精品视频一二| 三级三级久久三级久久18| 日韩一区二区三区中文字幕| aaa国产一区| 精品产品国产在线不卡| 日本人妻丰满熟妇久久久久久| 国产99一区视频免费| 国产福利一区二区三区在线观看| www.av黄色| 国产电影精品久久禁18| 成人欧美一区二区三区在线观看| 亚洲AV无码乱码国产精品牛牛 | 美女写真理伦片在线看| 久久精品亚洲麻豆av一区二区 | 一区二区三区午夜探花| 久久av资源网站| 免费又黄又爽又色的视频| 欧美一区影院| 久久久女女女女999久久| 久久亚洲成人av| 99人久久精品视频最新地址| 日本道色综合久久影院| 精品一区二三区| 精品一区二区免费| 99视频免费观看| 欧美在线 | 亚洲| 久久免费看少妇高潮| 日韩一区二区电影在线观看| 日本精品一区二区三区在线播放| 亚洲精选视频免费看| 97在线国产视频| 国产日韩电影| 欧美精品日韩一区| 欧美丰满熟妇bbb久久久| 欧美人与动xxxxz0oz| 一区二区三区美女xx视频| 成人免费视频入口| 国产精品chinese| 日韩av手机在线观看| 夜夜爽8888| 国产91精品入口| 欧美中日韩免费视频| 久久日韩视频| 欧美日韩国产中文字幕| 午夜精品久久久久久久99热影院| 66精品视频在线观看| 亚洲人成欧美中文字幕| 午夜剧场免费在线观看| 欧美中文字幕| 91久久精品国产91久久性色tv| 熟妇高潮一区二区三区| 国产精品国产三级国产普通话三级| 天天想你在线观看完整版电影免费| 天堂√8在线中文| 3atv在线一区二区三区| 亚洲精品视频大全| 91精品观看| 国产精品久久久久久久久借妻 | 国产一区二区精品丝袜| 深夜福利影院在线观看| 日本在线不卡视频| 国产丝袜不卡| 成人福利在线观看视频| 日韩欧美在线中文字幕| 日本成人在线免费观看| 欧美日韩一二三四| 51ⅴ精品国产91久久久久久| 国产乱淫av免费| 久久影院午夜论| 欧美a级免费视频| 欧洲美女精品免费观看视频| 日韩国产高清污视频在线观看| 97在线观看免费高| 免费观看在线综合色| 欧美日韩喷水| 欧美男人天堂| 亚洲电影免费观看高清完整版在线 | 亚洲中文一区二区| 99re亚洲国产精品| 给我免费播放片在线观看| 四虎国产精品免费久久5151| 一个色综合导航| 二区视频在线观看| 99精品热视频| 男人的天堂狠狠干| 风间由美一区二区av101 | 激情视频网站在线播放色 | 可以在线观看的av| 福利视频一区二区| 538国产视频| 亚洲视频成人| 久久av二区| a天堂资源在线| 精品国产在天天线2019| 久久影院一区二区| 懂色av一区二区夜夜嗨| 糖心vlog在线免费观看| 日本少妇精品亚洲第一区| 久久精品视频导航| 一级特黄特色的免费大片视频| 国产精品美女久久久久aⅴ国产馆| mm1313亚洲国产精品无码试看| 你微笑时很美电视剧整集高清不卡 | 男女全黄做爰文章| 久久精品久久99精品久久| 亚洲一区免费看| 国产精品一区二区三区www| 久久久精品国产| 精品乱子伦一区二区| 亚洲国产成人精品视频| 亚洲制服丝袜在线播放| 久久精品毛片| 中文字幕久精品免| 日本成人手机在线| 欧美亚洲国产视频小说| 国产1区2区3区在线| 欧美日韩在线观看一区二区 | 美女又爽又黄免费| 美女被久久久| 亚洲一区二区在线看| 亚洲午夜剧场| 久久久久久香蕉网| 免费在线高清av| 欧美老女人在线| 国产亚洲精久久久久久无码77777| 床上的激情91.| av免费播放网址| 欧美日韩久久精品| 97影院在线午夜| 中文字幕在线视频网站| 日韩在线欧美在线| 亚洲成人黄色片| 欧美性精品220| 亚洲天堂网av在线| 不卡的看片网站| 免费激情视频在线观看| 最新国产精品| 欧美日韩精品一区| 免费欧美网站| 日本最新高清不卡中文字幕| 麻豆影视国产在线观看| 亚洲精品久久久久久久久久久久 | 国产亚洲精品久久久久久无几年桃 | 精品国产精品自拍| 娇小11一12╳yⅹ╳毛片| 成人综合在线网站| 三级a在线观看| 亚洲青涩在线| 久久av秘一区二区三区| 日韩美女毛片| 91在线观看欧美日韩| 欧美成人黑人| 久久久久久久久久久av| www.亚洲.com| 亚洲精品成人久久| 国产模特av私拍大尺度| 色偷偷88欧美精品久久久| 国产熟女高潮视频| 91精品久久久久久粉嫩| 亚洲人成网站精品片在线观看 | 极品尤物一区二区| 久久久噜噜噜| www.av91| 久久国产电影| 欧美日韩精品免费看| 成人h动漫免费观看网站| 91精品国产综合久久香蕉922| 三妻四妾的电影电视剧在线观看| 欧美wwwxxxx| 在线视频二区| 亚洲欧美日韩网| 婷婷综合激情网| 欧美成人精精品一区二区频| 一级aaaa毛片| 欧美性色综合网| 欧美a视频在线观看| 亚洲一二三区在线观看| 亚洲熟女www一区二区三区| 国产精品毛片高清在线完整版 | 欧美黄色影院| 国产精品区一区二区三在线播放 | 久久国产麻豆精品| 任你操这里只有精品| 99国产精品私拍| 成年人网站国产| 欧美日一区二区在线观看| 中文字幕一区二区三区四区五区六区| 精品视频99| 日本一区二区三不卡| 奇米狠狠一区二区三区| 久久精品久久精品国产大片| 精品久久97| 久久精品国产一区二区三区日韩| 林ゆな中文字幕一区二区| 国产精品av一区| 激情小说一区| 久久国产精品久久| 亚洲人成亚洲精品| 欧美三级网色| 欧美一区二区三区激情视频| 日韩在线电影一区| 日韩1区2区| 一区二区三区四区免费视频| 99热精品久久| 亚洲黄色网址在线观看| 久久国产乱子伦精品| 黄网动漫久久久| 黄色在线观看国产| 91黄色小视频| 亚洲一二区视频| 6080日韩午夜伦伦午夜伦| 国产成人精品a视频| 日韩色视频在线观看| 欧美一区二区黄片| 日韩精品中文字| 国产黄在线播放| 日韩中文字幕视频在线观看| av文字幕在线观看| 久久理论片午夜琪琪电影网| 色偷偷偷在线视频播放| 国产精品第8页| 精品久久亚洲| 久草精品电影| 日韩中文在线电影| 日韩欧美猛交xxxxx无码| 午夜在线观看免费一区| 伊人影院综合在线| 国产91高潮流白浆在线麻豆| 亚洲色图14p| 国产精品久久久一区麻豆最新章节| 久久久久久福利| 一本高清dvd不卡在线观看| 91在线公开视频| 日韩成人激情在线| 1pondo在线播放免费| 欧美激情一区二区三区成人| 天天免费亚洲黑人免费| 91久久精品国产| 日韩av三区| 少妇熟女一区二区| 雨宫琴音一区二区在线| 国产视频1区2区3区| 成人动漫中文字幕| 懂色av粉嫩av浪潮av| 亚洲成人福利片| 一级片一区二区三区| 国产偷亚洲偷欧美偷精品| 免费在线观看黄色网| 国产91精品视频在线观看| 欧美三级一区| 日本欧美精品久久久| 欧美xxx在线观看| 久久午夜夜伦鲁鲁一区二区| 国产盗摄一区二区三区| 人妻精品久久久久中文| 亚洲国产你懂的| 国产免费高清视频| 国产亚洲日本欧美韩国| 五月天av在线| 操一操视频一区| 91欧美大片| 国内外免费激情视频| 成人一二三区视频| 婷婷社区五月天| 日本丶国产丶欧美色综合| 蜜臀久久精品久久久久| 久久九九国产精品怡红院| 久久天堂av| 欧美午夜精品久久久久免费视 | 好吊妞视频这里有精品| 亚洲国产精品女人| 欧美a级一区二区| 91视频免费观看网站| 午夜精品久久久久久久久| 99视频免费看| 久久精品久久久久久| 日韩高清不卡| 欧美自拍资源在线| 羞羞答答国产精品www一本| 久久人妻少妇嫩草av蜜桃| 亚洲六月丁香色婷婷综合久久| 中文字幕丰满人伦在线| 亚洲欧美日韩一区在线| 欧美电影免费观看| 久久影院理伦片| 欧美亚洲三区| 久久精品成人av| 欧美性生活大片免费观看网址| 无码精品视频一区二区三区 | 天然素人一区二区视频| 青青草原成人| 日韩在线a电影| 中文字幕第24页| 在线观看国产91| 日韩伦理在线观看| 国产在线观看精品| 天天射综合网视频| 中文字幕一区二区在线观看视频 | 一级做a爱片久久毛片| 最新的欧美黄色| 亚洲精品69| mm131午夜| 粉嫩久久99精品久久久久久夜| 久久在线视频精品| 亚洲国产另类久久精品| 国产美女高潮在线观看| 欧美激情www| 免费人成黄页网站在线一区二区| 99久久99久久精品免费看小说.| 欧美日韩在线播放三区四区| 免费黄色在线看| av在线不卡一区| 日韩亚洲国产精品| 30一40一50老女人毛片| 91黄色免费版| 日本成人在线播放| 国产精品swag| 美女国产精品| 羞羞在线观看视频| 日韩欧美成人一区二区| 亚洲最大网站| 亚洲欧洲日本国产| 国产电影精品久久禁18| 久久黄色精品视频| 中文字幕v亚洲ⅴv天堂| 久久国产精品免费一区二区三区| 日韩a级在线观看| 国产亚洲短视频| 国产情侣一区二区| 26uuu国产精品视频| 日韩国产专区| 折磨小男生性器羞耻的故事| 色一情一乱一乱一91av| 成人国产免费电影| 欧美日韩在线一区二区三区| 久久97超碰色| 在线观看中文字幕视频| 中文字幕亚洲欧美| 国产成人精品亚洲线观看| 精品久久久噜噜噜噜久久图片| 亚洲免费视频成人| 欧美中文在线| 99久久99久久| 丝袜亚洲精品中文字幕一区| 三级影片在线看| 国产亚洲免费的视频看| 97品白浆高清久久久久久| 波多野结衣作品集| 亚洲一区二区三区影院| 在线观看麻豆| 免费不卡亚洲欧美| 国产成人综合精品三级|