精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Apache Flink在唯品會的實踐

大數據
目前在唯品會實時平臺并不是一個統一的計算框架,而是包括Storm,Spark,Flink在內的三個主要計算框架。由于歷史原因,當前在Storm平臺上的job數量是最多的,但是從去年開始,業務重心逐漸切換到Flink上面,所以今年在Flink上面的應用數量有了大幅增加。

唯品會實時平臺現狀

目前在唯品會實時平臺并不是一個統一的計算框架,而是包括Storm,Spark,Flink在內的三個主要計算框架。由于歷史原因,當前在Storm平臺上的job數量是最多的,但是從去年開始,業務重心逐漸切換到Flink上面,所以今年在Flink上面的應用數量有了大幅增加。

實時平臺的核心業務包含八大部分:實時推薦作為電商的重點業務,包含多個實時特征;大促看板,包含各種維度的統計指標(例如:各種維度的訂單、UV、轉化率、漏斗等),供領導層、運營、產品決策使用;實時數據清洗,從用戶埋點收集來數據,進行實時清洗和關聯,為下游的各個業務提供更好的數據;此外還有互聯網金融、安全風控、與友商比價等業務,以及Logview、Mercury、Titan作為內部服務的監控系統、VDRC實時數據同步系統等。

Apache Flink在唯品會的實踐

實時平臺的職責主要包括實時計算平臺和實時基礎數據。實時計算平臺在Storm、Spark、Flink等計算框架的基礎上,為監控、穩定性提供了保障,為業務開發提供了數據的輸入與輸出。實時基礎數據包含對上游埋點的定義和規范化,對用戶行為數據、MySQL的Binlog日志等數據進行清洗、打寬等處理,為下游提供質量保證的數據。

在架構設計上,包括兩大數據源。一種是在App、微信、H5等應用上的埋點數據,原始數據收集后發送到在kafka中;另一種是線上實時數據的MySQL Binlog日志。數據在計算框架里面做清洗關聯,把原始的數據通過實時ETL為下游的業務應用(包括離線寬表等)提供更易于使用的數據。

Apache Flink在唯品會的實踐

Flink在唯品會的實踐

場景一:Dataeye實時看板

Dataeye實時看板是支持需要對所有的埋點數據、訂單數據等進行實時計算時,具有數據量大的特點,并且需要統計的維度有很多,例如全站、二級平臺、部類、檔期、人群、活動、時間維度等,提高了計算的復雜程度,統計的數據輸出指標每秒鐘可以達到幾十萬。

以UV計算為例,首先對Kafka內的埋點數據進行清洗,然后與Redis數據進行關聯,關聯好的數據寫入Kafka中;后續Flink計算任務消費Kafka的關聯數據。通常任務的計算結果的量也很大(由于計算維度和指標特別多,可以達到上千萬),數據輸出通過也是通過Kafka作為緩沖,最終使用同步任務同步到HBase中,作為實時數據展示。同步任務會對寫入HBase的數據限流和同類型的指標合并,保護HBase。與此同時還有另一路計算方案作為容災。 

Apache Flink在唯品會的實踐

在以Storm進行計算引擎中進行計算時,需要使用Redis作為中間狀態的存儲,而切換到Flink后,Flink自身具備狀態存儲,節省了存儲空間;由于不需要訪問Redis,也提升了性能,整體資源消耗降低到了原來的1/3。

在將計算任務從Storm逐步遷移到Flink的過程中,對兩路方案先后進行遷移,同時將計算任務和同步任務分離,緩解了數據寫入HBase的壓力。

切換到Flink后也需要對一些問題進行追蹤和改進。對于FlinkKafkaConsumer,由于業務原因對kafka中的Aotu Commit進行修改,以及對offset的設定,需要自己實現支持kafka集群切換的功能。對不帶window的state數據需要手動清理。還有計算框架的通病——數據傾斜問題需要處理。同時對于同步任務追數問題,Storm可以從Redis中取值,Flink只能等待。

場景二:Kafka數據落地HDFS

之前都是通過Spark Streaming的方式去實現,現在正在逐步切換到Flink上面,通過OrcBucketingTableSink將埋點數據落地到HDFS上的Hive表中。在Flink處理中單Task Write可達到3.5K/s左右,使用Flink后資源消耗降低了90%,同時將延遲30s降低到了3s以內。目前還在做Flink對Spark Bucket Table的支持。

場景三:實時的ETL

對于ETL處理工作而言,存在的一個痛點就是字典表存儲在HDFS中,并且是不斷變化的,而實時的數據流需要與字典表進行join。字典表的變化是由離線批處理任務引起的,目前的做法是使用ContinuousFileMonitoringFunction和ContinuousFileReaderOperator定時監聽HDFS數據變化,不斷地將新數據刷入,使用***的數據去做join實時數據。

我們計劃做更加通用的方式,去支持Hive表和Stream的join,實現Hive表數據變化之后,數據自動推送的效果。

Flink On K8S

在唯品會內部有一些不同的計算框架,有實時計算的,有機器學習的,還有離線計算的,所以需要一個統一的底層框架來進行管理,因此將Flink遷移到了K8S上。

在K8S上使用了思科的網絡組件,每個docker容器都有獨立的ip,對外也是可見的。實時平臺的融合器整體架構如下圖所示。

Apache Flink在唯品會的實踐

唯品會在K8S上的實現方案與Flink社區提供的方案差異還是很大的。唯品會使用K8S StatefulSet模式部署,內部實現了cluster相關的一些接口。一個job對應一個mini cluster,并且支持HA。對于Flink來說,使用StatefulSet的***的原因是pod的hostname是有序的;這樣潛在的好處有:

hostname為-0和-1的pod可以直接指定為jobmanager;可以使用一個statefulset啟動一個cluster,而deployment必須2個;Jobmanager和TaskManager分別獨立的deployment。

pod由于各種原因fail后,由于StatefulSet重新拉起的pod的hostname不變,集群recover的速度理論上可以比deployment更快(deployment每次主機名隨機)。 鏡像的docker entrypoint腳本里面需要設置的環境變量設置說明:

| 環境變量名稱 | 參數 | 示例內容 | 說明 | |--- |---|---|---|---| | JOB_MANGER_HOSTS | StatefulSet.name-0,StatefulSet.name-1 | flink-cluster-0,flink-cluster-1 | JM的主機名,短主機名;可以不用FQDN | | FLINK_CLUSTER_IDENT | namespace/StatefulSet.name | default/flink-cluster | 用來做zk ha設置和hdfs checkpiont的根目錄 | | TASK_MANAGER_NUMBER_OF_TASK_SLOTS | containers.resources.cpu.limits | 2 | TM的slot數量,根據resources.cpu.limits來設置 | | FLINK_ZK_QUORUM | env:FLINK_ZK_QUORUM | 10.198.199.112:2181 | HA ZK的地址 | | JOB_MANAGER_HEAP_MB | env:JOB_MANAGER_HEAP_MB value:containers.resources.memory.limit -1024 | 4096 | JM的Heap大小,由于存在堆外內存,需要小于container.resources.memory.limits;否則容易OOM kill | | TASK_MANAGER_HEAP_MB | env:TASK_MANAGER_HEAP_MB value: containers.resources.memory.limit -1024 |4096 | JM的Heap大小,由于存在堆外內存,需要小于container.resources.memory.limits;否則容易OOM kill |

對應Flink集群所依賴的HDFS等其他配置,則通過創建configmap來管理和維護。

  1. kubectl create configmap hdfs-conf --from-file=hdfs-site.xml --from-file=core-site.xml 

后續計劃

當前實時系統,機器學習平臺要處理的數據分布在各種數據存儲組件中,如Kafka、Redis、Tair和HDFS等,如何方便高效的訪問,處理,共享這些數據是一個很大的挑戰,對于當前的數據訪問和解析常常需要耗費很多的精力,主要的痛點包括:

  • 對于Kafka,Redis,Tair中的binary(PB/Avro等格式)數據,使用者無法快速直接的了解數據的schema與數據內容,采集數據內容及與寫入者的溝通成本很高。
  • 由于缺少獨立的統一數據系統服務,對Kafka,Redis,Tair等中的binary數據訪問需要依賴寫入者提供的信息,如proto生成類,數據格式wiki定義等,維護成本高,容易出錯。
  • 缺乏relational schema使得使用者無法直接基于更高效易用的SQL或LINQ層API開發業務。
  • 無法通過一個獨立的服務方便的發布和共享數據。
  • 實時數據無法直接提供給Batch SQL引擎使用。
  • 此外,對于當前大部分的數據源的訪問也缺少審計,權限管理,訪問監控,跟蹤等特性。

UDM(統一數據管理系統)包括Location Manager, Schema Metastore以及Client Proxy等模塊,主要的功能包括:

  • 提供從名字到地址的映射服務,使用者通過抽象名字而不是具體地址訪問數據。
  • 用戶可以方便的通過Web GUI界面方便的查看數據Schema,探查數據內容。
  • 提供支持審計,監控,溯源等附加功能的Client API Proxy。
  • 在Spark/Flink/Storm等框架中,以最適合使用的形式提供這些數據源的封裝。

UDM的整體架構如下圖所示:

 

Apache Flink在唯品會的實踐

UDM的使用者包括實時,機器學習以及離線平臺中數據的生產者和使用者。在使用Sql API或Table API的時候,首先完成Schema的注冊,之后使用Sql進行開發,降低了開發代碼量。

Apache Flink在唯品會的實踐

在Flink中,使用UDMExternalCatalog來打通Flink計算框架和UDM之間的橋梁,通過實現ExternalCatalog的各個接口,以及實現各自數據源的TableSourceFactory,完成Schema和接入管控等各項功能。

關于作者:王新春目前在唯品會負責實時平臺相關內容,主要包括實時計算框架和提供實時基礎數據,以及機器學習平臺的工作。之前在美團點評,也是負責大數據平臺工作。他已經在大數據實時處理方向積累了豐富的工作經驗。

責任編輯:未麗燕 來源: 李博bluemind
相關推薦

2021-05-06 11:54:40

大數據Flink

2017-03-29 10:09:44

敏捷Scrum實踐

2017-03-21 10:24:40

敏捷Scrum實踐總結

2017-03-22 09:04:21

敏捷Scrum實踐

2024-06-03 10:19:05

2016-11-10 19:10:09

唯品會雙11

2021-05-20 09:55:23

Apache Flin阿里云大數據

2022-09-16 08:23:22

Flink數據湖優化

2014-02-25 19:22:18

唯品會樂蜂網

2019-04-30 09:00:33

SQL數據庫Apache Flin

2022-04-22 09:05:12

蔚來汽車Flink實時數倉

2015-08-11 07:17:56

唯品會電商運營移動互聯網

2022-05-10 08:27:15

小紅書FlinkK8s

2025-11-18 05:00:00

2022-06-10 15:21:15

MySQL CDCSqlServer數據庫

2013-08-09 16:54:07

華為ICT華為

2023-06-07 07:27:32

唯品會冷凍系統故障

2022-04-07 16:50:28

FlinkB站Kafka

2022-07-08 09:26:45

Flink快手計算
點贊
收藏

51CTO技術棧公眾號

av动漫一区二区| 国产精品久久久一区二区| 欧美一区二区三级| 男女视频网站在线观看| 韩国中文字幕2020精品| 久久精品国产99久久6 | 亚洲欧洲久久久| 97色婷婷成人综合在线观看| 天天影视涩香欲综合网| 一区二区免费在线视频| 秋霞欧美在线观看| 国精产品一区一区三区mba桃花| 国内精品久久影院| 国产福利在线导航| 日本天堂一区| 欧美一级夜夜爽| 三年中国国语在线播放免费| 538在线精品| 中文字幕制服丝袜成人av| 国内外成人免费视频| 国产露脸91国语对白| 亚洲欧美日韩专区| 久久免费高清视频| 久久久久久久麻豆| 成人3d动漫在线观看| 日韩成人高清在线| 亚洲最大视频网| 亚洲成人精品综合在线| 色菇凉天天综合网| 97在线国产视频| 91国内在线| 国产精品国产自产拍在线| 欧美日韩在线观看一区| 日韩在线视频观看免费| 国产成人一区在线| 7777精品伊人久久久大香线蕉超级流畅 | 中文字幕日韩精品一区 | 色视频免费在线观看| 国产成人a级片| 91久久精品国产91性色| 波多野结衣视频观看| 亚洲一区免费| 97超级碰在线看视频免费在线看| 亚洲天堂黄色片| 久久国产成人午夜av影院宅| 亚洲一级片在线看| 免费黄色在线视频| 伊人成综合网yiren22| 亚洲第一av在线| fc2成人免费视频| 成人资源在线| 亚洲黄色www网站| 免费不卡的av| 偷拍亚洲精品| 精品视频在线播放色网色视频| 亚洲国产精品无码久久久久高潮| 日韩伦理在线| 中文一区一区三区高中清不卡| 欧美成熟毛茸茸复古| 欧美婷婷久久五月精品三区| 97精品久久久久中文字幕| 国产视频一区二区三区四区| 人人妻人人澡人人爽久久av| av亚洲精华国产精华精华| 久久久久欧美| 久久99久久| 国产精品天干天干在线综合| 亚洲一区二区在线看| 黄色av电影在线观看| 一区二区三区色| 九一国产精品视频| 欧美大片高清| 亚洲国产日韩a在线播放性色| 日本wwwcom| 伊人久久精品一区二区三区| 欧美性感一区二区三区| 亚洲18在线看污www麻豆| a级大胆欧美人体大胆666| 亚洲一区二区在线播放相泽| 国产成人无码精品久久久性色| 美女100%一区| 欧美日韩黄色一区二区| 久久久国产精品久久久| 欧美男男freegayvideosroom| 亚洲热线99精品视频| 天堂网中文在线观看| 国产精品99免费看| 日本亚洲欧美成人| 91丨porny丨在线中文 | 亚洲人永久免费| 欧美xxxx精品| 亚洲视频狠狠| 国产精品久久久久aaaa九色| 亚洲成人av综合| 国产亚洲综合在线| 9191国产视频| 视频在线日韩| 精品久久人人做人人爰| 欧美激情亚洲色图| 黄色亚洲大片免费在线观看| 国产精品男人的天堂| 一级片中文字幕| 美国十次了思思久久精品导航| 成人自拍爱视频| a中文在线播放| 亚洲国产精品人人做人人爽| av网站在线不卡| 久久夜色精品国产噜噜av小说| 深夜福利日韩在线看| 日韩在线观看第一页| 久久国产尿小便嘘嘘| 国产一区二区无遮挡| 国产精品久久久久久福利| 黑人狂躁日本妞一区二区三区 | 波多野结衣亚洲一区| 92国产精品视频| 男女av在线| 亚洲香肠在线观看| 国内自拍第二页| 国产欧美日韩一区二区三区四区| 久久久久久亚洲精品| 国产精品久久影视| 日本一区二区综合亚洲| 男女高潮又爽又黄又无遮挡| 澳门成人av| 久久视频免费在线播放| 尤物在线免费视频| 欧美在线免费| 国产精品视频精品| 天堂中文在线8| 亚洲国产综合人成综合网站| 日韩精品aaa| 97精品国产一区二区三区 | 国产 国语对白 露脸| 色综合久久久| 日韩中文视频免费在线观看| 波多野结衣一二区| 久久久亚洲午夜电影| 国产一区二区视频播放| 超碰cao国产精品一区二区| 久久成人综合视频| 欧美做爰啪啪xxxⅹ性| 天堂久久一区二区三区| 国产在线观看精品一区二区三区| 九九在线视频| 91久久精品国产91性色tv| 国产精品无码一区二区三区免费| 99在线精品免费视频九九视| 国产精品mp4| 97免费观看视频| 国产精品毛片高清在线完整版| 成人在线免费观看网址| 免费一级欧美在线观看视频| 精品美女在线播放| 久久久精品视频免费| 成人丝袜18视频在线观看| 欧洲亚洲一区二区三区四区五区| 周于希免费高清在线观看| 亚洲精品美女视频| 日韩欧美成人一区二区三区| 精品午夜久久福利影院| 26uuu成人| 国产一区二区视频在线看 | 欧美aa在线| 亚洲毛片在线免费观看| jizz国产在线观看| 国产精品乱码一区二区三区软件 | 九色丨蝌蚪丨成人| 2019中文字幕在线观看| h视频在线免费| 91精品蜜臀在线一区尤物| 九九视频免费看| www.66久久| 日本久久久久久久久久久久| 久久中文字幕av一区二区不卡| 亚洲字幕在线观看| 国产理论在线| 色综合伊人色综合网| 国产视频在线观看免费 | 日韩三级一区二区| 国产精品福利一区二区三区| 少妇丰满尤物大尺度写真| 亚洲综合国产| 国产av不卡一区二区| 粉嫩av一区二区| 国产精品久久久久久亚洲调教| 在线观看三级视频| 国产偷亚洲偷欧美偷精品| 91在线观看喷潮| 午夜国产精品影院在线观看| 精品日韩在线视频| 成人免费视频播放| 污污动漫在线观看| 日韩极品在线| 91精品国产自产在线| 3344国产永久在线观看视频| 国产午夜精品免费一区二区三区 | 久久国产手机看片| 久久精品女人天堂av免费观看| 另类视频在线观看| 午夜影院免费体验区| 欧美日本免费一区二区三区| 亚洲国产精品午夜在线观看| 国产精品电影院| 人妻在线日韩免费视频| 国产一本一道久久香蕉| 国产成人精品视频免费看| 亚洲精品国产偷自在线观看| 国产精品免费在线免费 | 女人天堂在线| 日韩一区二区三区在线| 波多野结衣在线网址| 91小视频免费观看| 国产伦精品一区二区三区妓女下载 | 国产淫片av片久久久久久| 午夜精品国产| 国产精品h视频| 欧美老女人另类| 久久久av水蜜桃| 成人精品毛片| 91最新国产视频| 九九九精品视频| 国产精品扒开腿做| 久九九久频精品短视频| 韩国三级电影久久久久久| 色噜噜狠狠狠综合欧洲色8| 日韩中文字幕国产精品| 麻豆导航在线观看| 日韩精品视频免费在线观看| 亚洲精品视频91| 日韩一区二区三区av| 一区二区久久精品66国产精品| 色哟哟国产精品| 亚洲一级理论片| 久久久久久久久久久久久久久99 | 久久悠悠精品综合网| 91精品视频网站| 国产aⅴ精品一区二区四区| 国产精品自拍视频| 欧美激情三区| 国产精品一区二区三区在线播放| 国产69精品久久久久按摩| 日韩av快播网址| 电影一区二区| 国产精品无码专区在线观看| 久久久国产精品网站| 国产精品综合久久久| 久久久加勒比| 96pao国产成视频永久免费| 精品精品视频| 国产91精品高潮白浆喷水| jizz一区二区三区| 久久久久久久久久久免费| 白浆在线视频| 欧美一级片在线播放| 日韩av中字| 国产欧美精品日韩| 国产精品白丝久久av网站| www.久久久| 国产综合色在线观看| 国产精品香蕉在线观看| 五月天色综合| 国产精品二区在线| 日韩av黄色在线| 日韩欧美一区二区在线观看| 我不卡伦不卡影院| 性一交一乱一伧国产女士spa| 亚洲青涩在线| 男人插女人下面免费视频| 久久成人麻豆午夜电影| 性色av浪潮av| 91年精品国产| 亚洲欧美日韩第一页| 一区二区三区资源| 影音先锋亚洲天堂| 欧美视频中文字幕| 午夜精品一二三区| 亚洲欧洲在线免费| 在线播放蜜桃麻豆| 欧美有码在线观看视频| www999久久| 狠狠爱一区二区三区| 欧美日韩一区二区综合| 日韩视频 中文字幕| 亚洲综合国产激情另类一区| 日本高清一区二区视频| 不卡电影一区二区三区| 欧美成人短视频| 亚洲成av人在线观看| 亚洲一区在线观| 亚洲国产精久久久久久| 淫片在线观看| 欧美野外猛男的大粗鳮| 亚洲福利影视| 免费试看一区| 欧美日本一区| 爱爱爱爱免费视频| 91在线视频免费观看| 欧美xxxx黑人xyx性爽| 欧美日韩另类视频| 精品国产无码AV| 一区二区三区无码高清视频| 搞黄网站在线看| 国产精品色悠悠| 色狠狠久久av综合| 超级碰在线观看| 男男成人高潮片免费网站| 北条麻妃在线一区| 国产91高潮流白浆在线麻豆| 成年人看的免费视频| 欧美日韩一区二区在线| 午夜精品久久久久久久99热黄桃 | 国产精品香蕉一区二区三区| av女人的天堂| 午夜欧美视频在线观看| av片免费播放| 俺也去精品视频在线观看| 蜜臀国产一区| 欧美大陆一区二区| 国产欧美亚洲一区| 无码人妻一区二区三区免费n鬼沢| 亚洲欧洲日本在线| 亚洲在线精品视频| 伊人久久男人天堂| 欧美xxx性| 欧美视频1区| 裸体一区二区| 午夜激情福利在线| 91亚洲大成网污www| 自拍偷拍欧美亚洲| 精品福利视频一区二区三区| 影音先锋男人在线资源| 亚洲iv一区二区三区| 天天综合一区| 亚洲精品综合在线观看| 国产精品国产三级国产有无不卡 | 国内精品伊人| 亚洲草草视频| 奇米精品一区二区三区四区| www.av天天| 在线观看日产精品| 欧美精品少妇| 国产精品电影一区| 国内精品视频在线观看| 天天视频天天爽| 日本一二三四高清不卡| 又污又黄的网站| 精品国产美女在线| 欧美久久亚洲| 欧美视频在线第一页| 成人av电影在线观看| 天堂中文字幕在线观看| 亚洲免费精彩视频| 91看片一区| 亚洲一卡二卡区| 国产剧情一区二区| 国产精品9191| 精品视频中文字幕| 午夜激情成人网| 一区二区成人国产精品 | 精品丰满少妇一区二区三区| 欧美精品18+| 日本在线观看高清完整版| 国产伦精品一区二区三区免| 亚洲欧美卡通另类91av| 九九九视频在线观看| 7878成人国产在线观看| 欧美人与性动交α欧美精品图片| 国产精品国色综合久久| 西西人体一区二区| 亚洲激情图片网| 亚洲成av人乱码色午夜| 成人性生交大片免费观看网站| 亚洲精品一区二| 成人午夜精品在线| 黄色av网站免费观看| 久久精品国产久精国产思思| 99精品中文字幕在线不卡| 国产精品亚洲αv天堂无码| 国产精品私房写真福利视频| www.精品久久| 国产xxx69麻豆国语对白| 天天综合精品| 91网站免费视频| 欧美一级在线视频| 朝桐光一区二区| 国产精品igao激情视频| 2022国产精品视频| 国产激情无套内精对白视频| 国产91精品久久久久| 欧美/亚洲一区| 男人操女人动态图| 精品国内片67194| 日韩欧美2区| 免费在线观看亚洲视频| 最新热久久免费视频| 免费黄色在线视频网站| 91免费观看| 精品一区二区三区免费播放 | 欧美精品在线一区二区|