精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于Apache Flink的實時計算引擎Blink在阿里搜索中的應用

大數據
Apache Flink®就是一種這樣的技術,阿里巴巴正在使用基于Flink的系統Blink來為搜索基礎架構的關鍵模塊提供支持,最終為用戶提供相關和準確的搜索結果。在這篇文章中,我將介紹Flink在阿里巴巴搜索中的應用,并介紹我們選擇在搜索基礎架構團隊中使用Flink的原因。

[[180070]]

阿里巴巴是世界上***的電子商務零售商。 我們在2015年的年銷售額總計3940億美元,超過eBay和亞馬遜之和。阿里巴巴搜索(個性化搜索和推薦平臺)是客戶的關鍵入口,并承載了大部分在線收入,因此搜索基礎架構團隊需要不斷探索新技術來改進產品。

在電子商務網站應用場景中,什么能造就一個強大的搜索引擎?答案就是盡可能的為每個用戶提供實時相關和準確的結果。同樣一個不容忽視的問題就是阿里巴巴的規模,當前很難找到能夠適合我們的技術。

Apache Flink®就是一種這樣的技術,阿里巴巴正在使用基于Flink的系統Blink來為搜索基礎架構的關鍵模塊提供支持,最終為用戶提供相關和準確的搜索結果。在這篇文章中,我將介紹Flink在阿里巴巴搜索中的應用,并介紹我們選擇在搜索基礎架構團隊中使用Flink的原因。

我還將討論如何改進Flink以滿足我們對Blink的獨特需求,以及我們如何與data Artisans和Flink社區合作,將這些更改貢獻給Flink社區。一旦成功地將我們的修改合并到開源項目中,我們會將現有系統從Blink轉移到Apache Flink。

Part 1: Flink在阿里巴巴搜索中的應用

文檔創建

為用戶提供***搜索引擎的***步是創建可供搜索的文檔。在阿里巴巴的應用場景中,文檔是由數百萬個商品列表和相關的商品數據組成。

因為商品數據存儲在許多不同的地方,所以搜索文檔創建也是一個很大的挑戰,搜索基礎架構團隊將商品相關的所有信息匯總在一起并創建完整的搜索文檔。一般來說,整個過程分為3個階段:

  1. 將不同來源(例如MySQL,分布式文件系統)的所有商品數據同步到一個HBase集群中。
  2. 使用業務邏輯將來自不同表的數據連接在一起,以創建最終的可搜索文檔。這是一個HBase表,我們稱之為'Result'表。
  3. 將此HBase表導出為文件作為更新集合。 

 

 

 

這3個階段實際上是在經典的“lambda架構”中的2個不同的pipeline上運行:全量構建pipeline和增量構建pipeline。

  • 在全量構建pipeline中,我們需要處理所有數據源,這通常是一個批處理作業。
  • 在增量構建pipeline中,我們需要處理在批處理作業完成后發生的更新。例如,賣家可能修改商品價格或商品描述以及庫存量的變化。這些信息需要盡可能快的反饋在搜索結果中。增量構建pipeline通常是一個流式作業。

搜索算法實時A/B測試

我們的工程師會定期測試不同的搜索算法,并且需要盡可能快地評估出效果。現在這種評估每天運行一次,因為想實時分析效果,所以我們使用Blink構建了一個實時A/B測試框架。

在線日志(展示,點擊,交易)由解析器和過濾器收集和處理,然后使用業務邏輯連接在一起。接下來聚合數據,將聚合結果推送到Druid,在Druid內部,我們可以編寫查詢語句并對數據執行復雜的OLAP分析,并查看不同算法的效果。 

 

 

 

在線機器學習

在這部分中Flink有兩個應用場景。首先,我們來討論它在商品特征實時更新中的應用。阿里巴巴搜索排序中使用的一些商品特征包括商品CTR,商品庫存和商品點擊總數。這些數據隨時間而變化,如果可以使用***的數據,我們就能為用戶提供更相關的搜索結果排序。Flink pipeline為我們提供在線特征更新,并大大提高了轉化率。

其次,每年的特定日子(如光棍節),有些商品折扣力度很大,有時甚至高達50%。因此,用戶行為也會發生很大的變化。交易量巨大,通常比我們在平時看到的高出很多倍。以前訓練的模型在這個場景作用有限,因此我們使用日志和Flink流式作業構建了在線機器學習模型,這個模型會將實時用戶行為數據反饋到系統中。結果在這些不常見但非常重要的營銷節日的轉換率有了很大的提升。 

 

 

 

Part 2: 選擇一個框架來解決問題

選擇Flink應用到搜索基礎架構中,我們在四個方面做過評估。 Flink在四個方面都滿足我們的要求。

  • 敏捷: 我們期望能夠為整個(2個pipeline)搜索基礎架構流程維護一套代碼,因此需要一個高級的API來滿足我們的業務邏輯。
  • 一致性: 賣方或商品數據庫發生的變化必須反饋在最終搜索結果中,因此搜索基礎架構團隊需要至少處理一次(at-least-once)的語義(對于公司中的一些其他Flink用例,要求正好一次(exactly-once)語義)。
  • 低延遲: 當商品庫存量發生變化時,必須盡快在搜索結果中得到體現。例如我們不想給售罄的商品給出很高的搜索排名。
  • 成本: 阿里巴巴需要處理大量數據,以我們的集群規模,效率提高可以顯著的降低成本。因此我們需要一個高性能、高吞吐量的框架。

一般來說,有兩種方法來將批處理和流式處理統一起來。一種方法是將批處理作為基本出發點,在批處理框架上支持流式處理。這可能不符合真正意義上低延遲,因為用微批量處理(micro-batching)模擬流式處理需要一些固定的開銷。因此,當試圖減少延遲時,開銷的比例也會相應增加。在我們的規模上,為每個微批量處理器調度1000個任務,需要重新建立連接并重新加載狀態。因此在某種程度上,微批處理方法代價太高將變得沒有意義。

Flink從另一個角度來解決這個問題,即將流式處理作為基本出發點,在流式處理框架上支持批量處理,將批處理作為流式處理的一種特殊情況。使用這種方法,不會丟掉我們在批處理模式(批處理模式下流是有限的)下做出的優化,你仍然可以做一些批量處理上的優化。

Part 3: Blink是什么?

Blink是Flink的一個分支版本,我們做了一定的改進以滿足阿里巴巴的一些特定需求。因此,Blink在幾個不同的集群上運行,每個集群有大約1000臺機器,大規模集群的性能對我們來說非常重要。

Blink的改進主要包括兩個方面:

Table API更完整,因此我們可以使用相同的SQL進行批處理和流式處理。

更強大的YARN模式,但仍然100%兼容Flink的API和更廣泛的生態系統。

Table API

我們首先添加了對用戶自定義函數UDF的支持,方便在Flink中實現獨特的業務邏輯。我們還添加了一個流對流的join的功能,由于Flink對于狀態比較好的支持,所以實現起來比較容易。我們添加了幾個聚合函數以及滑動窗口的支持,最有趣的一個是distinct_count。

(編輯注:FLIP-11涵蓋了與上述功能相關的一系列Table API和SQL改進,對該主題感興趣的可以閱讀) 

 

 

 

接下來,我們將介紹運行時改進,可以分為四個不同的類別。

Yarn上的Blink

當我們開始項目時,Flink支持2種集群模式:standalone模式和YARN上的Flink。在YARN模式中,作業不能動態請求和釋放資源,而是需要預先分配所有需要的資源。不同的作業可能共享相同的JVM進程,這有利于資源利用和資源隔離。

Blink中每個作業都有自己的JobMaster,以根據作業需要請求和釋放資源。并且不同的作業不能在同一個Java進程中運行,這將在作業和任務之間得到***隔離。阿里巴巴團隊目前正在與Flink社區合作,將這項工作貢獻給開放源代碼,改進工作在FLIP-6(除了YARN之外還擴展到其他集群管理器)中得到了體現。 

 

 

 

Operator縮放

在生產環境中,我們的客戶端可能需要改變Operator的并行性,但同時他們不想失去當前狀態。當我們開始使用Blink時,Flink不支持在保持狀態的同時改變Operator的并行性。Blink引入了“bucket”的概念作為狀態管理的基本單位。有比任務更多的bucket,并且每個任務將被分配多個bucket。當并行性改變時,我們將重新分配任務的bucket。 使用這種方法,可以改變Operator的并行性并維持狀態。

(編者注:Flink社區同時在Flink 1.2版本中解決了的這個問題 - 該功能在***版本的主分支中可用。Flink的“key groups”概念在很大程度上等同于上面提到的“bucket”,但是實現時使用的數據結構略有不同。更多信息,請在Jira查看FLIR-3755) 

 

 

 

增量Checkpoint

在Flink中,Checkpoint操作分為兩個階段:在本地獲取狀態快照,然后將狀態快照保存到HDFS(或另一個存儲系統),并且每個快照的整個狀態存儲在HDFS中。我們的狀態數據太大了,這種方法是不可行的,所以Blink只存儲修改的狀態在HDFS中,這能夠大大提高Checkpoint的效率。這種修改使我們能夠在生產環境中使用很大的狀態數據。 

 

 

 

異步I/O

我們的job在生產環境中很大瓶頸在訪問外部存儲器上,如HBase。為了解決這個問題,我們引入了異步I/O,我們將致力于為社區做出貢獻,并在FLIP-12中有詳細描述。

(編輯筆記:data Artisans認為FLIP-12足夠強大,可以在不久的將來在某個時間擁有自己的獨立寫入。所以我們只是簡單地介紹一下這里的想法,如果你想了解更多,可以查看FLIP writeup) 

 

 

 

 

Part 4: 阿里巴巴的Flink未來計劃是什么?

我們將繼續優化我們的流式job,特別是更好地處理臨時傾斜(temporary skew)和慢節點(slow machines),同時不會對反壓機制(backpressure)和故障快速恢復造成影響。正如在Flink Forward大會上大家討論的,我們認為Flink作為批處理框架以及流式處理框架有著巨大潛力。我們正在努力利用Flink的批處理能力,希望在幾個月內在生產環境中使用Flink批處理模式。

會議的另一個熱門話題是流式SQL,我們將繼續在Flink中添加更多的SQL支持和Table API的支持。阿里巴巴的業務持續增長,這意味著我們的job會越來越大,確保我們可以擴展到更大的集群變得越來越重要。

非常重要的是,我們期待與社區繼續合作,以便將我們的工作貢獻回開源社區,以便所有Flink用戶都能從我們加入Blink的工作中受益。我們期待著在2017年Flink Forward大會上向您介紹我們的進展情況。

責任編輯:龐桂玉 來源: 大數據雜談
相關推薦

2021-03-10 08:22:47

FlinktopN計算

2021-06-06 13:10:12

FlinkPvUv

2013-08-04 21:02:59

實時計算存儲阿里巴巴和仲

2017-05-22 08:05:46

HBase阿里搜索實踐

2020-09-10 17:41:14

ClickHouse數據引擎

2018-01-26 16:28:24

阿里Blink核心

2018-01-25 12:01:08

阿里巴巴機器學習大數據

2022-04-22 09:05:12

蔚來汽車Flink實時數倉

2017-09-26 09:35:22

2015-10-09 13:42:26

hbase實時計算

2017-01-15 13:45:20

Docker大數據京東

2015-08-31 14:27:52

2022-08-10 09:02:03

風控Flink阿里云

2021-07-16 10:55:45

數倉一體Flink SQL

2022-11-10 08:48:20

開源數據湖Arctic

2019-02-15 15:41:11

代碼開發技術

2019-04-30 09:00:33

SQL數據庫Apache Flin

2019-02-14 09:04:55

阿里開源Blink

2017-09-14 12:12:52

Go大數據引擎

2022-12-29 09:13:02

實時計算平臺
點贊
收藏

51CTO技術棧公眾號

中文字幕电影一区| 日韩电影在线观看电影| 亚洲精品狠狠操| 白嫩少妇丰满一区二区| 日本中文字幕在线视频| 丁香天五香天堂综合| 日本精品免费一区二区三区| 99鲁鲁精品一区二区三区| 国产成人一二片| 欧美性xxxxx极品少妇| 国产精品久久久久久久久电影网| 久久国产精品高清一区二区三区| 精品一区二区三区影院在线午夜| 久久久久久久久久久免费 | 无码无遮挡又大又爽又黄的视频| 免费大片在线观看www| 91偷拍与自偷拍精品| 96pao国产成视频永久免费| 国产九色在线播放九色| 女人色偷偷aa久久天堂| 一区二区三区无码高清视频| 一二三区视频在线观看| 欧美日韩亚洲国产| 亚洲va欧美va人人爽| 一区二区三区四区| 三区在线观看| 成人成人成人在线视频| 成人精品久久av网站| 亚洲黄网在线观看| 在线免费高清一区二区三区| 久久人人爽人人爽人人片亚洲| 亚洲熟妇一区二区三区| 大桥未久女教师av一区二区| 91精品国产综合久久福利软件| 中文字幕无码不卡免费视频| 大黄网站在线观看| 亚洲综合色噜噜狠狠| 伊人久久青草| 成年人视频免费在线观看| 久久日韩粉嫩一区二区三区| 国产午夜精品在线| 亚洲黄色精品视频| 国产精品亚洲人在线观看| 国产在线观看91精品一区| japanese国产在线观看| 久久久久99| 国产91精品网站| 亚洲va在线观看| 亚洲综合丁香| 日韩av免费在线看| 9i看片成人免费看片| 国产精品亚洲综合色区韩国| 韩剧1988免费观看全集| 国产精品白浆一区二小说| 欧美在线三级| 美女精品视频一区| 看片网站在线观看| 欧美精品三区| 久久久久久久久久久久av| 国产五月天婷婷| 99亚洲精品| 欧美一级黑人aaaaaaa做受| 亚洲久久在线观看| 视频一区国产视频| 国产精品久久久久免费a∨大胸| 亚洲午夜无码久久久久| 看片的网站亚洲| 91色在线视频| 亚洲免费视频网| aaa亚洲精品一二三区| 久久精品magnetxturnbtih| 欧美日韩在线中文字幕| 欧美极品少妇xxxxⅹ高跟鞋| 天天干天天操天天干天天操| 怡红院在线播放| 亚洲1区2区3区视频| aa在线免费观看| 视频精品导航| 日韩一区二区在线免费观看| 91精品又粗又猛又爽| 色婷婷狠狠五月综合天色拍| 亚洲午夜小视频| 亚洲 欧美 变态 另类 综合| 合欧美一区二区三区| 欧美在线视频播放| 亚洲一级特黄毛片| 成人黄色a**站在线观看| 乱一区二区三区在线播放| av资源在线观看免费高清| 亚洲欧美日本在线| 18岁网站在线观看| 欧美成a人片免费观看久久五月天| 欧美一级在线视频| aaaaaav| 秋霞欧美视频| 97国产一区二区精品久久呦| 亚洲av无码乱码国产精品fc2| 国产一区二区h| 蜜桃av噜噜一区二区三| www免费在线观看| 欧美日韩视频免费播放| 激情在线观看视频| 校花撩起jk露出白色内裤国产精品| 中文字幕欧美日韩精品| 日韩乱码在线观看| 久久国产精品区| 久久99精品久久久久久青青日本| 99精彩视频在线观看免费| 国产精品九九九九九| 日韩精品诱惑一区?区三区| 欧美老肥婆性猛交视频| 国产免费一区二区三区四区五区| 国内精品久久久久影院薰衣草 | 国产成人精品av在线观| 久久久久久久久久久久久女国产乱| 精品久久免费观看| 欧美日韩在线精品一区二区三区激情综合| 777a∨成人精品桃花网| 偷拍夫妻性生活| 亚洲国内欧美| 3d精品h动漫啪啪一区二区| 福利片在线观看| 黑人极品videos精品欧美裸| 国产精品嫩草影视| 久久精品不卡| 国产99久久精品一区二区永久免费| 丰满人妻一区二区三区免费视频| 国产精品久久久久婷婷| aⅴ在线免费观看| 日本成人7777| 午夜精品一区二区三区在线视 | 91视频国产资源| 成人黄色大片网站| 国产一区一区| 久久久成人精品| 中文字幕日韩三级| 国产日韩精品一区二区浪潮av | 日韩精品亚洲视频| 国产精品99精品无码视| 丁香另类激情小说| 91亚洲精品国产| 一区二区三区四区视频免费观看 | 精品久久国产字幕高潮| 成年人一级黄色片| 国产美女精品人人做人人爽| 在线免费观看成人网| 国产精品伦一区二区| 在线看片第一页欧美| 一级特黄免费视频| 久久久久久久久久久黄色| 18岁网站在线观看| 九九视频精品全部免费播放| 欧美一级视频免费在线观看| 日本五码在线| 色菇凉天天综合网| 天天摸日日摸狠狠添| 蜜桃av一区二区| 亚洲欧洲日本国产| 精品国产伦一区二区三区观看说明| 久久精品国产清自在天天线| 国产不卡av在线播放| 亚洲一区在线播放| 中国极品少妇videossexhd| 日韩视频二区| 青青影院一区二区三区四区| xxxxx.日韩| 久久精品国产91精品亚洲 | 国产精品538一区二区在线| 久久久99精品视频| 福利在线一区| 日本久久精品视频| 日本高清视频在线播放| 日韩视频免费直播| 日韩av在线播| 国产欧美久久久精品影院| 国产成人美女视频| 精品成人一区| 色一情一乱一伦一区二区三区| 欧美成人免费全部网站| 欧美激情视频免费观看| 色视频精品视频在线观看| 欧美日韩国产bt| 国产性生活网站| 久久久不卡影院| 国产欧美激情视频| 在线综合亚洲| 91手机视频在线| 亚洲毛片免费看| 成人美女av在线直播| 国产免费拔擦拔擦8x高清在线人| 亚洲人成电影网站色| 国产精品污视频| 欧美日韩一二三四五区| 国产免费美女视频| 91在线视频网址| www.午夜av| 免费国产自线拍一欧美视频| 艳母动漫在线观看| 亚洲资源网你懂的| 91传媒视频免费| 亚洲综合在线电影| 国模精品视频一区二区| 高清福利在线观看| 日韩电影免费在线观看中文字幕| 国产一区二区自拍视频| 欧美性猛交xxxxx水多| 欧美片一区二区| 中文字幕亚洲成人| 玖玖爱在线观看| 国产91精品免费| 色乱码一区二区三区在线| 亚洲久久一区| 91看片淫黄大片91| 日韩欧美字幕| 欧美在线视频二区| 国产图片一区| 亚洲一区二区三区久久| 欧美日韩亚洲国产| 欧美亚洲一级片| 青草青在线视频| 欧美成人激情视频| 午夜不卡视频| 中文字幕国产精品| 免费在线性爱视频| 日韩极品精品视频免费观看| www.热久久| 在线综合+亚洲+欧美中文字幕| 草莓视频18免费观看| 午夜久久久久久久久久一区二区| 日韩欧美123区| 国产精品久久久久久妇女6080 | 色婷婷一区二区三区在线观看| 男女av一区三区二区色多| 亚洲熟妇无码av在线播放| 亚洲色图插插| 久久精品国产精品亚洲精品色 | 99在线免费视频观看| 午夜视频一区| 国产精品视频网站在线观看 | 国产精品12345| 国一区二区在线观看| 欧洲精品在线播放| 红桃视频国产精品| 国产在线播放观看| 99视频一区| 国产裸体舞一区二区三区| 久久都是精品| 一区二区三区国产免费| 青青国产91久久久久久| 久热精品在线观看视频| 激情小说亚洲一区| 性生生活大片免费看视频| 国产在线播放一区三区四| 一级黄色大片儿| 国产精品一二三区| 妖精视频一区二区| 99久久国产综合色|国产精品| 国产伦精品一区二区三区妓女| 91一区二区在线观看| 欧洲美一区二区三区亚洲| 中文字幕巨乱亚洲| 四虎影院中文字幕| 亚洲国产日韩一级| 五月天激情国产综合婷婷婷| 色悠久久久久综合欧美99| 成人黄色三级视频| 欧美一区二区视频观看视频| 亚洲国产精品国自产拍久久| 亚洲国产欧美久久| 国产网站在线播放| 久久亚洲精品成人| 免费污视频在线观看| 97高清免费视频| 国产私拍福利精品视频二区| 成人免费福利在线| 国产图片一区| 五月天丁香综合久久国产| 中文字幕亚洲精品乱码| 亚洲 高清 成人 动漫| 蜜臀久久久久久久| 农村末发育av片一区二区 | 精品国产第一区二区三区观看体验 | 白白色免费视频| 亚洲三级视频在线观看| www日韩精品| 欧美日韩精品电影| 手机av免费在线观看| 中文字幕一区电影| 成人免费网站观看| 国产精品视频免费观看www| www.丝袜精品| 亚洲成人一区二区三区| 亚洲精选在线| 肉色超薄丝袜脚交| 久久精品亚洲一区二区三区浴池| 男人操女人的视频网站| 欧美性极品xxxx做受| 成 人 黄 色 片 在线播放| 亚洲人成在线免费观看| 在线免费观看亚洲视频| 亚洲大尺度视频在线观看| 波多野结衣小视频| 精品91自产拍在线观看一区| 成年人视频在线看| 午夜精品理论片| 国产美女视频一区二区| 欧洲av一区| 在线精品福利| 91在线第一页| 国产日韩高清在线| 日本在线观看视频网站| 欧美精品 日韩| 高清美女视频一区| 青草青草久热精品视频在线网站| 免费看日产一区二区三区| 日韩免费电影一区二区| 一区二区三区国产盗摄| 美女流白浆视频| 亚洲免费在线观看视频| 自拍偷拍色综合| 精品视频在线观看日韩| 2021天堂中文幕一二区在线观| 成人午夜黄色影院| 欧美xxav| 成人性生生活性生交12| 91视频在线观看免费| 男人的天堂一区二区| 欧美mv和日韩mv国产网站| 国产原创精品视频| 国产综合视频在线观看| 日本精品三区| 国产精品乱码久久久久| 91丨国产丨九色丨pron| 91精品国产乱码久久久张津瑜 | 亚洲激情在线观看视频| 久久影院午夜片一区| 九九热在线免费观看| 亚洲国产精品久久久久秋霞蜜臀 | 国产精品边吃奶边做爽| 亚洲大尺度视频在线观看| 手机在线不卡av| 97精品欧美一区二区三区| 高潮按摩久久久久久av免费| 黄色一级片在线看| 成人av网址在线观看| 日操夜操天天操| 精品视频久久久久久| 在线中文字幕播放| 日本免费一区二区三区| 天堂蜜桃91精品| 综合 欧美 亚洲日本| 欧美人伦禁忌dvd放荡欲情| 调教视频免费在线观看| 91麻豆国产语对白在线观看| 在线电影一区二区| 久久久无码人妻精品无码| 亚洲成a人片在线观看中文| 天天操天天干天天舔| 清纯唯美日韩制服另类| 成人在线免费观看91| 天堂av8在线| 亚洲精品日韩专区silk| 日韩一级免费视频| 欧美在线一区二区视频| 欧美日韩一区二区三区视频播放| 亚洲77777| 一区二区三区加勒比av| 五月婷婷丁香花| 国产精品91在线| 1024精品久久久久久久久| 女女调教被c哭捆绑喷水百合| 韩曰欧美视频免费观看| 99riav在线| 国产经典一区二区三区| 久久精品男女| 希岛爱理中文字幕| 亚洲国产一区自拍| 国产成人久久精品麻豆二区| 色呦呦网站入口| 91网站最新网址| 国产乱叫456在线| 91精品国产91久久久久| 国产欧美日韩在线观看视频| 午夜不卡福利视频| 精品日韩美女的视频高清 | 欧美激情精品久久久久久黑人| 亚洲宅男网av| 一区二区在线免费观看视频| 日韩欧美亚洲一二三区| 老司机精品视频在线观看6| 国内不卡一区二区三区| 免费xxxx性欧美18vr| 粉嫩aⅴ一区二区三区| 日韩在线观看免费| 亚洲日本三级| 伊人av在线播放| 日本道在线观看一区二区| 污网站在线免费看| 日韩欧美在线观看强乱免费| www.欧美亚洲|