精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

解析Spark在騰訊、雅虎、優酷的成功應用

數據庫 Spark
Spark作為Apache頂級的開源項目,項目主頁見http://spark.apache.org。在迭代計算,交互式查詢計算以及批量流計算方面都有相關的子項目,如Shark、Spark Streaming、MLbase、GraphX、SparkR等。從13年起Spark開始舉行了自已的Spark Summit會議,會議網址見http://spark-summit.org。Amplab實驗室單獨成立了獨立公司Databricks來支持Spark的研發。

為了滿足挖掘分析與交互式實時查詢的計算需求,騰訊大數據使用了Spark平臺來支持挖掘分析類計算、交互式實時查詢計算以及允許誤差范圍的快速查詢計算,目前騰訊大數據擁有超過200臺的Spark集群,并獨立維護Spark和Shark分支。Spark集群已穩定運行2年,我們積累了大量的案例和運營經驗能力,另外多個業務的大數據查詢與分析應用,已在陸續上線并穩定運行。在SQL查詢性能方面普遍比MapReduce高出2倍以上,利用內存計算和內存表的特性,性能至少在10倍以上。在迭代計算與挖掘分析方面,精準推薦將小時和天級別的模型訓練轉變為Spark的分鐘級別的訓練,同時簡潔的編程接口使得算法實現比MR在時間成本和代碼量上高出許多。

Spark VS MapReduce

盡管MapReduce適用大多數批處理工作,并且在大數據時代成為企業大數據處理的***技術,但由于以下幾個限制,它對一些場景并不是***選擇:

缺少對迭代計算以及DAG運算的支持

Shuffle過程多次排序和落地,MR之間的數據需要落Hdfs文件系統

Spark在很多方面都彌補了MapReduce的不足,比MapReduce的通用性更好,迭代運算效率更高,作業延遲更低,它的主要優勢包括:

提供了一套支持DAG圖的分布式并行計算的編程框架,減少多次計算之間中間結果寫到Hdfs的開銷

提供Cache機制來支持需要反復迭代計算或者多次數據共享,減少數據讀取的IO開銷

使用多線程池模型來減少task啟動開稍,shuffle過程中避免不必要的sort操作以及減少磁盤IO操作

廣泛的數據集操作類型

MapReduce由于其設計上的約束只適合處理離線計算,在實時查詢和迭代計算上仍有較大的不足,而隨著業務的發展,業界對實時查詢和迭代分析有更多的需求,單純依靠MapReduce框架已經不能滿足業務的需求了。Spark由于其可伸縮、基于內存計算等特點,且可以直接讀寫Hadoop上任何格式的數據,成為滿足業務需求的***候選者。

應用Spark的成功案例

目前大數據在互聯網公司主要應用在廣告、報表、推薦系統等業務上。在廣告業務方面需要大數據做應用分析、效果分析、定向優化等,在推薦系統方面則需要大數據優化相關排名、個性化推薦以及熱點點擊分析等。

這些應用場景的普遍特點是計算量大、效率要求高。Spark恰恰滿足了這些要求,該項目一經推出便受到開源社區的廣泛關注和好評。并在近兩年內發展成為大數據處理領域最炙手可熱的開源項目。

本章將列舉國內外應用Spark的成功案例。

1. 騰訊

廣點通是最早使用Spark的應用之一。騰訊大數據精準推薦借助Spark快速迭代的優勢,圍繞“數據+算法+系統”這套技術方案,實現了在“數據實時采集、算法實時訓練、系統實時預測”的全流程實時并行高維算法,最終成功應用于廣點通pCTR投放系統上,支持每天上百億的請求量。

基于日志數據的快速查詢系統業務構建于Spark之上的Shark,利用其快速查詢以及內存表等優勢,承擔了日志數據的即席查詢工作。在性能方面,普遍比Hive高2-10倍,如果使用內存表的功能,性能將會比Hive快百倍。

2. Yahoo

Yahoo將Spark用在Audience Expansion中的應用。Audience Expansion是廣告中尋找目標用戶的一種方法:首先廣告者提供一些觀看了廣告并且購買產品的樣本客戶,據此進行學習,尋找更多可能轉化的用戶,對他們定向廣告。Yahoo采用的算法是logistic regression。同時由于有些SQL負載需要更高的服務質量,又加入了專門跑Shark的大內存集群,用于取代商業BI/OLAP工具,承擔報表/儀表盤和交互式/即席查詢,同時與桌面BI工具對接。目前在Yahoo部署的Spark集群有112臺節點,9.2TB內存。

3. 淘寶

阿里搜索和廣告業務,最初使用Mahout或者自己寫的MR來解決復雜的機器學習,導致效率低而且代碼不易維護。淘寶技術團隊使用了Spark來解決多次迭代的機器學習算法、高計算復雜度的算法等。將Spark運用于淘寶的推薦相關算法上,同時還利用Graphx解決了許多生產問題,包括以下計算場景:基于度分布的中樞節點發現、基于***連通圖的社區發現、基于三角形計數的關系衡量、基于隨機游走的用戶屬性傳播等。

4. 優酷土豆

優酷土豆在使用Hadoop集群的突出問題主要包括:***是商業智能BI方面,分析師提交任務之后需要等待很久才得到結果;第二就是大數據量計算,比如進行一些模擬廣告投放之時,計算量非常大的同時對效率要求也比較高,***就是機器學習和圖計算的迭代運算也是需要耗費大量資源且速度很慢。

最終發現這些應用場景并不適合在MapReduce里面去處理。通過對比,發現Spark性能比MapReduce提升很多。首先,交互查詢響應快,性能比Hadoop提高若干倍;模擬廣告投放計算效率高、延遲小(同hadoop比延遲至少降低一個數量級);機器學習、圖計算等迭代計算,大大減少了網絡傳輸、數據落地等,極大的提高的計算性能。目前Spark已經廣泛使用在優酷土豆的視頻推薦(圖計算)、廣告業務等。

Spark與Shark的原理

1.Spark生態圈

如下圖所示為Spark的整個生態圈,***層為資源管理器,采用Mesos、Yarn等資源管理集群或者Spark自帶的Standalone模式,底層存儲為文件系統或者其他格式的存儲系統如HBase。Spark作為計算框架,為上層多種應用提供服務。Graphx和MLBase提供數據挖掘服務,如圖計算和挖掘迭代計算等。Shark提供SQL查詢服務,兼容Hive語法,性能比Hive快3-50倍,BlinkDB是一個通過權衡數據精確度來提升查詢晌應時間的交互SQL查詢引擎,二者都可作為交互式查詢使用。Spark Streaming將流式計算分解成一系列短小的批處理計算,并且提供高可靠和吞吐量服務。

大數據計算新貴Spark在騰訊雅虎優酷成功應用解析

2.Spark基本原理

Spark運行框架如下圖所示,首先有集群資源管理服務(Cluster Manager)和運行作業任務的結點(Worker Node),然后就是每個應用的任務控制結點Driver和每個機器節點上有具體任務的執行進程(Executor)。

大數據計算新貴Spark在騰訊雅虎優酷成功應用解析

與MR計算框架相比,Executor有二個優點:一個是多線程來執行具體的任務,而不是像MR那樣采用進程模型,減少了任務的啟動開稍。二個是Executor上會有一個BlockManager存儲模塊,類似于KV系統(內存和磁盤共同作為存儲設備),當需要迭代多輪時,可以將中間過程的數據先放到這個存儲系統上,下次需要時直接讀該存儲上數據,而不需要讀寫到hdfs等相關的文件系統里,或者在交互式查詢場景下,事先將表Cache到該存儲系統上,提高讀寫IO性能。另外Spark在做Shuffle時,在Groupby,Join等場景下去掉了不必要的Sort操作,相比于MapReduce只有Map和Reduce二種模式,Spark還提供了更加豐富全面的運算操作如filter,groupby,join等。

Spark采用了Scala來編寫,在函數表達上Scala有天然的優勢,因此在表達復雜的機器學習算法能力比其他語言更強且簡單易懂。提供各種操作函數來建立起RDD的DAG計算模型。把每一個操作都看成構建一個RDD來對待,而RDD則表示的是分布在多臺機器上的數據集合,并且可以帶上各種操作函數。如下圖所示:

大數據計算新貴Spark在騰訊雅虎優酷成功應用解析

首先從hdfs文件里讀取文本內容構建成一個RDD,然后使用filter()操作來對上次的RDD進行過濾,再使用map()操作取得記錄的***個字段,***將其cache在內存上,后面就可以對之前cache過的數據做其他的操作。整個過程都將形成一個DAG計算圖,每個操作步驟都有容錯機制,同時還可以將需要多次使用的數據cache起來,供后續迭代使用。

3.Shark的工作原理

Shark是基于Spark計算框架之上且兼容Hive語法的SQL執行引擎,由于底層的計算采用了Spark,性能比MapReduce的Hive普遍快2倍以上,如果是純內存計算的SQL,要快5倍以上,當數據全部load在內存的話,將快10倍以上,因此Shark可以作為交互式查詢應用服務來使用。

大數據計算新貴Spark在騰訊雅虎優酷成功應用解析

上圖就是整個Shark的框架圖,與其他的SQL引擎相比,除了基于Spark的特性外,Shark是完全兼容Hive的語法,表結構以及UDF函數等,已有的HiveSql可以直接進行遷移至Shark上。

與Hive相比,Shark的特性如下:

1.以在線服務的方式執行任務,避免任務進程的啟動和銷毀開稍,通常MapReduce里的每個任務都是啟動和關閉進程的方式來運行的,而在Shark中,Server運行后,所有的工作節點也隨之啟動,隨后以常駐服務的形式不斷的接受Server發來的任務。

2.Groupby和Join操作不需要Sort工作,當數據量內存能裝下時,一邊接收數據一邊執行計算操作。在Hive中,不管任何操作在Map到Reduce的過程都需要對Key進行Sort操作。

3.對于性能要求更高的表,提供分布式Cache系統將表數據事先Cache至內存中,后續的查詢將直接訪問內存數據,不再需要磁盤開稍。

4.還有很多Spark的特性,如可以采用Torrent來廣播變量和小數據,將執行計劃直接傳送給Task,DAG過程中的中間數據不需要落地到Hdfs文件系統。

騰訊大數據Spark的概況

騰訊大數據綜合了多個業務線的各種需求和特性,目前正在進行以下工作:

1.經過改造和優化的Shark和Spark吸收了TDW平臺的功能,如Hive的特有功能:元數據重構,分區優化等,同時可以通過IDE或者洛子調度來直接執行HiveSql查詢和定時調度Spark的任務;

2.與Gaia和TDW的底層存儲直接兼容,可以直接安全且高效地使用TDW集群上的數據;

3.對Spark底層的使用門檻,資源管理與調度,任務監控以及容災等多個功能進行完善,并支持快速的遷移和擴容。

責任編輯:彭凡 來源: 36大數據
相關推薦

2014-03-27 09:36:36

Spark

2009-12-16 10:06:51

互聯網

2015-10-08 16:51:56

旋轉菜單動畫

2014-03-03 13:33:03

易傳媒移動DSP

2015-06-11 10:09:04

大數據HBase

2017-11-23 15:42:03

視頻

2010-05-06 21:27:33

2023-10-08 07:40:29

2017-06-16 09:39:32

優酷實踐阿里云

2021-06-25 17:48:56

騰訊NTA

2015-11-09 09:20:21

阿里優酷土豆視頻

2017-12-11 13:30:49

Go語言數據庫中間件

2011-12-13 14:44:02

360開放平臺

2019-04-09 15:02:36

OpenResty騰訊游戲營銷技術

2009-05-22 08:32:23

蘋果iPhone移動OS

2025-07-11 00:48:00

2019-10-29 09:48:20

ElectronGithub開源庫

2009-04-03 08:42:45

蘋果Iphone移動OS

2021-03-04 08:39:21

SparkRDD調優
點贊
收藏

51CTO技術棧公眾號

av剧情在线观看| 依依成人在线视频| 亚洲肉体裸体xxxx137| 一本一道综合狠狠老| 亚洲一区三区| 天天射天天色天天干| 日本美女一区二区三区视频| 欧美成人激情在线| 久久国产精品影院| 精品一区二区三区视频在线播放| 午夜免费久久看| 亚洲欧洲国产日韩精品| 成人毛片视频免费看| 青青草伊人久久| 韩国国内大量揄拍精品视频| 国精产品一区一区| 日韩电影在线观看完整免费观看| 欧美三级电影网| 黄色www网站| 国产在线观看91| 久久精品亚洲精品国产欧美kt∨| 97netav| 在线免费观看av网址| 国产精品地址| 久久av资源网站| 国产伦精品一区二区三区视频女| 嗯用力啊快一点好舒服小柔久久| 欧美日韩亚洲综合| 国产精品亚洲a| www.综合| 亚洲在线观看免费| 在线观看三级网站| 日本最新在线视频| 国产视频一区二区在线观看| 国产精品一区免费观看| 国产裸体无遮挡| 蜜桃av一区二区在线观看| 7m精品福利视频导航| 免费人成年激情视频在线观看| 日产午夜精品一线二线三线| 亚洲精品中文字幕av| 95视频在线观看| 视频国产精品| 欧美一区二区性放荡片| 日本不卡一区二区在线观看| 色成人免费网站| 色综合天天综合网国产成人综合天 | 久久久久久**毛片大全| 久久精品99| 色香蕉在线视频| 成人av网在线| 极品日韩久久| 特级丰满少妇一级aaaa爱毛片| 高清成人在线观看| 国产精品亚洲综合| 少妇av在线播放| 91亚洲精品久久久蜜桃| 精品视频在线观看| 三区在线观看| 国产亚洲污的网站| 亚洲国产一区二区三区在线| 福利小视频在线观看| 国产欧美日韩另类一区| 亚洲午夜精品一区二区| 免费a级毛片在线播放| 日韩毛片高清在线播放| 青青草原网站在线观看| 18videosex性欧美麻豆| 午夜精品在线看| 一区二区传媒有限公司| 中文日产幕无线码一区二区| 在线观看视频91| 手机在线成人免费视频| 国产免费av国片精品草莓男男| 欧美一区二区三区的| 中文字幕在线观看91| 国产欧美自拍一区| 亚洲日本aⅴ片在线观看香蕉| 久久国产柳州莫菁门| 小说区亚洲自拍另类图片专区| 久久中文字幕一区| 日本少妇激情舌吻| 日韩一区精品字幕| 成人精品久久久| 日本精品999| 欧美国产日韩在线观看| 日本免费黄色小视频| а√在线中文网新版地址在线| 色一情一乱一乱一91av| 亚洲黄色av片| 开心激情综合| 中文字幕亚洲第一| 精品在线视频免费| 青青草国产精品97视觉盛宴| 99影视tv| 黄色国产在线| 一区二区三区成人| 99久久激情视频| 精品一区二区三区中文字幕| 日韩av有码在线| 国产jizz18女人高潮| 国模大胆一区二区三区| 国产成人午夜视频网址| 国产强被迫伦姧在线观看无码| a亚洲天堂av| 国产a级片免费看| а√在线中文在线新版| 91麻豆精品久久久久蜜臀| 国产人妻黑人一区二区三区| 日韩理论在线| 青草青草久热精品视频在线观看| 国产精品久久免费| 成人精品一区二区三区中文字幕| 日本精品二区| 久久一卡二卡| 6080午夜不卡| 波多野结衣一二三四区| 亚洲深夜影院| 国产伦精品一区二区三区视频黑人| 丁香婷婷在线| 色综合久久天天| 欧美一级片在线免费观看| 色欧美自拍视频| 日产日韩在线亚洲欧美| 无码精品视频一区二区三区 | 国产一区二区导航在线播放| 日韩欧美99| 欧美天堂视频| 亚洲欧美在线第一页| 日本特黄一级片| 国产福利一区二区三区视频| 在线视频一区观看| 国产精品蜜月aⅴ在线| 亚洲欧美一区二区精品久久久| 日韩成人一区二区三区| 国产91在线|亚洲| 青青视频免费在线观看| 国产精品1区在线| 久久九九国产精品怡红院 | 欧美三级电影在线播放| 韩国成人二区| 亚洲精品久久久久久下一站| 日本熟妇毛茸茸丰满| 国产a区久久久| 欧美高清中文字幕| 国产精品男女| 91精品国产777在线观看| 天天综合天天综合| 天天av天天翘天天综合网| 精品国产av色一区二区深夜久久| 伊人精品在线| 精品无人乱码一区二区三区的优势| 91豆花视频在线播放| 亚洲国产精品福利| 国产精品视频久久久久久久| 99精品在线免费| 国产日韩一区二区在线| 久久不卡国产精品一区二区| 国产成人精品久久二区二区91| 国产69精品久久app免费版| 欧美又粗又大又爽| 搜索黄色一级片| 国产一区二区久久| 欧美精品久久久久久久自慰| 四虎884aa成人精品最新| 国产成人精品免高潮费视频| 国产精品视频二区三区| 欧美精品日韩综合在线| 欧美成人片在线观看| 成人国产在线观看| 久久久久久久久久久久久久国产| 精品视频网站| 91最新在线免费观看| 爱情岛论坛亚洲品质自拍视频网站| 亚洲爱爱爱爱爱| 自拍偷拍校园春色| 综合中文字幕亚洲| 五十路六十路七十路熟婆| 三级久久三级久久| 欧美 国产 精品| 欧美aaaaa级| 国产欧美日韩免费| 欧美人与性动交α欧美精品图片| 亚洲国产成人久久综合| 真实的国产乱xxxx在线91| 亚洲欧美一区二区三区国产精品| 中文成人无字幕乱码精品区| 日韩高清在线不卡| 视色,视色影院,视色影库,视色网| 国内精品麻豆美女在线播放视频| 国产精品狠色婷| 欧美大片黄色| 中文字幕九色91在线| 成人高潮片免费视频| 色偷偷成人一区二区三区91 | 青草久久伊人| 91.麻豆视频| 精品免费囯产一区二区三区| 日韩毛片精品高清免费| 大又大又粗又硬又爽少妇毛片| 狠狠久久亚洲欧美| 黄www在线观看| 欧美搞黄网站| 亚洲一区二区三区精品视频| 精品一区二区男人吃奶| 成人激情视频在线| 欧美magnet| 国语自产在线不卡| 免费超碰在线| 在线一区二区日韩| 亚洲人妻一区二区| 日韩你懂的电影在线观看| 日韩精品在线一区二区三区| 亚洲国产一区二区在线播放| 亚洲欧美另类日本| 久久久久久夜精品精品免费| 久久久久亚洲av无码网站| 久久99精品国产91久久来源| 欧美精品色婷婷五月综合| 欧美特黄一区| 熟女视频一区二区三区| 日韩精品看片| 日韩精品久久一区| 免费欧美视频| 免费不卡亚洲欧美| 国产精品三p一区二区| 999久久久| 另类视频一区二区三区| 成人免费高清完整版在线观看| 亚州一区二区三区| 日韩av电影院| 亚洲美女尤物影院| 91精品国产高清久久久久久久久| 伊人福利在线| 美女精品视频一区| 成码无人av片在线观看网站| 日日狠狠久久偷偷四色综合免费| 第一视频专区在线| 国产一区二区久久精品| 国产乱子伦三级在线播放| 国产婷婷色综合av蜜臀av| 色在线免费视频| 日韩电影免费在线观看中文字幕| 视频污在线观看| 亚洲成人精品视频在线观看| 熟妇人妻系列aⅴ无码专区友真希| 精品日韩在线一区| 成人乱码一区二区三区| 亚洲国产精品99久久| 色婷婷综合视频| 日韩激情av在线播放| 青青青草网站免费视频在线观看| 日韩精品视频中文在线观看| 美女毛片在线看| 中文字幕日韩欧美| 久久77777| 欧美情侣性视频| 成人一级福利| 国产91免费观看| 狠狠久久综合| 91成人伦理在线电影| 国产厕拍一区| 欧美激情一区二区三区在线视频| 精品久久国产| avove在线观看| 精品av久久久久电影| 亚洲自偷自拍熟女另类| 日韩国产欧美在线播放| 亚洲天堂一区二区在线观看| 国产高清不卡二三区| theav精尽人亡av| 国产精品美女久久久久aⅴ| 夫妻性生活毛片| 夜夜精品浪潮av一区二区三区| 国产小视频在线免费观看| 欧美影视一区在线| 精品久久久久中文慕人妻 | 国产精品久久一区二区三区不卡| 一本色道久久88精品综合| 久操视频在线免费播放| 久久久亚洲影院| 亚洲电影有码| 91大片在线观看| 国产一区二区三区91| 在线视频福利一区| 中文亚洲欧美| 欧美日韩精品区别| 99久久久久免费精品国产 | 91欧美在线| 青青青青草视频| 蜜臀精品一区二区三区在线观看| 国产精品19p| 欧美激情一区二区三区蜜桃视频| 青青草激情视频| 欧洲精品一区二区三区在线观看| 国产哺乳奶水91在线播放| 亚洲女人天堂色在线7777| a黄色片在线观看| 日本久久久久久久久久久| 日韩在线成人| 日韩欧美视频一区二区| 亚洲久久成人| √天堂资源在线| 国产免费观看久久| 久久高清免费视频| 在线综合亚洲欧美在线视频| 精品欧美不卡一区二区在线观看| 欧美黑人巨大xxx极品| 国内自拍亚洲| 美媛馆国产精品一区二区| 欧美日韩hd| 亚洲综合激情视频| 久久久久久麻豆| 国产无遮挡又黄又爽在线观看 | 无码国产精品一区二区色情男同| 精品国产一区久久久| 国产成人精品亚洲日本在线观看| 精品无人区一区二区三区| 激情亚洲成人| 国产老头和老头xxxx×| 中文字幕一区二区三区在线不卡 | 91嫩草丨国产丨精品| 欧美视频中文字幕| 日本在线视频1区| 668精品在线视频| 大奶在线精品| 国产av熟女一区二区三区| 激情综合一区二区三区| 免费一级suv好看的国产网站| 色哟哟亚洲精品| 国产在线黄色| 国产成人精品电影| 欧美人与拘性视交免费看| 国产二级片在线观看| 成人av午夜电影| 国产亚洲精品久久久久久打不开| 欧美一级生活片| wwwav在线| 3d动漫啪啪精品一区二区免费| 99久久婷婷| 一级黄色录像在线观看| 国产精品久久久久久久第一福利| 国模私拍一区二区| 中文字幕亚洲欧美在线| 久草综合在线| 国产经典久久久| 国产成a人亚洲| 国产一级视频在线观看| 亚洲成人三级在线| 男人天堂视频在线观看| 九九99玖玖| 男人的天堂亚洲| 国产午夜福利一区| 欧美猛男男办公室激情| av网址在线免费观看| 高清一区二区三区视频| 一区二区毛片| 天天躁日日躁aaaa视频| 欧美日韩一区小说| 18videosex性欧美麻豆| 国语精品中文字幕| 丝袜美腿亚洲色图| 国产农村妇女精品一区| 91精品国产乱| h片在线观看视频免费免费| 久久综合九色欧美狠狠| 蜜臀精品久久久久久蜜臀| 91porn在线视频| 日韩av综合中文字幕| 香蕉成人影院| 91xxx视频| 93久久精品日日躁夜夜躁欧美| 国产主播第一页| 欧美巨乳美女视频| 婷婷精品视频| 涩多多在线观看| 欧美性69xxxx肥| 黄色在线播放网站| 久久精品二区| 美女mm1313爽爽久久久蜜臀| wwwav国产| 亚洲色图15p| 91精品尤物| 北条麻妃在线视频| 一区二区三区四区在线播放 | 国产伦子伦对白视频| 国模gogo一区二区大胆私拍| 一区二区美女| 超碰在线超碰在线| 色一情一伦一子一伦一区| 在线不卡日本v二区707| 欧洲精品久久| 国产成a人亚洲精品| 日韩精品在线一区二区三区| 欧美激情亚洲自拍| 欧美gayvideo| 在线免费观看成年人视频| 91.com视频| 在线成人视屏| 青青草国产精品视频|