精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Apache Spark源碼走讀之1:論文閱讀筆記

數(shù)據(jù)庫 Spark
源碼閱讀是一件非常容易的事,也是一件非常難的事。容易的是代碼就在那里,一打開就可以看到。難的是要通過代碼明白作者當(dāng)初為什么要這樣設(shè)計(jì),設(shè)計(jì)之初要解決的主要問題是什么。在對Spark的源碼進(jìn)行具體的走讀之前,如果想要快速對Spark的有一個(gè)整體性的認(rèn)識(shí),閱讀Matei Zaharia做的Spark論文是一個(gè)非常不錯(cuò)的選擇。在閱讀該論文的基礎(chǔ)之上,再結(jié)合Spark作者在2012 Developer Meetup上做的演講Introduction to Spark Internals,那么對于Spark的內(nèi)部實(shí)現(xiàn)會(huì)有一個(gè)比較大概的了解。 有了上述的兩篇文章奠定基礎(chǔ)之后,再來進(jìn)行源碼閱讀,

基本概念(Basic Concepts)

RDD - resillient distributed dataset 彈性分布式數(shù)據(jù)集

Operation - 作用于RDD的各種操作分為transformation和action

Job - 作業(yè),一個(gè)JOB包含多個(gè)RDD及作用于相應(yīng)RDD上的各種operation

Stage - 一個(gè)作業(yè)分為多個(gè)階段

Partition - 數(shù)據(jù)分區(qū), 一個(gè)RDD中的數(shù)據(jù)可以分成多個(gè)不同的區(qū)

DAG - Directed Acycle graph, 有向無環(huán)圖,反應(yīng)RDD之間的依賴關(guān)系

Narrow dependency - 窄依賴,子RDD依賴于父RDD中固定的data partition

Wide Dependency - 寬依賴,子RDD對父RDD中的所有data partition都有依賴

Caching Managenment -- 緩存管理,對RDD的中間計(jì)算結(jié)果進(jìn)行緩存管理以加快整體的處理速度

編程模型(Programming Model)

RDD是只讀的數(shù)據(jù)分區(qū)集合,注意是數(shù)據(jù)集。

作用于RDD上的Operation分為transformantion和action。 經(jīng)Transformation處理之后,數(shù)據(jù)集中的內(nèi)容會(huì)發(fā)生更改,由數(shù)據(jù)集A轉(zhuǎn)換成為數(shù)據(jù)集B;而經(jīng)Action處理之后,數(shù)據(jù)集中的內(nèi)容會(huì)被歸約為一個(gè)具體的數(shù)值。

只有當(dāng)RDD上有action時(shí),該RDD及其父RDD上的所有operation才會(huì)被提交到cluster中真正的被執(zhí)行。

從代碼到動(dòng)態(tài)運(yùn)行,涉及到的組件如下圖所示。

 

演示代碼


val sc = new SparkContext("Spark://...", "MyJob", home, jars) val file = sc.textFile("hdfs://...") val errors = file.filter(_.contains("ERROR"))
errors.cache()
errors.count()

運(yùn)行態(tài)(Runtime view)

不管什么樣的靜態(tài)模型,其在動(dòng)態(tài)運(yùn)行的時(shí)候無外乎由進(jìn)程,線程組成。

用Spark的術(shù)語來說,static view稱為dataset view,而dynamic view稱為parition view. 關(guān)系如圖所示

 

在Spark中的task可以對應(yīng)于線程,worker是一個(gè)個(gè)的進(jìn)程,worker由driver來進(jìn)行管理。

那么問題來了,這一個(gè)個(gè)的task是如何從RDD演變過來的呢?下節(jié)將詳細(xì)回答這個(gè)問題。

部署(Deployment view)

當(dāng)有Action作用于某RDD時(shí),該action會(huì)作為一個(gè)job被提交。

在提交的過程中,DAGScheduler模塊介入運(yùn)算,計(jì)算RDD之間的依賴關(guān)系。RDD之間的依賴關(guān)系就形成了DAG。

每一個(gè)JOB被分為多個(gè)stage,劃分stage的一個(gè)主要依據(jù)是當(dāng)前計(jì)算因子的輸入是否是確定的,如果是則將其分在同一個(gè)stage,避免多個(gè)stage之間的消息傳遞開銷。

當(dāng)stage被提交之后,由taskscheduler來根據(jù)stage來計(jì)算所需要的task,并將task提交到對應(yīng)的worker.

Spark支持以下幾種部署模式1)standalone 2)Mesos 3) yarn. 這些部署模式將作為taskscheduler的初始化入?yún)ⅰ?/p>

RDD接口(RDD Interface)

RDD由以下幾個(gè)主要部分組成

  1. partitions --    partition集合,一個(gè)RDD中有多少data partition

  2. dependencies -- RDD依賴關(guān)系

  3. compute(parition) -- 對于給定的數(shù)據(jù)集,需要作哪些計(jì)算

  4. preferredLocations --  對于data partition的位置偏好

  5. partitioner -- 對于計(jì)算出來的數(shù)據(jù)結(jié)果如何分發(fā)

緩存機(jī)制(caching)

RDD的中間計(jì)算結(jié)果可以被緩存起來,緩存先選Memory,如果Memory不夠的話,將會(huì)被寫入到磁盤中。

根據(jù)LRU(last-recent update)來決定哪先內(nèi)容繼續(xù)保存在內(nèi)存,哪些保存到磁盤。

容錯(cuò)性(Fault-tolerant)

從最初始的RDD到衍生出來的***一個(gè)RDD,中間要經(jīng)過一系列的處理。那么如何處理中間環(huán)節(jié)出現(xiàn)錯(cuò)誤的場景呢?

Spark提供的解決方案是只對失效的data partition進(jìn)行事件重演,而無須對整個(gè)數(shù)據(jù)全集進(jìn)行事件重演,這樣可以大大加快場景恢復(fù)的開銷。

RDD又是如何知道自己的data partition的number該是多少?如果是hdfs文件,那么hdfs文件的block將會(huì)成為一個(gè)重要的計(jì)算依據(jù)。

集群管理(cluster management)

task運(yùn)行在cluster之上,除了spark自身提供的standalone部署模式之外,spark還內(nèi)在支持yarn和mesos.

Yarn來負(fù)責(zé)計(jì)算資源的調(diào)度和監(jiān)控,根據(jù)監(jiān)控結(jié)果來重啟失效的task或者是重新distributed task一旦有新的node加入cluster的話。

這一部分的內(nèi)容需要參考yarn的文檔。

小結(jié)

在源碼閱讀時(shí),需要重點(diǎn)把握以下兩大主線。

  • 靜態(tài)view 即 RDD, transformation and action

  • 動(dòng)態(tài)view 即 life of a job, 每一個(gè)job又分為多個(gè)stage,每一個(gè)stage中可以包含多個(gè)rdd及其transformation,這些stage又是如何映射成為task被distributed到cluster中

參考資料(reference)

  1. Introduction to Spark Internals http://files.meetup.com/3138542/dev-meetup-dec-2012.pptx

  2. Resilient Distributed Datasets: A Fault-tolerant Abstraction for In-Memory Cluster Computing  https://www.usenix.org/system/files/.../nsdi12-final138.pdf

  3. Lightning-Fast Cluster Computing with Spark and Shark   http://www.meetup.com/TriHUG/events/112474102/

原文鏈接:http://www.cnblogs.com/hseagle/p/3664933.html

責(zé)任編輯:彭凡 來源: 博客園
相關(guān)推薦

2014-07-23 10:02:11

Spark源碼

2014-07-04 10:58:47

Apache Spar

2014-07-15 10:59:58

Spark代碼跟讀

2013-12-24 10:05:04

memcached

2021-11-22 16:12:34

Axios Axios-Retry前端

2014-02-14 15:43:16

ApacheSpark

2021-09-09 10:23:08

GinNetHttp

2016-09-20 10:26:25

LaravelPHPMiddleware

2016-09-20 10:15:49

LaravelPHPContainer

2021-11-19 07:54:59

Axios網(wǎng)絡(luò)源碼

2017-04-01 14:01:50

Apache Spar內(nèi)存管理

2018-11-16 16:35:19

Java源碼編程語言

2022-06-01 13:52:11

開源大數(shù)據(jù)

2022-10-08 08:01:17

Spring源碼服務(wù)

2012-02-14 14:05:59

JavaSpring

2017-04-05 16:40:45

2017-03-16 11:39:33

Openstack源碼姿勢

2016-12-20 09:47:38

Apache SparLambda架構(gòu)

2022-12-14 14:09:47

AIChatGPT筆記

2017-06-26 15:00:17

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

在线免费看黄视频| 中文字幕色一区二区| 中文字幕视频网站| 一道本在线免费视频| 中文字幕码精品视频网站| 国产精品99久久| 精品国产乱码久久久久久夜甘婷婷| 1024av视频| 黄色在线视频网站| 99天天综合性| 91九色视频在线| 天堂在线免费观看视频| 天天做综合网| 亚洲视频在线观看视频| 美女被爆操网站| 九九久久国产| 欧美日韩亚洲精品一区二区三区| 在线无限看免费粉色视频| 天堂a√中文在线| 国产精品99久久久久久久vr| 国产精品pans私拍| 日韩大片免费在线观看| 91精品一区二区三区综合在线爱 | 亚洲理论电影网| 亚洲欧洲国产精品| 国产xxxx视频| 视频一区中文字幕精品| 精品污污网站免费看| 欧美日韩二三区| 久久亚洲导航| 亚洲欧美日韩中文播放| 亚洲不卡中文字幕| 精品视频三区| 久久先锋资源网| 精品国产综合| 黄色小视频免费在线观看| 国产麻豆精品视频| 国产精品一区二区三区毛片淫片| 午夜久久久久久久久久影院| 国产视频一区三区| 韩日在线一区| 亚洲精品一二区| 亚洲久久久久久| 国产成人在线中文字幕| 日韩三级视频在线看| 日本激情综合网| 欧美日韩视频免费观看| 色婷婷综合久久久中文一区二区 | 免费一二一二在线视频| 亚洲成人精品一区| 少妇人妻大乳在线视频| free性欧美16hd| 亚洲图片欧美视频| 成人性生活视频免费看| heyzo高清在线| 午夜激情久久久| 成年人视频网站免费观看| 在线免费av资源| 91福利精品第一导航| 国产精品人人妻人人爽人人牛| 成人精品电影在线| 欧美最猛性xxxxx直播| 亚洲第一中文av| 国产精品1区| 欧美xxxx在线观看| 麻豆国产精品一区| 精品一区二区三区的国产在线观看| 伊人男人综合视频网| 男女男精品视频网站| 亚洲无中文字幕| 欧美疯狂性受xxxxx另类| 日本a在线观看| 亚洲欧美视频| 国产精品专区一| 99热这里是精品| www.av亚洲| 日本最新一区二区三区视频观看| 在线免费看黄| 亚洲尤物视频在线| 日韩a在线播放| 91精品福利观看| 亚洲第一色在线| 一级黄色片网址| 欧美一区在线看| 欧美在线视频观看免费网站| 中文有码在线播放| 国产成人精品一区二| 精品国产日本| 日本三级视频在线播放| 亚洲综合一二三区| 久久婷婷国产91天堂综合精品| 经典三级久久| 亚洲欧美www| 青春草免费视频| 日韩有码一区二区三区| 91精品免费| jzzjzzjzz亚洲成熟少妇| 亚洲一区在线观看视频| 老司机午夜av| 第四色在线一区二区| 深夜福利国产精品| 日韩黄色三级视频| 国内外成人在线| 农村寡妇一区二区三区| 99热国产在线| 欧美视频三区在线播放| 91丨porny丨对白| 婷婷亚洲图片| 国产成人亚洲综合| 欧美性猛交 xxxx| 成人免费一区二区三区视频| 亚洲午夜无码av毛片久久| 日韩一区二区三区在线看| 亚洲三级黄色在线观看| 在线看成人av| 国产精品一品视频| 亚洲精品一区二区三区蜜桃久| 麻豆蜜桃在线观看| 精品国产乱码久久久久久闺蜜| 网站永久看片免费| 日韩va亚洲va欧美va久久| 国产一区免费视频| 在线黄色网页| 777午夜精品视频在线播放| 少妇人妻好深好紧精品无码| 亚洲国内欧美| 国产欧美一区二区视频| 密臀av在线| 日韩欧美一区二区久久婷婷| 日本精品在线免费观看| 蜜臀av一级做a爰片久久| 欧美日韩系列| 成人性生活视频| 日韩精品在线观看一区| 97超碰人人干| 97se亚洲国产综合在线| 国产在线播放观看| 豆花视频一区二区| 久久久久中文字幕| 欧美性受xxxx狂喷水| 亚洲国产精品一区二区久久| 亚洲少妇一区二区| 欧美激情无毛| 99久久无色码| 国产99在线观看| 亚洲第一精品福利| 成人免费区一区二区三区| av在线不卡网| 欧美在线观看www| 一区二区美女| 国产剧情在线观看一区二区| 国产精品扒开腿做爽爽爽男男 | 久久久久久爱| 欧美床上激情在线观看| 亚洲国产精品无码久久| 亚洲一区二区在线免费看| 精品人妻伦一二三区久| 亚洲免费网址| 视频一区二区三| 欧美一区=区三区| 久久久国产成人精品| 国产成人精品一区二三区四区五区| 亚洲精品视频在线| 国产大学生视频| 性欧美xxxx大乳国产app| 日韩高清国产一区在线观看| 亚洲电影有码| 另类天堂视频在线观看| 亚洲精品18p| 欧美视频一二三| 中文字幕伦理片| 国产专区欧美精品| www.av片| 成人3d精品动漫精品一二三| 91国产在线播放| 色戒汤唯在线观看| 色悠悠久久88| 男人天堂一区二区| 日本高清不卡视频| 国产十六处破外女视频| 26uuu国产一区二区三区| 伊人网在线综合| 精品999日本| 亚洲7777| youjizz欧美| 国产精品r级在线| 七七久久电影网| 国产小视频国产精品| 国产成人精品a视频| 日韩欧美中文免费| 无码黑人精品一区二区| 2020国产精品| 精品人妻一区二区三| 久久美女性网| 乱熟女高潮一区二区在线| 国产一区二区三区日韩精品| av在线不卡观看| 国产精品久久亚洲不卡| 欧美精品久久久久久久久| yiren22亚洲综合伊人22| 精品国产污网站| 一卡二卡在线视频| 欧美午夜无遮挡| 免费在线观看av网址| 中文字幕乱码久久午夜不卡| 日韩无码精品一区二区| 精品一区二区三区在线播放视频| 日本毛片在线免费观看| 欧美视频网站| 亚洲成年人专区| av伊人久久| 蜜桃成人免费视频| jizz性欧美2| 亚洲jizzjizz日本少妇| 97人人做人人爽香蕉精品| 69**夜色精品国产69乱| 亚洲区欧洲区| 久久精品国产亚洲7777| 99re在线视频| 亚洲偷欧美偷国内偷| 三级理论午夜在线观看| 精品精品欲导航| 性一交一乱一色一视频麻豆| 欧美美女一区二区| 中文字幕免费播放| 色菇凉天天综合网| 欧产日产国产69| 欧美日韩精品在线播放| 久青草免费视频| 一区二区视频免费在线观看| 精品国产国产综合精品| 中日韩免费视频中文字幕| 9.1成人看片免费版| 99r国产精品| 污污内射在线观看一区二区少妇| 成人综合婷婷国产精品久久蜜臀 | 日本xxxx黄色| 日本成人超碰在线观看| 日本va中文字幕| 久久综合亚州| 日本成人中文字幕在线| 日韩激情一区二区| 丰满少妇在线观看| 蜜桃av一区二区三区| 久久99爱视频| 国产主播一区二区三区| 中文字幕第六页| 大桥未久av一区二区三区中文| 97中文字幕在线观看| 从欧美一区二区三区| 女性生殖扒开酷刑vk| 成人黄色在线看| 国产精品一区二区人妻喷水| 91一区二区三区在线观看| 人妻丰满熟妇av无码久久洗澡 | 欧美成人免费观看视频 | 久久艹国产精品| 在线看片一区| 毛片av免费在线观看| 青青草伊人久久| 亚洲视频第二页| 国产综合色在线| 亚洲一区二区三区四区av| 99久久精品国产网站| 中文字字幕码一二三区| 欧美国产精品久久| 性欧美videos| 亚洲成人免费视频| 国产精品成人久久久| 欧美精品黑人性xxxx| 国产成人手机在线| 亚洲欧美制服中文字幕| 一区二区三区视频网站| 欧美日韩高清在线观看| 97se综合| 91免费欧美精品| 日韩深夜影院| 亚洲区一区二区三区| 欧美va天堂在线| 国产极品美女高潮无套久久久 | 国产精品久久无码| 国产日韩欧美精品一区| 国产波霸爆乳一区二区| 欧美三级xxx| 国产又粗又长视频| 日韩二区三区在线| 天天影视久久综合| 久久免费观看视频| 国内自拍亚洲| 精品婷婷色一区二区三区蜜桃| 国产一区二区三区电影在线观看| 成人免费看片视频在线观看| 欧美亚洲专区| 蜜桃视频无码区在线观看| 国产午夜精品在线观看| 欧美人妻一区二区| 欧美在线观看一区二区| 农村少妇久久久久久久| 日日骚久久av| 神马午夜在线视频| 91久久大香伊蕉在人线| 精品不卡一区| 国产精品无码av在线播放| 国产毛片精品国产一区二区三区| 国产手机在线观看| 亚洲成人自拍网| 国产片在线播放| 中文国产成人精品久久一| h片在线观看下载| 成人欧美一区二区三区在线| 精品在线观看入口| 黄色成人在线看| 国产精品一区二区你懂的| 午夜影院黄色片| 欧美视频第一页| 少妇无码一区二区三区| 欧美成人激情在线| 亚洲精品伦理| 日韩av电影免费在线| 国产精品一国产精品k频道56| 欧美性生交xxxxx| 一区二区三区中文免费| 国产美女免费看| 日韩视频在线一区| 日韩毛片一区| 日韩av图片| 欧美综合二区| 欧美 日本 国产| 欧美特黄级在线| 四虎精品在永久在线观看| 久久人人看视频| av男人一区| 亚洲理论电影在线观看| 国产999精品久久久久久绿帽| 欧美国产在线看| 日韩精品一区国产麻豆| 日本h片在线观看| 超碰97在线人人| 国模吧视频一区| 亚洲图片综合网| 欧美性猛交xxxx黑人猛交| 视频午夜在线| 日本成人精品在线| 久久99青青| 8x8x最新地址| 国产精品伦理在线| 亚洲中文字幕一区二区| www.日韩系列| 精品国产乱码久久久久久樱花| 麻豆一区二区三区在线观看| 国产精品一区免费在线观看| 久久精品第一页| 亚洲国产成人久久综合一区| 乡村艳史在线观看| 欧美人xxxxx| 蜜桃精品视频在线| 国产成人无码aa精品一区| 精品国产一二三区| 欧美gv在线观看| 图片区小说区区亚洲五月| 精品一区二区日韩| 久久艹精品视频| 精品夜色国产国偷在线| 成人免费av电影| 潘金莲一级淫片aaaaaa播放1| 国产91精品在线观看| 欧美一级片免费在线观看| 亚洲最新中文字幕| 国产精品亚洲综合在线观看 | 亚洲国语精品自产拍在线观看| 天堂√中文最新版在线| 亚洲黄色一区二区三区| 国产成人午夜视频| jizz国产在线观看| 超碰91人人草人人干| 奇米777国产一区国产二区| 啊啊啊国产视频| 一区二区三区在线影院| 日本午夜在线| 91久久国产精品| 性欧美暴力猛交另类hd| 老司机成人免费视频| 日韩av在线网| 24小时成人在线视频| 国产亚洲精品网站| 中文字幕色av一区二区三区| 色婷婷在线视频| 国产精品自产拍在线观看| 伊人久久综合| 最新黄色av网址| 亚洲精品久久久久久下一站| 欧美激情福利| 国产亚洲欧美在线视频| 亚洲精品成人精品456| 黄色片免费在线| 国产高清自拍99| 久久99精品久久久久久国产越南 | 欧美日韩精品免费观看| 国产精品一级片| 中文字字幕在线中文乱码|