精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4個簡單技巧,可提高您的Apache Spark工作性能

大數據 Spark
在開發Spark應用程序時,最耗時的部分之一是優化。 在此博客文章中,我將提供一些性能提示,以及(至少對我而言)啟動時可能會使用的未知配置參數。

使您的Apache Spark應用程序運行速度更快,而對代碼的更改最少!

[[326152]]

介紹

在開發Spark應用程序時,最耗時的部分之一是優化。 在此博客文章中,我將提供一些性能提示,以及(至少對我而言)啟動時可能會使用的未知配置參數。

因此,我將介紹以下主題:

  • 多個小文件作為源
  • 隨機分區參數
  • 強制廣播Join
  • 分區vs合并vs隨機分區參數設置

我們可以改善什么?

1. 使用多個小文件?

OpenCostInBytes(來自文檔)—可以同時掃描打開文件的估計成本(以字節數衡量)。 將多個文件放入分區時使用。 最好高估一下,然后,具有較小文件的分區將比具有較大文件的分區(首先安排)更快。 默認值為4MB。

spark.conf.set("spark.files.openCostInBytes", SOME_COST_IN_BYTES)

我對包含12,000個文件的1GB文件夾,包含800個文件的7.8GB文件夾和包含1.6k個文件的18GB文件夾進行了測試。 我的目的是弄清楚輸入文件是否較小,最好使用低于默認值的文件。

因此,當測試1GB和7.8GB文件夾時-肯定是較低的值,但是測試大約11MB的文件時,較大的參數值會更好。

使用接近您的小文件大小的openCostInBytes大小。 這樣會更有效率!

2. 隨機分區

開始使用Spark時,我莫名其妙地想到了在創建Spark會話時設置的配置是不可變的。 天哪,我怎么錯。

因此,通常,在進行聚集或聯接時,spark分區在spark中是一個靜態數字(默認為200)。 根據您的數據大小,這會導致兩個問題:

  • 數據集很小-200太多,數據分散且效率不高
  • 數據集巨大-200太少了。 數據被浪費了,我們沒有充分利用我們想要的所有資源。

因此,在遇到此類問題時遇到了一些麻煩,我在Google上花費了很多時間,發現了這個美麗的東西

  1. spark.conf.set("spark.sql.shuffle.partitions", X) 

可以在運行時中途隨時隨地更改此整潔的配置,它會影響設置后觸發的步驟。 您也可以在創建Spark會話時使用這個壞男孩。 在對聯接或聚合進行數據混排時,將使用此分區數量。 還獲得數據幀分區計數:

  1. df.rdd.getNumPartitions() 

您可以估計最合適的混搭分區數,以進行進一步的聯接和聚合。

也就是說,您有一個巨大的數據框,并且想要保留一些信息。 這樣就得到了大數據幀的分區數。 將shuffle分區參數設置為此值。 這樣一來,加入后就不會成為默認值200! 更多并行性-我們來了!

3. 廣播Join

非常簡單的情況:我們有一個龐大的表,其中包含所有用戶,而我們的表中包含內部用戶,質量檢查人員和其他不應包含在內的用戶。 目標只是離開非內部人員。

  • 讀兩個表
  • Huge_table 左防聯接小表

它看起來像是一個簡單且性能明智的好解決方案。 如果您的小型表小于10MB,則您的小型數據集將在沒有任何提示的情況下進行廣播。 如果在代碼中添加提示,則可能會使它在更大的數據集上運行,但這取決于優化程序的行為。

但是,假設它是100-200MB,并且提示您不要強制廣播它。 因此,如果您確信它不會影響代碼的性能(或引發一些OOM錯誤),則可以使用它并覆蓋默認值:

  1. spark.conf.set("spark.sql.autoBroadcastJoinThreshold", SIZE_OF_SMALLER_DATASET) 

在這種情況下,它將廣播給所有執行者,并且加入應該工作得更快。

當心OOM錯誤!

4. 分區vs合并vs隨機分區配置設置

如果您使用的是Spark,則可能知道重新分區方法。 對我來說,來自SQL后臺方法合并的方式有不同的含義! 顯然,在分區上進行火花合并時,其行為方式有所不同-它移動并將多個分區組合在一起。 基本上,我們將數據改組和移動減到最少。

如果我們只需要減少分區數,則應該使用合并而不是重新分區,因為這樣可以最大程度地減少數據移動并且不會觸發交換。 如果我們想更均勻地在分區之間劃分數據,請重新分區。

但是,假設我們有一個重復出現的模式,我們執行聯接/轉換并得到200個分區,但是我們不需要200個分區,即100個甚至1個。

讓我們嘗試進行比較。 我們將讀取11MB的文件夾,并像以前一樣進行匯總。

通過將數據幀持久存儲在僅存儲選件磁盤上,我們可以估計數據幀大小。 所以small_df只有10 MB,但是分區數是200。等等? 平均每個分區可提供50KB的數據,這效率不高。 因此,我們將讀取大數據幀,并將聚合后的分區計數設置為1,并強制Spark執行,最后我們將其算作一項操作。

這是我們三種情況的執行計劃:

4個簡單技巧,可提高您的Apache Spark工作性能

> Setting shuffle partition parameter

4個簡單技巧,可提高您的Apache Spark工作性能

> Coalesce action

4個簡單技巧,可提高您的Apache Spark工作性能

> Repartitioning

因此,在所有可見的設置中,我們不會調用Coalesce / Exchange的其他步驟(重新分區操作)。 因此,我們可以通過跳過它來節省一些執行時間。 如果我們看一下執行時間:Shuffle Partition設置在7.1分鐘,Coalesce 8.1,Repartition 8.3中完成。

這只是一個簡單的示例,它仍然顯示了通過設置一個配置參數可以節省多少時間!

摘要

關于如何使您的Apache Spark應用程序更快,更高效地運行,有許多小而簡單的技巧和竅門。 不幸的是,使用Spark時,大多數情況下解決方案都是單獨的。 為了使其正常工作,大多數時候您必須了解Spark內部組件的內幕,并從頭到尾閱讀文檔多次。

在本文中,我提到了如何更快地讀取多個小文件,如何強制建議廣播連接,選擇何時使用shuffle分區參數,合并和重新分區。

我希望它很有用,并會在您開發Apache Spark應用程序的過程中為您提供幫助!

 

責任編輯:趙寧寧 來源: 今日頭條
相關推薦

2017-11-06 13:25:25

MySQL數據庫技巧

2024-10-25 15:48:21

GPUPyTorch編程

2020-03-25 08:00:32

Kubernetes節點工作

2020-09-23 09:20:58

代碼Java字符串

2017-02-05 17:33:59

前端優化Web性能

2020-08-04 08:30:18

JS數組技巧

2021-05-12 09:00:00

WebReactJavaScript

2009-12-23 17:07:37

WPF性能

2017-11-17 08:56:59

Java性能優化技巧

2015-11-16 10:03:10

效率

2023-10-13 12:56:23

工作效率VS Code技巧

2017-05-18 09:16:54

前端CSS技巧

2020-06-04 15:55:54

GitHub代碼開發者

2016-10-21 16:05:44

SQLSQL SERVER技巧

2011-08-05 10:55:53

2019-08-30 14:25:03

Vim命令Linux

2009-06-17 10:13:03

提高EJB性能

2019-03-19 14:20:58

Linux在機器學習腳本

2024-04-09 14:21:15

HTML開發

2023-02-21 14:55:40

React開發技巧
點贊
收藏

51CTO技術棧公眾號

亚洲第一色中文字幕| 中文字幕第一区综合| 久久久久在线观看| 黄色正能量网站| 国产成人免费9x9x人网站视频| 国产精品欧美精品| 国产精品夜夜夜一区二区三区尤| 99久久精品国产亚洲| 91日韩欧美| 亚洲国产成人精品女人久久久 | 国产精品视频精品视频| 久久久久久久久毛片| 伊人成综合网yiren22| 91精品婷婷国产综合久久竹菊| 青青青在线视频播放| 成人在线免费公开观看视频| 国产成人在线免费| 国产97在线|亚洲| 亚洲国产成人精品综合99| 国产日产精品一区二区三区四区的观看方式 | 欧美精品久久久久久久自慰 | 国产精品白浆| 欧美精品免费视频| 黑鬼大战白妞高潮喷白浆| 最新日本在线观看| 国产精品午夜在线观看| 久久久精品有限公司| 国产色综合视频| 男女男精品视频| 欧美亚洲在线观看| 国产真实夫妇交换视频| 性欧美69xoxoxoxo| 一本色道久久88综合亚洲精品ⅰ| 亚洲一区二区在线免费| 精品国产乱码一区二区三区 | 国模精品系列视频| 亚洲波多野结衣| 欧美肉体xxxx裸体137大胆| 亚洲国产女人aaa毛片在线| 亚洲精品在线网址| 日韩一区二区三区四区五区| 在线看不卡av| 欧美三级午夜理伦三级| 性xxxxfreexxxxx欧美丶| 一区二区三区成人| 日本道在线视频| 欧美成人高清在线| 国产精品高潮呻吟| 中文字幕中文字幕99| 性开放的欧美大片| 国产精品免费av| 日韩免费电影一区二区三区| 免费资源在线观看| 国产日本欧美一区二区| 日本一区二区三区四区高清视频 | 欧美成年人视频网站欧美| 懂色av粉嫩av浪潮av| 色综合天天综合网中文字幕| 亚洲欧美在线第一页| 日韩精品无码一区二区三区久久久| 国产精品一区二区中文字幕| 亚洲成人xxx| 亚洲の无码国产の无码步美| 久9re热视频这里只有精品| 精品国产第一区二区三区观看体验| 精品国产aⅴ一区二区三区东京热 久久久久99人妻一区二区三区 | 91禁外国网站| 五月激情六月丁香| 久久天堂成人| 成人国产精品久久久| 国产美女永久免费| 成人禁用看黄a在线| 国产精品久久精品视| 日韩私人影院| 国产免费成人在线视频| 亚洲一区三区在线观看| 岛国中文字幕在线| 亚洲动漫第一页| 一女被多男玩喷潮视频| av在线一区不卡| 欧美高清视频www夜色资源网| 91香蕉视频免费看| 理论片一区二区在线| 亚洲精品中文字幕av| 岛国片在线免费观看| 一本一道久久a久久精品蜜桃| 欧美—级a级欧美特级ar全黄| 九一国产在线观看| 蜜桃av噜噜一区二区三区小说| 91免费看片在线| 日本xxxx人| 中文字幕国产一区| 国产欧美精品aaaaaa片| 少妇淫片在线影院| 欧美丰满一区二区免费视频| 亚洲欧美日韩色| 欧美日韩中文一区二区| 欧美韩日一区二区| 精品黑人一区二区三区| 国产一区999| 久久久亚洲综合网站| 欧美天天影院| 日韩欧美一区二区三区| 性久久久久久久久久久久久久| 欧美自拍一区| 久久精品国产精品| 午夜影院免费在线观看| 国产福利一区在线| 亚洲乱码一区二区三区| 欧美a级在线观看| 欧美精品久久久久久久久老牛影院| 亚洲精品无码一区二区| 久久一区二区三区喷水| 91精品国产99| 99久久国产热无码精品免费| 国产日韩精品一区二区三区| 成人黄色大片网站| 久久久精品区| 中文字幕av一区| 国产欧美日韩另类| 国产盗摄视频一区二区三区| 天天久久人人| 中文在线8资源库| 亚洲成年人在线| 国产suv一区二区三区| 免费成人av资源网| 欧美一区观看| 丝袜老师在线| 亚洲成人网久久久| 久久中文免费视频| 麻豆精品蜜桃视频网站| 欧美日韩在线高清| 日韩欧美精品一区二区三区| 精品久久一区二区| 五月天婷婷色综合| 韩国视频一区二区| 一区二区三区四区免费视频| 日韩精品麻豆| 亚洲人成电影在线| 亚洲AV无码成人精品区东京热| zzijzzij亚洲日本少妇熟睡| 毛片在线视频观看| 粉嫩av国产一区二区三区| 日韩中文理论片| 中文在线最新版天堂| 国产欧美一区在线| 亚洲精品高清无码视频| blacked蜜桃精品一区| 日韩美女视频在线观看| 国产系列电影在线播放网址| 色综合一个色综合亚洲| 国产精品一区二区入口九绯色| 99国产精品| 精品伊人久久大线蕉色首页| 欧美gv在线观看| 亚洲女人天堂成人av在线| www.国产一区二区| 国产性天天综合网| 日韩大片一区二区| 亚洲综合激情在线| 国产成人成网站在线播放青青| 在线观看wwwxxxx| 精品免费日韩av| 日韩精品成人在线| 2021中文字幕一区亚洲| 黄色国产精品视频| 第一会所亚洲原创| 成人h猎奇视频网站| 中文字幕在线观看播放| 精品国产乱码久久久久久蜜臀| 日本三级网站在线观看| 久久久99精品久久| 色乱码一区二区三区在线| 91精品电影| 国产免费一区二区三区| 成人免费看视频网站| 中文字幕最新精品| 国产黄色av片| 欧美色视频日本版| 欧美乱大交做爰xxxⅹ小说| 国产一区二区福利视频| 欧美在线一区视频| 免费毛片在线不卡| 91精品视频网站| 黄色大片在线| 亚洲视频欧美视频| 国产视频一区二区三| 无吗不卡中文字幕| 99自拍偷拍视频| 处破女av一区二区| 色婷婷综合久久久久中文字幕 | 99精品欧美一区二区三区小说| 欧美xxxxx在线视频| 91精品一区国产高清在线gif| 不卡一区二区三区视频| 日本电影欧美片| 不卡毛片在线看| 欧洲视频在线免费观看| 欧美剧情片在线观看| 精品无码av在线| 欧美极品xxx| 97中文字幕在线观看| 久久天堂精品| 国产乱子伦精品无码专区| 亚洲综合图色| 97久草视频| 国产欧美在线观看免费| 亚州精品天堂中文字幕| 秋霞a级毛片在线看| 日韩精品福利在线| 国产三级第一页| 日本精品免费观看高清观看| 欧美日韩综合一区二区| 国产精品丝袜91| 亚洲一区二区乱码| 国产高清成人在线| 岛国av在线免费| 久久国产精品久久久久久电车| 精品一区二区成人免费视频| 精品国产日韩欧美| 精品免费二区三区三区高中清不卡| 亚洲伦理久久| 国产精品第8页| caoporn视频在线| 欧美xxxx做受欧美.88| 香蕉视频国产在线观看| 伊人精品在线观看| 日本福利在线观看| 亚洲国产精品久久精品怡红院| 97久久人国产精品婷婷| 欧美亚洲国产bt| 天天干天天干天天操| 午夜精品久久久久影视| 妺妺窝人体色www在线下载| 日韩理论片网站| 午夜国产福利视频| 欧美国产精品劲爆| 亚洲图片另类小说| 91理论电影在线观看| 六十路息与子猛烈交尾| 成人午夜av电影| 伊人久久一区二区三区| 懂色av中文字幕一区二区三区| 青青草精品在线| 国产精品18久久久久久久久久久久 | 好看的中文字幕在线播放| 欧美伦理91i| 日韩激情av| 久久久久久一区二区三区| 男人天堂亚洲天堂| 欧美激情精品久久久久久久变态| 四虎影视国产在线视频| 久久久久久久久久久久久久久久久久av| 制服丝袜在线播放| 久久人人爽人人| 黄视频免费在线看| 4p变态网欧美系列| 成人日韩精品| 国产日韩在线视频| 欧一区二区三区| 国模精品一区二区三区| 特黄特色欧美大片| 日韩av高清| 婷婷亚洲最大| 精品无码av无码免费专区| 亚洲高清资源| 成年人网站大全| 老司机一区二区| 男生和女生一起差差差视频| 国产999精品久久| 亚洲最大成人网站| 国产精品美女久久久久高潮| 免费看一级大片| 天天影视涩香欲综合网| 人人妻人人爽人人澡人人精品| 欧美日韩一区二区三区免费看| 国产女人高潮的av毛片| 精品国产精品网麻豆系列| 欧美精品a∨在线观看不卡| 有码中文亚洲精品| 手机在线免费看av| 欧美怡红院视频一区二区三区| 国产原创一区| 国产区一区二区三区| 国产成人一区| 伊人再见免费在线观看高清版 | 免费久久久久久久久| 中文字幕一区二区三区四区五区六区| 黄色av日韩| 久草在在线视频| 国产精品亚洲综合一区在线观看| 中文字幕丰满孑伦无码专区| 国产精品日韩精品欧美在线| 国产一级特黄a高潮片| 色噜噜夜夜夜综合网| 97精品人妻一区二区三区在线| 亚洲第一区第二区| 91精品国产综合久久久久久豆腐| 毛片精品免费在线观看| 欧美一区 二区 三区| av日韩中文字幕| 日韩欧美中字| 国产极品粉嫩福利姬萌白酱 | 9.1成人看片| 自拍偷拍国产精品| 一二三区免费视频| 精品国产乱码久久久久久夜甘婷婷| 超碰免费97在线观看| 97在线观看免费高清| 成人国产精品久久| 日韩精品无码一区二区三区| 亚洲一级黄色| 日韩成人av免费| 国产亚洲短视频| 国产成人精品一区二三区| 7777精品久久久大香线蕉| 精品亚洲成a人片在线观看| 久久久久久久久国产| 国产美女视频一区二区| 亚州欧美一区三区三区在线| 99国产精品私拍| 国产成人精品一区二区三区在线观看| 欧美极品另类videosde| 中文字幕精品无码一区二区| 亚洲第一福利视频| 91三级在线| 91精品在线看| 国产精品99视频| 日韩精品一区中文字幕| 久久免费视频色| 日韩欧美一级视频| 亚洲成人a**站| wwww亚洲| 精品久久久久久一区二区里番| 国产精品a久久久久| 午夜免费福利网站| 国产精品看片你懂得| 成人一级免费视频| 亚洲午夜久久久影院| 日本久久免费| 欧美另类一区| 久热国产精品| 国产伦理片在线观看| 欧美在线免费播放| 福利成人在线观看| 国产日韩中文在线| 国产精品99在线观看| 天天色天天综合网| 亚洲日穴在线视频| www.爱爱.com| 久久久久久久久久国产精品| 国产精品超碰| 欧美黄网站在线观看| 久久在线观看免费| 久草视频在线免费| www.国产精品一二区| av在线播放一区二区| 激情五月五月婷婷| 国产不卡一区视频| 日本系列第一页| 亚洲欧美另类国产| 国产成+人+综合+亚洲欧美| 亚洲人久久久| 国产成人免费视频一区| 日韩av综合在线| 亚洲欧美制服丝袜| 伊人久久精品| 一本久道高清无码视频| 久久久一区二区| 一区二区视频在线免费观看| 久久亚洲国产精品| 欧美理论电影在线精品| 别急慢慢来1978如如2| 国产精品黄色在线观看| 亚洲高清精品视频| 日韩免费av片在线观看| 久久中文字幕二区| 波多野结衣三级视频| 一本色道久久综合精品竹菊| av资源在线观看免费高清| 成人网址在线观看| 国产精品日韩| 欧美一级特黄高清视频| 亚洲精品999| 国产91亚洲精品久久久| 美女扒开大腿让男人桶| 亚洲国产成人在线| 国产成人精品免费看视频| 欧美主播福利视频| 国产精品毛片一区二区在线看| 亚洲色图欧美日韩| 欧美日韩一级片在线观看| 制服丝袜中文字幕在线| 日本最新一区二区三区视频观看| 国产乱子轮精品视频| 国产区一区二区三| 操人视频在线观看欧美| 国产成人影院| 日本国产在线视频| 3d动漫精品啪啪一区二区竹菊|