淺談Spark On Yarn 中的延遲調度問題

原創

2020-02-22 19:58

延遲調度算法思想十分簡單，爲了實現data locality(即該task所需數據就在其運行的機器上)，會盡量將task分佈到有其所需數據的機器或者jvm中去，如果機器或者jvm已被佔用就進行延遲等待，直到該機器或者jvm可以運行該task或者超過等待時限則將task運行到其他機器上。
這個想法基於以下幾點:
1.往往數據比程序要大得多，分佈式上處理的數據都是GB爲單位的，將程序放到數據所在機器去執行，大大減少網絡傳輸時間。
2.在集羣上面task一般都是運行時間較短的，即整個集羣上面不斷有task完成，釋放其佔用的資源，延遲調度的task能夠有極大的機會獲得分配。
總之，就是延遲調度節省的網絡傳輸時間遠遠大於task等待花費的時間。
延遲調度的思想是相通的，本文討論的是spark在yarn集羣上的延遲調度情況，故分爲兩層，第一層是yarn的延遲調度，第二層則是spark內部的延遲調度。
1.yarn級別的Delay Scheduler
spark在yarn上面的Delay Scheduler其實就是覺得spark的executor分配在哪些NodeManager上面，這是由yarn根據application的輸入文件而定。儘量將executor分佈到有數據的NodeManager上。因爲，在這一層上如果executor無法做到data locality，那麼到了spark的級別分配task到executor的時候，更加無法實現data locality。
在yarn中配置yarn.scheduler.capacity.node-locality-delay配置延遲等待次數。（通常設置機架數量）。
2.spark內部Task的Delay Scheduler
這個級別的Delay Scheduler是面臨的問題，是將task分到有數據的executor上去，上面已經說了，這一層次的Delay Scheduler依賴於yarn對executor的分配。另外，在運算過程中，有task 的Delay Scheduler是因爲我們在spark中對數據進行了cache或者persist。在shuffle中是不用考慮Delay Scheduler的，因爲shuffle中的read task 是需要去所有的write task的disk上拉取數據的，故也就不存在通過延遲調度來選擇data locality的問題了。
在spark中會有3個配置項:
spark.locality.wait.process default 3000ms
spark.locality.wait.node default spark.locality.wait.process
spark.locality.wait.rack default spark.locality.wait.process
目前就還有最後一個問題，需要解決了，配置項該以什麼標準進行配置？
在這篇論文中Delay Scheduling: A Simple Technique for AchievingLocality and Fairness in Cluster Scheduling 有一個詳細的介紹，這裏我直接給出公式：
Job等待一次task實現data locality所花的最長時間 W= (D/S)*T=D/(L*M) * T
D是實現Data Locality，需要延遲等待的次數
M是本次計算用到的集羣節點數
L爲每個節點能用的core數量
S即爲集羣能用的總的core
N爲本次job的task數量
R爲文件的備份數量(HDFS默認爲3)
λ爲期望本次job達到的數據本地率
T爲單個task運行所需要的時間。
通過上面兩個公式，我們就能計算出yarn和spark中的延遲調度項如何配置了。
(D則爲yarn配置的延遲等待次數，W則爲spark中配置中的等待時間。)

站內首發文章

玉羽凌風

發佈了127 篇原創文章 · 獲贊 76 · 訪問量 45萬+

他的留言板關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

淺談Spark On Yarn 中的延遲調度問題

Nginx R31 doc 官方文檔-01-nginx 如何安裝

golang開發環境搭建(win10)

Common issues of disk going full on EMR Cluster (or In general any Hadoop / Spark cluster)

Amazon AWS 中國區的那些"坑"

jedis使用scan替換keys

HDFS中將普通用戶加入到supergroup組來訪問HDFS

hive-site.xml 參數設置

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結