Spark Streaming源碼解讀之Driver中的ReceiverTracker架構設計以及具體實現徹底研究

上節課講到了Receiver是如何不斷的接收數據的，並且接收到的數據的元數據會彙報給ReceiverTracker，下面我們看看ReceiverTracker具體的功能及實現。
一、 ReceiverTracker主要的功能：
在Executor上啓動Receivers。
停止Receivers 。
更新Receiver接收數據的速率(也就是限流)
不斷的等待Receivers的運行狀態，只要Receivers停止運行，就重新啓動Receiver。也就是Receiver的容錯功能。
接受Receiver的註冊。
藉助ReceivedBlockTracker來管理Receiver接收數據的元數據。
彙報Receiver發送過來的錯誤信息

ReceiverTracker 管理了一個消息通訊體ReceiverTrackerEndpoint，用來與Receiver或者ReceiverTracker 進行消息通信。
在ReceiverTracker的start方法中，實例化了ReceiverTrackerEndpoint，並且在Executor上啓動Receivers：
/** Start the endpoint and receiver execution thread. */
def start(): Unit = synchronized {
if (isTrackerStarted) {
throw new SparkException("ReceiverTracker already started")
}

if (!receiverInputStreams.isEmpty) {
endpoint = ssc.env.rpcEnv.setupEndpoint(
"ReceiverTracker", new ReceiverTrackerEndpoint(ssc.env.rpcEnv))
if (!skipReceiverLaunch) launchReceivers()
logInfo("ReceiverTracker started")
trackerState = Started
}
}

啓動Receivr，其實是ReceiverTracker給ReceiverTrackerEndpoint發送了一個本地消息，ReceiverTrackerEndpoint將Receiver封裝成RDD以job的方式提交給集羣運行。
endpoint.send(StartAllReceivers(receivers))

這裏的endpoint就是ReceiverTrackerEndpoint的引用。

Receiver啓動後，會向ReceiverTracker註冊，註冊成功纔算正式啓動了。
override protected def onReceiverStart(): Boolean = {
val msg = RegisterReceiver(
streamId, receiver.getClass.getSimpleName, host, executorId, endpoint)
trackerEndpoint.askWithRetry[Boolean](msg)
}

當Receiver端接收到數據，達到一定的條件需要將數據寫入BlockManager，並且將數據的元數據彙報給ReceiverTracker：
/** Store block and report it to driver */
def pushAndReportBlock(
receivedBlock: ReceivedBlock,
metadataOption: Option[Any],
blockIdOption: Option[StreamBlockId]
) {
val blockId = blockIdOption.getOrElse(nextBlockId)
val time = System.currentTimeMillis
val blockStoreResult = receivedBlockHandler.storeBlock(blockId, receivedBlock)
logDebug(s"Pushed block $blockId in ${(System.currentTimeMillis - time)} ms")
val numRecords = blockStoreResult.numRecords
val blockInfo = ReceivedBlockInfo(streamId, numRecords, metadataOption, blockStoreResult)
trackerEndpoint.askWithRetry[Boolean](AddBlock(blockInfo))
logDebug(s"Reported block $blockId")
}

當ReceiverTracker收到元數據後，會在線程池中啓動一個線程來寫數據：
case AddBlock(receivedBlockInfo) =>
if (WriteAheadLogUtils.isBatchingEnabled(ssc.conf, isDriver = true)) {
walBatchingThreadPool.execute(new Runnable {
override def run(): Unit = Utils.tryLogNonFatalError {
if (active) {
context.reply(addBlock(receivedBlockInfo))
} else {
throw new IllegalStateException("ReceiverTracker RpcEndpoint shut down.")
}
}
})
} else {
context.reply(addBlock(receivedBlockInfo))
}

數據的元數據是交由ReceivedBlockTracker管理的。
數據最終被寫入到streamIdToUnallocatedBlockQueues中：一個流對應一個數據塊信息的隊列。

private type ReceivedBlockQueue = mutable.Queue[ReceivedBlockInfo]

private val streamIdToUnallocatedBlockQueues = new mutable.HashMap[Int, ReceivedBlockQueue]

每當Streaming 觸發job時，會將隊列中的數據分配成一個batch，並將數據寫入timeToAllocatedBlocks數據結構。

private val timeToAllocatedBlocks = new mutable.HashMap[Time, AllocatedBlocks]
....
def allocateBlocksToBatch(batchTime: Time): Unit = synchronized {
if (lastAllocatedBatchTime == null || batchTime > lastAllocatedBatchTime) {
val streamIdToBlocks = streamIds.map { streamId =>
(streamId, getReceivedBlockQueue(streamId).dequeueAll(x => true))
}.toMap
val allocatedBlocks = AllocatedBlocks(streamIdToBlocks)
if (writeToLog(BatchAllocationEvent(batchTime, allocatedBlocks))) {
timeToAllocatedBlocks.put(batchTime, allocatedBlocks)
lastAllocatedBatchTime = batchTime
} else {
logInfo(s"Possibly processed batch $batchTime need to be processed again in WAL recovery")
}
} else {
// This situation occurs when:
// 1. WAL is ended with BatchAllocationEvent, but without BatchCleanupEvent,
// possibly processed batch job or half-processed batch job need to be processed again,
// so the batchTime will be equal to lastAllocatedBatchTime.
// 2. Slow checkpointing makes recovered batch time older than WAL recovered
// lastAllocatedBatchTime.
// This situation will only occurs in recovery time.
logInfo(s"Possibly processed batch $batchTime need to be processed again in WAL recovery")
}
}

可見一個batch會包含多個流的數據。

每當Streaming 的一個job運行完畢後：
private def handleJobCompletion(job: Job, completedTime: Long) {
val jobSet = jobSets.get(job.time)
jobSet.handleJobCompletion(job)
job.setEndTime(completedTime)
listenerBus.post(StreamingListenerOutputOperationCompleted(job.toOutputOperationInfo))
logInfo("Finished job " + job.id + " from job set of time " + jobSet.time)
if (jobSet.hasCompleted) {
jobSets.remove(jobSet.time)
jobGenerator.onBatchCompletion(jobSet.time)
logInfo("Total delay: %.3f s for time %s (execution: %.3f s)".format(
jobSet.totalDelay / 1000.0, jobSet.time.toString,
jobSet.processingDelay / 1000.0
))
listenerBus.post(StreamingListenerBatchCompleted(jobSet.toBatchInfo))
}
...

JobScheduler會調用handleJobCompletion方法，最終會觸發
jobScheduler.receiverTracker.cleanupOldBlocksAndBatches(time - maxRememberDuration)

這裏的maxRememberDuration是DStream中每個時刻生成的RDD保留的最長時間。
def cleanupOldBatches(cleanupThreshTime: Time, waitForCompletion: Boolean): Unit = synchronized {
require(cleanupThreshTime.milliseconds < clock.getTimeMillis())
val timesToCleanup = timeToAllocatedBlocks.keys.filter { _ < cleanupThreshTime }.toSeq
logInfo("Deleting batches " + timesToCleanup)
if (writeToLog(BatchCleanupEvent(timesToCleanup))) {
timeToAllocatedBlocks --= timesToCleanup
writeAheadLogOption.foreach(_.clean(cleanupThreshTime.milliseconds, waitForCompletion))
} else {
logWarning("Failed to acknowledge batch clean up in the Write Ahead Log.")
}
}

而最後

listenerBus.post(StreamingListenerBatchCompleted(jobSet.toBatchInfo))

這個代碼會調用
case batchCompleted: StreamingListenerBatchCompleted =>
listener.onBatchCompleted(batchCompleted)

... 一路跟着下去...

/**
* A RateController that sends the new rate to receivers, via the receiver tracker.
*/
private[streaming] class ReceiverRateController(id: Int, estimator: RateEstimator)
extends RateController(id, estimator) {
override def publish(rate: Long): Unit =
ssc.scheduler.receiverTracker.sendRateUpdate(id, rate)
}

/** Update a receiver's maximum ingestion rate */
def sendRateUpdate(streamUID: Int, newRate: Long): Unit = synchronized {
if (isTrackerStarted) {
endpoint.send(UpdateReceiverRateLimit(streamUID, newRate))
}
}

case UpdateReceiverRateLimit(streamUID, newRate) =>
for (info <- receiverTrackingInfos.get(streamUID); eP <- info.endpoint) {
eP.send(UpdateRateLimit(newRate))
}

發送調整速率的消息給Receiver，Receiver接到消息後，最終通過BlockGenerator來調整數據的寫入的時間，而控制數據流的速率。

case UpdateRateLimit(eps) =>
logInfo(s"Received a new rate limit: $eps.")
registeredBlockGenerators.foreach { bg =>
bg.updateRate(eps)
}

Spark Streaming源碼解讀之Driver中的ReceiverTracker架構設計以及具體實現徹底研究

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

Spark Streaming源碼解讀之Driver容錯安全性

Spark Streaming源碼解讀之流數據不斷接收全生命週期徹底研究和思考

RDD：基於內存的集羣計算容錯抽象

Spark Streaming源碼解讀之Executor容錯安全性

Spark Streaming源碼解讀之JobScheduler內幕實現和深度思考

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結