原生線程池這麼強大,Tomcat 爲何還需擴展線程池?

前言

Tomcat/Jetty 是目前比較流行的 Web 容器,兩者接受請求之後都會轉交給線程池處理,這樣可以有效提高處理的能力與併發度。JDK 提高完整線程池實現,但是 Tomcat/Jetty 都沒有直接使用。Jetty 採用自研方案,內部實現 QueuedThreadPool 線程池組件,而 Tomcat 採用擴展方案,踩在 JDK 線程池的肩膀上,擴展 JDK 原生線程池。

JDK 原生線程池可以說功能比較完善,使用也比較簡單,那爲何 Tomcat/Jetty 卻不選擇這個方案,反而自己去動手實現那?

JDK 線程池

通常我們可以將執行的任務分爲兩類:

  • cpu 密集型任務

  • io 密集型任務

cpu 密集型任務,需要線程長時間進行的複雜的運算,這種類型的任務需要少創建線程,過多的線程將會頻繁引起上文切換,降低任務處理處理速度。

而 io 密集型任務,由於線程並不是一直在運行,可能大部分時間在等待 IO 讀取/寫入數據,增加線程數量可以提高併發度,儘可能多處理任務。

JDK 原生線程池工作流程如下:

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?

線程池執行流程圖

詳情可以查看 一文教你安全的關閉線程池, 上圖假設使用 LinkedBlockingQueue。

靈魂拷問:上述流程是否記錯過?在很長一段時間內,我都認爲線程數量到達最大線程數,才放入隊列中。 ̄□ ̄||

上圖中可以發現只要線程池線程數量大於核心線程數,就會先將任務加入到任務隊列中,只有任務隊列加入失敗,纔會再新建線程。也就是說原生線程池隊列未滿之前,最多隻有核心線程數量線程。

這種策略顯然比較適合處理 cpu 密集型任務,但是對於 io 密集型任務,如數據庫查詢,rpc 請求調用等,就不是很友好了。

由於 Tomcat/Jetty 需要處理大量客戶端請求任務,如果採用原生線程池,一旦接受請求數量大於線程池核心線程數,這些請求就會被放入到隊列中,等待覈心線程處理。這樣做顯然降低這些請求總體處理速度,所以兩者都沒采用 JDK 原生線程池。

解決上面的辦法可以像 Jetty 自己實現線程池組件,這樣就可以更加適配內部邏輯,不過開發難度比較大,另一種就像 Tomcat 一樣,擴展原生 JDK 線程池,實現比較簡單。

下面主要以 Tomcat 擴展線程池,講講其實現原理。

擴展線程池

首先我們從 JDK 線程池源碼出發,查看如何這個基礎上擴展。

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?


可以看到線程池流程主要分爲三步,第二步根據 queue#offer 方法返回結果,判斷是否需要新建線程。

JDK 原生隊列類型 LinkedBlockingQueue, SynchronousQueue,兩者實現邏輯不盡相同。

LinkedBlockingQueue

offer 方法內部將會根據隊列是否已滿作爲判斷條件。若隊列已滿,返回 false,若隊列未滿,則將任務加入隊列中,且返回 true。

SynchronousQueue

這個隊列比較特殊,內部不會儲存任何數據。若有線程將任務放入其中將會被阻塞,直到其他線程將任務取出。反之,若無其他線程將任務放入其中,該隊列取任務的方法也將會被阻塞,直到其他線程將任務放入。

對於 offer 方法來說,若有其他線程正在被取方法阻塞,該方法將會返回 true。反之,offer 方法將會返回 false。

所以若想實現適合 io 密集型任務線程池,即優先新建線程處理任務,關鍵在於 queue#offer 方法。可以重寫該方法內部邏輯,只要當前線程池數量小於最大線程數,該方法返回 false,線程池新建線程處理。

當然上述實現邏輯比較糙,下面我們就從 Tomcat 源碼查看其實現邏輯。

Tomcat 擴展線程池

Tomcat 擴展線程池直接繼承 JDK 線程池 java.util.concurrent.ThreadPoolExecutor,重寫部分方法的邏輯。另外還實現了 TaskQueue,直接繼承 LinkedBlockingQueue,重寫 offer 方法。

首先查看 Tomcat 線程池的使用方法。

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?


可以看到 Tomcat 線程池使用方法與普通的線程池差不太多。

接着我們查看一下 Tomcat 線程池核心方法 execute 的邏輯。

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?


execute 方法邏輯比較簡單,任務核心還是交給 Java 原生線程池處理。這裏主要增加一個重試策略,如果原生線程池執行拒絕策略的情況,拋出 RejectedExecutionException 異常。這裏將會捕獲,然後重新再次嘗試將任務加入到 TaskQueue ,盡最大可能執行任務。

這裏需要注意 submittedCount 變量。這是 Tomcat 線程池內部一個重要的參數,它是一個 AtomicInteger 變量,將會實時統計已經提交到線程池中,但還沒有執行結束的任務。也就是說 submittedCount 等於線程池隊列中的任務數加上線程池工作線程正在執行的任務。TaskQueue#offer 將會使用該參數實現相應的邏輯。

接着我們主要查看 TaskQueue#offer 方法邏輯。

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?


核心邏輯在於第三步,這裏如果 submittedCount 小於當前線程池線程數量,將會返回 false。上面我們講到 offer 方法返回 false,線程池將會直接創建新線程。

Dubbo 2.6.X 版本增加 EagerThreadPool,其實現原理與 Tomcat 線程池差不多,感興趣的小夥伴可以自行翻閱。

折衷方法

上述擴展方法雖然看起不是很難,但是自己實現代價可能就比較大。若不想擴展線程池運行 io 密集型任務,可以採用下面這種折衷方法。

原生線程池這麼強大,Tomcat 爲何還需擴展線程池?


不過使用這種方式將會使 keepAliveTime 失效,線程一旦被創建,將會一直存在,比較浪費系統資源。

總結

JDK 實現線程池功能比較完善,但是比較適合運行 CPU 密集型任務,不適合 IO 密集型的任務。對於 IO 密集型任務可以間接通過設置線程池參數方式做到。

覺得文章不錯就給小老弟點個關注吧,更多內容陸續奉上。

最後,分享一份面試寶典《Java核心知識點整理.pdf》,覆蓋了JVM、鎖、高併發、反射、Spring原理、微服務、Zookeeper、數據庫、數據結構等等。加入我的粉絲羣(Java架構技術棧:644872653)即可免費獲取到!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章