1、垃圾收集器概述
垃圾收集器是垃圾回收算法(標記-清除算法、複製算法、標記-整理算法)的具體實現,不同商家、不同版本的JVM所提供的垃圾收集器可能會有很在差別,本文主要介紹HotSpot虛擬機中的垃圾收集器。
1-1、垃圾收集器組合
JDK7/8後,HotSpot虛擬機所有收集器及組合(連線),如下圖:
(A)、圖中展示了7種不同分代的收集器:
Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old、CMS、G1;
(B)、而它們所處區域,則表明其是屬於新生代收集器還是老年代收集器:
新生代收集器:Serial、ParNew、Parallel Scavenge;
老年代收集器:Serial Old、Parallel Old、CMS;
整堆收集器:G1;
(C)、兩個收集器間有連線,表明它們可以搭配使用:
Serial/Serial Old、Serial/CMS、ParNew/Serial Old、ParNew/CMS、Parallel Scavenge/Serial Old、Parallel Scavenge/Parallel Old、G1;
(D)、其中Serial Old作爲CMS出現"Concurrent Mode Failure"失敗的後備預案(後面介紹);
1-2、併發垃圾收集和並行垃圾收集的區別
(A)、並行(Parallel)
指多條垃圾收集線程並行工作,但此時用戶線程仍然處於等待狀態;
如ParNew、Parallel Scavenge、Parallel Old;
(B)、併發(Concurrent)
指用戶線程與垃圾收集線程同時執行(但不一定是並行的,可能會交替執行);
用戶程序在繼續運行,而垃圾收集程序線程運行於另一個CPU上;
如CMS、G1(也有並行);
1-3、Minor GC和Full GC的區別
(A)、Minor GC
又稱新生代GC,指發生在新生代的垃圾收集動作;
因爲Java對象大多是朝生夕滅,所以Minor GC非常頻繁,一般回收速度也比較快;
(B)、Full GC
又稱Major GC或老年代GC,指發生在老年代的GC;
出現Full GC經常會伴隨至少一次的Minor GC(不是絕對,Parallel Sacvenge收集器就可以選擇設置Major GC策略);
Major GC速度一般比Minor GC慢10倍以上;
下面將介紹這些收集器的特性、基本原理和使用場景,並重點分析CMS和G1這兩款相對複雜的收集器;但需要明確一個觀點:
沒有最好的收集器,更沒有萬能的收集;
選擇的只能是適合具體應用場景的收集器。
2、Serial收集器
Serial(串行)垃圾收集器是最基本、發展歷史最悠久的收集器;
JDK1.3.1前是HotSpot新生代收集的唯一選擇;
1、特點
針對新生代;
採用複製算法;
單線程收集;
進行垃圾收集時,必須暫停所有工作線程,直到完成;
即會"Stop The World";
Serial/Serial Old組合收集器運行示意圖如下:
2、應用場景
依然是HotSpot在Client模式下默認的新生代收集器;
也有優於其他收集器的地方:
簡單高效(與其他收集器的單線程相比);
對於限定單個CPU的環境來說,Serial收集器沒有線程交互(切換)開銷,可以獲得最高的單線程收集效率;
在用戶的桌面應用場景中,可用內存一般不大(幾十M至一兩百M),可以在較短時間內完成垃圾收集(幾十MS至一百多MS),只要不頻繁發生,這是可以接受的
3、設置參數
"-XX:+UseSerialGC":添加該參數來顯式的使用串行垃圾收集器;
4、Stop TheWorld說明
JVM在後臺自動發起和自動完成的,在用戶不可見的情況下,把用戶正常的工作線程全部停掉,即GC停頓;
會帶給用戶不良的體驗;
從JDK1.3到現在,從Serial收集器-》Parallel收集器-》CMS-》G1,用戶線程停頓時間不斷縮短,但仍然無法完全消除;
3、ParNew收集器
ParNew垃圾收集器是Serial收集器的多線程版本。
1、特點
除了多線程外,其餘的行爲、特點和Serial收集器一樣;
如Serial收集器可用控制參數、收集算法、Stop The World、內存分配規則、回收策略等;
兩個收集器共用了不少代碼;
ParNew/Serial Old組合收集器運行示意圖如下:
2、應用場景
在Server模式下,ParNew收集器是一個非常重要的收集器,因爲除Serial外,目前只有它能與CMS收集器配合工作;
但在單個CPU環境中,不會比Serail收集器有更好的效果,因爲存在線程交互開銷。
3、設置參數
"-XX:+UseConcMarkSweepGC":指定使用CMS後,會默認使用ParNew作爲新生代收集器;
"-XX:+UseParNewGC":強制指定使用ParNew;
"-XX:ParallelGCThreads":指定垃圾收集的線程數量,ParNew默認開啓的收集線程與CPU的數量相同;
4、爲什麼只有ParNew能與CMS收集器配合
CMS是HotSpot在JDK1.5推出的第一款真正意義上的併發(Concurrent)收集器,第一次實現了讓垃圾收集線程與用戶線程(基本上)同時工作;
CMS作爲老年代收集器,但卻無法與JDK1.4已經存在的新生代收集器Parallel Scavenge配合工作;
因爲Parallel Scavenge(以及G1)都沒有使用傳統的GC收集器代碼框架,而另外獨立實現;而其餘幾種收集器則共用了部分的框架代碼;
關於CMS收集器後面會詳細介紹。
4、Parallel Scavenge收集器
Parallel Scavenge垃圾收集器因爲與吞吐量關係密切,也稱爲吞吐量收集器(Throughput Collector)。
1、特點
(A)、有一些特點與ParNew收集器相似
新生代收集器;
採用複製算法;
多線程收集;
(B)、主要特點是:它的關注點與其他收集器不同
CMS等收集器的關注點是儘可能地縮短垃圾收集時用戶線程的停頓時間;
而Parallel Scavenge收集器的目標則是達一個可控制的吞吐量(Throughput);
關於吞吐量與收集器關注點說明詳見本節後面;
2、應用場景
高吞吐量爲目標,即減少垃圾收集時間,讓用戶代碼獲得更長的運行時間;
當應用程序運行在具有多個CPU上,對暫停時間沒有特別高的要求時,即程序主要在後臺進行計算,而不需要與用戶進行太多交互;
例如,那些執行批量處理、訂單處理、工資支付、科學計算的應用程序;
3、設置參數
Parallel Scavenge收集器提供兩個參數用於精確控制吞吐量:
(A)、"-XX:MaxGCPauseMillis"
控制最大垃圾收集停頓時間,大於0的毫秒數;
MaxGCPauseMillis設置得稍小,停頓時間可能會縮短,但也可能會使得吞吐量下降;
因爲可能導致垃圾收集發生得更頻繁;
(B)、"-XX:GCTimeRatio"
設置垃圾收集時間佔總時間的比率,0<n<100的整數;
GCTimeRatio相當於設置吞吐量大小;
垃圾收集執行時間佔應用程序執行時間的比例的計算方法是:
1 / (1 + n)
例如,選項-XX:GCTimeRatio=19,設置了垃圾收集時間佔總時間的5%--1/(1+19);
默認值是1%--1/(1+99),即n=99;
垃圾收集所花費的時間是年輕一代和老年代收集的總時間;
如果沒有滿足吞吐量目標,則增加代的內存大小以儘量增加用戶程序運行的時間;
此外,還有一個值得關注的參數:
(C)、"-XX:+UseAdptiveSizePolicy"
開啓這個參數後,就不用手工指定一些細節參數,如:
新生代的大小(-Xmn)、Eden與Survivor區的比例(-XX:SurvivorRation)、晉升老年代的對象年齡(-XX:PretenureSizeThreshold)等;
JVM會根據當前系統運行情況收集性能監控信息,動態調整這些參數,以提供最合適的停頓時間或最大的吞吐量,這種調節方式稱爲GC自適應的調節策略(GC Ergonomiscs);
這是一種值得推薦的方式:
(1)、只需設置好內存數據大小(如"-Xmx"設置最大堆);
(2)、然後使用"-XX:MaxGCPauseMillis"或"-XX:GCTimeRatio"給JVM設置一個優化目標;
(3)、那些具體細節參數的調節就由JVM自適應完成;
這也是Parallel Scavenge收集器與ParNew收集器一個重要區別;
4、吞吐量與收集器關注點說明
(A)、吞吐量(Throughput)
CPU用於運行用戶代碼的時間與CPU總消耗時間的比值;
即吞吐量=運行用戶代碼時間/(運行用戶代碼時間+垃圾收集時間);
高吞吐量即減少垃圾收集時間,讓用戶代碼獲得更長的運行時間;
(B)、垃圾收集器期望的目標(關注點)
(1)、停頓時間
停頓時間越短就適合需要與用戶交互的程序;
良好的響應速度能提升用戶體驗;
(2)、吞吐量
高吞吐量則可以高效率地利用CPU時間,儘快完成運算的任務;
主要適合在後臺計算而不需要太多交互的任務;
(3)、覆蓋區(Footprint)
在達到前面兩個目標的情況下,儘量減少堆的內存空間;
可以獲得更好的空間局部性;
上面介紹的都是新生代收集器,接下來開始介紹老年代收集器;
5、Serial Old收集器
Serial Old是 Serial收集器的老年代版本;
1、特點
針對老年代;
採用"標記-整理"算法(還有壓縮,Mark-Sweep-Compact);
單線程收集;
Serial/Serial Old收集器運行示意圖如下:
2、應用場景
主要用於Client模式;
而在Server模式有兩大用途:
(A)、在JDK1.5及之前,與Parallel Scavenge收集器搭配使用(JDK1.6有Parallel Old收集器可搭配);
(B)、作爲CMS收集器的後備預案,在併發收集發生Concurrent Mode Failure時使用(後面詳解);
6、Parallel Old收集器
Parallel Old垃圾收集器是Parallel Scavenge收集器的老年代版本;
JDK1.6中才開始提供;
1、特點
針對老年代;
採用"標記-整理"算法;
多線程收集;
Parallel Scavenge/Parallel Old收集器運行示意圖如下:
2、應用場景
JDK1.6及之後用來代替老年代的Serial Old收集器;
特別是在Server模式,多CPU的情況下;
這樣在注重吞吐量以及CPU資源敏感的場景,就有了Parallel Scavenge加Parallel Old收集器的"給力"應用組合;
3、設置參數
"-XX:+UseParallelOldGC":指定使用Parallel Old收集器;
7、CMS收集器
併發標記清理(Concurrent Mark Sweep,CMS)收集器也稱爲併發低停頓收集器(Concurrent Low Pause Collector)或低延遲(low-latency)垃圾收集器;
在前面ParNew收集器曾簡單介紹過其特點;
1、特點
針對老年代;
基於"標記-清除"算法(不進行壓縮操作,產生內存碎片);
以獲取最短回收停頓時間爲目標;
併發收集、低停頓;
需要更多的內存(看後面的缺點);
是HotSpot在JDK1.5推出的第一款真正意義上的併發(Concurrent)收集器;
第一次實現了讓垃圾收集線程與用戶線程(基本上)同時工作;
2、應用場景
與用戶交互較多的場景;
希望系統停頓時間最短,注重服務的響應速度;
以給用戶帶來較好的體驗;
如常見WEB、B/S系統的服務器上的應用;
3、設置參數
"-XX:+UseConcMarkSweepGC":指定使用CMS收集器;
4、CMS收集器運作過程
比前面幾種收集器更復雜,可以分爲4個步驟:
(A)、初始標記(CMS initial mark)
僅標記一下GC Roots能直接關聯到的對象;
速度很快;
但需要"Stop The World";
(B)、併發標記(CMS concurrent mark)
進行GC Roots Tracing的過程;
剛纔產生的集合中標記出存活對象;
應用程序也在運行;
並不能保證可以標記出所有的存活對象;
(C)、重新標記(CMS remark)
爲了修正併發標記期間因用戶程序繼續運作而導致標記變動的那一部分對象的標記記錄;
需要"Stop The World",且停頓時間比初始標記稍長,但遠比並發標記短;
採用多線程並行執行來提升效率;
(D)、併發清除(CMS concurrent sweep)
回收所有的垃圾對象;
整個過程中耗時最長的併發標記和併發清除都可以與用戶線程一起工作;
所以總體上說,CMS收集器的內存回收過程與用戶線程一起併發執行;
CMS收集器運行示意圖如下:
5、CMS收集器3個明顯的缺點
(A)、對CPU資源非常敏感
併發收集雖然不會暫停用戶線程,但因爲佔用一部分CPU資源,還是會導致應用程序變慢,總吞吐量降低。
CMS的默認收集線程數量是=(CPU數量+3)/4;
當CPU數量多於4個,收集線程佔用的CPU資源多於25%,對用戶程序影響可能較大;不足4個時,影響更大,可能無法接受。
增量式併發收集器:
針對這種情況,曾出現了"增量式併發收集器"(Incremental Concurrent Mark Sweep/i-CMS);
類似使用搶佔式來模擬多任務機制的思想,讓收集線程和用戶線程交替運行,減少收集線程運行時間;
但效果並不理想,JDK1.6後就官方不再提倡用戶使用。
(B)、無法處理浮動垃圾,可能出現"Concurrent Mode Failure"失敗
(1)、浮動垃圾(Floating Garbage)
在併發清除時,用戶線程新產生的垃圾,稱爲浮動垃圾;
這使得併發清除時需要預留一定的內存空間,不能像其他收集器在老年代幾乎填滿再進行收集;
也要可以認爲CMS所需要的空間比其他垃圾收集器大;
"-XX:CMSInitiatingOccupancyFraction":設置CMS預留內存空間;
JDK1.5默認值爲68%;
JDK1.6變爲大約92%;
(2)、"Concurrent Mode Failure"失敗
如果CMS預留內存空間無法滿足程序需要,就會出現一次"Concurrent Mode Failure"失敗;
這時JVM啓用後備預案:臨時啓用Serail Old收集器,而導致另一次Full GC的產生;
這樣的代價是很大的,所以CMSInitiatingOccupancyFraction不能設置得太大。
(C)、產生大量內存碎片
由於CMS基於"標記-清除"算法,清除後不進行壓縮操作;
前面《Java虛擬機垃圾回收(二) 垃圾回收算法》"標記-清除"算法介紹時曾說過:
產生大量不連續的內存碎片會導致分配大內存對象時,無法找到足夠的連續內存,從而需要提前觸發另一次Full GC動作。
解決方法:
(1)、"-XX:+UseCMSCompactAtFullCollection"
使得CMS出現上面這種情況時不進行Full GC,而開啓內存碎片的合併整理過程;
但合併整理過程無法併發,停頓時間會變長;
默認開啓(但不會進行,結合下面的CMSFullGCsBeforeCompaction);
(2)、"-XX:+CMSFullGCsBeforeCompaction"
設置執行多少次不壓縮的Full GC後,來一次壓縮整理;
爲減少合併整理過程的停頓時間;
默認爲0,也就是說每次都執行Full GC,不會進行壓縮整理;
由於空間不再連續,CMS需要使用可用"空閒列表"內存分配方式,這比簡單實用"碰撞指針"分配內存消耗大;
更多關於內存分配方式請參考:《Java對象在Java虛擬機中的創建過程》
總體來看,與Parallel Old垃圾收集器相比,CMS減少了執行老年代垃圾收集時應用暫停的時間;
但卻增加了新生代垃圾收集時應用暫停的時間、降低了吞吐量而且需要佔用更大的堆空間;
8、G1收集器
G1(Garbage-First)是JDK7-u4才推出商用的收集器;
1、特點
(A)、並行與併發
能充分利用多CPU、多核環境下的硬件優勢;
可以並行來縮短"Stop The World"停頓時間;
也可以併發讓垃圾收集與用戶程序同時進行;
(B)、分代收集,收集範圍包括新生代和老年代
能獨立管理整個GC堆(新生代和老年代),而不需要與其他收集器搭配;
能夠採用不同方式處理不同時期的對象;
雖然保留分代概念,但Java堆的內存佈局有很大差別;
將整個堆劃分爲多個大小相等的獨立區域(Region);
新生代和老年代不再是物理隔離,它們都是一部分Region(不需要連續)的集合;
(C)、結合多種垃圾收集算法,空間整合,不產生碎片
從整體看,是基於標記-整理算法;
從局部(兩個Region間)看,是基於複製算法;
這是一種類似火車算法的實現;
都不會產生內存碎片,有利於長時間運行;
(D)、可預測的停頓:低停頓的同時實現高吞吐量
G1除了追求低停頓處,還能建立可預測的停頓時間模型;
可以明確指定M毫秒時間片內,垃圾收集消耗的時間不超過N毫秒;
2、應用場景
面向服務端應用,針對具有大內存、多處理器的機器;
最主要的應用是爲需要低GC延遲,並具有大堆的應用程序提供解決方案;
如:在堆大小約6GB或更大時,可預測的暫停時間可以低於0.5秒;
用來替換掉JDK1.5中的CMS收集器;
在下面的情況時,使用G1可能比CMS好:
(1)、超過50%的Java堆被活動數據佔用;
(2)、對象分配頻率或年代提升頻率變化很大;
(3)、GC停頓時間過長(長於0.5至1秒)。
是否一定採用G1呢?也未必:
如果現在採用的收集器沒有出現問題,不用急着去選擇G1;
如果應用程序追求低停頓,可以嘗試選擇G1;
是否代替CMS需要實際場景測試才知道。
3、設置參數
"-XX:+UseG1GC":指定使用G1收集器;
"-XX:InitiatingHeapOccupancyPercent":當整個Java堆的佔用率達到參數值時,開始併發標記階段;默認爲45;
"-XX:MaxGCPauseMillis":爲G1設置暫停時間目標,默認值爲200毫秒;
"-XX:G1HeapRegionSize":設置每個Region大小,範圍1MB到32MB;目標是在最小Java堆時可以擁有約2048個Region;
4、爲什麼G1收集器可以實現可預測的停頓
G1可以建立可預測的停頓時間模型,是因爲:
可以有計劃地避免在Java堆的進行全區域的垃圾收集;
G1跟蹤各個Region獲得其收集價值大小,在後臺維護一個優先列表;
每次根據允許的收集時間,優先回收價值最大的Region(名稱Garbage-First的由來);
這就保證了在有限的時間內可以獲取儘可能高的收集效率;
5、一個對象被不同區域引用的問題
一個Region不可能是孤立的,一個Region中的對象可能被其他任意Region中對象引用,判斷對象存活時,是否需要掃描整個Java堆才能保證準確?
在其他的分代收集器,也存在這樣的問題(而G1更突出):
回收新生代也不得不同時掃描老年代?
這樣的話會降低Minor GC的效率;
解決方法:
無論G1還是其他分代收集器,JVM都是使用Remembered Set來避免全局掃描:
每個Region都有一個對應的Remembered Set;
每次Reference類型數據寫操作時,都會產生一個Write Barrier暫時中斷操作;
然後檢查將要寫入的引用指向的對象是否和該Reference類型數據在不同的Region(其他收集器:檢查老年代對象是否引用了新生代對象);
如果不同,通過CardTable把相關引用信息記錄到引用指向對象的所在Region對應的Remembered Set中;
當進行垃圾收集時,在GC根節點的枚舉範圍加入Remembered Set;
就可以保證不進行全局掃描,也不會有遺漏。
6、G1收集器運作過程
不計算維護Remembered Set的操作,可以分爲4個步驟(與CMS較爲相似)。
(A)、初始標記(Initial Marking)
僅標記一下GC Roots能直接關聯到的對象;
且修改TAMS(Next Top at Mark Start),讓下一階段併發運行時,用戶程序能在正確可用的Region中創建新對象;
需要"Stop The World",但速度很快;
(B)、併發標記(Concurrent Marking)
進行GC Roots Tracing的過程;
剛纔產生的集合中標記出存活對象;
耗時較長,但應用程序也在運行;
並不能保證可以標記出所有的存活對象;
(C)、最終標記(Final Marking)
爲了修正併發標記期間因用戶程序繼續運作而導致標記變動的那一部分對象的標記記錄;
上一階段對象的變化記錄在線程的Remembered Set Log;
這裏把Remembered Set Log合併到Remembered Set中;
需要"Stop The World",且停頓時間比初始標記稍長,但遠比並發標記短;
採用多線程並行執行來提升效率;
(D)、篩選回收(Live Data Counting and Evacuation)
首先排序各個Region的回收價值和成本;
然後根據用戶期望的GC停頓時間來制定回收計劃;
最後按計劃回收一些價值高的Region中垃圾對象;
回收時採用"複製"算法,從一個或多個Region複製存活對象到堆上的另一個空的Region,並且在此過程中壓縮和釋放內存;
可以併發進行,降低停頓時間,並增加吞吐量;
G1收集器運行示意圖如下:
到這裏,我們大體瞭解HotSpot虛擬機中的所有垃圾收集器,後面我們將去了解JVM的一些內存分配與回收策略、JVM垃圾收集相關調優方法……
原文鏈接:https://blog.csdn.net/tjiyu/article/details/53983650
說明:搜索相關資料的時候,偶然發現了這麼一篇文章,覺得寫的很好,非常詳細,所以索性就偷了個懶,直接轉載過來啦~