深入理解java虛擬機之垃圾收集策略與算法

程序計數器、虛擬機棧、本地方法棧隨線程而生,也隨線程而滅;棧幀隨着方法的開始而入棧,隨着方法的結束而出棧。這幾個區域的內存分配和回收都具有確定性,在這幾個區域內不需要過多考慮回收的問題,因爲方法結束或者線程結束時,內存自然就跟隨着回收了。

而對於 Java 堆和方法區,我們只有在程序運行期間才能知道會創建哪些對象,這部分內存的分配和回收都是動態的,垃圾收集器所關注的正是這部分內存。

判定對象是否存活

若一個對象不被任何對象或變量引用,那麼它就是無效對象,需要被回收。

引用計數法

在對象頭維護着一個 counter 計數器,對象被引用一次則計數器 +1;若引用失效則計數器 -1。當計數器爲 0 時,就認爲該對象無效了。

引用計數算法的實現簡單,判定效率也很高,在大部分情況下它都是一個不錯的算法。但是主流的 Java 虛擬機裏沒有選用引用計數算法來管理內存,主要是因爲它很難解決對象之間循環引用的問題。

舉個栗子對象 objA 和 objB 都有字段 instance,令 objA.instance = objB 並且 objB.instance = objA,由於它們互相引用着對方,導致它們的引用計數都不爲 0,於是引用計數算法無法通知 GC 收集器回收它們。

可達性分析法

所有和 GC Roots 直接或間接關聯的對象都是有效對象,和 GC Roots 沒有關聯的對象就是無效對象。

GC Roots 是指:

Java 虛擬機棧(棧幀中的本地變量表)中引用的對象

本地方法棧中引用的對象

方法區中常量引用的對象

方法區中類靜態屬性引用的對象

GC Roots 並不包括堆中對象所引用的對象,這樣就不會有循環引用的問題。

引用的種類

判定對象是否存活與“引用”有關。在 JDK 1.2 以前,Java 中的引用定義很傳統,一個對象只有被引用或者沒有被引用兩種狀態,我們希望能描述這一類對象:當內存空間還足夠時,則保留在內存中;如果內存空間在進行垃圾手收集後還是非常緊張,則可以拋棄這些對象。很多系統的緩存功能都符合這樣的應用場景。

在 JDK 1.2 之後,Java 對引用的概念進行了擴充,將引用分爲了以下四種:

強引用(Strong Reference)

類似 "Object obj = new Object()" 這類的引用,就是強引用,只要強引用存在,垃圾收集器永遠不會回收被引用的對象。

軟引用(Soft Reference)

軟引用是用來描述一些有用但並非必需的對象,j就是說,內存足夠時留着它們,內存即將發生溢出時把這些對象列入回收範圍進行回收。若回收過後還沒有足夠的內存,才拋出內存溢出異常。

弱引用(Weak Reference)

弱引用也是用來描述非必需對象的,但是它的強度比軟引用更弱一些。當 JVM 進行垃圾回收時,無論內存是否充足,都會回收被軟引用關聯的對象。

虛引用(Phantom Reference)

虛引用也稱幽靈引用或者幻影引用,它是最弱的一種引用關係。一個對象是否有虛引用的存在,完全不會對其生存時間構成影響。爲一個對象設置虛引用關聯的唯一目的就是能在這個對象被收集器回收時收到一個系統通知。

回收堆中無效對象

對於可達性分析中不可達的對象,也並不是沒有存活的可能。

判定 finalize() 是否有必要執行

JVM 會判斷此對象是否有必要執行 finalize() 方法,如果對象沒有覆蓋 finalize() 方法,或者 finalize() 方法已經被虛擬機調用過,那麼視爲“沒有必要執行”。那麼對象基本上就真的被回收了。

如果對象被判定爲有必要執行 finalize() 方法,那麼對象會被放入一個 F-Queue 隊列中,虛擬機會以較低的優先級執行這些 finalize()方法,但不會確保所有的 finalize() 方法都會執行結束。如果 finalize() 方法出現耗時操作,虛擬機就直接停止指向該方法,將對象清除。

對象重生或死亡

如果在執行 finalize() 方法時,將 this 賦給了某一個引用,那麼該對象就重生了。如果沒有,那麼就會被垃圾收集器清除。

任何一個對象的 finalize() 方法只會被系統自動調用一次,如果對象面臨下一次回收,它的 finalize() 方法不會被再次執行,想繼續在 finalize() 中自救就失效了。

回收方法區內存

方法區中存放生命週期較長的類信息、常量、靜態變量,每次垃圾收集只有少量的垃圾被清除。方法區中主要清除兩種垃圾:

廢棄常量

無用的類

判定廢棄常量

只要常量池中的常量不被任何變量或對象引用,那麼這些常量就會被清除掉。比如,一個字符串 "bingo" 進入了常量池,但是當前系統沒有任何一個 String 對象引用常量池中的 "bingo" 常量,也沒有其它地方引用這個字面量,必要的話,"bingo"常量會被清理出常量池。

判定無用的類

判定一個類是否是“無用的類”,條件較爲苛刻:

該類的所有對象都已經被清除

加載該類的 ClassLoader 已經被回收

該類的 java.lang.Class 對象沒有在任何地方被引用,無法在任何地方通過反射訪問該類的方法。

一個類被虛擬機加載進方法區,那麼在堆中就會有一個代表該類的對象:java.lang.Class。這個對象在類被加載進方法區時創建,在方法區該類被刪除時清除。

垃圾收集算法

學會了如何判定無效對象、無用類、廢棄常量之後,剩餘工作就是回收這些垃圾。常見的垃圾收集算法有以下幾個:

標記-清除算法

判斷哪些數據需要清除,並對它們進行標記,然後清除被標記的數據。

這種方法有兩個不足:

效率問題:標記和清除兩個過程的效率都不高。

空間問題:標記清除之後會產生大量不連續的內存碎片,碎片太多可能導致以後需要分配較大對象時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作。

複製算法(新生代)

爲了解決效率問題,“複製”收集算法出現了。它將可用內存按容量劃分爲大小相等的兩塊,每次只使用其中的一塊。當這一塊內存用完,需要進行垃圾收集時,就將存活者的對象複製到另一塊上面,然後將第一塊內存全部清除。這種算法有優有劣:

優點:不會有內存碎片的問題。

缺點:內存縮小爲原來的一半,浪費空間。

爲了解決空間利用率問題,可以將內存分爲三塊: Eden、From Survivor、To Survivor,比例是 8:1:1,每次使用 Eden 和其中一塊 Survivor。回收時,將 Eden 和 Survivor 中還存活的對象一次性複製到另外一塊 Survivor 空間上,最後清理掉 Eden 和剛纔使用的 Survivor 空間。這樣只有 10% 的內存被浪費。

但是我們無法保證每次回收都只有不多於 10% 的對象存活,當 Survivor 空間不夠,需要依賴其他內存(指老年代)進行分配擔保。

分配擔保

爲對象分配內存空間時,如果 Eden+Survivor 中空閒區域無法裝下該對象,會觸發 MinorGC 進行垃圾收集。但如果 Minor GC 過後依然有超過 10% 的對象存活,這樣存活的對象直接通過分配擔保機制進入老年代,然後再將新對象存入 Eden 區。

標記-整理算法(老年代)

在回收垃圾前,首先將廢棄對象做上標記,然後將未標記的對象移到一邊,最後清空另一邊區域即可。

這是一種老年代的垃圾收集算法。老年代的對象一般壽命比較長,因此每次垃圾回收會有大量對象存活,如果採用複製算法,每次需要複製大量存活的對象,效率很低。

分代收集算法

根據對象存活週期的不同,將內存劃分爲幾塊。一般是把 Java 堆分爲新生代和老年代,針對各個年代的特點採用最適當的收集算法。

分享個java進階高級架構羣,羣內提供免費架構視頻資料,有大牛解答疑問,能給你提供職業生涯的一些建議!

羣號:779792048

發佈了70 篇原創文章 · 獲贊 68 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章