垃圾回收機制



那些內存需要回收?

什麼時候回收?

如何回收?



    在程序運行時,何時會觸發垃圾回收?


一、內存分配與回收策略


    java技術體系中所提倡的自動內存管理最終可以歸結自動解決兩個問題: 給對象分配內存回收分配給對象的內存。我們下面一起討論給對象分配內存的那點事。

    對象的內存分配,往大方向上講,就是在堆上分配對象主要分配在新生代的Eden區,如果啓動了本地線程分配緩衝,將按照線程優先在TLAB上分配。少數情況下也可能直接分配在老年代中。分配的規則並不是百分百固定的,七夕節取決於當前使用的是哪一種垃圾收集器組合,還有虛擬機中與內存相關的參數設置。


1. 對象優先在Eden分配

    大多數情況下,對象在新生代Eden區中分配。當Eden區沒有足夠空間進行分配時,虛擬機將發起一次Minor GC


 2. 大對象直接進入老年代

    所謂的大對象是指,需要大量連續內存空間的java對象,最典型的的大對象就是那種很長的字符串以及數組。經常出現大對象容易導致內存還有不少空間時就提前觸發垃圾收集以獲取足夠的連續空間來安置它們。

    虛擬機提供了一個-XX:PretenureSizeThreshold參數,令大於這個設置值的對象直接在老年代分配。這樣的目的是避免在Eden區及兩個survivor區之間發生大量的內存複製。


 3. 長期存活的對象將進入老年代

     既然虛擬機採用了分代收集的思想來管理內存,那麼內存回收時就必須能識別那些對象應放在新生代,那些對象應放在老年代中。爲了做到這一點,虛擬機給每個對象定義了一個對象年齡計數器。如果對象在Eden出生經過第一次Minor GC後仍然存活,並且能被Servivor容納的話,將被移動到Servivor空間中,並且對象年齡設置爲1。對象在Servivor區中每熬過一次Minor GC年齡就增加1歲,當它的年齡增加到一定程度(默認15歲)就將會被晉升到老年代中。對象晉升老年代的年齡閾值:-XX:MaxTenuringThreshold設置。


 4. 動態對象年齡判斷

     爲了更好的適應不同程序的內存情況,虛擬機並不是永遠的要求對象的年齡必須達到了MaxTenuringshold才能晉升老年代,如果在servivor空間中相同年齡所有對象大小的總和大於servivor空間的一半年齡大於或等於該年齡的對象就可以直接進入老年代,無須等到MaxTenuringThreshold中要求的年齡。


 5. 空間分配擔保

        在發生Minor GC之前,虛擬機會先檢查老年代最大可用的連續空間是否大於新生代所有對象總空間,如果條件成立,那麼Minor GC可以確保是安全的。

如果不成立,則虛擬機會查看HandlePromotionFailure設置值是否允許擔保失敗

        如果允許,那麼會檢查老年代最大可用的連續空間是否大於歷次晉升到老年代對象的平均大小

            如果大於,將嘗試進行一次Minor GC

            如果小於,或者HandlePromotionFailure設置不允許冒險,那這是要改爲進行一次Full GC    



    

    垃圾收集器在對堆進行回收前,第一件事就是確定這些對象之中那些還活着,那些已經死?



二、可達性分析算法

      在主流的商用程序語言的主流實現中,都是通過可達性分析(reachability Analusis)來判斷對象是否存活。這個算法的基本思路:通過一系列的成爲“GC Roots”的對象作爲起始點,從這些節點開始向下搜索,搜索所走過的路徑稱爲引用鏈(Reference Chain),當一個對象到GC Roots沒有任何引用鏈時,則證明此對象是不可用的。


   spacer.gif

在Java語言中,可作爲GC Roots的對象包括下面幾種:

·虛擬機棧(棧幀中的本地變量表)中引用的變量

·方法區中類靜態屬性引用的對象

·方法區中常量引用的對象

·本地方法棧中native引用的對象


  判斷對象是否存活都與引用有關。在JDK1.2以前,java中引用的定義很傳統:如果reference類型的數據中存儲的數值代表另外一塊內存的起始地址,就稱這塊內存代表着一個引用。在jdk1.2之後,java對引用的概念進行了擴充,將引用分爲強引用(Strong Reference)軟引用(Soft Reference)弱引用(Weak  Reference)虛引用(Phantom Reference)



    對於已經判斷是不可用對象,如何進行清理。


三、垃圾收集算法


1. 標記-清除(Mark-Sweep)算法

   

    最基礎的收集算法是“標記-清除”算法,算法分爲“標記”和“清除”兩個階段:首先標記出所有要回收的對象,在標記完成後統一回收所有被標記的對象。它主要不足有兩點:一個是效率問題。標記和清除兩個過程的效率都不高;另一個是空間問題,標記清除之後會產生大量的不連續的內存碎片,空間碎片太多可能會導致以後程序運行過程中需要分配較大對象時,無法找到足夠的連續內存而不得不提前觸發另一次垃圾收集動作。

spacer.gif

2. 複製算法

      爲了解決效率問題,一種稱爲“複製(copying)”的收集算法出現了,它將可用內存容量劃分爲大小相等的兩塊每次只使用其中一塊。當這一塊的內存用完了,就將還存活着的對象複製到另外一塊上面,然後再把已使用過的內存空間一次清理掉。這樣使得每次都是對整個半區進行內存回收,內存分配時也就不用考慮內存碎片等複雜情況,只要移動棧頂的指針,按順序分配內存即可。這種算法的代價是將內存縮小爲原來的一半。


      現在的商業虛擬機都是採用複製算法來回收新生代,新生代中的對象98%是朝生夕死。將內存劃分爲一塊較大的Eden空間和兩個較小的Servivor空間每次使用Eden和其中一塊Servivor。當回收時,將Eden和Servivor中還存活的對象一次性複製到另外一塊Servivor空間上,最後清理掉Eden和剛纔使用過的Servivor空間。HotSpot虛擬機默認Eden和Servivor的大小比例是8:1,也就是說每次新生代中可用的內存空間爲整個新生代容量的90%,只有10%的內存會被浪費。當Servivor空間沒有足夠空間存放上一次新生代收集下來的存活對象時,這些對象直接通過分配擔保機制進入老年代


3. 標記-整理(Mark-Compact)算法

    根據老年代的特點,有人提出來“標記-整理”算法,先標記所有要回收的對象,然後讓所有存活的對象都向一端移動,然後直接清理掉端邊界以外的內存

    spacer.gif

4. 分帶收集算法

    當前商業虛擬機的垃圾收集都是採用“分代收集(Generational Collection)算法”。根據對象存活週期的不同將內存劃分爲幾塊。一般把java堆分爲新生代和老年代,可以根據各個年代的特點採用最合適的收集算法。

·新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,選擇複製算法,只需要付出少量存活對象的複製成本就可以完成收集。

·老生代中,對象存活率高、沒有額外的空間對它進行分配擔保,就必須使用“標記-清理”或者“標記-整理”算法來進行回收。




    


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章