Jvm對象探祕

1、對象的創建

        在語言層面,創建對象(列如克隆、反序列化)通常僅僅是一個new關鍵字而已。而在虛擬機中,當遇到new指令時,首先將去檢查這個指令的參數是否能在常量池中定位到有個類的符號引用,並且檢查這個符號引用代表的類是否已被加載、解析和初始化過。如果沒有,那必須先執行相應的類加載過程。

       在類加載檢查通過之後,jvm將爲新生對象分配內存。對象所需要的內存在類加載完成之後便可以完全確定,爲對象分配空間的任務等同於把一塊確定大小的內存從java堆中劃分出來。

       假設Java堆中的內存是絕對規整的,所有用過的內存都放在一邊,空閒的內存放在一邊。中間放着一個指針作爲分界點的指示器,那所分配的內存僅僅就是把那個指針向空閒空間那邊挪一段與對象大小相等的距離,這種分配方式叫“指針碰撞”。

       如果java堆中的內存並不是規整的,已使用的內存和空閒的內存相互交錯,那就沒有辦法簡單的進行指針碰撞了,虛擬機就必需維護一個列表,記錄哪些內存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象是實例,並且更新列表上的記錄,這種分配方式稱爲“空閒列表”。

       選擇哪種分配方式由java堆是否規整決定,而java堆是否規整又由所採用的垃圾收集器是否帶有壓縮整理功能決定。除了劃分可用空間之外,還需要考慮的是:對象的創建在虛擬機中是非常頻繁的行爲,即使是僅僅修改一個指針所指向的位置,在併發情況下載也並不是線程安全的。可能會出現正在給對象A分配內存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內存的情況。

       解決這個問題有兩種方案:一種是對分配內存空間的動作進行同步處理;另一種是把內存分配的動作按照線程劃分在不同的空間之中進行,即每一個線程在java堆中預先分配一小塊內存,稱爲本地線程分配緩衝(Thread Local Allocation Buffer,TLAB)。哪個線程需要分配內存,就在哪個線程的TLAB分配,只有TLAB用完並分配新的TLAB時,才需要同步鎖定。

       內存分配完成之後,jvm需要將分配到內存空間都初始化爲零值,如果使用TLAB,這一工作過程也可以提前至TLAB分配時進行。這一步操作保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數據類型所對應的零值。

       接下來,虛擬機還要對對象進行表要的設置,例如這個對象是哪個類的實例,如何才能找到類的元數據信息,對象的哈希碼,對象的GC分代年齡等信息。這些信息存放在對象的對象頭中。

        在上面工作都完成之後,從虛擬機的視角來看,一個新的對象已經產生了,但從Java程序的視角來看,對象創建纔剛剛開始——<init>方法還沒有執行,所有的字段都還爲零。所以,一般來說執行new指令之後會接着執行<init>方法,把對象按照程序員的意願進行初始化,這樣一個真正可用的對象纔算完全產生出來。

2、對象的內存佈局

       對象在內存中的儲存佈局可以分爲3部分:對象頭、實例數據、對齊填充。

       對象頭包括兩部分信息:第一部分用於儲存對象自身的運行時數據,如:哈希碼,GC分代年齡,鎖狀態標誌,線程持有的鎖,偏向線程ID,偏向時間戳等;另外一部分是類型指針,即對象指向它的類元數據的指針,jvm通過這個指針來確定這個對象是哪個類的實例。

       實例數據部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段的內容。無論是從父類繼承下來的還是在子類中定義的,都需要記錄下來。

      對齊補充並不是必然存在的,也沒有特別的含義,它僅僅起着佔位符的作用。由於jvm的自動內存管理系統要求對象起始地址是8字節的整數倍,換句話說,就是對象的大小必須是8字節的整數倍。而對象頭部分正好是8字節的倍數(1倍或者2倍),因此,當對象實例數據部分沒有對齊時,就需要通過對齊填充來補全。

3、對象的訪問定位

      java程序需要通過棧上的reference數據來操作堆上的具體對象。由於reference類型在虛擬機規範中只規定了一個指向對象的引用,並沒有定義這個引用應該通過何種方式去定位、訪問堆中的對象的具體位置,所以對象訪問方式也是取決於虛擬機實現而定。目前主流的訪問方式有句柄和直接指針兩種

      如果使用句柄訪問的話,那麼java堆中將會劃分出一塊內存作爲句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自具體地址信息。

       如果使用直接指針訪問,那麼java堆對象的佈局中就必須考慮如何放置訪問類型數據的相關信息,而reference中存儲的直接就是對象地址。

       這兩種對象訪問方式各有優勢,使用句柄訪問的最大好處就是reference中存儲的是穩定的句柄地址,在對象被移動(比如垃圾回收時)時只會改變句柄中的實例數據指針。而reference本身不需要改變。使用直接指針訪問的方式的最大好處就是速度快,節省了一次指針定位的時間開銷。由於對象在Java中非常頻繁,因此這類開銷積少成多後也是一項很大的成本。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章