「面試複習」「Java」四、Java虛擬機JVM

目錄

(一)JVM 基礎知識

1)什麼是 JVM ?

2)JVM 由哪些部分組成?

3)JVM內存劃分?

4)類加載器?

5)類加載器是如何加載 class 文件的?

6)雙親委派模型(Parent Delegation Model)?

(二)JVM內存管理

1)內存的分配與回收?

2)如何判斷一個對象是否死去?

3)引用的分類?

4)垃圾收集算法?

5)垃圾收集器?

6)類似-Xms、-Xmn這些參數的含義?

7)內存泄漏和內存溢出?

8)Java中創建一個對象的過程?

9)對象的內存佈局是怎樣的?

10)對象是如何定位訪問的?

參考:


(一)JVM 基礎知識

1)什麼是 JVM ?

JVM,即 Java Virtual Machine,Java 虛擬機。JVM 能夠跨平臺執行 Java 字節碼,主要是由於 JVM 屏蔽了與各個計算機平臺相關的軟件或者硬件之間的差異,使得與平臺相關的耦合統一由 JVM 提供者來實現。

2)JVM 由哪些部分組成?

JVM 的結構基本上由 4 部分組成:

  • 類加載器,在 JVM 啓動時或者類運行時將需要的 class 加載到 JVM 中

  • 執行引擎,執行引擎的任務是負責執行 class 文件中包含的字節碼指令,相當於實際機器上的 CPU

  • 內存區,將內存劃分成若干個區以模擬實際機器上的存儲、記錄和調度功能模塊,如實際機器上的各種功能的寄存器或者 PC 指針的記錄器等

  • 本地方法調用,調用 C 或 C++ 實現的本地方法的代碼返回結果

3)JVM內存劃分?

  • 方法區(線程共享):各個線程共享的一個區域,用於存儲虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。雖然 Java 虛擬機規範把方法區描述爲堆的一個邏輯部分,但是它卻又一個別名叫做 Non-Heap(非堆),目的應該是與 Java 堆區分開來。

  • 運行時常量池:是方法區的一部分,用於存放編譯器生成的各種字面量和符號引用。
  • 堆內存(線程共享):所有線程共享的一塊區域,垃圾收集器管理的主要區域。目前主要的垃圾回收算法都是分代收集算法,所以 Java 堆中還可以細分爲:新生代和老年代;再細緻一點的有 Eden 空間、From Survivor 空間、To Survivor 空間等,默認情況下新生代按照8:1:1的比例來分配。根據 Java 虛擬機規範的規定,Java 堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤一樣。

  • 程序計數器: Java 線程私有,類似於操作系統裏的 PC 計數器,它可以看做是當前線程所執行的字節碼的行號指示器。如果線程正在執行的是一個 Java 方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是 Native 方法,這個計數器值則爲空(Undefined)。此內存區域是唯一一個在 Java 虛擬機規範中沒有規定任何 OutOfMemoryError 情況的區域。

  • 虛擬機棧(棧內存):Java線程私有,虛擬機展描述的是Java方法執行的內存模型:每個方法在執行的時候,都會創建一個棧幀用於存儲局部變量、操作數、動態鏈接、方法出口等信息;每個方法調用都意味着一個棧幀在虛擬機棧中入棧到出棧的過程;

  • 本地方法棧:和Java虛擬機棧的作用類似,區別是該區域爲 JVM 提供使用 native 方法的服務

4)類加載器?

類加載器(class loader)用來加載 Java 類到 Java 虛擬機中。一般來說,Java 虛擬機使用 Java 類的方式如下:

Java 源程序(.java 文件)在經過 Java 編譯器編譯之後就被轉換成 Java 字節代碼(.class 文件)。類加載器負責讀取 Java 字節代碼,並轉換成 java.lang.Class類的一個實例。每個這樣的實例用來表示一個 Java 類。通過此實例的 newInstance()方法就可以創建出該類的一個對象。實際的情況可能更加複雜,比如 Java 字節代碼可能是通過工具動態生成的,也可能是通過網絡下載的。

Java 虛擬機是如何判定兩個 Java 類是相同的?

Java 虛擬機不僅要看類的全名是否相同,還要看加載此類的類加載器是否一樣。只有兩者都相同的情況,才認爲兩個類是相同的。即便是同樣的字節代碼,被不同的類加載器加載之後所得到的類,也是不同的。

5)類加載器是如何加載 class 文件的?

ClassLoader 加載一個 class 文件到 JVM 時需要經過的步驟:

第一個階段是找到 .class 文件並把這個文件包含的字節碼加載到內存中

第二階段又可以分爲三個步驟,分別是字節碼驗證、Class 類數據結構分析及相應的內存分配和最後的符號表的鏈接

第三個階段是類中靜態屬性和初始化賦值,以及靜態塊的執行等

1.加載

查找並加載類的二進制數據加載時類加載過程的第一個階段,在加載階段,虛擬機需要完成以下三件事情:

  • 通過一個類的全限定名來獲取其定義的二進制字節流。
  • 將這個字節流所代表的靜態存儲結構轉化爲方法區的運行時數據結構。
  • 在Java堆中生成一個代表這個類的 java.lang.Class 對象,作爲對方法區中這些數據的訪問入口。

相對於類加載的其他階段而言,加載階段(準確地說,是加載階段獲取類的二進制字節流的動作)是可控性最強的階段,因爲開發人員既可以使用系統提供的類加載器來完成加載,也可以自定義自己的類加載器來完成加載。

加載階段完成後,虛擬機外部的二進制字節流就按照虛擬機所需的格式存儲在方法區之中,而且在Java堆中也創建一個 java.lang.Class類的對象,這樣便可以通過該對象訪問方法區中的這些數據。

2.連接

驗證:確保被加載的類的正確性

驗證是連接階段的第一步,這一階段的目的是爲了確保Class文件的字節流中包含的信息符合當前虛擬機的要求,並且不會危害虛擬機自身的安全。驗證階段大致會完成4個階段的檢驗動作:

  • 文件格式驗證:驗證字節流是否符合Class文件格式的規範;例如:是否以 0xCAFEBABE開頭、主次版本號是否在當前虛擬機的處理範圍之內、常量池中的常量是否有不被支持的類型。
  • 元數據驗證:對字節碼描述的信息進行語義分析(注意:對比javac編譯階段的語義分析),以保證其描述的信息符合Java語言規範的要求;例如:這個類是否有父類,除了 java.lang.Object之外。
  • 字節碼驗證:通過數據流和控制流分析,確定程序語義是合法的、符合邏輯的。
  • 符號引用驗證:確保解析動作能正確執行。

驗證階段是非常重要的,但不是必須的,它對程序運行期沒有影響,如果所引用的類經過反覆驗證,那麼可以考慮採用 -Xverifynone 參數來關閉大部分的類驗證措施,以縮短虛擬機類加載的時間。

準備:爲類的靜態變量分配內存,並將其初始化爲默認值

準備階段是正式爲類變量分配內存並設置類變量初始值的階段,這些內存都將在方法區中分配。對於該階段有以下幾點需要注意:

  • ① 這時候進行內存分配的僅包括類變量(static),而不包括實例變量,實例變量會在對象實例化時隨着對象一塊分配在Java堆中。
  • ② 這裏所設置的初始值通常情況下是數據類型默認的零值(如0、0L、null、false等),而不是被在Java代碼中被顯式地賦予的值。

假設一個類變量的定義爲: public static int value = 3;

那麼變量value在準備階段過後的初始值爲 0,而不是 3,因爲這時候尚未開始執行任何 Java 方法,而把 value 賦值爲 3 的public static指令是在程序編譯後,存放於類構造器 <clinit>()方法之中的,所以把value賦值爲3的動作將在初始化階段纔會執行。

這裏還需要注意如下幾點:

  • 對基本數據類型來說,對於類變量(static)和全局變量,如果不顯式地對其賦值而直接使用,則系統會爲其賦予默認的零值,而對於局部變量來說,在使用前必須顯式地爲其賦值,否則編譯時不通過。
  • 對於同時被static和final修飾的常量,必須在聲明的時候就爲其顯式地賦值,否則編譯時不通過;而只被final修飾的常量則既可以在聲明時顯式地爲其賦值,也可以在類初始化時顯式地爲其賦值,總之,在使用前必須爲其顯式地賦值,系統不會爲其賦予默認零值。
  • 對於引用數據類型reference來說,如數組引用、對象引用等,如果沒有對其進行顯式地賦值而直接使用,系統都會爲其賦予默認的零值,即null。
  • 如果在數組初始化時沒有對數組中的各元素賦值,那麼其中的元素將根據對應的數據類型而被賦予默認的零值。
  • ③ 如果類字段的字段屬性表中存在 ConstantValue 屬性,即同時被 final 和 static 修飾,那麼在準備階段變量 value 就會被初始化爲 ConstValue 屬性所指定的值。

假設上面的類變量 value 被定義爲: public static final int value = 3;

編譯時 Javac 將會爲 value 生成 ConstantValue 屬性,在準備階段虛擬機就會根據 ConstantValue 的設置將 value 賦值爲 3。我們可以理解爲 static final 常量在編譯期就將其結果放入了調用它的類的常量池中

解析:把類中的符號引用轉換爲直接引用

解析階段是虛擬機將常量池內的符號引用替換爲直接引用的過程,解析動作主要針對類或接口、字段、類方法、接口方法、方法類型、方法句柄和調用點限定符7類符號引用進行。符號引用就是一組符號來描述目標,可以是任何字面量。

直接引用就是直接指向目標的指針、相對偏移量或一個間接定位到目標的句柄。

3.初始化

初始化,爲類的靜態變量賦予正確的初始值,JVM負責對類進行初始化,主要對類變量進行初始化。在Java中對類變量進行初始值設定有兩種方式:

  • ① 聲明類變量是指定初始值
  • ② 使用靜態代碼塊爲類變量指定初始值

JVM初始化步驟

  • 1、假如這個類還沒有被加載和連接,則程序先加載並連接該類
  • 2、假如該類的直接父類還沒有被初始化,則先初始化其直接父類
  • 3、假如類中有初始化語句,則系統依次執行這些初始化語句

類初始化時機:只有當對類的主動使用的時候纔會導致類的初始化,類的主動使用包括以下六種:

  • 創建類的實例,也就是new的方式
  • 訪問某個類或接口的靜態變量,或者對該靜態變量賦值
  • 調用類的靜態方法
  • 反射(如 Class.forName(“com.shengsiyuan.Test”))
  • 初始化某個類的子類,則其父類也會被初始化
  • Java虛擬機啓動時被標明爲啓動類的類( JavaTest),直接使用 java.exe命令來運行某個主類

結束生命週期

在如下幾種情況下,Java虛擬機將結束生命週期

  • 執行了 System.exit()方法
  • 程序正常執行結束
  • 程序在執行過程中遇到了異常或錯誤而異常終止
  • 由於操作系統出現錯誤而導致Java虛擬機進程終止

6)雙親委派模型(Parent Delegation Model)?

類加載器 ClassLoader 是具有層次結構的,也就是父子關係,其中,Bootstrap 是所有類加載器的父親,如下圖所示:

該模型要求除了頂層的 Bootstrap class loader 啓動類加載器外,其餘的類加載器都應當有自己的父類加載器。子類加載器和父類加載器不是以繼承(Inheritance)的關係來實現,而是通過組合(Composition)關係來複用父加載器的代碼。每個類加載器都有自己的命名空間(由該加載器及所有父類加載器所加載的類組成,在同一個命名空間中,不會出現類的完整名字(包括類的包名)相同的兩個類;在不同的命名空間中,有可能會出現類的完整名字(包括類的包名)相同的兩個類)

雙親委派模型的工作過程?

1.當前 ClassLoader 首先從自己已經加載的類中查詢是否此類已經加載,如果已經加載則直接返回原來已經加載的類。

每個類加載器都有自己的加載緩存,當一個類被加載了以後就會放入緩存,
等下次加載的時候就可以直接返回了。

2.當前 ClassLoader 的緩存中沒有找到被加載的類的時候,委託父類加載器去加載,父類加載器採用同樣的策略,首先查看自己的緩存,然後委託父類的父類去加載,一直到 bootstrap ClassLoader.

當所有的父類加載器都沒有加載的時候,再由當前的類加載器加載,並將其放入它自己的緩存中,以便下次有加載請求的時候直接返回。

爲什麼這樣設計?

主要是爲了安全性,避免用戶自己編寫的類動態替換 Java 的一些核心類,比如 String,同時也避免了重複加載,因爲 JVM 中區分不同類,不僅僅是根據類名,相同的 class 文件被不同的 ClassLoader 加載就是不同的兩個類,如果相互轉型的話會拋java.lang.ClassCaseException.

(二)JVM內存管理

1)內存的分配與回收?

  • 新生代:即複製算法中提到的Eden區以及2個Survivor區。
  • 老年代:新生代存活足夠長時間後進入老年代。堆上的另一塊區域。
  • Minor GC:發生在新生代的垃圾收集動作。因爲Java對象存活時間一般較短,故Minor GC非常頻繁,一般回收速度也較快。
  • Full GC:發生在老年代的垃圾收集動作,伴隨着最少一次的Minor GC,且速度較慢(比Minor GC慢10倍以上)

1. 空間的分配

  • 對象優先在新生代Eden區分配。當Eden區沒有足夠空間時,將發動一次Minor GC.
  • 較大對象需要連續的空間,如長字符串或數組,如果放在新生代會提前觸發GC。故大對象直接進入老年代區域,避免頻繁的GC。
  • 長期存活的對象進入老年代,每個對象有一個年齡,在對象頭Mark Word中記錄,剛被創建時年齡爲0,當它活過一次Minor GC,並且轉移到Survivor中,年齡變爲1,此後,在Survivor區中每活過一個Minor GC,年齡就會+1,當年齡達到某個程度(默認爲15),就會晉升到老年代。
  • 此外,爲了適應內存的複雜情況,年齡不一定達到規定值才能進入老年代。當Survivor區的相同年齡所有對象大小大於Survivor區大小的一半時,此年齡就會被作爲判定標準,大於等於該年齡的都會進入老年代。

2. 空間的回收--GC

平均大小來作比較,因爲有多少對象晉升到老年代是無法知道的,所以只好取之前每一次晉升到老年代的對象的容量的平均值大小來作爲經驗值,來決定是否進行Full GC來讓老年代騰出更多空間。如果仍然失敗,那麼只能進行一次Full GC。

2)如何判斷一個對象是否死去?

  • 引用計數:每個對象有一個引用計數屬性,新增一個引用時計數加1,引用釋放時計數減1,計數爲0時可以回收。此方法簡單,無法解決對象相互循環引用的問題。
  • 可達性分析(Reachability Analysis):從GC Roots開始向下搜索,搜索所走過的路徑稱爲引用鏈。當一個對象到GC Roots沒有任何引用鏈相連時,則證明此對象是不可用的。不可達對象。

3)引用的分類?

強引用(Strong Reference):我們一般情況下使用的都是強引用,如Object o = new Object(),之類的代碼。只要強引用還在,垃圾收集器就永遠不會回收被引用的對象。
軟引用(Soft  Reference):SoftReference類來實現,用來描述一些還有用但是不必須的對象,在系統如果不回收就會發生OOM時纔會對軟引用進行內存回收。
弱引用(Weak  Reference):WeakReference類來實現,描述非必需的對象,強度弱,只能活到下一次發生垃圾回收前,無論那時內存是否短缺,都會對軟引用對象進行內存回收
虛引用(Phantom Reference):PhantomReference類實現,不會對生存時間發生任何影響,唯一目的時能在這個對象被收集器回收時得到一個通知。

4)垃圾收集算法?

1. 標記清除算法(Mark-Sweep)

算法分爲兩個階段,標記與清除。

標記階段:標記出所有需要回收的對象。回收階段:將所有標記區域回收。由於該算法不對空間進行整理,因此會產生大量的內存碎片,內存空間碎片過多會導致在分配較大的對象時,因爲沒有連續的內存而不得不提前觸發一個GC。另外,標記與清除的過程效率都不高。這也是最基礎的GC算法。

2. 複製算法(Copying)

將內存的總容量分爲兩塊,每次只使用其中的一塊,當這一塊用完了,觸發GC,此時將還存活的對象轉移到另一塊內存中,之前使用的那一塊內存完全清理掉。這樣每次對一個半區進行回收,也不會存在內存碎片,實現簡單,運行高效,但是一次只能使用半塊內存可能會造成浪費。

在新生代中,絕大部分的對象時“朝生夕死”的,因此,不需要按照1:1來劃分空間。而是將內存分爲一塊較大的Eden區以及兩個Survivor區,HotSpot虛擬機中,Eden:Survivor=8:1 ,每次使用一個Eden區以及一個Survivor區,90%的空間,觸發GC後,將剩餘的對象轉移到未使用的Survivor中,然後清理Eden區和用過的Survivor區,空間不夠時,會擔保分配到老年代。這樣一次可以使用90%的內存空間,極大的提高了內存的使用率。因此,新生代一般採用這種算法來回收。

3. 標記整理算法(Mark-Compact)

如果回收時空間內的對象存活率較高,那麼使用複製算法一次只能使用50%的空間(以應對所有對象都存活的情況),因此老年代採用標記整理算法。先對需要清理的對象進行標記,然後將存活的對象都向一端移動,直接清理掉端邊界以外的內存。這種方式也不會留下內存碎片。

標記整理算法沒有複製算法快。

5)垃圾收集器?

新生代收集器:Serial收集器、ParNew收集器(Serial的多線程版本)、Parallel Scanvenge收集器(控制吞吐量,提高相應速度)

老年代收集器:Serial Old收集器、Parallel Old收集器、CMS收集器(最短停頓)、G1(新生代、老年代都可回收)

6)類似-Xms、-Xmn這些參數的含義?

堆內存分配:

  1. JVM初始分配的內存由-Xms指定,默認是物理內存的1/64
  2. JVM最大分配的內存由-Xmx指定,默認是物理內存的1/4
  3. 默認空餘堆內存小於40%時,JVM就會增大堆直到-Xmx的最大限制;空餘堆內存大於70%時,JVM會減少堆直到 -Xms的最小限制。
  4. 因此服務器一般設置-Xms、-Xmx相等以避免在每次GC 後調整堆的大小。對象的堆內存由稱爲垃圾回收器的自動內存管理系統回收。

非堆內存分配:

  1. JVM使用-XX:PermSize設置非堆內存初始值,默認是物理內存的1/64;
  2. 由XX:MaxPermSize設置最大非堆內存的大小,默認是物理內存的1/4。
  3. -Xmn2G:設置年輕代大小爲2G。
  4. -XX:SurvivorRatio,設置年輕代中Eden區與Survivor區的比值。

7)內存泄漏和內存溢出?

概念:

  1. 內存溢出指的是內存不夠用了。
  2. 內存泄漏是指對象可達,但是沒用了。即本該被GC回收的對象並沒有被回收
  3. 內存泄露是導致內存溢出的原因之一;內存泄露積累起來將導致內存溢出。

內存泄漏的原因分析:

  1. 長生命週期的對象引用短生命週期的對象
  2. 沒有將無用對象置爲null

8)Java中創建一個對象的過程?

下圖展示的是類的生命週期流向:

Java中對象的創建就是在堆上分配內存空間的過程,此處說的對象創建僅限於new關鍵字創建的普通Java對象,不包括數組對象的創建。

大致過程如下:

1. 檢測類是否被加載:

當虛擬機執行到new時,會先去常量池中查找這個類的符號引用。如果能找到符號引用,說明此類已經被加載到方法區(方法區存儲虛擬機已經加載的類的信息),可以繼續執行;如果找不到符號引用,就會使用類加載器執行類的加載過程,類加載完成後繼續執行。

2. 爲對象分配內存:

類加載完成以後,虛擬機就開始爲對象分配內存,此時所需內存的大小就已經確定了。只需要在堆上分配所需要的內存即可。

具體的分配內存有兩種情況:第一種情況是內存空間絕對規整,第二種情況是內存空間是不連續的。

  • 對於內存絕對規整的情況相對簡單一些,虛擬機只需要在被佔用的內存和可用空間之間移動指針即可,這種方式被稱爲指針碰撞。
  • 對於內存不規整的情況稍微複雜一點,這時候虛擬機需要維護一個列表,來記錄哪些內存是可用的。分配內存的時候需要找到一個可用的內存空間,然後在列表上記錄下已被分配,這種方式成爲空閒列表。

分配內存的時候也需要考慮線程安全問題,有兩種解決方案:

  • 第一種是採用同步的辦法,使用CAS來保證操作的原子性。
  • 另一種是每個線程分配內存都在自己的空間內進行,即是每個線程都在堆中預先分配一小塊內存,稱爲本地線程分配緩衝(TLAB),分配內存的時候再TLAB上分配,互不干擾。

3. 爲分配的內存空間初始化零值:

對象的內存分配完成後,還需要將對象的內存空間都初始化爲零值,這樣能保證對象即使沒有賦初值,也可以直接使用。

4. 對對象進行其他設置:

分配完內存空間,初始化零值之後,虛擬機還需要對對象進行其他必要的設置,設置的地方都在對象頭中,包括這個對象所屬的類,類的元數據信息,對象的hashcode,GC分代年齡等信息。

5. 執行 init 方法:

執行完上面的步驟之後,在虛擬機裏這個對象就算創建成功了,但是對於Java程序來說還需要執行init方法纔算真正的創建完成,因爲這個時候對象只是被初始化零值了,還沒有真正的去根據程序中的代碼分配初始值,調用了init方法之後,這個對象才真正能使用。

到此爲止一個對象就產生了,這就是new關鍵字創建對象的過程。過程如下:

9)對象的內存佈局是怎樣的?

對象的內存佈局包括三個部分:對象頭,實例數據和對齊填充。

  • 對象頭:對象頭包括兩部分信息,第一部分是存儲對象自身的運行時數據,如哈希碼,GC分代年齡,鎖狀態標誌,線程持有的鎖等等。第二部分是類型指針,即對象指向類元數據的指針。

  • 實例數據:就是數據啦

  • 對齊填充:不是必然的存在,就是爲了對齊的嘛

10)對象是如何定位訪問的?

對象的訪問定位有兩種:句柄定位和直接指針

  • 句柄定位:Java 堆會畫出一塊內存來作爲句柄池,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自的具體地址信息

  • 直接指針訪問:java堆對象的不居中就必須考慮如何放置訪問類型數據的相關信息,而reference中存儲的直接就是對象地址

比較:

使用直接指針就是速度快,使用句柄reference指向穩定的句柄,對象被移動改變的也只是句柄中實例數據的指針,而reference本身並不需要修改。

 

 

 

參考:

https://www.jianshu.com/p/bfb876565a1e

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章