Java虛擬機模型

1 概述


衆所周知,Java支持平臺無關性、安全性和網絡移動性。而Java平臺由Java虛擬機和Java核心類所構成,它爲純Java程序提供了統一的編程接口,而不管下層操作系統是什麼。正是得益於Java虛擬機,它號稱的“一次編譯,到處運行”纔能有所保障。


1.1 Java程序執行流程


Java程序的執行依賴於編譯環境和運行環境。源碼代碼轉變成可執行的機器代碼,由下面的流程完成:



Java技術的核心就是Java虛擬機,因爲所有的Java程序都在虛擬機上運行。Java程序的運行需要Java虛擬機、Java API和Java Class文件的配合。Java虛擬機實例負責運行一個Java程序。當啓動一個Java程序時,一個虛擬機實例就誕生了。當程序結束,這個虛擬機實例也就消亡。



Java的跨平臺特性,因爲它有針對不同平臺的虛擬機。


1.2 Java虛擬機


Java虛擬機的主要任務是裝載class文件並且執行其中的字節碼。由下圖可以看出,Java虛擬機包含一個類裝載器(class loader),它可以從程序和API中裝載class文件,Java API中只有程序執行時需要的類纔會被裝載,字節碼由執行引擎來執行。



當Java虛擬機由主機操作系統上的軟件實現時,Java程序通過調用本地方法和主機進行交互。Java方法由Java語言編寫,編譯成字節碼,存儲在class文件中。本地方法由C/C++/彙編語言編寫,編譯成和處理器相關的機器代碼,存儲在動態鏈接庫中,格式是各個平臺專有。所以本地方法是聯繫Java程序和底層主機操作系統的連接方式。


由於Java虛擬機並不知道某個class文件是如何被創建的,是否被篡改一無所知,所以它實現了一個class文件檢測器,確保class文件中定義的類型可以安全地使用。class文件檢驗器通過四趟獨立的掃描來保證程序的健壯性:


  • class文件的結構檢查

  • 類型數據的語義檢查

  • 字節碼驗證

  • 符號引用驗證


Java虛擬機在執行字節碼時還進行其它的一些內置的安全機制的操作,他們作爲Java編程語言保證Java程序健壯性的特性,同時也是Java虛擬機的特性:


  • 類型安全的引用轉換

  • 結構化的內存訪問

  • 自動垃圾收集

  • 數組邊界檢查

  • 空引用檢查


1.3 Java虛擬機數據類型


Java虛擬機通過某些數據類型來執行計算。數據類型可以分爲兩種:基本類型和引用類型,如下圖:



但boolean有點特別,當編譯器把Java源碼編譯爲字節碼時,它會用int或byte表示boolean。在Java虛擬機中,false是由0表示,而true則由所有非零整數表示。和Java語言一樣,Java虛擬機的基本類型的值域在任何地方都是一致的,不管主機平臺是什麼,一個long在任何虛擬機中總是一個64位二進制補碼的有符號整數。


對於returnAddress,這個基本類型被用來實現Java程序中的finally子句,Java程序員不能使用這個類型,它的值指向一條虛擬機指令的操作碼。

*注:此博文比較長,到這裏爲止就對Java虛擬機模型有大致的瞭解了。


2 體系結構


在 Java虛擬機規範中,一個虛擬機實例的行爲是分別按照子系統、內存區、數據類型和指令來描述的,這些組成部分一起展示了抽象的虛擬機的內部體系結構。



2.1 class文件


Java class文件包含了關於類或接口的所有信息。class文件的“基本類型”如下:


u1 1個字節,無符號類型
u2 2個字節,無符號類型
u4 4個字節,無符號類型
u8 8個字節,無符號類型


如果想了解更多,Oracle的JVM SE7給出了官方規範:The Java® Virtual Machine Specification


class文件包含的內容:


ClassFile {
 
    u4 magic;                                     //魔數:0xCAFEBABE,用來判斷是否是Java class文件
    u2 minor_version;                             //次版本號
    u2 major_version;                             //主版本號
    u2 constant_pool_count;                       //常量池大小
    cp_info constant_pool[constant_pool_count-1]; //常量池
    u2 access_flags;                              //類和接口層次的訪問標誌(通過|運算得到)
    u2 this_class;                                //類索引(指向常量池中的類常量)
    u2 super_class;                               //父類索引(指向常量池中的類常量)
    u2 interfaces_count;                          //接口索引計數器
    u2 interfaces[interfaces_count];              //接口索引集合
    u2 fields_count;                              //字段數量計數器
    field_info fields[fields_count];              //字段表集合
    u2 methods_count;                             //方法數量計數器
    method_info methods[methods_count];           //方法表集合
    u2 attributes_count;                          //屬性個數
    attribute_info attributes[attributes_count];  //屬性表
 
}


2.2 類裝載器子系統


類裝載器子系統負責查找並裝載類型信息。其實Java虛擬機有兩種類裝載器:系統裝載器和用戶自定義裝載器。前者是Java虛擬機實現的一部分,後者則是Java程序的一部分。



  • 啓動類裝載器(bootstrap class loader):它用來加載 Java 的核心庫,是用原生代碼來實現的,並不繼承自java.lang.ClassLoader。

  • 擴展類裝載器(extensions class loader):它用來加載 Java 的擴展庫。Java 虛擬機的實現會提供一個擴展庫目錄。該類加載器在此目錄裏面查找並加載 Java 類。

  • 應用程序類裝載器(application class loader):它根據 Java 應用的類路徑(CLASSPATH)來加載 Java 類。一般來說,Java 應用的類都是由它來完成加載的。可以通過 ClassLoader.getSystemClassLoader()來獲取它。


除了系統提供的類裝載器以外,開發人員可以通過繼承 java.lang.ClassLoader類的方式實現自己的類裝載器,以滿足一些特殊的需求。


類裝載器子系統涉及Java虛擬機的其它幾個組成部分以及來自java.lang庫的類。ClassLoader定義的方法爲程序提供了訪問類裝載器機制的接口。此外,對於每一個被裝載的類型,Java虛擬機都會爲它創建一個java.lang.Class類的實例來代表該類型。和其它對象一樣,用戶自定義的類裝載器以及Class類的實例放在內存中的堆區,而裝載的類型信息則位於方法區。


類裝載器子系統除了要定位和導入二進制class文件外,還必須負責驗證被導入類的正確性,爲類變量分配並初始化內存,以及解析符號引用。這些動作還需要按照以下順序進行:


  • 裝載(查找並裝載類型的二進制數據)

  • 連接(執行驗證:確保被導入類型的正確性;準備:爲類變量分配內存,並將其初始化爲默認值;解析:把類型中的符號引用轉換爲直接引用)

  • 初始化(類變量初始化爲正確初始值)


2.3 方法區


在Java虛擬機中,關於被裝載的類型信息存儲在一個方法區的內存中。當虛擬機裝載某個類型時,它使用類裝載器定位相應的class文件,然後讀入這個class文件並將它傳輸到虛擬機中,接着虛擬機提取其中的類型信息,並將這些信息存儲到方法區。方法區也可以被垃圾回收器收集,因爲虛擬機允許通過用戶定義的類裝載器來動態擴展Java程序。


方法區中存放了以下信息:


  • 這個類型的全限定名(如全限定名java.lang.Object)

  • 這個類型的直接超類的全限定名

  • 這個類型是類類型還是接口類型

  • 這個類型的訪問修飾符(public, abstract, final的某個子集)

  • 任何直接超接口的全限定名的有序列表

  • 該類型的常量池(一個有序集合,包括直接常量[string, integer和floating point常量]和對其它類型、字段和方法的符號引用)

  • 字段信息(字段名、類型、修飾符)

  • 方法信息(方法名、返回類型、參數數量和類型、修飾符)

  • 除了常量以外的所有類(靜態)變量

  • 指向ClassLoader類的引用(每個類型被裝載時,虛擬機必須跟蹤它是由啓動類裝載器還是由用戶自定義類裝載器裝載的)

  • 指向Class類的引用(對於每一個被裝載的類型,虛擬機相應地爲它創建一個java.lang.Class類的實例。比如你有一個到java.lang.Integer類的對象的引用,那麼只需要調用Integer對象引用的getClass()方法,就可以得到表示java.lang.Integer類的Class對象)


2.4 堆


Java程序在運行時創建的所有類實例或數組(數組在Java虛擬機中是一個真正的對象)都放在同一個堆中。由於Java虛擬機實例只有一個堆空間,所以所有線程都將共享這個堆。需要注意的是,Java虛擬機有一條在堆中分配對象的指令,卻沒有釋放內存的指令,因爲虛擬機把這個任務交給垃圾收集器處理。Java虛擬機規範並沒有強制規定垃圾收集器,它只要求虛擬機實現必須“以某種方式”管理自己的堆空間。比如某個實現可能只有固定大小的堆空間,當空間填滿,它就簡單拋出OutOfMemory異常,根本不考慮回收垃圾對象的問題,但卻是符合規範的。


Java虛擬機規範並沒有規定Java對象在堆中如何表示,這給虛擬機的實現者決定怎麼設計。一個可能的堆設計如下:



一個句柄池,一個對象池。一個對象的引用就是一個指向句柄池的本地指針。這種設計的好處有利於堆碎片的整理,當移動對象池中的對象時,句柄部分只需更改一下指針指向對象的新地址即可。缺點是每次訪問對象的實例變量都要經過兩次指針傳遞。


2.5 Java棧


每當啓動給一個線程時,Java虛擬機會爲它分配一個Java棧。Java棧由許多棧幀組成,一個棧幀包含一個Java方法調用的狀態。當線程調用一個Java方法時,虛擬機壓入一個新的棧幀到該線程的Java棧中,當該方法返回時,這個棧幀就從Java棧中彈出。Java棧存儲線程中Java方法調用的狀態–包括局部變量、參數、返回值以及運算的中間結果等。Java虛擬機沒有寄存器,其指令集使用Java棧來存儲中間數據。這樣設計的原因是爲了保持Java虛擬機的指令集儘量緊湊,同時也便於Java虛擬機在只有很少通用寄存器的平臺上實現。另外,基於棧的體系結構,也有助於運行時某些虛擬機實現的動態編譯器和即時編譯器的代碼優化。


2.5.1 棧幀


棧幀由局部變量區、操作數棧和幀數據區組成。當虛擬機調用一個Java方法時,它從對應類的類型信息中得到此方法的局部變量區和操作數棧的大小,並根據此分配棧幀內存,然後壓入Java棧中。


2.5.1.1 局部變量區


局部變量區被組織爲以字長爲單位、從0開始計數的數組。字節碼指令通過從0開始的索引使用其中的數據。類型爲int, float, reference和returnAddress的值在數組中佔據一項,而類型爲byte, short和char的值在存入數組前都被轉換爲int值,也佔據一項。但類型爲long和double的值在數組中卻佔據連續的兩項。



2.5.1.2 操作數棧


和局部變量區一樣,操作數棧也是被組織成一個以字長爲單位的數組。它通過標準的棧操作訪問–壓棧和出棧。由於程序計數器無法被程序指令直接訪問,Java虛擬機的指令是從操作數棧中取得操作數,所以它的運行方式是基於棧而不是基於寄存器。虛擬機把操作數棧作爲它的工作區,因爲大多數指令都要從這裏彈出數據,執行運算,然後把結果壓回操作數棧。


2.5.1.3 幀數據區


除了局部變量區和操作數棧,Java棧幀還需要幀數據區來支持常量池解析、正常方法返回以及異常派發機制。每當虛擬機要執行某個需要用到常量池數據的指令時,它會通過幀數據區中指向常量池的指針來訪問它。除了常量池的解析外,幀數據區還要幫助虛擬機處理Java方法的正常結束或異常中止。如果通過return正常結束,虛擬機必須恢復發起調用的方法的棧幀,包括設置程序計數器指向發起調用方法的下一個指令;如果方法有返回值,虛擬機需要將它壓入到發起調用的方法的操作數棧。爲了處理Java方法執行期間的異常退出情況,幀數據區還保存一個對此方法異常表的引用。


2.6 程序計數器


對於一個運行中的Java程序而言,每一個線程都有它的程序計數器。程序計數器也叫PC寄存器。程序計數器既能持有一個本地指針,也能持有一個returnAddress。當線程執行某個Java方法時,程序計數器的值總是下一條被執行指令的地址。這裏的地址可以是一個本地指針,也可以是方法字節碼中相對該方法起始指令的偏移量。如果該線程正在執行一個本地方法,那麼此時程序計數器的值是“undefined”。


2.7 本地方法棧


任何本地方法接口都會使用某種本地方法棧。當線程調用Java方法時,虛擬機會創建一個新的棧幀並壓入Java棧。當它調用的是本地方法時,虛擬機會保持Java棧不變,不再在線程的Java棧中壓入新的棧,虛擬機只是簡單地動態連接並直接調用指定的本地方法。


其中方法區和堆由該虛擬機實例中所有線程共享。當虛擬機裝載一個class文件時,它會從這個class文件包含的二進制數據中解析類型信息,然後把這些類型信息放到方法區。當程序運行時,虛擬機會把所有該程序在運行時創建的對象放到堆中。


像其它運行時內存區一樣,本地方法棧佔用的內存區可以根據需要動態擴展或收縮。


3 執行引擎


在Java虛擬機規範中,執行引擎的行爲使用指令集定義。實現執行引擎的設計者將決定如何執行字節碼,實現可以採取解釋、即時編譯或直接使用芯片上的指令執行,還可以是它們的混合。


執行引擎可以理解成一個抽象的規範、一個具體的實現或一個正在運行的實例。抽象規範使用指令集規定了執行引擎的行爲。具體實現可能使用多種不同的技術–包括軟件方面、硬件方面或樹種技術的結合。作爲運行時實例的執行引擎就是一個線程。


運行中Java程序的每一個線程都是一個獨立的虛擬機執行引擎的實例。從線程生命週期的開始到結束,它要麼在執行字節碼,要麼執行本地方法。


3.1 指令集


方法的字節碼流由Java虛擬機的指令序列構成。每一條指令包含一個單字節的操作碼,後面跟隨0個或多個操作數。操作碼錶示需要執行的操作;操作數向Java虛擬機提供執行操作碼需要的額外信息。當虛擬機執行一條指令時,可能使用當前常量池中的項、當前幀的局部變量中的值或者位於當前幀操作數棧頂端的值。


抽象的執行引擎每次執行一條字節碼指令。Java虛擬機中運行的程序的每個線程(執行引擎實例)都執行這個操作。執行引擎取得操作碼,如果操作碼有操作數,就取得它的操作數。它執行操作碼和跟隨的操作數規定的動作,然後再取得下一個操作碼。這個執行字節碼的過程在線程完成前將一直持續,通過從它的初始方法返回,或者沒有捕獲拋出的異常都可以標誌着線程的完成。


4 本地方法接口


Java本地接口,也叫JNI(Java Native Interface),是爲可移植性準備的。本地方法接口允許本地方法完成以下工作:


  • 傳遞或返回數據

  • 操作實例變量

  • 操作類變量或調用類方法

  • 操作數組

  • 對堆的對象加鎖

  • 裝載新的類

  • 拋出異常

  • 捕獲本地方法調用Java方法拋出的異常

  • 捕獲虛擬機拋出的異步異常

  • 指示垃圾收集器某個對象不再需要


發佈了31 篇原創文章 · 獲贊 19 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章