Java類文件解析

一、什麼是Java類文件
    Java類文件是Java程序的二進制表示形式。每一個類文件代表一個類或者接口。不可能在一個類文件中放入多個類或者接口。這樣就使得無論類文件是在哪 一種平臺上生成,都可以在任何主機上執行。
    雖然類文件是Java體系結構的一部分,但是他並不是與Java語言不可分的。你可以將其他語言的程序編譯爲類文件,也可以將Java程序文件編譯爲其他二進制形式。
Java類文件是一個基於8-bit字節的二進制流。數據塊順序的、無分割符的、big-endian的形式存儲。
二、類文件的內容
Java的類文件中包含了所有Java虛擬機所需要的關於類和接口的信息。所有類文件中的信息都以以下的四種基本類型的存儲:
    Table 6-1. Class file "primitive types"
    u1    a single unsigned byte
    u2    two unsigned bytes
    u4    four unsigned bytes
    u8    eight unsigned bytes
類文件中的主要部分以表6-2的順序存儲:
    Table 6-2. Format of a ClassFile Table
    Type&    #9;Name    Count
    u4    magic    1
    u2    minor_version    1
    u2    major_version    1
    u2    constant_pool_count    1
    cp_info    constant_pool    constant_pool_count-1
    u2    access_flags    1
    u2    this_class    1
    u2    super_class    1
    u2    interfaces_count    1
    u2    interfaces    interfaces_count
    u2    fields_count    1
    field_info    fields    fields_count
    u2    methods_count    1
    method_info    methods    methods_count
    u2    attributes_count    1
    attribute_info    attributes    attributes_count
    1、魔術編碼(magic)
    每一個Java類文件的開頭四個字節都是魔術編碼(OxCAFEBABE)。通過魔術編碼可以很容易識別類文件。
    2、副版本號和主版本號(minor_version and major_version)
    剩下的四個字節是副版本號和主版本號。但Java技術在進化時,一些新的特性可能會被加入到類文件中。每一次類文件格式的變化,都會相應的改變版本號。虛 擬機通過版本號來識別自己能夠處理的類文件。Java虛擬機往往只能處理一個給定的主版本號和其下的一些副版本號。虛擬機必須拒絕那些不再處理範圍內的類 文件。
    3、常量個數和常量池(constant_pool_count and constant_pool)
    接下來的就是常量池,常量池中包含了哪些被類或者接口訪問過的常量,比如:字符串,常量(final variable values),類名,方法名。常量池作爲一個列表存儲。列表中常量的個數就是之前保存的“constant_pool_count”。
    很多常量池中的常量都引用了常量池中的其他常量,那些引用常量池常量的引用最終也會轉換爲對常量池中常量的直接引用。雖然常量列表中的索引是從1開始的, 但是常量個數還是包含了0,比如一個常量列表中有15個常量,那麼它的常量個數就爲16。
    每一個常量開頭都會有一個標誌,以表示他的類型。當虛擬機讀取這個標誌時,就會知道這個常量的具體類型了。表6-3列舉了這些標誌:
    Table 6-3. Constant pool tags
    Entry Type    Tag Value    Description
    CONSTANT_Utf8    1    A UTF-8 encoded Unicode string
    CONSTANT_Integer    3    An int literal value
    CONSTANT_Float    4    A float literal value
    CONSTANT_Long    5    A long literal value
    CONSTANT_Double    6    A double literal value
    CONSTANT_Class    7    A symbolic reference to a class or interface
    CONSTANT_String    8    A String literal value
    CONSTANT_Fieldref    9    A symbolic reference to a field
    CONSTANT_Methodref    10    A symbolic reference to a method declared in a class
    CONSTANT_InterfaceMethodref    11    A symbolic reference to a method declared in an interface
    CONSTANT_NameAndType    12    Part of a symbolic reference to a field or method
    表6-3中的每一個標誌都會有一個相應的表格,用來描述這個標誌的所表示的一些詳細信息,這些對應的標誌都會以標誌名+_INFO來結尾。比如 CONSTANT_CLASS標誌對應的就是CONSTANT_CLASS_INFO。
    常量池在程序的動態鏈接中扮演了很重要的角色。除了上邊所說的各種常量值以外,常量池中包含了一下三種符號引用:類和接口的全名,字段名和描述符,方法名 和描述符。一個字段是一個類或者接口中的實例或者類變量,字段描述符是字段的類型。方法的描述符是方法和返回值和參數的個數、順序和類型。在虛擬機將這個 類或者接口鏈接到其他類或者接口時用到這些全名。因爲類文件不包含任何關於內存結構的信息,所以這個鏈接只能以符號引用的形式存在。虛擬機在執行時將這些 符號引用轉換爲實際的地址。具體的信息參見第八章“The Linking Model”。
    4、訪問標誌(access_flags)
    緊接在常量池後面的兩個字節就是訪問標誌,表示這個類或者接口的幾方面信息,他有如下幾種值:
    Table 6-4. Flag bits in the access_flags item of ClassFile tables
    Flag Name    Value    Meaning if Set    Set By
    ACC_PUBLIC    0x0001    Type is public    Classes and interfaces
    ACC_FINAL    0x0010    Class is final    Classes only
    ACC_SUPER    0x0020    Use new    invokespecial semanticsClasses and interfaces
    ACC_INTERFACE    0x0200    Type is an interface, not a class    All interfaces, no classes
    ACC_ABSTRACT    0x0400    Type is abstract    All interfaces, some classes
    ACC_SUPER標誌是爲了兼容以前SUN的老式的編譯器。所有沒有使用的訪問標誌,必須設置爲0。
    5、類名(this_class)
    接下來的兩個字節保存了一個常量池的索引。這個常量池中的實體必須是CONSTANT_CLSS_INTO類型的,他包含了標誌和名字索引。標誌就是 CONSTATN_CLASS,那個名字索引應該是一個保存了這個類或者接口全名的CONSTANT_UTF8_INFO類型的索引。
    6、父類(super_class)
    this_class之後的就是兩個字節的super_class,他也是一個常量池的索引,其中保存了父類的全名,處理this_class一樣。當父 類是java.lang.Object時,super_class都應該是0。對於接口super_class都是0。
    7、(interfaces_count and interfaces)
    interfaces_count中保存了父接口的個數,interfaces中以數組形式保存了一些常量池的索引。每一個索引都指向了一個 CONSTANT_CLASS_INFO的常量,其中保存了每一個父接口的全名。這個數組的順序就是父接口出現在在implements、extends 語句中從左到右的順序。
    8、(fields_count and fields)
    字段被保存在一個field_info的列表中,fields_count是這個列表的長度。Field_info列表中保存的只是類或者接口中的申明的 變量,從父類或者父接口中繼承的字段不保存在這裏。
每一個field_info表中的一條都描述了一個字段的信息,包括:字段名,描述符,訪問權 限。如果一個字段被申明爲final,那麼這個字段的信息即會保存在field_info表中,也會保存在常量池中。
    9、(methods_count and methods)
    方法的信息都保存在method_info表中,mehtods_count是表的長度。Method_info表中只保存類或者接口中申明的方法,不保 存從父類或者接口中繼承的方法。
Method_info 表中保存了方法名和描述符(返回值和參數類型)。如果不是抽象方法,還會保存用於堆棧的大小(保存本地變量用的)、操作數堆棧的最大值、捕捉的異常列表、 方法的字節碼、可選的行號和本地變量表。如果方法拋出一些被檢查的異常,method_info還會包含一個被檢查異常的列表。
    10、(attributes_count and attributes)
    類文件中最後的就是屬性個數和atribute_info列表。Atribute_info表中保存了一些指向常量池中 constant_utf8_info的索引,其中保存了屬性的名字。Java虛擬機規範中定義了兩種類型的屬性:源代碼和內部類。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章