Java動態綁定機制的內幕解惑

  在Java方法調用的過程中,JVM是如何知道調用的是哪個類的方法源代碼? 這裏面到底有什麼內幕呢? 這篇文章我們就將揭露JVM方法調用的靜態(static binding)動態綁定機制(auto binding)

 

 

★ 靜態綁定機制

Java代碼  收藏代碼
  1. //被調用的類  
  2. package hr.test;  
  3. class Father{  
  4.       public static void f1(){  
  5.               System.out.println("Father— f1()");  
  6.       }  
  7. }  
  8. //調用靜態方法  
  9. import hr.test.Father;  
  10. public class StaticCall{  
  11.        public static void main(){  
  12.             Father.f1(); //調用靜態方法  
  13.        }  
  14. }  

     上面的源代碼中執行方法調用的語句(Father.f1())被編譯器編譯成了一條指令:invokestatic #13。我們看看JVM是如何處理這條指令的

     (1) 指令中的#13指的是StaticCall類的常量池中第13個常量表的索引項(關於常量池詳見《Class文件內容及常量池》)。這個常量表(CONSTATN_Methodref_info)記錄的是方法f1信息的符號引用(包括f1所在的類名,方法名和返回類型)。JVM會首先根據這個符號引用找到方法f1所在的類的全限定名: hr.test.Father。

     (2) 緊接着JVM會加載、鏈接和初始化Father類。

     (3) 然後在Father類所在的方法區中找到f1()方法的直接地址,並將這個直接地址記錄到StaticCall類的常量池索引爲13的常量表中。這個過程叫常量池解析,以後再次調用Father.f1()時,將直接找到f1方法的字節碼。

     (4) 完成了StaticCall類常量池索引項13的常量表的解析之後,JVM就可以調用f1()方法,並開始解釋執行f1()方法中的指令了。

 

     通過上面的過程,我們發現經過常量池解析之後,JVM就能夠確定要調用的f1()方法具體在內存的什麼位置上了。實際上,這個信息在編譯階段就已經在StaticCall類的常量池中記錄了下來。這種在編譯階段就能夠確定調用哪個方法的方式,我們叫做靜態綁定機制

 

     除了被static修飾的靜態方法,所有被private修飾的私有方法、被final修飾的禁止子類覆蓋的方法都會被編譯成invokestatic指令。另外所有類的初始化方法<init>和<clinit>會被編譯成invokespecial指令。JVM會採用靜態綁定機制來順利的調用這些方法。

 

 

 

★ 動態綁定機制

Java代碼  收藏代碼
  1. package hr.test;  
  2. //被調用的父類  
  3. class Father{  
  4.     public void f1(){  
  5.         System.out.println("father-f1()");  
  6.     }  
  7.         public void f1(int i){  
  8.                 System.out.println("father-f1()  para-int "+i);  
  9.         }  
  10. }  
  11. //被調用的子類  
  12. class Son extends Father{  
  13.     public void f1(){ //覆蓋父類的方法  
  14.         System.out.println("Son-f1()");  
  15.     }  
  16.         public void f1(char c){  
  17.                 System.out.println("Son-s1() para-char "+c);  
  18.         }  
  19. }  
  20.   
  21. //調用方法  
  22. import hr.test.*;  
  23. public class AutoCall{  
  24.     public static void main(String[] args){  
  25.         Father father=new Son(); //多態  
  26.         father.f1(); //打印結果: Son-f1()  
  27.     }  
  28. }  

      上面的源代碼中有三個重要的概念:多態(polymorphism)方法覆蓋方法重載。打印的結果大家也都比較清楚,但是JVM是如何知道f.f1()調用的是子類Sun中方法而不是Father中的方法呢?在解釋這個問題之前,我們首先簡單的講下JVM管理的一個非常重要的數據結構——方法表

 

       在JVM加載類的同時,會在方法區中爲這個類存放很多信息(詳見《Java 虛擬機體系結構》)。其中就有一個數據結構叫方法表。它以數組的形式記錄了當前類及其所有超類的可見方法字節碼在內存中的直接地址。下圖是上面源代碼中Father和Sun類在方法區中的方法表:

 

      上圖中的方法表有兩個特點:(1) 子類方法表中繼承了父類的方法,比如Father extends Object。 (2) 相同的方法(相同的方法簽名:方法名和參數列表)在所有類的方法表中的索引相同。比如Father方法表中的f1()和Son方法表中的f1()都位於各自方法表的第11項中。

 

      對於上面的源代碼,編譯器首先會把main方法編譯成下面的字節碼指令:

多態調用的字節碼指令代碼  收藏代碼
  1. 0  new hr.test.Son [13] //在堆中開闢一個Son對象的內存空間,並將對象引用壓入操作數棧  
  2. 3  dup    
  3. 4  invokespecial #7 [15] // 調用初始化方法來初始化堆中的Son對象   
  4. 7  astore_1 //彈出操作數棧的Son對象引用壓入局部變量1中  
  5. 8  aload_1 //取出局部變量1中的對象引用壓入操作數棧  
  6. 9  invokevirtual #15 //調用f1()方法  
  7. 12  return  

       其中invokevirtual指令的詳細調用過程是這樣的:

       (1) invokevirtual指令中的#15指的是AutoCall類的常量池中第15個常量表的索引項。這個常量表(CONSTATN_Methodref_info)記錄的是方法f1信息的符號引用(包括f1所在的類名,方法名和返回類型)。JVM會首先根據這個符號引用找到調用方法f1的類的全限定名: hr.test.Father。這是因爲調用方法f1的類的對象father聲明爲Father類型。

       (2) 在Father類型的方法表中查找方法f1,如果找到,則將方法f1在方法表中的索引項11(如上圖)記錄到AutoCall類的常量池中第15個常量表中(常量池解析)。這裏有一點要注意:如果Father類型方法表中沒有方法f1,那麼即使Son類型中方法表有,編譯的時候也通過不了。因爲調用方法f1的類的對象father的聲明爲Father類型。

       (3) 在調用invokevirtual指令前有一個aload_1指令,它會將開始創建在堆中的Son對象的引用壓入操作數棧。然後invokevirtual指令會根據這個Son對象的引用首先找到堆中的Son對象,然後進一步找到Son對象所屬類型的方法表。過程如下圖所示:

                   

      (4) 這是通過第(2)步中解析完成的#15常量表中的方法表的索引項11,可以定位到Son類型方法表中的方法f1(),然後通過直接地址找到該方法字節碼所在的內存空間。

 

      很明顯,根據對象(father)的聲明類型(Father)還不能夠確定調用方法f1的位置,必須根據father在堆中實際創建的對象類型Son來確定f1方法所在的位置。這種在程序運行過程中,通過動態創建的對象的方法表來定位方法的方式,我們叫做動態綁定機制

 

      上面的過程很清楚的反映出在方法覆蓋的多態調用的情況下,JVM是如何定位到準確的方法的。但是下面的調用方法JVM是如何定位的呢?(仍然使用上面代碼中的Father和Son類型)

Java代碼  收藏代碼
  1. public class AutoCall{  
  2.        public static void main(String[] args){  
  3.              Father father=new Son();  
  4.              char c='a';  
  5.              father.f1(c); //打印結果:father-f1()  para-int 97  
  6.        }  
  7. }  

       問題是Fahter類型中並沒有方法簽名爲f1(char)的方法呀。但打印結果顯示JVM調用了Father類型中的f1(int)方法,並沒有調用到Son類型中的f1(char)方法。

 

       根據上面詳細闡述的調用過程,首先可以明確的是:JVM首先是根據對象father聲明的類型Father來解析常量池的(也就是用Father方法表中的索引項來代替常量池中的符號引用)。如果Father中沒有匹配到"合適"的方法,就無法進行常量池解析,這在編譯階段就通過不了。

      那麼什麼叫"合適"的方法呢?當然,方法簽名完全一樣的方法自然是合適的。但是如果方法中的參數類型在聲明的類型中並不能找到呢?比如上面的代碼中調用father.f1(char),Father類型並沒有f1(char)的方法簽名。實際上,JVM會找到一種“湊合”的辦法,就是通過參數的自動轉型來找到“合適”的 方法。比如char可以通過自動轉型成int,那麼Father類中就可以匹配到這個方法了(關於Java的自動轉型問題可以參見《【解惑】Java類型間的轉型》)。但是還有一個問題,如果通過自動轉型發現可以“湊合”出兩個方法的話怎麼辦?比如下面的代碼:

Java代碼  收藏代碼
  1. class Father{  
  2.     public void f1(Object o){  
  3.         System.out.println("Object");  
  4.     }  
  5.     public void f1(double[] d){  
  6.         System.out.println("double[]");  
  7.     }  
  8.       
  9. }  
  10. public class Demo{  
  11.     public static void main(String[] args) {  
  12.         new Father().f1(null); //打印結果: double[]  
  13.     }  
  14. }  

        null可以引用於任何的引用類型,那麼JVM如何確定“合適”的方法呢。一個很重要的標準就是:如果一個方法可以接受傳遞給另一個方法的任何參數,那麼第一個方法就相對不合適。比如上面的代碼: 任何傳遞給f1(double[])方法的參數都可以傳遞給f1(Object)方法,而反之卻不行,那麼f1(double[])方法就更合適。因此JVM就會調用這個更合適的方法。

 

 

★ 總結

 

      (1) 所有私有方法、靜態方法、構造器及初始化方法<clinit>都是採用靜態綁定機制。在編譯器階段就已經指明瞭調用方法在常量池中的符號引用,JVM運行的時候只需要進行一次常量池解析即可。


      (2) 類對象方法的調用必須在運行過程中採用動態綁定機制。

           首先,根據對象的聲明類型(對象引用的類型)找到“合適”的方法。具體步驟如下:

           ① 如果能在聲明類型中匹配到方法簽名完全一樣(參數類型一致)的方法,那麼這個方法是最合適的。

           ② 在第①條不能滿足的情況下,尋找可以“湊合”的方法。標準就是通過將參數類型進行自動轉型之後再進行匹配。如果匹配到多個自動轉型後的方法簽名f(A)和f(B),則用下面的標準來確定合適的方法:傳遞給f(A)方法的參數都可以傳遞給f(B),則f(A)最合適。反之f(B)最合適

 

           ③ 如果仍然在聲明類型中找不到“合適”的方法,則編譯階段就無法通過。

 

           然後,根據在堆中創建對象的實際類型找到對應的方法表,從中確定具體的方法在內存中的位置。

 

 

 

★ 覆寫(override)

       一個實例方法可以覆寫(override)在其超類中可訪問到的具有相同簽名的所有實例方法,從而使能了動態分派(dynamic dispatch);換句話說,VM將基於實例的運行期類型來選擇要調用的覆寫方法。覆寫是面向對象編程技術的基礎,並且是唯一沒有被普遍勸阻的名字重用形式:

Java代碼  收藏代碼
  1. class Base{  
  2.       public void f(){}  
  3. }  
  4. class Derived extends Base{  
  5.       public void f(){}  
  6. }  

 

 

★ 隱藏(hide)

       一個域、靜態方法或成員類型可以分別隱藏(hide)在其超類中可訪問到的具有相同名字(對方法而言就是相同的方法簽名)的所有域、靜態方法或成員類型。隱藏一個成員將阻止其被繼承。

Java代碼  收藏代碼
  1. class Base{  
  2.       public static void f(){}  
  3. }  
  4. class Derived extends Base  {  
  5.       private static void f(){}   //hides Base. f()  
  6. }  
 

★ 重載(overload)
      在某個類中的方法可以重載(overload)另一個方法,只要它們具有相同的名字和不同的簽名。由調用所指定的重載方法是在編譯期選定的。

Java代碼  收藏代碼
  1. class CircuitBreaker{  
  2.       public void f (int i){}    //int overloading  
  3.       public void f(String s){}   //String overloading  
  4. }  
 

★ 遮蔽(shadow)
     一個變量、方法或類型可以分別遮蔽(shadow)在一個閉合的文本範圍內的具有相同名字的所有變量、方法或類型。如果一個實體被遮蔽了,那麼你用它的簡單名是無法引用到它的;根據實體的不同,有時你根本就無法引用到它。

Java代碼  收藏代碼
  1. class WhoKnows{  
  2.     static String sentence=”I don't know.”;  
  3.     public static void main(String[] args〕{  
  4.            String sentence=”I don't know.”;  //shadows static field  
  5.            System.out. println (sentence);  // prints local variable  
  6.     }  
  7. }  

      儘管遮蔽通常是被勸阻的,但是有一種通用的慣用法確實涉及遮蔽。構造器經常將來自其所在類的某個域名重用爲一個參數,以傳遞這個命名域的值。這種慣用法並不是沒有風險,但是大多數Java程序員都認爲這種風格帶來的實惠要超過
其風險:

Java代碼  收藏代碼
  1. class Belt{  
  2.       private find int size ;  //Parameter shadows Belt. size  
  3.       public Belt (int size){  
  4.            this. size=size;  
  5.       }  
  6. }  

 

★ 遮掩(obscure)

       一個變量可以遮掩具有相同名字的一個類型,只要它們都在同一個範圍內:如果這個名字被用於變量與類型都被許可的範圍,那麼它將引用到變量上。相似地,一個變量或一個類型可以遮掩一個包。遮掩是唯一一種兩個名字位於不同的名字空間的名字重用形式,這些名字空間包括:變量、包、方法或類型。如果一個類型或一個包被遮掩了,那麼你不能通過其簡單
名引用到它,除非是在這樣一個上下文環境中,即語法只允許在其名字空間中出現一種名字。遵守命名習慣就可以極大地消除產生遮掩的可能性:

Java代碼  收藏代碼
  1. public class Obscure{  
  2.       static String System;// Obscures type java.lang.System  
  3.       public static void main(String[] args)  
  4.             // Next line won't compile:System refers to static field  
  5.             System. out. println(“hello, obscure world!”);  
  6.       }  

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章