前段時間,給星球的球友們專門碼了一篇文章《深入分析Java的編譯原理》,其中深入的介紹了Java中的javac編譯和JIT編譯的區別及原理。並在文中提到:JIT編譯除了具有緩存的功能外,還會對代碼做各種優化,比如:逃逸分析、 鎖消除、 鎖膨脹、 方法內聯、 空值檢查消除、 類型檢測消除、 公共子表達式消除等。
有球友閱讀完這部分內容後,對JVM產生了濃厚的興趣,自己回去專門學習了一下,在學習過程中遇到一個小問題,關於Java內存分配的。所以和我在微信上做過簡單的交流。主要涉及到Java中的堆和棧、數組內存分配、逃逸分析、編譯優化等技術及原理。本文也是關於這部分知識點的分享。
JVM內存分配策略
關於JVM的內存結構及內存分配方式,不是本文的重點,這裏只做簡單回顧。以下是我們知道的一些常識:
1、根據Java虛擬機規範,Java虛擬機所管理的內存包括方法區、虛擬機棧、本地方法棧、堆、程序計數器等。
2、我們通常認爲JVM中運行時數據存儲包括堆和棧。這裏所提到的棧其實指的是虛擬機棧,或者說是虛擬棧中的局部變量表。
3、棧中存放一些基本類型的變量數據(int/short/long/byte/float/double/Boolean/char)和對象引用。
4、堆中主要存放對象,即通過new關鍵字創建的對象。
5、數組引用變量是存放在棧內存中,數組元素是存放在堆內存中。
在《深入理解Java虛擬機中》關於Java堆內存有這樣一段描述:
但是,隨着JIT編譯期的發展與逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化,所有的對象都分配到堆上也漸漸變得不那麼“絕對”了。
這裏只是簡單提了一句,並沒有深入分析,很多人看到這裏由於對JIT、逃逸分析等技術不瞭解,所以也無法真正理解上面這段話的含義。
PS:這裏默認大家都瞭解什麼是JIT,不瞭解的朋友可以先自行Google瞭解下,或者加入我的知識星球,閱讀那篇球友專享文章。
其實,在編譯期間,JIT會對代碼做很多優化。其中有一部分優化的目的就是減少內存堆分配壓力,其中一種重要的技術叫做逃逸分析。
逃逸分析
逃逸分析(Escape Analysis)是目前Java虛擬機中比較前沿的優化技術。這是一種可以有效減少Java 程序中同步負載和內存堆分配壓力的跨函數全局數據流分析算法。通過逃逸分析,Java Hotspot編譯器能夠分析出一個新的對象的引用的使用範圍從而決定是否要將這個對象分配到堆上。
逃逸分析的基本行爲就是分析對象動態作用域:當一個對象在方法中被定義後,它可能被外部方法所引用,例如作爲調用參數傳遞到其他地方中,稱爲方法逃逸。
例如:
public static StringBuffer craeteStringBuffer(String s1, String s2) { StringBuffer sb = new StringBuffer(); sb.append(s1); sb.append(s2); return sb; }
StringBuffer sb是一個方法內部變量,上述代碼中直接將sb返回,這樣這個StringBuffer有可能被其他方法所改變,這樣它的作用域就不只是在方法內部,雖然它是一個局部變量,稱其逃逸到了方法外部。甚至還有可能被外部線程訪問到,譬如賦值給類變量或可以在其他線程中訪問的實例變量,稱爲線程逃逸。
上述代碼如果想要StringBuffer sb不逃出方法,可以這樣寫:
public static String createStringBuffer(String s1, String s2) { StringBuffer sb = new StringBuffer(); sb.append(s1); sb.append(s2); return sb.toString(); }
不直接返回 StringBuffer,那麼StringBuffer將不會逃逸出方法。
使用逃逸分析,編譯器可以對代碼做如下優化:
一、同步省略。如果一個對象被發現只能從一個線程被訪問到,那麼對於這個對象的操作可以不考慮同步。
二、將堆分配轉化爲棧分配。如果一個對象在子程序中被分配,要使指向該對象的指針永遠不會逃逸,對象可能是棧分配的候選,而不是堆分配。
三、分離對象或標量替換。有的對象可能不需要作爲一個連續的內存結構存在也可以被訪問到,那麼對象的部分(或全部)可以不存儲在內存,而是存儲在CPU寄存器中。
上面的關於同步省略的內容,我在《深入理解多線程(五)—— Java虛擬機的鎖優化技術》中有介紹過,即鎖優化中的鎖消除技術,依賴的也是逃逸分析技術。
本文,主要來介紹逃逸分析的第二個用途:將堆分配轉化爲棧分配。
其實,以上三種優化中,棧上內存分配其實是依靠標量替換來實現的。由於不是本文重點,這裏就不展開介紹了。如果大家感興趣,我後面專門出一篇文章,全面介紹下逃逸分析。
在Java代碼運行時,通過JVM參數可指定是否開啓逃逸分析, -XX:+DoEscapeAnalysis
: 表示開啓逃逸分析 -XX:-DoEscapeAnalysis
: 表示關閉逃逸分析 從jdk 1.7開始已經默認開始逃逸分析,如需關閉,需要指定-XX:-DoEscapeAnalysis
對象的棧上內存分配
我們知道,在一般情況下,對象和數組元素的內存分配是在堆內存上進行的。但是隨着JIT編譯器的日漸成熟,很多優化使這種分配策略並不絕對。JIT編譯器就可以在編譯期間根據逃逸分析的結果,來決定是否可以將對象的內存分配從堆轉化爲棧。
我們來看以下代碼:
public static void main(String[] args) { long a1 = System.currentTimeMillis(); for (int i = 0; i < 1000000; i++) { alloc(); } // 查看執行時間 long a2 = System.currentTimeMillis(); System.out.println("cost " + (a2 - a1) + " ms"); // 爲了方便查看堆內存中對象個數,線程sleep try { Thread.sleep(100000); } catch (InterruptedException e1) { e1.printStackTrace(); } } private static void alloc() { User user = new User(); } static class User { }
其實代碼內容很簡單,就是使用for循環,在代碼中創建100萬個User對象。
我們在alloc方法中定義了User對象,但是並沒有在方法外部引用他。也就是說,這個對象並不會逃逸到alloc外部。經過JIT的逃逸分析之後,就可以對其內存分配進行優化。
我們指定以下JVM參數並運行:
-Xmx4G -Xms4G -XX:-DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
在程序打印出 cost XX ms
後,代碼運行結束之前,我們使用[jmap][1]
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps 2809 StackAllocTest 2810 Jps ➜ ~ jmap -histo 2809 num #instances #bytes class name ---------------------------------------------- 1: 524 87282184 [I 2: 1000000 16000000 StackAllocTest$User 3: 6806 2093136 [B 4: 8006 1320872 [C 5: 4188 100512 java.lang.String 6: 581 66304 java.lang.Class
從上面的jmap執行結果中我們可以看到,堆中共創建了100萬個StackAllocTest$User
實例。
在關閉逃避分析的情況下(-XX:-DoEscapeAnalysis),雖然在alloc方法中創建的User對象並沒有逃逸到方法外部,但是還是被分配在堆內存中。也就說,如果沒有JIT編譯器優化,沒有逃逸分析技術,正常情況下就應該是這樣的。即所有對象都分配到堆內存中。
接下來,我們開啓逃逸分析,再來執行下以上代碼。
-Xmx4G -Xms4G -XX:+DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
在程序打印出 cost XX ms
後,代碼運行結束之前,我們使用jmap
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps 709 2858 Launcher 2859 StackAllocTest 2860 Jps ➜ ~ jmap -histo 2859 num #instances #bytes class name ---------------------------------------------- 1: 524 101944280 [I 2: 6806 2093136 [B 3: 83619 1337904 StackAllocTest$User 4: 8006 1320872 [C 5: 4188 100512 java.lang.String 6: 581 66304 java.lang.Class
從以上打印結果中可以發現,開啓了逃逸分析之後(-XX:+DoEscapeAnalysis),在堆內存中只有8萬多個StackAllocTest$User
對象。也就是說在經過JIT優化之後,堆內存中分配的對象數量,從100萬降到了8萬。
除了以上通過jmap驗證對象個數的方法以外,讀者還可以嘗試將堆內存調小,然後執行以上代碼,根據GC的次數來分析,也能發現,開啓了逃逸分析之後,在運行期間,GC次數會明顯減少。正是因爲很多堆上分配被優化成了棧上分配,所以GC次數有了明顯的減少。
總結
所以,如果以後再有人問你:是不是所有的對象和數組都會在堆內存分配空間?
那麼你可以告訴他:不一定,隨着JIT編譯器的發展,在編譯期間,如果JIT經過逃逸分析,發現有些對象沒有逃逸出方法,那麼有可能堆內存分配會被優化成棧內存分配。但是這也並不是絕對的。就像我們前面看到的一樣,在開啓逃逸分析之後,也並不是所有User對象都沒有在堆上分配。
最後傳播一個好消息
騰訊雲有史以來最大優惠,新用戶福利1000減750!雲服務器最低2折,1核1G內存50G硬盤1年最低325元!戳此直達活動現場!
作者:Hollis_公衆號Hollis
鏈接:https://juejin.im/post/5b627e595188256281497872
來源:掘金