String類的intern()方法詳解及String對象的創建過程

0.引言

什麼都先不說,先看下面這個引入的例子:

  1. String str1 = new String("SEU")+ new String("Calvin");
  2. System.out.println(str1.intern() == str1);
  3. System.out.println(str1 == "SEUCalvin");

本人JDK版本1.8,輸出結果爲:

  1. true
  2. true
再將上面的例子加上一行代碼:
  1. String str2 = "SEUCalvin";//新加的一行代碼,其餘不變
  2. String str1 = new String("SEU")+ new String("Calvin");
  3. System.out.println(str1.intern() == str1);
  4. System.out.println(str1 == "SEUCalvin");
再運行,結果爲:

  1. false
  2. false

是不是感覺莫名其妙,新定義的str2好像和str1沒有半毛錢的關係,怎麼會影響到有關str1的輸出結果呢?其實這都是intern()方法搞的鬼!看完這篇文章,你就會明白。o(_)o 

說實話我本來想總結一篇Android內存泄漏的文章的,查閱了很多資料,發現不得不從JavaOOM講起,講JavaOOM又不得不講Java的虛擬機架構。如果不瞭解JVM的同學可以查看此篇 JVM——Java虛擬機架構。(這篇文章已經被我修改過N多次了,個人感覺還是挺全面清晰的,每次看都會有新的理解。)

JVM架構一文中也有介紹,在JVM運行時數據區中的方法區有一個常量池,但是發現在JDK1.6以後常量池被放置在了堆空間,因此常量池位置的不同影響到了Stringintern()方法的表現。深入瞭解後發現還是值得寫下來記錄一下的。爲了確保文章的實時更新,實時修改可能出錯的地方,請確保這篇是原文,而不是無腦轉載來的“原創文”,原文鏈接爲:SEU_Calvin的博客


1.爲什麼要介紹intern()方法

intern()方法設計的初衷,就是重用String對象,以節省內存消耗。這麼說可能有點抽象,那麼就用例子來證明。

  1. static final int MAX = 100000;
  2. static final String[] arr = new String[MAX];
  3. public static void main(String[] args) throws Exception {
  4. //爲長度爲10的Integer數組隨機賦值
  5. Integer[] sample = new Integer[10];
  6. Random random = new Random(1000);
  7. for (int i = 0; i < sample.length; i++) {
  8. sample[i] = random.nextInt();
  9. }
  10. //記錄程序開始時間
  11. long t = System.currentTimeMillis();
  12. //使用/不使用intern方法爲10萬個String賦值,值來自於Integer數組的10個數
  13. for (int i = 0; i < MAX; i++) {
  14. arr[i] = new String(String.valueOf(sample[i % sample.length]));
  15. //arr[i] = new String(String.valueOf(sample[i % sample.length])).intern();
  16. }
  17. System.out.println((System.currentTimeMillis() - t) + "ms");
  18. System.gc();
  19. }

這個例子也比較簡單,就是爲了證明使用intern()比不使用intern()消耗的內存更少

先定義一個長度爲10Integer數組,並隨機爲其賦值,在通過for循環爲長度爲10萬的String對象依次賦值,這些值都來自於Integer數組。兩種情況分別運行,可通過Window ---> Preferences --> Java --> Installed JREs設置JVM啓動參數爲-agentlib:hprof=heap=dump,format=b,將程序運行完後的hprof置於工程目錄下。再通過MAT插件查看該hprof文件。
兩次實驗結果如下:



從運行結果來看,不使用intern()的情況下,程序生成了101762String對象,而使用了intern()方法時,程序僅生成了1772String對象。自然也證明了intern()節省內存的結論

細心的同學會發現使用了intern()方法後程序運行時間有所增加。這是因爲程序中每次都是用了new String後又進行intern()操作的耗時時間,但是不使用intern()佔用內存空間導致GC的時間是要遠遠大於這點時間的。 


2.深入認識intern()方法

JDK1.7後,常量池被放入到堆空間中,這導致intern()函數的功能不同,具體怎麼個不同法,且看看下面代碼,這個例子是網上流傳較廣的一個例子,分析圖也是直接粘貼過來的,這裏我會用自己的理解去解釋這個例子:

  1. String s = new String("1");
  2. s.intern();
  3. String s2 = "1";
  4. System.out.println(s == s2);
  5. String s3 = new String("1") + new String("1");
  6. s3.intern();
  7. String s4 = "11";
  8. System.out.println(s3 == s4);

輸出結果爲:

  1. JDK1.6以及以下:false false
  2. JDK1.7以及以上:false true

再分別調整上面代碼2.3行、7.8行的順序:

  1. String s = new String("1");
  2. String s2 = "1";
  3. s.intern();
  4. System.out.println(s == s2);
  5. String s3 = new String("1") + new String("1");
  6. String s4 = "11";
  7. s3.intern();
  8. System.out.println(s3 == s4);

輸出結果爲:

  1. JDK1.6以及以下:false false
  2. JDK1.7以及以上:false false

下面依據上面代碼對intern()方法進行分析:


2.1 JDK1.6


JDK1.6中所有的輸出結果都是 false,因爲JDK1.6以及以前版本中,常量池是放在 Perm 區(屬於方法區)中的,熟悉JVM的話應該知道這是和堆區完全分開的

使用引號聲明的字符串都是會直接在字符串常量池中生成的,而 new 出來的 String 對象是放在堆空間中的。所以兩者的內存地址肯定是不相同的,即使調用了intern()方法也是不影響的。如果不清楚String類的“==”和equals()的區別可以查看我的這篇博文Java面試——從Java堆、棧角度比較equals和==的區別

intern()方法在JDK1.6中的作用是:比如String s = new String("SEU_Calvin"),再調用s.intern(),此時返回值還是字符串"SEU_Calvin",表面上看起來好像這個方法沒什麼用處。但實際上,在JDK1.6中它做了個小動作:檢查字符串池裏是否存在"SEU_Calvin"這麼一個字符串,如果存在,就返回池裏的字符串;如果不存在,該方法會把"SEU_Calvin"添加到字符串池中,然後再返回它的引用。然而在JDK1.7中卻不是這樣的,後面會討論。


2.2 JDK1.7

針對JDK1.7以及以上的版本,我們將上面兩段代碼分開討論。先看第一段代碼的情況:


再把第一段代碼貼一下便於查看:

  1. String s = new String("1");
  2. s.intern();
  3. String s2 = "1";
  4. System.out.println(s == s2);
  5. String s3 = new String("1") + new String("1");
  6. s3.intern();
  7. String s4 = "11";
  8. System.out.println(s3 == s4);

String s = newString("1"),生成了常量池中的“1” 和堆空間中的字符串對象

s.intern(),這一行的作用是s對象去常量池中尋找後發現"1"已經存在於常量池中了

String s2 = "1",這行代碼是生成一個s2的引用指向常量池中的“1”對象

結果就是 s s2 的引用地址明顯不同。因此返回了false。


String s3 = new String("1") + newString("1"),這行代碼在字符串常量池中生成“1” ,並在堆空間中生成s3引用指向的對象(內容爲"11")。注意此時常量池中是沒有 “11”對象的。

s3.intern(),這一行代碼,是將 s3中的“11”字符串放入 String 常量池中,此時常量池中不存在“11”字符串,JDK1.6的做法是直接在常量池中生成一個 "11" 的對象。

但是在JDK1.7中,常量池中不需要再存儲一份對象了,可以直接存儲堆中的引用。這份引用直接指向 s3 引用的對象也就是說s3.intern() ==s3會返回true。

String s4 = "11", 這一行代碼直接去常量池中創建,但是發現已經有這個對象了,此時也就是指向 s3 引用對象的一個引用因此s3 == s4返回了true


下面繼續分析第二段代碼:


再把第二段代碼貼一下便於查看:

  1. String s = new String("1");
  2. String s2 = "1";
  3. s.intern();
  4. System.out.println(s == s2);
  5. String s3 = new String("1") + new String("1");
  6. String s4 = "11";
  7. s3.intern();
  8. System.out.println(s3 == s4);

String s = newString("1"),生成了常量池中的“1” 和堆空間中的字符串對象

String s2 = "1",這行代碼是生成一個s2的引用指向常量池中的“1”對象,但是發現已經存在了,那麼就直接指向了它

s.intern(),這一行在這裏就沒什麼實際作用了。因爲"1"已經存在了。

結果就是 s  s2 的引用地址明顯不同。因此返回了false。


String s3 = new String("1") + newString("1"),這行代碼在字符串常量池中生成“1” ,並在堆空間中生成s3引用指向的對象(內容爲"11")。注意此時常量池中是沒有 “11”對象的。

String s4 = "11", 這一行代碼直接去生成常量池中的"11"

s3.intern(),這一行在這裏就沒什麼實際作用了。因爲"11"已經存在了。

結果就是 s3  s4 的引用地址明顯不同。因此返回了false。

爲了確保文章的實時更新,實時修改可能出錯的地方,請確保這篇是原文,而不是無腦轉載來的“原創文”,原文鏈接爲:SEU_Calvin的博客


3 總結

終於要做Ending了。現在再來看一下開篇給的引入例子,是不是就很清晰了呢。

  1. String str1 = new String("SEU") + new String("Calvin");
  2. System.out.println(str1.intern() == str1);
  3. System.out.println(str1 == "SEUCalvin");

str1.intern() == str1就是上面例子中的情況,str1.intern()發現常量池中不存在“SEUCalvin”,因此指向了str1 "SEUCalvin"在常量池中創建時,也就直接指向了str1了。兩個都返回true就理所當然啦。

那麼第二段代碼呢:

  1. String str2 = "SEUCalvin";//新加的一行代碼,其餘不變
  2. String str1 = new String("SEU")+ new String("Calvin");
  3. System.out.println(str1.intern() == str1);
  4. System.out.println(str1 == "SEUCalvin");
也很簡單啦,str2先在常量池中創建了“SEUCalvin”,那麼str1.intern()當然就直接指向了str2,你可以去驗證它們兩個是返回的true。後面的"SEUCalvin"也一樣指向str2。所以誰都不搭理在堆空間中的str1了,所以都返回了false。

好了,本篇對intern的作用以及在JDK1.6和1.7中的實現原理的介紹就到此爲止了。希望能給你帶來幫助。

轉載請註明出處http://blog.csdn.net/seu_calvin/article/details/52291082


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章