(轉載)Java中字符串常量和字符串變量的區別

https://blog.csdn.net/u010617952/article/details/51781319

 

 

 

 

ava中字符串對象創建有兩種形式,一種爲字面量形式,如String str = "droid";,另一種就是使用new這種標準的構造對象的方法,如String str = new String("droid");,這兩種方式我們在代碼編寫時都經常使用,尤其是字面量的方式。然而這兩種實現其實存在着一些性能和內存佔用的差別。這一切都是源於JVM爲了減少字符串對象的重複創建,其維護了一個特殊的內存,這段內存被成爲字符串常量池或者字符串字面量池。

工作原理

當代碼中出現字面量形式創建字符串對象時,JVM首先會對這個字面量進行檢查,如果字符串常量池中存在相同內容的字符串對象的引用,則將這個引用返回,否則新的字符串對象被創建,然後將這個引用放入字符串常量池,並返回該引用。

舉例說明

字面量創建形式

複製代碼代碼如下:


String str1 = "droid";

 

JVM檢測這個字面量,這裏我們認爲沒有內容爲droid的對象存在。JVM通過字符串常量池查找不到內容爲droid的字符串對象存在,那麼會創建這個字符串對象,然後將剛創建的對象的引用放入到字符串常量池中,並且將引用返回給變量str1。

如果接下來有這樣一段代碼

 

複製代碼代碼如下:


String str2 = "droid";

 

同樣JVM還是要檢測這個字面量,JVM通過查找字符串常量池,發現內容爲”droid”字符串對象存在,於是將已經存在的字符串對象的引用返回給變量str2。注意這裏不會重新創建新的字符串對象

驗證是否爲str1和str2是否指向同一對象,我們可以通過這段代碼

 

複製代碼代碼如下:


System.out.println(str1 == str2);

 

結果爲true。

使用new創建

 

複製代碼代碼如下:


String str3 = new String("droid");

 

當我們使用了new來構造字符串對象的時候,不管字符串常量池中有沒有相同內容的對象的引用,新的字符串對象都會創建。因此我們使用下面代碼測試一下,

 

複製代碼代碼如下:


String str3 = new String("droid");
System.out.println(str1 == str3);


結果如我們所想,爲false,表明這兩個變量指向的爲不同的對象。

 

intern

對於上面使用new創建的字符串對象,如果想將這個對象的引用加入到字符串常量池,可以使用intern方法。

調用intern後,首先檢查字符串常量池中是否有該對象的引用,如果存在,則將這個引用返回給變量,否則將引用加入並返回給變量。

 

複製代碼代碼如下:


String str4 = str3.intern();
System.out.println(str4 == str1);

 

輸出的結果爲true。

疑難問題

前提條件?

字符串常量池實現的前提條件就是Java中String對象是不可變的,這樣可以安全保證多個變量共享同一個對象。如果Java中的String對象可變的話,一個引用操作改變了對象的值,那麼其他的變量也會受到影響,顯然這樣是不合理的。

引用 or 對象

字符串常量池中存放的時引用還是對象,這個問題是最常見的。字符串常量池存放的是對象引用,不是對象。在Java中,對象都創建在堆內存中。

更新驗證,收到的很多評論也在討論這個問題,我簡單的進行了驗證。 驗證環境:

複製代碼代碼如下:


22:18:54-androidyue~/Videos$ cat /etc/os-release
NAME=Fedora
VERSION="17 (Beefy Miracle)"
ID=fedora
VERSION_ID=17
PRETTY_NAME="Fedora 17 (Beefy Miracle)"
ANSI_COLOR="0;34"
CPE_NAME="cpe:/o:fedoraproject:fedora:17"

 

22:19:04-androidyue~/Videos$ java -version
java version "1.7.0_25"
OpenJDK Runtime Environment (fedora-2.3.12.1.fc17-x86_64)
OpenJDK 64-Bit Server VM (build 23.7-b01, mixed mode)

 

驗證思路:以下的Java程序讀取一個大小爲82M的視頻文件,以字符串形式進行intern操作。

 

複製代碼代碼如下:


22:01:17-androidyue~/Videos$ ll -lh | grep why_to_learn.mp4
-rw-rw-r--. 1 androidyue androidyue  82M Oct 20  2013 why_to_learn.mp4

 

驗證代碼

 

複製代碼代碼如下:


import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;

 


public class TestMain {
  private static String fileContent;
  public static void main(String[] args) {
      fileContent = readFileToString(args[0]);
      if (null != fileContent) {
          fileContent = fileContent.intern();
          System.out.println("Not Null");
      }
  }
  
  
  private static String readFileToString(String file) {
      BufferedReader reader = null;
      try {
          reader = new BufferedReader(new FileReader(file));
          StringBuffer buff = new StringBuffer();
          String line;
          while ((line = reader.readLine()) != null) {
              buff.append(line);
          }
          return buff.toString();
      } catch (FileNotFoundException e) {
          e.printStackTrace();
      } catch (IOException e) {
          e.printStackTrace();
      } finally {
          if (null != reader) {
              try {
                  reader.close();
              } catch (IOException e) {
                  e.printStackTrace();
              }
          }
      }
      return null;
  }
}

 

由於字符串常量池存在於堆內存中的永久代,適用於Java8之前。我們通過設置永久代一個很小的值來進行驗證。如果字符串對象存在字符串常量池中,那麼必然拋出java.lang.OutOfMemoryError permgen space錯誤。

 

複製代碼代碼如下:


java -XX:PermSize=6m TestMain ~/Videos/why_to_learn.mp4

 

運行證明程序沒有拋出OOM,其實這個不能很好的證明存儲的是對象還是引用。

但是這個至少證明了字符串的實際內容對象char[]不存放在字符串常量池中。既然這樣的話,其實字符串常量池存儲字符串對象還是字符串對象的引用反而不是那麼重要。但個人還是傾向於存儲的爲引用。

優缺點

字符串常量池的好處就是減少相同內容字符串的創建,節省內存空間。

如果硬要說弊端的話,就是犧牲了CPU計算時間來換空間。CPU計算時間主要用於在字符串常量池中查找是否有內容相同對象的引用。不過其內部實現爲HashTable,所以計算成本較低。

GC回收?

因爲字符串常量池中持有了共享的字符串對象的引用,這就是說是不是會導致這些對象無法回收?

首先問題中共享的對象一般情況下都比較小。據我查證瞭解,在早期的版本中確實存在這樣的問題,但是隨着弱引用的引入,目前這個問題應該沒有了。

關於這個問題,可以具體瞭解這片文章interned Strings : Java Glossary

intern使用?

關於使用intern的前提就是你清楚自己確實需要使用。比如,我們這裏有一份上百萬的記錄,其中記錄的某個值多次爲美國加利福尼亞州,我們不想創建上百萬條這樣的字符串對象,我們可以使用intern只在內存中保留一份即可。關於intern更深入的瞭解請參考深入解析String#intern

總有例外?

你知道下面的代碼,會創建幾個字符串對象,在字符串常量池中保存幾個引用麼?

複製代碼代碼如下:


String test = "a" + "b" + "c";


答案是隻創建了一個對象,在常量池中也只保存一個引用。我們使用javap反編譯看一下即可得知。

 

 

複製代碼代碼如下:


17:02 $ javap -c TestInternedPoolGC
Compiled from "TestInternedPoolGC.java"
public class TestInternedPoolGC extends java.lang.Object{
public TestInternedPoolGC();
  Code:
   0:  aload_0
   1:  invokespecial    #1; //Method java/lang/Object."<init>":()V
   4:  return

 

public static void main(java.lang.String[])   throws java.lang.Exception;
  Code:
   0:  ldc  #2; //String abc
   2:  astore_1
   3:  return


看到了麼,實際上在編譯期間,已經將這三個字面量合成了一個。這樣做實際上是一種優化,避免了創建多餘的字符串對象,也沒有發生字符串拼接問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章