JDK | JDK6和JDK7中substring的原理及區別

String是Java中一個比較基礎的類,每一個開發人員都會經常接觸到。而且,String也是面試中經常會考的知識點。String有很多方法,有些方法比較常用,有些方法不太常用。今天要介紹的subString就是一個比較常用的方法,而且圍繞subString也有很多面試題。

substring(int beginIndex, int endIndex)方法在不同版本的JDK中的實現是不同的。瞭解他們的區別可以幫助你更好的使用他。爲簡單起見,後文中用substring()代表substring(int beginIndex, int endIndex)方法。

substring() 的作用

substring(int beginIndex, int endIndex)方法截取字符串並返回其[beginIndex,endIndex-1]範圍內的內容。

String x = "abcdef";
x = x.substring(1,3);
System.out.println(x);

輸出內容:

bc

調用substring()時發生了什麼?

你可能知道,因爲x是不可變的,當使用x.substring(1,3)對x賦值的時候,它會指向一個全新的字符串:

string-immutability1

然而,這個圖不是完全正確的表示堆中發生的事情。因爲在jdk6 和 jdk7中調用substring時發生的事情並不一樣。

JDK 6中的substring

String是通過字符數組實現的。在jdk 6 中,String類包含三個成員變量:char value[], int offsetint count。他們分別用來存儲真正的字符數組,數組的第一個位置索引以及字符串中包含的字符個數。

當調用substring方法的時候,會創建一個新的string對象,但是這個string的值仍然指向堆中的同一個字符數組。這兩個對象中只有count和offset 的值是不同的。

string-substring-jdk6

下面是證明上說觀點的Java源碼中的關鍵代碼:

//JDK 6
String(int offset, int count, char value[]) {
    this.value = value;
    this.offset = offset;
    this.count = count;
}

public String substring(int beginIndex, int endIndex) {
    //check boundary
    return  new String(offset + beginIndex, endIndex - beginIndex, value);
}

JDK 6中的substring導致的問題

如果你有一個很長很長的字符串,但是當你使用substring進行切割的時候你只需要很短的一段。這可能導致性能問題,因爲你需要的只是一小段字符序列,但是你卻引用了整個字符串(因爲這個非常長的字符數組一直在被引用,所以無法被回收,就可能導致內存泄露)。在JDK 6中,一般用以下方式來解決該問題,原理其實就是生成一個新的字符串並引用他。

x = x.substring(x, y) + ""

關於JDK 6中subString的使用不當會導致內存系列已經被官方記錄在Java Bug Database中:

leak

內存泄露:在計算機科學中,內存泄漏指由於疏忽或錯誤造成程序未能釋放已經不再使用的內存。 內存泄漏並非指內存在物理上的消失,而是應用程序分配某段內存後,由於設計錯誤,導致在釋放該段內存之前就失去了對該段內存的控制,從而造成了內存的浪費。

JDK 7 中的substring

上面提到的問題,在jdk 7中得到解決。在jdk 7 中,substring方法會在堆內存中創建一個新的數組。

string-substring-jdk7

Java源碼中關於這部分的主要代碼如下:

//JDK 7
public String(char value[], int offset, int count) {
    //check boundary
    this.value = Arrays.copyOfRange(value, offset, offset + count);
}

public String substring(int beginIndex, int endIndex) {
    //check boundary
    int subLen = endIndex - beginIndex;
    return new String(value, beginIndex, subLen);
}

以上是JDK 7中的subString方法,其使用new String創建了一個新字符串,避免對老字符串的引用。從而解決了內存泄露問題。

所以,如果你的生產環境中使用的JDK版本小於1.7,當你使用String的subString方法時一定要注意,避免內存泄露。

 

轉自:https://github.com/hollischuang/toBeTopJavaer/blob/master/basics/java-basic/substring.md

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章