黃偉峯
三.優化JAVA程序設計和編碼,提高JAVA程序性能的一些方法。
通過使用一些前面介紹過的輔助性工具來找到程序中的瓶頸,然後就可以對瓶頸部分的代碼進行優化。一般有兩種方案:即優化代碼或更改設計方法。我們一般會選 擇後者,因爲不去調用以下代碼要比調用一些優化的代碼更能提高程序的性能。而一個設計良好的程序能夠精簡代碼,從而提高性能。 |
下面將提供一些在JAVA程序的設計和編碼中,爲了能夠提高JAVA程序的性能,而經常採用的一些方法和技巧。 |
JAVA程序設計中一個普遍的問題就是沒有好好的利用JAVA語言本身提供的函數,從而常常會生成大量的對象(或實例)。由於系統不僅要花時間生成對象,以後可能還需花時間對這些對象進行垃圾回收和處理。因此,生成過多的對象將會給程序的性能帶來很大的影響。 |
例1:關於String ,StringBuffer,+和append |
JAVA語言提供了對於String類型變量的操作。但如果使用不當,會給程序的性能帶來影響。如下面的語句: |
String name=new String(“HuangWeiFeng”); |
System.out.println(name+”is my name”); |
看似已經很精簡了,其實並非如此。爲了生成二進制的代碼,要進行如下的步驟和操作。 |
(1) 生成新的字符串 new String(STR_1); |
(3) 加載字符串常量”HuangWeiFeng”(STR_2); |
(4) 調用字符串的構架器(Constructor); |
(6) 從java.io.PrintStream類中得到靜態的out變量 |
(7) 生成新的字符串緩衝變量new StringBuffer(STR_BUF_1); |
(9) 調用字符串緩衝的構架器(Constructor); |
(10) 保存該字符串緩衝到數組中(從位置1開始) |
(11) 以STR_1爲參數,調用字符串緩衝(StringBuffer)類中的append方法。 |
(12) 加載字符串常量”is my name”(STR_3); |
(13) 以STR_3爲參數,調用字符串緩衝(StringBuffer)類中的append方法。 |
(14) 對於STR_BUF_1執行toString命令。 |
(15) 調用out變量中的println方法,輸出結果。 |
由此可以看出,這兩行簡單的代碼,就生成了STR_1,STR_2,STR_3,STR_4和STR_BUF_1五個對象變量。這些生成的類的實例一般都 存放在堆中。堆要對所有類的超類,類的實例進行初始化,同時還要調用類極其每個超類的構架器。而這些操作都是非常消耗系統資源的。因此,對對象的生成進行 限制,是完全有必要的。 |
StringBuffer name=new StringBuffer(“HuangWeiFeng”); |
System.out.println(name.append(“is my name.”).toString()); |
(1) 生成新的字符串緩衝變量new StringBuffer(STR_BUF_1); |
(3) 加載字符串常量”HuangWeiFeng”(STR_1); |
(4) 調用字符串緩衝的構架器(Constructor); |
(6) 從java.io.PrintStream類中得到靜態的out變量 |
(8) 加載字符串常量”is my name”(STR_2); |
(9) 以STR_2爲參數,調用字符串緩衝(StringBuffer)實例中的append方法。 |
(10) 對於STR_BUF_1執行toString命令。(STR_3) |
(11)調用out變量中的println方法,輸出結果。 |
由此可以看出,經過改進後的代碼只生成了四個對象變量:STR_1,STR_2,STR_3和STR_BUF_1.你可能覺得少生成一個對象不會對程序的 性能有很大的提高。但下面的代碼段2的執行速度將是代碼段1的2倍。因爲代碼段1生成了八個對象,而代碼段2只生成了四個對象。 |
String name= new StringBuffer(“HuangWeiFeng”); |
StringBuffer name=new StringBuffer(“HuangWeiFeng”); |
name.append(“name.”).toString(); |
因此,充分的利用JAVA提供的庫函數來優化程序,對提高JAVA程序的性能時非常重要的.其注意點主要有如下幾方面; |
(1) 儘可能的使用靜態變量(Static Class Variables) |
如果類中的變量不會隨他的實例而變化,就可以定義爲靜態變量,從而使他所有的實例都共享這個變量。 |
SomeObject so=new SomeObject(); |
static SomeObject so=new SomeObject(); |
對於一些類(如:String類)來講,寧願在重新生成一個新的對象實例,而不應該修改已經生成的對象實例。 |
上述代碼生成了三個String類型的對象實例。而前兩個馬上就需要系統進行垃圾回收處理。如果要對字符串進行連接的操作,性能將得更差。因爲系統將不得爲此生成更多得臨時變量。如上例1所示。 |
JAVA中的很多類都有它的默認的空間分配大小。對於StringBuffer類來講,默認的分配空間大小是16個字符。如果在程序中使用StringBuffer的空間大小不是16個字符,那麼就必須進行正確的初始化。 |
(4) 避免生成不太使用或生命週期短的對象或變量。 |
對於這種情況,因該定義一個對象緩衝池。以爲管理一個對象緩衝池的開銷要比頻繁的生成和回收對象的開銷小的多。 |
JAVA允許在代碼的任何地方定義和初始化對象。這樣,就可以只在對象作用的範圍內進行初始化。從而節約系統的開銷。 |
SomeObject so=new SomeObject(); |
SomeObject so=new SomeObject(); |
JAVA語言中提供了try/catch來發方便用戶捕捉異常,進行異常的處理。但是如果使用不當,也會給JAVA程序的性能帶來影響。因此,要注意以下兩點。 |
(1) 避免對應用程序的邏輯使用try/catch |
如果可以用if,while等邏輯語句來處理,那麼就儘可能的不用try/catch語句 |
在必須要進行異常的處理時,要儘可能的重用已經存在的異常對象。以爲在異常的處理中,生成一個異常對象要消耗掉大部分的時間。 |
一個高性能的應用程序中一般都會用到線程。因爲線程能充分利用系統的資源。在其他線程因爲等待硬盤或網絡讀寫而 時,程序能繼續處理和運行。但是對線程運用不當,也會影響程序的性能。 |
Vector主要用來保存各種類型的對象(包括相同類型和不同類型的對象)。但是在一些情況下使用會給程序帶來性能上的影響。這主要是由Vector類的 兩個特點所決定的。第一,Vector提供了線程的安全保護功能。即使Vector類中的許多方法同步。但是如果你已經確認你的應用程序是單線程,這些方 法的同步就完全不必要了。第二,在Vector查找存儲的各種對象時,常常要花很多的時間進行類型的匹配。而當這些對象都是同一類型時,這些匹配就完全不 必要了。因此,有必要設計一個單線程的,保存特定類型對象的類或集合來替代Vector類.用來替換的程序如下(StringVector.java): |
public class StringVector |
public StringVector() { this(10); // default size is 10 } |
public StringVector(int initialSize) |
data = new String[initialSize]; |
public void add(String str) |
if(str == null) { return; } |
ensureCapacity(count + 1); |
private void ensureCapacity(int minCapacity) |
int oldCapacity = data.length; |
if (minCapacity > oldCapacity) |
int newCapacity = oldCapacity * 2; |
data = new String[newCapacity]; |
System.arraycopy(oldData, 0, data, 0, count); |
public void remove(String str) |
if(str == null) { return // ignore null str } |
for(int i = 0; i < count; i++) |
System.arraycopy(data,i+1,data,i,count-1); // copy data |
// allow previously valid array element be gc'd |
public final String getStringAt(int index) { |
if(index < 0) { return null; } |
return null; // index is > # strings |
else { return data[index]; // index is good } |
/* * * * * * * * * * * * * * * *StringVector.java * * * * * * * * * * * * * * * * */ |
Vector Strings=new Vector(); |
String Second=(String)Strings.elementAt(1); |
StringVector Strings=new StringVector(); |
String Second=Strings.getStringAt(1); |
這樣就可以通過優化線程來提高JAVA程序的性能。用於測試的程序如下(TestCollection.java): |
public class TestCollection |
public static void main(String args []) |
TestCollection collect = new TestCollection(); |
"Usage: java TestCollection [ vector | stringvector ]"); |
if(args[0].equals("vector")) |
Vector store = new Vector(); |
long start = System.currentTimeMillis(); |
for(int i = 0; i < 1000000; i++) |
store.addElement("string"); |
long finish = System.currentTimeMillis(); |
System.out.println((finish-start)); |
start = System.currentTimeMillis(); |
for(int i = 0; i < 1000000; i++) |
String result = (String)store.elementAt(i); |
finish = System.currentTimeMillis(); |
System.out.println((finish-start)); |
else if(args[0].equals("stringvector")) |
StringVector store = new StringVector(); |
long start = System.currentTimeMillis(); |
for(int i = 0; i < 1000000; i++) { store.add("string"); } |
long finish = System.currentTimeMillis(); |
System.out.println((finish-start)); |
start = System.currentTimeMillis(); |
for(int i = 0; i < 1000000; i++) { |
String result = store.getStringAt(i); |
finish = System.currentTimeMillis(); |
System.out.println((finish-start)); |
/* * * * * * * * * * * * * * * *TestCollection.java * * * * * * * * * * * * * * * * */ |
測試的結果如下(假設標準的時間爲1,越小性能越好): |
如上所示,不必要的同步常常會造成程序性能的下降。因此,如果程序是單線程,則一定不要使用同步。 |
對某個方法或函數進行同步比對整個代碼段進行同步的性能要好。 |
一般每個對象都只有一個”鎖”,這就表明如果兩個線程執行一個對象的兩個不同的同步方法時,會發生”死鎖”。即使這兩個方法並不共享任何資源。爲了避免這個問題,可以對一個對象實行”多鎖”的機制。如下所示: |
private static Object lock1=new Object(); |
private static Object lock2=new Object(); |
public static void increment1() |
public static void increment2() |
輸入和輸出包括很多方面,但涉及最多的是對硬盤,網絡或數據庫的讀寫操作。對於讀寫操作,又分爲有緩存和沒有緩存的;對於數據庫的操作,又可以有多種類型的JDBC驅動器可以選擇。但無論怎樣,都會給程序的性能帶來影響。因此,需要注意如下幾點: |
儘可能的多使用緩存。但如果要經常對緩存進行刷新(flush),則建議不要使用緩存。 |
(2) 輸出流(Output Stream)和Unicode字符串 |
當時用Output Stream和Unicode字符串時,Write類的開銷比較大。因爲它要實現Unicode到字節(byte)的轉換.因此,如果可能的話,在使用Write類之前就實現轉換或用OutputStream類代替Writer類來使用。 |
當序列化一個類或對象時,對於那些原子類型(atomic)或可以重建的原素要表識爲transient類型。這樣就不用每一次都進行序列化。如果這些序列化的對象要在網絡上傳輸,這一小小的改變對性能會有很大的提高。 |
對於那些經常要使用而又不大變化的對象或數據,可以把它存儲在高速緩存中。這樣就可以提高訪問的速度。這一點對於從數據庫中返回的結果集尤其重要。 |
(5) 使用速度快的JDBC驅動器(Driver) |
JAVA對訪問數據庫提供了四種方法。這其中有兩種是JDBC驅動器。一種是用JAVA外包的本地驅動器;另一種是完全的JAVA驅動器。具體要使用哪一種得根據JAVA佈署的環境和應用程序本身來定。 |
(2) 避免在同一個類中動過調用函數或方法(get或set)來設置或調用變量。 |
(3) 避免在循環中生成同一個變量或調用同一個函數(參數變量也一樣) |
(4) 儘可能的使用static,final,private等關鍵字 |
(5) 當複製大量數據時,使用System.arraycopy()命令。