Java學習——深刻解析序列化

Java 序列化

序列化的用處:

    對象需要遠程調用(比如說socket)

    對象需要在不同的進程間調用

    對象需要永久存放在硬盤上(脫離對象運行環境,編寫成一個以字符串形式存在的對象,需要時,通過獲取字符串,反序列化就能實現獲取一個對象)

 

首先說明一下序列化的知識:
java中的序列化(serialization)機制能夠將一個實例對象的狀態信息寫入到一個字節流中,使其可以通過socket進行傳輸、或 者持久化存儲到數據庫或文件系統中;然後在需要的時候,可以根據字節流中的信息來重構一個相同的對象。序列化機制在java中有着廣泛的應用,EJB、 RMI等技術都是以此爲基礎的。

序列化機制是通過java.io.ObjectOutputStream類和java.io.ObjectInputStream類來實現的。在 序列化(serialize)一個對象的時候,會先實例化一個ObjectOutputStream對象,然後調用其writeObject()方法;在 反序列化(deserialize)的時候,則會實例化一個ObjectInputStream對象,然後調用其readObject()方法。


Java的序列化機制是通過在運行時判斷類的serialVersionUID來驗證版本一致性的。在進行反序列化時,JVM會把傳來的字節流中 的serialVersionUID與本地相應實體(類)的serialVersionUID進行比較,如果相同就認爲是一致的,可以進行反序列化,否則就會出現序列化版本不一致的異常。

當實現java.io.Serializable接口的實體(類)沒有顯式地定義一個名爲serialVersionUID,類型爲long的變量時,Java序列化機制會根據編譯的class自動生成一個serialVersionUID作序列化版本比較用,這種情況下,只有同一次編譯生成的 class纔會生成相同的serialVersionUID 。

如果我們不希望通過編譯來強制劃分軟件版本,即實現序列化接口的實體能夠兼容先前版本,未作更改的類,就需要顯式地定義一個名爲serialVersionUID,類型爲long的變量,不修改這個變量值的序列化實體都可以相互進行串行化和反串行化。

設置 serialVersionUID默認的生成方式:
private static final long serialVersionUID = 545456546548431L;
      serialVersionUID的作用:serialVersionUID 用來表明類的不同版本間的兼容性。如果你修改了此類, 要修改此值。否則以前用老版本的類序列化的類恢復時會出錯。
在JDK中,可以利用JDK的bin目錄下的serialver.exe工具產生這個serialVersionUID,對於Test.class,執行命令:serialverTest。

     爲了在反序列化時,確保類版本的兼容性,最好在每個要序列化的類中加入 private static final long serialVersionUID這個屬性,具體數值自己定義。這樣,即使某個類在與之對應的對象已經序列化出去後做了修改,該對象依然可以被正確反序列化。否則,如果不顯式定義該屬性,這個屬性值將由JVM根據類的相關信息計算,而修改後的類的計算結果與修改前的類的計算結果往往不同,從而造成對象的反序列化因爲類版本不兼容而失敗。
不顯式定義這個屬性值的另一個壞處是,不利於程序在不同的JVM之間的移植。因爲不同的編譯器實現該屬性值的計算策略可能不同,從而造成雖然類沒有改變,但是因爲JVM不同,出現因類版本不兼容而無法正確反序列化的現象出現。


轉載:
當兩個進程在進行遠程通信時,彼此可以發送各種類型的數據。無論是何種類型的數據,都會以二進制序列的形式在網絡上傳送。發送方需要把這個Java對象轉換爲字節序列,才能在網絡上傳送;接收方則需要把字節序列再恢復爲Java對象。

把Java對象轉換爲字節序列的過程稱爲對象的序列化。

把字節序列恢復爲Java對象的過程稱爲對象的反序列化。

對象的序列化主要有兩種用途:

1) 把對象的字節序列永久地保存到硬盤上,通常存放在一個文件中;

2) 在網絡上傳送對象的字節序列。

一.            JDK類庫中的序列化API

java.io.ObjectOutputStream代表對象輸出流,它的writeObject(Objectobj)方法可對參數指定的obj對象進行序列化,把得到的字節序列寫到一個目標輸出流中。

java.io.ObjectInputStream代表對象輸入流,它的readObject()方法從一個源輸入流中讀取字節序列,再把它們反序列化爲一個對象,並將其返回。、

只有實現了Serializable和Externalizable接口的類的對象才能被序列化。Externalizable接口繼承自 Serializable接口,實現Externalizable接口的類完全由自身來控制序列化的行爲,而僅實現Serializable接口的類可以 採用默認的序列化方式。

對象序列化包括如下步驟:

1) 創建一個對象輸出流,它可以包裝一個其他類型的目標輸出流,如文件輸出流;

2) 通過對象輸出流的writeObject()方法寫對象。

對象反序列化的步驟如下:

1) 創建一個對象輸入流,它可以包裝一個其他類型的源輸入流,如文件輸入流;

2) 通過對象輸入流的readObject()方法讀取對象。

下面讓我們來看一個對應的例子,類的內容如下:

import java.io.*;

import java.util.Date;


public class ObjectSaver {

  
       public static void main(String[] args)throws Exception {

             ObjectOutputStream out = new ObjectOutputStream

                    (new FileOutputStream("D:""objectFile.obj"));

             //序列化對象

             Customer customer = new Customer("阿蜜果", 24);

             out.writeObject("你好!");

             out.writeObject(new Date());

             out.writeObject(customer);

             out.writeInt(123); //寫入基本類型數據

             out.close();

             //反序列化對象

             ObjectInputStream in = new ObjectInputStream

                    (new FileInputStream("D:""objectFile.obj"));

             System.out.println("obj1=" + (String) in.readObject());

             System.out.println("obj2=" + (Date) in.readObject());

             Customer obj3 = (Customer) in.readObject();

             System.out.println("obj3=" + obj3);

             int obj4 = in.readInt();

             System.out.println("obj4=" + obj4);

             in.close();

       }

}

class Customer implements Serializable {

       private String name;

       private int age;

       public Customer(String name, int age) {

             this.name = name;

             this.age = age;

       }

       public String toString() {

             return "name=" + name + ", age=" + age;

       }

}

       輸出結果如下:

obj1=你好!

obj2=Sat Sep 15 22:02:21 CST 2007

obj3=name=阿蜜果, age=24

obj4=123

    因此例比較簡單,在此不再詳述。

二.實現Serializable接口

ObjectOutputStream只能對Serializable接口的類的對象進行序列化。默認情況下,ObjectOutputStream按照默認方式序列化,這種序列化方式僅僅對對象的非transient的實例變量進行序列化,而不會序列化對象 的transient的實例變量,也不會序列化靜態變量。

當ObjectOutputStream按照默認方式反序列化時,具有如下特點:

1)             如果在內存中對象所屬的類還沒有被加載,那麼會先加載並初始化這個類。如果在classpath中不存在相應的類文件,那麼會拋出ClassNotFoundException;

2)             在反序列化時不會調用類的任何構造方法。

如果用戶希望控制類的序列化方式,可以在可序列化類中提供以下形式的writeObject()和readObject()方法。

private void writeObject(java.io.ObjectOutputStream out) throws IOException

private void readObject(java.io.ObjectInputStream in) throws IOException,ClassNotFoundException;

當ObjectOutputStream對一個Customer對象進行序列化時,如果該對象具有writeObject()方法,那麼就會執行這一方法,否則就按默認方式序列化。在該對象的writeObjectt()方法中,可以先調用ObjectOutputStream的defaultWriteObject()方法,使得對象輸出流先執行默認的序列化操作。同理可得出反序列化的情況,不過這次是 defaultReadObject()方法。

有些對象中包含一些敏感信息,這些信息不宜對外公開。如果按照默認方式對它們序列化,那麼它們的序列化數據在網絡上傳輸時,可能會被不法份子竊取。對於這類信息,可以對它們進行加密後再序列化,在反序列化時則需要解密,再恢復爲原來的信息。

默認的序列化方式會序列化整個對象圖,這需要遞歸遍歷對象圖。如果對象圖很複雜,遞歸遍歷操作需要消耗很多的空間和時間,它的內部數據結構爲雙向列表。

在應用時,如果對某些成員變量都改爲transient類型,將節省空間和時間,提高序列化的性能。

三.            實現Externalizable接口

Externalizable接口繼承自Serializable接口,如果一個類實現了Externalizable接口,那麼將完全由這個類控制自身的序列化行爲。Externalizable接口聲明瞭兩個方法:

public void writeExternal(ObjectOutput out) throws IOException

public void readExternal(ObjectInput in) throws IOException ,ClassNotFoundException

前者負責序列化操作,後者負責反序列化操作。

在對實現了Externalizable接口的類的對象進行反序列化時,會先調用類的不帶參數的構造方法,這是有別於默認反序列方式的。如果把類的不帶參數的構造方法刪除,或者把該構造方法的訪問權限設置爲private、默認或protected級別,會拋出java.io.InvalidException: no valid constructor異常。

四.            可序列化類的不同版本的序列化兼容性

凡是實現Serializable接口的類都有一個表示序列化版本標識符的靜態變量:

private static final long serialVersionUID;

以上serialVersionUID的取值是Java運行時環境根據類的內部細節自動生成的。如果對類的源代碼作了修改,再重新編譯,新生成的類文件的serialVersionUID的取值有可能也會發生變化。

類的serialVersionUID的默認值完全依賴於Java編譯器的實現,對於同一個類,用不同的Java編譯器編譯,有可能會導致不同的 serialVersionUID,也有可能相同。爲了提高哦啊serialVersionUID的獨立性和確定性,強烈建議在一個可序列化類中顯示的定義serialVersionUID,爲它賦予明確的值。顯式地定義serialVersionUID有兩種用途:

1)             在某些場合,希望類的不同版本對序列化兼容,因此需要確保類的不同版本具有相同的serialVersionUID;

2)             在某些場合,不希望類的不同版本對序列化兼容,因此需要確保類的不同版本具有不同的serialVersionUID。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章