淺談Java的序列化機制

概念

一個對象如果想在硬盤上存儲，一定就需要藉助於一定的數據格式。這種把對象轉換爲硬盤存儲的格式的過程就叫做對象的序列化，同樣地，將這些文件再反向轉換爲程序中對象的操作就叫做反序列化

一些複雜的解決方案可能是將對象轉換爲json字符串的方式，這種方式的優點是易讀，但是效率還是太低，所以Java的序列化的解決方案是將對象轉換爲一個二進制流的形式，來實現數據的持久化，本篇文章將會來詳細講解序列化的實現和原理

實現

準備

我們這裏有一個普通的對象，要注意的是這個類和其中用到的所有對象都需要實現序列化接口Serializable：

class Demo implements Serializable {

    int val = 10;

    String time = new SimpleDateFormat("HH:mm:ss").format(new Date());

    A a = new A(20);

    @Override
    public String toString() {
        return "[hashcode=" + hashCode() + " val=" + val + ", time=" + time 
                + ", A.val=" + a.val +"]";
    }
}

這個A是一個普通的對象，如下：

class A implements Serializable {
    int val = 20;
    
    public A(int val) {
        this.val = val;
    }
}

現在我們有一個Demo對象，來輸出一下這個對象的標誌字符串：

        Demo demo = new Demo();
        System.out.println(demo.toString());

輸出結果：

[hashcode=1625635731 val=10, time=20:28:56, A.val=20]

序列化

現在，我們需要將這個對象序列化爲二進制流，則需要以下的操作：

        FileOutputStream fileOutputStream = new FileOutputStream("target");
        ObjectOutputStream objectOutputStream = new ObjectOutputStream(fileOutputStream);

        objectOutputStream.writeObject(demo);
        objectOutputStream.flush();
        objectOutputStream.close();

這樣，demo對象就被我們持久化到硬盤的target文件中了

反序列化

反之，如果我們想將這個對象從target文件中取出，就需要如下的操作：

        FileInputStream fileInputStream = new FileInputStream("target");
        ObjectInputStream objectInputStream = new ObjectInputStream(fileInputStream);

        Demo newDemo = (Demo)objectInputStream.readObject();

檢驗

現在，我們用以下的語句來檢驗這兩個對象是否是一個對象：

        System.out.println(newDemo.toString());
        System.out.println("demo == newDemo : " + (demo == newDemo));

輸出

[hashcode=885284298 val=10, time=20:28:56, A.val=20]
demo == newDemo : false

我們會發現，反序列化得到的對象雖然值和原有對象一致，但是其不是同一個對象，這一點很重要

原理

我們打開序列化生成的target文件，這裏需要用二進制流的方式打開：

這裏可以將文件分爲5個部分：

文件頭：聲明文件是一個對象序列化文件，同時聲明瞭序列化版本
類描述：聲明類信息，包括類名、序列化id，以及域的個數等屬性
屬性描述
父類信息描述
對象屬性的實際值

也就是說，在這個二進制文件中，通過這幾部分就能表明一個類的全部信息，在反序列化的過程中，Java將會按照指定的文件格式來從文件中恢復數據

注意事項

序列化的類一定要實現Serializable接口
序列化類中包含的自定義對象都需要實現Serializable接口

這兩點是爲什麼呢，我們來看ObjectOutputStream中的writeObject0方法，這裏截取了一小段：

            if (obj instanceof String) {
                writeString((String) obj, unshared);
            } else if (cl.isArray()) {
                writeArray(obj, desc, unshared);
            } else if (obj instanceof Enum) {
                writeEnum((Enum<?>) obj, desc, unshared);
            } else if (obj instanceof Serializable) {
                writeOrdinaryObject(obj, desc, unshared);
            } else {
                if (extendedDebugInfo) {
                    throw new NotSerializableException(
                        cl.getName() + "\n" + debugInfoStack.toString());
                } else {
                    throw new NotSerializableException(cl.getName());
                }
            }

這段代碼中的obj不僅僅是被序列化的對象，還會是這個對象中的所有字段，也就是說其中的域對象，必須是字符串、數組、枚舉和序列化接口中的一種，否則就會拋出異常

序列化ID

其實，還有一點注意事項，我留在了這裏來講：

在序列化和反序列化之間，對象的字段名稱、類型和數量均不能改變

這是爲什麼呢，我們來看反序列化中的一塊代碼：

            if (model.serializable == osc.serializable &&
                    !cl.isArray() &&
                    suid != osc.getSerialVersionUID()) {
                throw new InvalidClassException(osc.name,
                        "local class incompatible: " +
                                "stream classdesc serialVersionUID = " + suid +
                                ", local class serialVersionUID = " +
                                osc.getSerialVersionUID());
            }

這是ObjectStreamClass中的initNonProxy方法中的一段，這個方法也就是讀取我們序列化文件的核心方法，用於初始化類描述符

不過我們重點不在這裏，重點是一個suid和osc.getSerialVersionUID()的比較，這時候就要涉及到一個序列化id的概念了，序列化id的聲明類似下面這種形式：

class Demo implements Serializable {

	// 這個序列化id一般的ide都會提供有自動生成的插件，感興趣的可以自行下載
	private static final long serialVersionUID = -5809782578272943999L;
	// ...
}

Java的反序列化成功與否的關鍵，就是比較文件的序列化id和類的序列化id是否一致，如果一致，則認爲文件中的對象和類對象是同一個對象，否則，就說明兩個類壓根就不是一個類，如果強行轉換則很有可能發生異常

但是我們之前沒有手動設置序列化id也一樣能反序列化成功不是嗎？其實，之前能反序列化成功僅僅是因爲我們沒有改動原來的類，如果我們沒有設置序列化id，則以下任何的操作，均會導致反序列化失敗：

修改了字段/方法的名稱/類型
添加或刪除字段/方法

看到了嗎，即使我們僅僅修改了字段的名稱，也會導致反序列化的失敗，如果不注意這一點，將會導致所有反序列化操作的崩潰，但是隻要我們設置一個序列化id，即使我們把類中元素刪的一乾二淨，也一樣會反序列化成功，只不過是丟失屬性而已

淺談Java的序列化機制

概念

實現

準備

序列化

反序列化

檢驗

原理

注意事項

序列化ID

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

簡要了解JVM的內存劃分

Leetcode題解：287. Find the Duplicate Number尋找重複數

詳解ThreadPoolExecutor線程池的原理

Dijkstra最短路徑算法分析

淺談AQS（抽象隊列同步器）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結