【Java拾遺】不可不知的 Java 序列化

前言

在程序運行的生命週期中，序列化與反序列化的操作，幾乎無時無刻不在發生着。對於任何一門語言來說，不管它是編譯型還是解釋型，只要它需要通訊或者持久化時，就必然涉及到序列化與反序列化操作。但是，又正因爲序列化與反序列化太過重要，太過普遍，大部分編程語言和框架都對其進行了很好的封裝，又因爲他的潤物細無聲，使得我們很多時候根本沒有意識到，代碼下面其實進行了許許多多序列化相關的操作。今天我們就一起去探尋這位最熟悉的陌生人。

序列化是什麼

百度百科中給序列化的定義是『序列化 (Serialization)是將對象的狀態信息轉換爲可以存儲或傳輸的形式的過程。』。似乎有點抽象，下面用一個例子簡單類比一下。

日常生活中，總少不了人跟人之間的交流與溝通。而溝通的前提是先要把我們大腦中想的內容，通過某種形式表達出來。然後別人再通過我們表達出的內容去理解。

而表達的方式多種多樣，最常見的就是說話，我們通過說一些話，把我們腦海裏想的內容表達出來，對方聽了這些話立刻明白了我們的想法。當然表達也可以是文字，比如你正在看的本文，不也是在與你交流嗎？導演通過電影去表達自己對於世界的理解，畫家通過畫作述說的對美的渴望，音樂家通過樂符描述着對自由的嚮往。凡此種種，不勝枚舉。

所以，這些又跟我們的主題 序列化 有什麼關係呢？

其實人與人之間少不了溝通交流，程序與程序之間，機器與機器之間也少不了溝通交流。只不過通常不會說是溝通，我們會說請求、響應、傳輸、通訊…… 同樣的內容只是換了一種說法。

上文中提到，人與人之間的溝通需要一種表達方式。通過這種表達方式把我們大腦中所想的內容，轉化成他人可以理解的內容。而機器與機器之間的通訊也需要這樣一種表達方式，通過這種表達方式把內存中的內容，轉化成其它機器可以讀取的內容。

所以序列化可以簡單的理解成是 機器內存中信息的表達方式 。

爲什麼需要序列化

通常情況下，我們的語言一方面用於交流，比如聊天，把我腦海中的思想，通過語言表達出來，對方聽到我們的話語，會意我們的想法。

另一方面，我們的語言除了用於溝通交流，還可以用於記錄。有一句話叫做『好記性不如爛筆頭』。說的就是記錄的重要性，因爲話在我們的腦子裏，很容易就忘了，通過記錄下來可以保存更久。

而序列化功能又正好對應這兩點，一個是用來傳輸信息，另一個是用來持久化。序列化用來傳輸的作用，前文已經說過了，關於持久化的作用，也很好理解。首先明確一個問題，序列化的是什麼內容？通常是內存中的內容。而內存有一個特點我們都知道，那就是一重啓就沒了。對於部分內容，我們想在重啓後還存在（比如說 tomcat 中 session 裏面的對象），要怎麼辦呢？答案就是把內存中的對象保存到磁盤上，這樣就不怕重啓了，而持久化就需要用到序列化技術。

如何實現序列化

人與人之間有許許多多的表達方式，而且機器與機器之間也同樣，序列化的方式多種多樣。

Java 原生形式

對於如此普遍的序列化需求，Java 其實早在 JDK 1.1 開始就在語言層面進行了支持。而且使用起來非常方便，下面我們就一起看看具體代碼。

首先我們要把想序列化的類實現 Java 自帶的 java.io.Serializable 接口

/*
 *
 *  * *
 *  *  * blog.coder4j.cn
 *  *  * Copyright (C) 2016-2020 All Rights Reserved.
 *  *
 *
 */
package cn.coder4j.study.example.serialization;

import java.io.Serializable;
import java.util.StringJoiner;

/**
 * @author buhao
 * @version HaveSerialization.java, v 0.1 2020-09-17 16:58 buhao
 */
public class HaveSerialization implements Serializable {
    private static final long serialVersionUID = -4504407589319471384L;
    private String name;
    private Integer age;

    /**
     * Getter method for property <tt>name</tt>.
     *
     * @return property value of name
     */
    public String getName() {
        return name;
    }

    /**
     * Setter method for property <tt>name</tt>.
     *
     * @param name value to be assigned to property name
     */
    public void setName(String name) {
        this.name = name;
    }

    /**
     * Getter method for property <tt>age</tt>.
     *
     * @return property value of age
     */
    public Integer getAge() {
        return age;
    }

    /**
     * Setter method for property <tt>age</tt>.
     *
     * @param age value to be assigned to property age
     */
    public void setAge(Integer age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return new StringJoiner(", ", HaveSerialization.class.getSimpleName() + "[", "]")
                .add("name='" + name + "'")
                .add("age=" + age)
                .toString();
    }
}

需要注意的是，雖說是實現了 java.io.Serializable 接口，但是我們其實沒有覆蓋任何方法。這是爲什麼呢？我們一起看一下 java.io.Serializable 的源碼。

public interface Serializable {
}

沒錯，是個空接口，除了接口定義部分，啥也沒有。通常遇到這種情況，我們稱之爲標記接口，主要爲了標記某些類，標記的原因是，把它與其它類區別出來，方便我們後面專門處理。而 Serializable 這個標記接口，就是爲了讓我們知道這個類是要進行序列化操作的類，僅此而已。

另外，雖然我們只實現一個空接口，但是細心的你，肯定發現了我們的類中多了一個 serialVersionUID 屬性。那麼這個屬性的作用是什麼呢？

它主要目的就是爲了驗證序列化與反序列化的類是否一致。比如上面 HaveSerialization 這個類現在有業務屬性 name 與 age ，現在因爲業務需要，我們要添加一個 address 的屬性。序列化操作是沒有問題的，但是把序列化信息傳輸給其它機器，其它機器在反序列化的時候，就出現了問題。因爲其它機器的 HaveSerialization 沒有 address 這個屬性。

爲了解決這個問題，JDK 通過使用 serialVersionUID 在作爲該類的版本號，在反序列化時比較傳輸的類的值與要反序列化類的值是否一致，不一致就會報 InvalidCastException 。

當然，出發點是好的，但是直接拋異常會導致業務無法進行下去，通常 serialVersionUID 生成好後，我們不會再更新，序列化如果沒有更新，對應變更的屬性會爲空，我們只要在業務裏做好兼容就好了。

序列化對象

好了，我們已經完成了第一步，定義了一個序列化類，下面我們就把他給序列化掉。

    /**
     * 序列化對象（保存序列化文件）
     * @throws IOException
     */
    @Test
    public void testSaveSerializationObject() throws IOException {
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);
        // 創建序列化對象保存的文件
        final File file = new File("haveSerialization.ser");
        // 創建對象輸出流
        try (final ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(file))) {
            // 將對象輸出到序列化文件
            objectOutputStream.writeObject(haveSerialization);
        }
    }

可以看到代碼十分簡單，大體分成如下 4 步：

創建要序列化的對象
其實就是你上面的實現 java.io.Serializable 的類，如果沒有實現，在這裏會報 NotSerializableException 異常
創建一個 File 對象，用來保存序列化後的二進制數據。
注意這裏文件名我用的是 *.ser ，這個 ser 後綴並沒有強制要求，只是方便理解，你可能寫成其它後綴
創建對象輸出流
創建一個 ObjectOutputStream 對象輸出流的對象，並把上面定義的序列化文件對象通過構造函數傳給它。
通過輸出流把對象寫到序列化文件裏
注意這裏我用的 JDK 8 的 try with resource 語法，所以不用手動 close

好了，到這裏我們序列化也完成了。

反序列化對象

既然有序列化，那肯定也有反序列化。反序列化可以理解成是序列化的逆向操作，既然序列化把內存中的對象轉成一個可以持久化的文件，那麼反序列化要做的就是把這個文件再加載到內存中的對象。話不多說，直接看代碼。

    /**
     * 反序列化對象（從序列化文件中讀取對象）
     * @throws IOException
     * @throws ClassNotFoundException
     */
    @Test
    public void testLoadSerializationObject() throws IOException, ClassNotFoundException {
        // 創建對象輸出流
        try (ObjectInputStream objectInputStream = new ObjectInputStream(
                new FileInputStream(new File("haveSerialization.ser")))) {
            // 從輸出流中創建對象
            final Object obj = objectInputStream.readObject();
            System.out.println(obj);
        }
    }

是的，反序列化代碼比序列化代碼還少，主要分成如下 2 步：

創建對象輸入流
創建一個 ObjectInputStream 對象，並把序列化文件通過構造函數傳給它
從對象輸入流中讀取對象
直接通過 readObject 方法即可，注意讀取後是 Object 類型，後續使用需手動強轉一次

到這裏，我們便通過 JDK 原生的方法完成了序列化與反序列化操作，是不是還很簡單。但是日常工作不太推薦直接使用原生的方式實現序列化，一方面它生成的序列化文件較大，一方面也比一些第三方框架生成的慢，但是序列化原理大致類似。下面我們簡單看一下其它方式如何序列化。

通用對象序列化

通常序列化是與語言綁定的，比如說通過上面 JDK 序列化的文件，不可能拿給 PHP 應用反序列化成 PHP 的對象。不過可以通過某些特殊的通用對象結構序列化來實現跨語言使用，比較常見的是 JSON 、XML 。下面我們以 JSON 爲例看一下

    /**
     * 測試序列化通過json
     */
    @Test
    public void testSerializationByJSON(){
        //-------------序列化操作---------------
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);

        // 序列化成 JSON 字符串
        final String jsonString = JSON.toJSONString(haveSerialization);
        System.out.println("JSON:" + jsonString);

        //-------------反序列化操作---------------
        final HaveSerialization haveSerializationByJSON = JSON.parseObject(jsonString, HaveSerialization.class);
        System.out.println(haveSerializationByJSON);
    }

運行結果：

JSON:{"age":18,"name":"kiwi"}
HaveSerialization[name='kiwi', age=18]

上述代碼使用的 JSON 框架是 alibaba/fastjson 。但是大部分 JSON 框架使用起來都大同小異。可以按個人喜好去替換。

序列化框架

序列化框架其實有很多，比如 kryo 、 hessian 、 protostuff 。它們各有優缺點，詳細的比較可以看這篇文章序列化框架 kryo VS hessian VS Protostuff VS java 。大家可以按各自的使用場景選擇使用，下文以 kryo 爲例演示。

依賴

<dependency>
    <groupId>com.esotericsoftware</groupId>
    <artifactId>kryo</artifactId>
    <version>5.0.0-RC9</version>
</dependency>

具體代碼

    /**
     * 測試序列化通過kryo
     */
    @Test
    public void testSerializationByKryo() throws FileNotFoundException {
        //-------------序列化操作---------------
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);

        final Kryo kryo = new Kryo();
        // 註冊序列化類
        kryo.register(HaveSerialization.class);

        // 序列化操作
        try (final Output output = new Output(new FileOutputStream("haveSerialization.kryo"))) {
            kryo.writeObject(output, haveSerialization);
        }

        // 反序列化
        try (final Input input = new Input(new FileInputStream("haveSerialization.kryo"))) {
            final HaveSerialization haveSerializationByKryo = kryo.readObject(input, HaveSerialization.class);
            System.out.println(haveSerializationByKryo);
        }
    }

其實看代碼可以發現跟 JDK 的流程幾乎一樣，其中有幾點需要注意的，kryo 在序列化前，要手動通過 register 註冊序列化的類，有點類似 JDK 實現 java.io.Serializable 接口。然後 Input 、 Output 對象不是 JDK 的。是 kryo 提供的。另外 Kryo 有不少需要注意的地方，可以查看參考鏈接部分的內容學習。

源碼地址

因文章篇幅有限，無法展示所有代碼，已經另外把完整代碼上傳到 github，具體鏈接如下：

https://github.com/kiwiflydream/study-example/tree/master/study-serialization-example

參考鏈接

總結

本文主要介紹了 Java 序列化的相關內容，主要介紹序列化是什麼？與人與人之間溝通的表達方式做類比，得到是 機器內存中信息的表達方式 。而爲什麼需要序列化，我們通過舉例說明了序列化 信息傳輸與持久化 的功能。最後我們一起從 JDK 原生的實現 java.io.Serializable 的方式，再到通用對象序列化的 JSON、XML 方式，最終到第三方框架 kryo 的形式瞭解如何去實現序列化。

【Java拾遺】不可不知的 Java 序列化

【Java拾遺】不可不知的 Java 序列化

前言

序列化是什麼

爲什麼需要序列化

如何實現序列化

Java 原生形式

通用對象序列化

序列化框架

源碼地址

參考鏈接

總結

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

【BREW】brew mysql 無法連接問題

【Java拾遺】不可不知的 Java 序列化

【譯】10 個有用的 git log 技巧

【測試】 Java如何優雅的生成測試數據

【隨筆】愛因斯坦與科舉制

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結