【Java拾遺】不可不知的 Java 序列化

【Java拾遺】不可不知的 Java 序列化


前言


在程序運行的生命週期中,序列化與反序列化的操作,幾乎無時無刻不在發生着。對於任何一門語言來說,不管它是編譯型還是解釋型,只要它需要通訊或者持久化時,就必然涉及到序列化與反序列化操作。但是,又正因爲序列化與反序列化太過重要,太過普遍,大部分編程語言和框架都對其進行了很好的封裝,又因爲他的潤物細無聲,使得我們很多時候根本沒有意識到,代碼下面其實進行了許許多多序列化相關的操作。今天我們就一起去探尋這位最熟悉的陌生人。

序列化是什麼


百度百科中給序列化的定義是『序列化 (Serialization)是將對象的狀態信息轉換爲可以存儲或傳輸的形式的過程。』。似乎有點抽象,下面用一個例子簡單類比一下。


日常生活中,總少不了人跟人之間的交流與溝通。而溝通的前提是先要把我們大腦中想的內容,通過某種形式表達出來。然後別人再通過我們表達出的內容去理解。





而表達的方式多種多樣,最常見的就是說話,我們通過說一些話,把我們腦海裏想的內容表達出來,對方聽了這些話立刻明白了我們的想法。當然表達也可以是文字,比如你正在看的本文,不也是在與你交流嗎?導演通過電影去表達自己對於世界的理解,畫家通過畫作述說的對美的渴望,音樂家通過樂符描述着對自由的嚮往。凡此種種,不勝枚舉。


所以,這些又跟我們的主題 序列化 有什麼關係呢?


其實人與人之間少不了溝通交流,程序與程序之間,機器與機器之間也少不了溝通交流。只不過通常不會說是溝通,我們會說請求、響應、傳輸、通訊…… 同樣的內容只是換了一種說法。


上文中提到,人與人之間的溝通需要一種表達方式。通過這種表達方式把我們大腦中所想的內容,轉化成他人可以理解的內容。而機器與機器之間的通訊也需要這樣一種表達方式,通過這種表達方式把內存中的內容,轉化成其它機器可以讀取的內容。





所以序列化可以簡單的理解成是 機器內存中信息的表達方式

爲什麼需要序列化


通常情況下,我們的語言一方面用於交流,比如聊天,把我腦海中的思想,通過語言表達出來,對方聽到我們的話語,會意我們的想法。


另一方面,我們的語言除了用於溝通交流,還可以用於記錄。有一句話叫做『好記性不如爛筆頭』。說的就是記錄的重要性,因爲話在我們的腦子裏,很容易就忘了,通過記錄下來可以保存更久。


而序列化功能又正好對應這兩點,一個是用來傳輸信息,另一個是用來持久化。序列化用來傳輸的作用,前文已經說過了,關於持久化的作用,也很好理解。首先明確一個問題,序列化的是什麼內容?通常是內存中的內容。而內存有一個特點我們都知道,那就是一重啓就沒了。對於部分內容,我們想在重啓後還存在(比如說 tomcat 中 session 裏面的對象),要怎麼辦呢?答案就是把內存中的對象保存到磁盤上,這樣就不怕重啓了,而持久化就需要用到序列化技術。

如何實現序列化


人與人之間有許許多多的表達方式,而且機器與機器之間也同樣,序列化的方式多種多樣。

Java 原生形式


對於如此普遍的序列化需求,Java 其實早在 JDK 1.1 開始就在語言層面進行了支持。而且使用起來非常方便,下面我們就一起看看具體代碼。

  1. 首先我們要把想序列化的類實現 Java 自帶的 java.io.Serializable 接口
/*
 *
 *  * *
 *  *  * blog.coder4j.cn
 *  *  * Copyright (C) 2016-2020 All Rights Reserved.
 *  *
 *
 */
package cn.coder4j.study.example.serialization;

import java.io.Serializable;
import java.util.StringJoiner;

/**
 * @author buhao
 * @version HaveSerialization.java, v 0.1 2020-09-17 16:58 buhao
 */
public class HaveSerialization implements Serializable {
    private static final long serialVersionUID = -4504407589319471384L;
    private String name;
    private Integer age;

    /**
     * Getter method for property <tt>name</tt>.
     *
     * @return property value of name
     */
    public String getName() {
        return name;
    }

    /**
     * Setter method for property <tt>name</tt>.
     *
     * @param name value to be assigned to property name
     */
    public void setName(String name) {
        this.name = name;
    }

    /**
     * Getter method for property <tt>age</tt>.
     *
     * @return property value of age
     */
    public Integer getAge() {
        return age;
    }

    /**
     * Setter method for property <tt>age</tt>.
     *
     * @param age value to be assigned to property age
     */
    public void setAge(Integer age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return new StringJoiner(", ", HaveSerialization.class.getSimpleName() + "[", "]")
                .add("name='" + name + "'")
                .add("age=" + age)
                .toString();
    }
}


需要注意的是,雖說是實現了 java.io.Serializable 接口,但是我們其實沒有覆蓋任何方法。這是爲什麼呢?我們一起看一下 java.io.Serializable 的源碼。

public interface Serializable {
}


沒錯,是個空接口,除了接口定義部分,啥也沒有。通常遇到這種情況,我們稱之爲標記接口,主要爲了標記某些類,標記的原因是,把它與其它類區別出來,方便我們後面專門處理。而  Serializable 這個標記接口,就是爲了讓我們知道這個類是要進行序列化操作的類,僅此而已。


另外,雖然我們只實現一個空接口,但是細心的你,肯定發現了我們的類中多了一個 serialVersionUID 屬性。那麼這個屬性的作用是什麼呢?


它主要目的就是爲了驗證序列化與反序列化的類是否一致。比如上面 HaveSerialization 這個類現在有業務屬性 nameage ,現在因爲業務需要,我們要添加一個 address 的屬性。序列化操作是沒有問題的,但是把序列化信息傳輸給其它機器,其它機器在反序列化的時候,就出現了問題。因爲其它機器的 HaveSerialization 沒有 address 這個屬性。


爲了解決這個問題,JDK 通過使用 serialVersionUID 在作爲該類的版本號,在反序列化時比較傳輸的類的值與要反序列化類的值是否一致,不一致就會報 InvalidCastException


當然,出發點是好的,但是直接拋異常會導致業務無法進行下去,通常 serialVersionUID 生成好後,我們不會再更新,序列化如果沒有更新,對應變更的屬性會爲空,我們只要在業務裏做好兼容就好了。


  1. 序列化對象


好了,我們已經完成了第一步,定義了一個序列化類,下面我們就把他給序列化掉。

    /**
     * 序列化對象(保存序列化文件)
     * @throws IOException
     */
    @Test
    public void testSaveSerializationObject() throws IOException {
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);
        // 創建序列化對象保存的文件
        final File file = new File("haveSerialization.ser");
        // 創建對象輸出流
        try (final ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(file))) {
            // 將對象輸出到序列化文件
            objectOutputStream.writeObject(haveSerialization);
        }
    }


可以看到代碼十分簡單,大體分成如下 4 步:

  1. 創建要序列化的對象
    其實就是你上面的實現 java.io.Serializable 的類,如果沒有實現,在這裏會報 NotSerializableException 異常
  2. 創建一個 File 對象,用來保存序列化後的二進制數據。
    注意這裏文件名我用的是 *.ser ,這個 ser 後綴並沒有強制要求,只是方便理解,你可能寫成其它後綴
  3. 創建對象輸出流
    創建一個 ObjectOutputStream 對象輸出流的對象,並把上面定義的序列化文件對象通過構造函數傳給它。
  4. 通過輸出流把對象寫到序列化文件裏
    注意這裏我用的 JDK 8try with resource 語法,所以不用手動 close


好了,到這裏我們序列化也完成了。

  1. 反序列化對象


既然有序列化,那肯定也有反序列化。反序列化可以理解成是序列化的逆向操作,既然序列化把內存中的對象轉成一個可以持久化的文件,那麼反序列化要做的就是把這個文件再加載到內存中的對象。話不多說,直接看代碼。

    /**
     * 反序列化對象(從序列化文件中讀取對象)
     * @throws IOException
     * @throws ClassNotFoundException
     */
    @Test
    public void testLoadSerializationObject() throws IOException, ClassNotFoundException {
        // 創建對象輸出流
        try (ObjectInputStream objectInputStream = new ObjectInputStream(
                new FileInputStream(new File("haveSerialization.ser")))) {
            // 從輸出流中創建對象
            final Object obj = objectInputStream.readObject();
            System.out.println(obj);
        }
    }


是的,反序列化代碼比序列化代碼還少,主要分成如下 2 步:

  1. 創建對象輸入流
    創建一個 ObjectInputStream 對象,並把序列化文件通過構造函數傳給它
  2. 從對象輸入流中讀取對象
    直接通過 readObject 方法即可,注意讀取後是 Object 類型,後續使用需手動強轉一次


到這裏,我們便通過 JDK 原生的方法完成了序列化與反序列化操作,是不是還很簡單。但是日常工作不太推薦直接使用原生的方式實現序列化,一方面它生成的序列化文件較大,一方面也比一些第三方框架生成的慢,但是序列化原理大致類似。下面我們簡單看一下其它方式如何序列化。

通用對象序列化


通常序列化是與語言綁定的,比如說通過上面 JDK 序列化的文件,不可能拿給 PHP 應用反序列化成 PHP 的對象。不過可以通過某些特殊的通用對象結構序列化來實現跨語言使用,比較常見的是 JSONXML 。下面我們以 JSON 爲例看一下

    /**
     * 測試序列化通過json
     */
    @Test
    public void testSerializationByJSON(){
        //-------------序列化操作---------------
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);

        // 序列化成 JSON 字符串
        final String jsonString = JSON.toJSONString(haveSerialization);
        System.out.println("JSON:" + jsonString);

        //-------------反序列化操作---------------
        final HaveSerialization haveSerializationByJSON = JSON.parseObject(jsonString, HaveSerialization.class);
        System.out.println(haveSerializationByJSON);
    }


運行結果:

JSON:{"age":18,"name":"kiwi"}
HaveSerialization[name='kiwi', age=18]


上述代碼使用的 JSON 框架是 alibaba/fastjson 。但是大部分 JSON 框架使用起來都大同小異。可以按個人喜好去替換。

序列化框架


序列化框架其實有很多,比如 kryohessianprotostuff 。它們各有優缺點,詳細的比較可以看這篇文章 序列化框架 kryo VS hessian VS Protostuff VS java 。大家可以按各自的使用場景選擇使用,下文以 kryo 爲例演示。

  1. 依賴
<dependency>
    <groupId>com.esotericsoftware</groupId>
    <artifactId>kryo</artifactId>
    <version>5.0.0-RC9</version>
</dependency>
  1. 具體代碼
    /**
     * 測試序列化通過kryo
     */
    @Test
    public void testSerializationByKryo() throws FileNotFoundException {
        //-------------序列化操作---------------
        // 創建對象
        final HaveSerialization haveSerialization = new HaveSerialization();
        haveSerialization.setName("kiwi");
        haveSerialization.setAge(18);

        final Kryo kryo = new Kryo();
        // 註冊序列化類
        kryo.register(HaveSerialization.class);

        // 序列化操作
        try (final Output output = new Output(new FileOutputStream("haveSerialization.kryo"))) {
            kryo.writeObject(output, haveSerialization);
        }

        // 反序列化
        try (final Input input = new Input(new FileInputStream("haveSerialization.kryo"))) {
            final HaveSerialization haveSerializationByKryo = kryo.readObject(input, HaveSerialization.class);
            System.out.println(haveSerializationByKryo);
        }
    }


其實看代碼可以發現跟 JDK 的流程幾乎一樣,其中有幾點需要注意的,kryo 在序列化前,要手動通過 register 註冊序列化的類,有點類似 JDK 實現 java.io.Serializable 接口。然後 InputOutput 對象不是 JDK 的。是 kryo 提供的。另外 Kryo 有不少需要注意的地方,可以查看參考鏈接部分的內容學習。

源碼地址


因文章篇幅有限,無法展示所有代碼,已經另外把完整代碼上傳到 github,具體鏈接如下:


https://github.com/kiwiflydream/study-example/tree/master/study-serialization-example

參考鏈接

  1. 序列化框架 kryo VS hessian VS Protostuff VS java - 知其然,知其所以然 - ITeye博客
  2. Kryo 使用指南 - hntyzgn - 博客園
  3. 深入理解 RPC 之序列化篇 --Kryo | 徐靖峯|個人博客
  4. EsotericSoftware/kryo: Java binary serialization and cloning: fast, efficient, automatic

總結


本文主要介紹了 Java 序列化的相關內容,主要介紹序列化是什麼?與人與人之間溝通的表達方式做類比,得到是 機器內存中信息的表達方式 。而爲什麼需要序列化,我們通過舉例說明了序列化 信息傳輸與持久化 的功能。最後我們一起從 JDK 原生的實現 java.io.Serializable 的方式,再到通用對象序列化的 JSON、XML 方式,最終到第三方框架 kryo 的形式瞭解如何去實現序列化。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章