java文件中爲什麼會有serialVersionUID

一些java類中爲什麼需要重載 serialVersionUID 屬性。


在Java中,軟件的兼容性是一個大問題,尤其在使用到對象串行性的時候,那麼在某一個對象已經被串行化了,可是這個對象又被修改後重新部署了,那麼在這種情況下, 用老軟件來讀取新文件格式雖然不是什麼難事,但是有可能丟失一些信息。

serialVersionUID 來解決這些問題,新增的serialVersionUID必須定義成下面這種形式:static final long serialVersionUID=-2805284943658356093L;。其中數字後面加上的L表示這是一個long值。 通過這種方式來解決不同的版本之間的串行話問題。

提綱:

━━━━━━━━

一、概述

二、Java串行化

三、引入版本編號

四、結束語

━━━━━━━━

一、概述

一 個程序正式發行出去之後,如果要增加一些新的功能,往往意味着同時要修改用戶保存數據的方式,也就是必須更改程序保存文件的格式——通常是增加保存到文件 的數據。有些時候,文件格式必須作徹底的改動,以配合實現程序的新功能。從這個意義上看,文件格式的發展/變化總是和程序的功能改進相呼應。

但是,大多數情況下,把原有的數據格式一丟了事是行不通的。動物王國中,不能適應環境意味着死亡;軟件領域也相似,新軟件是否支持原有的數據格式很大程度上決定了用戶是否升級。

不管軟件新增/改進了多少功能,不管新的文件格式是多麼完美,如果新軟件不能利用原來的文件格式,用戶一般不太會認可新軟件。解決該問題的辦法包括:

● 保留老代碼來讀取老文件。採用這種方案一般需要額外編寫一些代碼,把老文件轉換成新的格式(一般地,最簡單的辦法是先把老文件的數據轉換成新的內部對象, 然後利用現有的寫入新版文件格式的對象)。這種辦法的好處是既保留了原有的代碼,又使它與新的文件格式兼容。但是,這種辦法有時可能導致丟失部分數據,不 過總要比丟失全部數據好。

●使新版軟件能夠讀/寫老文件格式。這種辦法工作量較大,因爲程序的新版本一般會增加一些原來沒有的功能,老的數據格式中通常缺乏新功能必需的某些數據。

當 新版軟件對原來執行任務的方式作了根本性的變動時,丟失數據決非難得一見的偶然事件。如果新版軟件採用和原來不同的方式達到同樣的效果,原來的功能可能不 再有保留的必要。例如,如果一個程序原來用Swing做用戶界面,現在把它改成了Web(瀏覽器)用戶界面,原來的許多用戶界面設置就不再有效。

又如,如果有一個郵件程序,原來用的是以文件夾爲基礎的索引,現在把它改成了以單詞爲基礎的索引系統,在升級索引文件格式的過程中就有可能丟失許多信息;如果原來的索引文件保存了許多用戶配置選項和優化措施,在新的索引系統中這些數據可能無法利用。

這 類問題沒有絕對完美的解決辦法,但是我們可以採取一些措施,使得升級文件格式帶來的負面影響儘可能小。Java串行化(Serialization)有着 簡單易用的特點,日益成爲一種保存文件的重要手段,有鑑於此,下面我們就來看看在軟件版本變更過程中,通過Java串行化保存的文件如何保持兼容性。

二、Java串行化

Java串行化有許多優點:

●容易使用。

●如果一個對象連接到其他對象,串行化機制會保存所有相關的對象。

●如果某個對象出現多次,串行化機制只保存一次。這一點極爲重要,它不僅減小了文件空間,而且即使代碼寫得不是很老練,也不必擔心會出現無限循環(一個不老練的例子是,用遞歸的方式保存各個對象,卻又未能有效審計哪些對象已經保存,這時就有可能陷入永無終止的循環)。

遺憾的是,Java串行化機制定義的文件格式似乎很脆弱,只要稍微改動一下類的定義,原來保存的對象就可能無法讀取。例如,下面是一個簡單的類定義:

public class Save implements Serializable
{
String name;

public void save() throws IOException
{
FileOutputStream f = new FileOutputStream("foo");
ObjectOutputStream oos = new ObjectOutputStream(f);
oos.writeObject(this);
oos.close();
}
}



如果在這個類定義中增加一個域,例如final int val = 7;,再來讀取原來保存的對象,就會出現下面的異常:

java.io.InvalidClassException:
Save; local class incompatible:
stream classdesc serialVersionUID = -2805284943658356093,
local class serialVersionUID = 3419534311899376629



上例異常信息中的數字串表示類定義裏各種屬性的編碼值:

●類的名字(Save)。

●域的名字(name)。

●方法的名字(Save)。

●已實現的接口(Serializable)。

改 動上述任意一項內容(無論是增加或刪除),都會引起編碼值變化,從而引起類似的異常警報。這個數字序列稱爲“串行化版本統一標識符”(serial version universal identifier),簡稱UID。解決這個問題的辦法是在類裏面新增一個域serialVersionUID,強制類仍舊使用原來的UID。新增的域 必須是:

●static:該域定義的屬性作用於整個類,而非特定的對象。

●final:保證代碼運行期間該域不會被修改。

●long:它是一個64位的數值。

也就是說,新增的serialVersionUID必須定義成下面這種形式:static final long serialVersionUID=-2805284943658356093L;。其中數字後面加上的L表示這是一個long值。

當 然,改動之後的類不一定能夠和原來的對象兼容。例如,如果把一個域的定義從String改成了int,執行逆-串行化操作時系統就不知道如何處理該值,顯 示出錯誤信息:java.io.InvalidClassException: Save; incompatible types for field name。

Java串行化規範(http://java.sun.com/j2se/1.4.1/docs/guide/

serialization/spec/serialTOC.doc.html)提供了有關兼容的改動(http://java.sun.com/j2se/1.4.1/docs/

guide/serialization/spec/version.doc7.html)和不兼容改動(http://java.sun.com/j2se/1.4.1/docs/guide/

serialization/spec/version.doc8.html)的清單,這些清單指出了對類作了哪些改動之後仍可能讀取原來串行化的數據。具體細節比較複雜,但瞭解其主要機制還是很容易的:





簡而言之,如果文件中確實保存了所有必需的數據,那麼仍有可能讀取該文件,當然前提是必須處理好串行化的UID。

三、引入版本編號

許 多程序都在無意之中作出了這樣的假設:這種文件格式是我要用到的最後一種格式,以後不再需要制定新的格式,現在要做的是處理好在此之前的各種格式。這種程 序會試圖讀取格式版本更高的文件,操作進行到一半才發現某些不能識別的數據,然後就是突然崩潰。如果文件包含了大量的元數據(描述文件本身的數據),處理 起來就要容易得多。

在Java中,每一個域都由其名稱顯式標明,只要文件的改動不是很大(只添加了域,沒有被刪除或作重大更改的域),可以想象,用老軟件來讀取新文件格式不是什麼難事,雖然有可能丟失一些信息,但可以搞清楚文件的基本情況。

文件格式隨着程序功能的改變而改變。理想情況下,程序應當做到既向後兼容(新的版本能夠按照老版本的格式讀取,甚至可能允許更新),同時做到向前兼容(較老的軟件能夠識別和處理新版的文件格式)。

通 常,文件的版本無法從表面上一眼看出。大多數程序不會因爲文件的版本不同而更改文件擴展名,而且目前尚無統一的標記文件版本的辦法。因此,有關文件格式的 版本聲明只能在文件本身之內進行。如果你現在使用的文件格式還不包含版本聲明,最好在下次把文件升級成一個不兼容的版本時馬上加入版本標記,或者尋求一種 在當前文件格式中加入版本標記但不會帶來負面影響的辦法。

版本信息一般在文件的開頭聲明,這是因爲程序必須在處理文件之前首先檢查文件的版本,除非確定了文件的版本,否則不必讀取文件的其餘部分。

按照慣例,文件版本編號包含兩個部分:主版本編號和次版本編號。一個特定版本的程序應當有最適合它處理的主-次版本號;主版本號變化意味着文件格式的重大變化,要繼續使用已經非常困難,必須作出重大修改才能升級到新的版本。

文 件的主次版本號之前往往還可以加入另一項內容,稱爲“魔術數字”,它的作用就是保證程序處理的文件類型不會有誤(因爲文件擴展名有可能不能唯一地標明文件 類型)。例如,Java的類文件總是以下列字節內容開頭(十六進制):CA FE BA BE。目前還沒有這類數字的統一註冊機構,不過UNIX在/etc/magic下提供了一個清單(但並不完整)。魔術數字一般有四個字節,取值範圍很大, 所以一般不必擔心會出現取值衝突的情形。

在編寫和維護必須讀/寫文件的代碼時,注意代碼的向前/向後兼容性是非常必要的。在處理文件的代碼中首先讀取文件版本,然後根據版本號將文件剩餘內容傳遞給適當的處理方法;如果文件的版本太老,已不再支持,程序應當給出明確的提示。

四、結束語

文 件格式設計是一個極其重要的話題,但本文還有許多細節問題尚未涉及。例如,對於大型文件,我們需要隨機訪問,而不是從前向後依次讀取文件內容的順序訪問, 這樣就不必爲了訪問文件最後幾個字節而讀取整個文件。無論是XML還是Java串行化對這類隨機訪問的支持都不是很理想,而且這類文件格式的發展變化比普 通文件更難管理,因爲他們依賴於字節級的訪問,稍微改動一下文件格式就可能導致不兼容。

如果要讓文件具有ACID特性—— Atomicity、Consistency、Isolation和Durability,即原子性、一致性、隔離性、持久性,問題更加複雜。ACID與 事務的概念密切相關,支持多用戶同時訪問一個文件。對於這類文件,可以考慮採用某種小型的數據庫系統,例如Birdstep或Sleepycat。不過這 已經進入了文件格式管理的另一個領域,既涉及到數據庫管理軟件的版本,也涉及到數據模式設計的版本。

撇開這些複雜的問題不談,在實踐中,很多時候我們只需簡單的文件來保存數據,而且不會出現多用戶併發訪問,可以一次性地處理整個文件(或者至少適合使用順序訪問方式)。對於這些情形,最好在設計文件格式時就考慮版本問題,在日後的運行、維護中一定會帶來不少方便。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章