⑴ 序列化和反序列化
序列化(serialization)在計算機科學的數據處理中,是指將數據結構或對象狀態轉換成可取用格式(例如存成文件,存於緩沖,或經由網路中發送),以留待後續在相同或另一台計算機環境中,能恢復原先狀態的過程。依照序列化格式重新獲取位元組的結果時,可以利用它來產生與原始對象相同語義的副本。對於許多對象,像是使用大量引用的復雜對象,這種序列化重建的過程並不容易。面向對象中的對象序列化,並不概括之前原始對象所關系的函數。這種過程也稱為對象編組(marshalling)。從一系列位元組提取數據結構的反向操作,是反序列化(也稱為解編組、deserialization、unmarshalling)。
序列化在計算機科學中通常有以下定義:
序列化與反序列化為數據交換提供了可能,但是因為傳遞的是位元組碼,可讀性差。在應用層開發過程中不易調試,為了解決這種問題,最直接的想法就是將對象的內容轉換為字元串的形式進行傳遞。具體的傳輸格式可自行定義,但自定義格式有一個很大的問題——兼容性,如果引入其他系統的模塊,就需要對數據格式進行轉換,維護其他的系統時,還要先了解一下它的序列化方式。為了統一數據傳輸的格式,出現了幾種數據交換協議,如:JSON, Protobuf,XML。這些數據交換協議可視為是應用層面的序列化/反序列化。
如前所述,序列化和反序列化的出現往往晦澀而隱蔽,與其他概念之間往往相互包容。為了更好了讓大家理解序列化和反序列化的相關概念在每種協議裡面的具體實現,我們將一個例子穿插在各種序列化協議講解中。在該例子中,我們希望將一個用戶信息在多個系統裡面進行傳遞;在應用層,如果採用 .net 語言,所面對的類對象如下所示:
JSON中的元素都是鍵值對——key:value形式,鍵值對之間以":"分隔,每個鍵需用雙引號引起來,值的類型為String時也需要雙引號。其中value的類型包括:對象,數組,值,每種類型具有不同的語法表示。
基礎類型
對象
數組
說到XML就不得不介紹下SOAP(Simple Object Access protocol),SOAP 是一種被廣泛應用的,基於 XML 為序列化和反序列化協議的結構化消息傳遞協議。SOAP 在互聯網影響如此大,以至於我們給基於 SOAP 的解決方案一個特定的名稱 --Web service。SOAP 雖然可以支持多種傳輸層協議,不過 SOAP 最常見的使用方式還是 XML+HTTP。SOAP 協議的主要介面描述語言(IDL)是 WSDL(Web Service Description Language)。SOAP 具有安全、可擴展、跨語言、跨平台並支持多種傳輸層協議。如果不考慮跨平台和跨語言的需求,XML 的在某些語言裡面具有非常簡單易用的序列化使用方法,無需 IDL 文件和第三方編譯器
實際使用中具體要使用哪個協議,我們可以從上列出的幾個特性進行綜合考慮
序列化協議一方面要能擺脫語言、平台的束縛;另一方面要在業界耳熟能詳應用廣泛。比如java標準的對象序列化實現就不是這一條的好榜樣,你要一個C程序員將Java標准序列化實現的數據反序列化成對應結構體是一個很蛋疼的事情。相反,JSON就是一個很好的序列化協議,至少在這一條上算得上是佼佼者了。
序列化協議要能方便開發過程中的調試。做過二進制協議開發的同學一定深有體會,肉眼基本不可辨別序列化後的數據,需要藉助一些第三方的工具一點點分析。相對於二進制協議,文本協議就比較和藹可親了。
協議要能夠經得住時間的考驗。一般情況下採用公開流行的協議是不存在這個問題的,因為他們都被成千上萬的應用檢驗過了。特別要小心的是自定義協議,舉個反例,比如自定義一個類似於Java標准序列化協議的協議,由於當前業務沒有涉及到對象和對象之間的繼承關系,所以協議制定者沒有考慮對象繼承的情況。但是隨著業務的發展,系統中出現了繼承關系的實體類,某個同事不小心將這種對象的實例序列化,結果可想而知。協議不夠成熟,所以自定義協議需要考慮的因數很多。如果自己不是大牛,建議不要自定義序列化協議。
和穩定性差不多,滿足通用性條件的協議基本不會出現這個問題。問題還是會出現在自定義協議上。協議的成熟是一個漫長的過程,要經過不斷的測試。比如穩定性中出現的那個問題,協議將繼承關系的序列化加入,升級之後就能解決問題。但是要做到兼容以前的版本就不那麼容易了。協議的制定者也不是聖人,不可能考慮得那麼周全,但是一定要有一套可擴展的方案,這樣協議才能存活下來,慢慢迭代成穩定版本。
說道性能問題,無非就是時間和空間的博弈。序列化結果數據的大小,直接影響網路傳輸的帶寬和磁碟存儲的空間。序列化和反序列化過程所消耗的時間長短,影響系統的性能。幾種常用的協議性能的比較網上有很多,這里就不詳細介紹了。
⑵ 序列化和反序列化,怎麼保證數據的正確性
Java序列化與反序列化是什麼?為什麼需要序列化與反序列化?如何實現Java序列化與反序列化?本文圍繞這些問題進行了探討。
1.Java序列化與反序列化
Java序列化是指把Java對象轉換為位元組序列的過程;而Java反序列化是指把位元組序列恢復為Java對象的過程。
2.為什麼需要序列化與反序列化
我們知道,當兩個進程進行遠程通信時,可以相互發送各種類型的數據,包括文本、圖片、音頻、視頻等, 而這些數據都會以二進制序列的形式在網路上傳送。那麼當兩個Java進程進行通信時,能否實現進程間的對象傳送呢?答案是可以的。如何做到呢?這就需要Java序列化與反序列化了。換句話說,一方面,發送方需要把這個Java對象轉換為位元組序列,然後在網路上傳送;另一方面,接收方需要從位元組序列中恢復出Java對象。
當我們明晰了為什麼需要Java序列化和反序列化後,我們很自然地會想Java序列化的好處。其好處一是實現了數據的持久化,通過序列化可以把數據永久地保存到硬碟上(通常存放在文件里),二是,利用序列化實現遠程通信,即在網路上傳送對象的位元組序列。
3.如何實現Java序列化與反序列化
1)JDK類庫中序列化API
java.io.ObjectOutputStream:表示對象輸出流
它的writeObject(Object obj)方法可以對參數指定的obj對象進行序列化,把得到的位元組序列寫到一個目標輸出流中。
java.io.ObjectInputStream:表示對象輸入流
它的readObject()方法源輸入流中讀取位元組序列,再把它們反序列化成為一個對象,並將其返回。
2)實現序列化的要求
只有實現了Serializable或Externalizable介面的類的對象才能被序列化,否則拋出異常。
3)實現Java對象序列化與反序列化的方法
假定一個Student類,它的對象需要序列化,可以有如下三種方法:
方法一:若Student類僅僅實現了Serializable介面,則可以按照以下方式進行序列化和反序列化
ObjectOutputStream採用默認的序列化方式,對Student對象的非transient的實例變數進行序列化。
ObjcetInputStream採用默認的反序列化方式,對對Student對象的非transient的實例變數進行反序列化。
方法二:若Student類僅僅實現了Serializable介面,並且還定義了readObject(ObjectInputStream in)和writeObject(ObjectOutputSteam out),則採用以下方式進行序列化與反序列化。
ObjectOutputStream調用Student對象的writeObject(ObjectOutputStream out)的方法進行序列化。
ObjectInputStream會調用Student對象的readObject(ObjectInputStream in)的方法進行反序列化。
方法三:若Student類實現了Externalnalizable介面,且Student類必須實現readExternal(ObjectInput in)和writeExternal(ObjectOutput out)方法,則按照以下方式進行序列化與反序列化。
ObjectOutputStream調用Student對象的writeExternal(ObjectOutput out))的方法進行序列化。
ObjectInputStream會調用Student對象的readExternal(ObjectInput in)的方法進行反序列化。
4)JDK類庫中序列化的步驟
步驟一:創建一個對象輸出流,它可以包裝一個其它類型的目標輸出流,如文件輸出流:
ObjectOutputStream out = new ObjectOutputStream(new fileOutputStream(「D:\\objectfile.obj」));
步驟二:通過對象輸出流的writeObject()方法寫對象:
out.writeObject(「Hello」);
out.writeObject(new Date());
5)JDK類庫中反序列化的步驟
步驟一:創建一個對象輸入流,它可以包裝一個其它類型輸入流,如文件輸入流:
ObjectInputStream in = new ObjectInputStream(new fileInputStream(「D:\\objectfile.obj」));
步驟二:通過對象輸出流的readObject()方法讀取對象:
String obj1 = (String)in.readObject();
Date obj2 = (Date)in.readObject();
說明:為了正確讀取數據,完成反序列化,必須保證向對象輸出流寫對象的順序與從對象輸入流中讀對象的順序一致。
為了更好地理解Java序列化與反序列化,選擇方法一編碼實現。
Student類定義如下:
[java] view plain
package com.jieke.io;
import java.io.Serializable;
/**
*Title:學生類
*Description:實現序列化介面的學生類
*Copyright: right(c) 2012
*Filename: Student.java
*@author Wang Luqing
*@version 1.0
*/
public class Student implements Serializable
{
private String name;
private char sex;
private int year;
private double gpa;
public Student()
{
}
public Student(String name,char sex,int year,double gpa)
{
this.name = name;
this.sex = sex;
this.year = year;
this.gpa = gpa;
}
public void setName(String name)
{
this.name = name;
}
public void setSex(char sex)
{
this.sex = sex;
}
public void setYear(int year)
{
this.year = year;
}
public void setGpa(double gpa)
{
this.gpa = gpa;
}
public String getName()
{
return this.name;
}
public char getSex()
{
return this.sex;
}
public int getYear()
{
return this.year;
}
public double getGpa()
{
return this.gpa;
}
}
把Student類的對象序列化到文件O:\\Java\\com\\jieke\\io\\student.txt,並從該文件中反序列化,向console顯示結果。代碼如下:
[java] view plain
import java.io.*;
/**
*Title:應用學生類
*Description:實現學生類實例的序列化與反序列化
*Copyright: right(c) 2012
*Filename: UseStudent.java
*@author Wang Luqing
*@version 1.0
*/
public class UseStudent
{
public static void main(String[] args)
{
Student st = new Student("Tom",'M',20,3.6);
File file = new File("O:\\Java\\com\\jieke\\io\\student.txt");
try
{
file.createNewFile();
}
catch(IOException e)
{
e.printStackTrace();
}
try
{
//Student對象序列化過程
FileOutputStream fos = new FileOutputStream(file);
ObjectOutputStream oos = new ObjectOutputStream(fos);
oos.writeObject(st);
oos.flush();
oos.close();
fos.close();
//Student對象反序列化過程
FileInputStream fis = new FileInputStream(file);
ObjectInputStream ois = new ObjectInputStream(fis);
Student st1 = (Student) ois.readObject();
System.out.println("name = " + st1.getName());
System.out.println("sex = " + st1.getSex());
System.out.println("year = " + st1.getYear());
System.out.println("gpa = " + st1.getGpa());
ois.close();
fis.close();
}
catch(ClassNotFoundException e)
{
e.printStackTrace();
}
catch (IOException e)
{
e.printStackTrace();
}
}
}
結果如下所示:
name = Tom
sex = M
year = 20
gpa = 3.6
總結:
1)Java序列化就是把對象轉換成位元組序列,而Java反序列化就是把位元組序列還原成Java對象。
2)採用Java序列化與反序列化技術,一是可以實現數據的持久化,在MVC模式中很是有用;二是可以對象數據的遠程通信。