Java中对象序列化与反序列化

…衆ロ難τιáo~ 提交于 2020-02-29 08:43:10

1. 概念

把对象转换为字节序列的过程称为对象的序列化。
把字节序列恢复为对象的过程称为对象的反序列化。
对象的序列化主要有两种用途:

  1.  把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;
  2.  在网络上传送对象的字节序列。

  在很多应用中,需要对某些对象进行序列化,让它们离开内存空间,入住物理硬盘,以便长期保存。比如最常见的是Web服务器中的Session对象,当有10万用户并发访问,就有可能出现10万个Session对象,内存可能吃不消,于是Web容器就会把一些seesion先序列化到硬盘中,等要用了,再把保存在硬盘中的对象还原到内存中。

  当两个进程在进行远程通信时,彼此可以发送各种类型的数据。无论是何种类型的数据,都会以二进制序列的形式在网络上传送。发送方需要把这个Java对象转换为字节序列,才能在网络上传送;接收方则需要把字节序列再恢复为Java对象。

2. JDK类库中的序列化API

     java.io.ObjectOutputStream代表对象输出流,它的writeObject(Object obj)方法可对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出流中。
  java.io.ObjectInputStream代表对象输入流,它的readObject()方法从一个源输入流中读取字节序列,再把它们反序列化为一个对象,并将其返回。
  只有实现了Serializable和Externalizable接口的类的对象才能被序列化。Externalizable接口继承自 Serializable接口,实现Externalizable接口的类完全由自身来控制序列化的行为,而仅实现Serializable接口的类可以采用默认的序列化方式 。
对象序列化包括如下步骤:
  • 创建一个对象输出流,它可以包装一个其他类型的目标输出流,如文件输出流;
  • 通过对象输出流的writeObject()方法写对象。
对象反序列化的步骤如下:
  • 创建一个对象输入流,它可以包装一个其他类型的源输入流,如文件输入流;
  • 通过对象输入流的readObject()方法读取对象。

2.1 对象序列化和反序列范例:

定义一个Person类,实现Serializable接口

import java.io.Serializable;

public class Person implements Serializable {

    /**
     * 序列化ID
     */
    private static final long serialVersionUID = -5809782578272943999L;
    private int age;
    private String name;
    private String sex;

    public int getAge() {
        return age;
    }

    public String getName() {
        return name;
    }

    public String getSex() {
        return sex;
    }

    public void setAge(int age) {
        this.age = age;
    }

    public void setName(String name) {
        this.name = name;
    }

    public void setSex(String sex) {
        this.sex = sex;
    }
}
序列化和反序列化Person类对象
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;
import java.text.MessageFormat;

public class TestObjSerializeAndDeserialize {

    public static void main(String[] args) throws Exception {
        SerializePerson();//序列化Person对象
        Person p = DeserializePerson();//反序列Perons对象
        System.out.println(MessageFormat.format("name={0},age={1},sex={2}",
                                                 p.getName(), p.getAge(), p.getSex()));
    }
    
    /**
     * Description: 序列化Person对象
     * @throws FileNotFoundException
     * @throws IOException
     */
    private static void SerializePerson() throws FileNotFoundException,
            IOException {
        Person person = new Person();
        person.setName("hosee");
        person.setAge(2);
        person.setSex("男");
        // ObjectOutputStream 对象输出流,将Person对象存储到E盘的Person.txt文件中,完成对Person对象的序列化操作
        ObjectOutputStream oo = new ObjectOutputStream(new FileOutputStream(
                new File("E:/Person.txt")));
        oo.writeObject(person);
        System.out.println("Person对象序列化成功!");
        oo.close();
    }

    /**
     * Description: 反序列Perons对象
     * @return
     * @throws Exception
     * @throws IOException
     */
    private static Person DeserializePerson() throws Exception, IOException {
        ObjectInputStream ois = new ObjectInputStream(new FileInputStream(
                new File("E:/Person.txt")));
        Person person = (Person) ois.readObject();
        System.out.println("Person对象反序列化成功!");
        return person;
    }

}
让我们看看序列化的Person类长什么样

都是些二进制格式。

默认实现Serializable接口的序列化是对于一个类的非static非transient的实例变量进行序列化与反序列化。刚刚上面也说了,如果要对static实例变量进行序列化就要使用Externalizable接口,手动实现

序列化时只保存

1)对象的类型
2)对象属性的类型
3)对象属性的值

那么就有个疑问了,为什么不序列化方法呢?(方法根本不存在序列化这一说,这里提出是排除个别的困惑)

B地能接收序列化之后的CLASS A,说明B地也有一个完全一样的CLASS A,所以方法什么的都已经准备好了。所以序列化时只需要存属性值什么的就够了。

2.2 Externalizable

我们简单的说一下实现Externalizable接口。 实现Externalizable接口的类完全由自身来控制序列化的行为。而且必须实现writeExternal(ObjectOutput out)和readExternal(ObjectInput in)。

注意在对实现了这个接口的对象进行反序列化的时候,会先调用类的不带参数的构造函数,这个和之前的默认反序列化方式是不一样的。

例子不再举例了,Externalizable不常用,因为Externalizable可以用 transient+Serializable代替。

但是Externalizable可以实现自主的序列化过程,作用有以下几点

1. Externalizable中序列化static成员变量。

2. 对敏感字段的加密。

在大多数jdk源码中,往往使用另一种方式来自己实现序列化。

它们都继承了Serializable,但是它们同时也实现了writeObject与readObject方法,把不想序列化的属性transient,来实现自己需要的序列化。

3. serialVersionUID的作用

serialVersionUID: 字面意思上是序列化的版本号,凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量
private static final long serialVersionUID
serialVersionUID有两种生成方式:

采用这种方式生成的serialVersionUID是1L:

private static final long serialVersionUID = 1L;

采用这种方式生成的serialVersionUID是根据类名,接口名,方法和属性等来生成的,例如:

private static final long serialVersionUID = 4603642343377807741L;
那么这个 serialVersionUID到底有什么用呢?

在上面的例子中已经展示了序列化与反序列化的过程。那么当我们序列化保存到硬盘上后,对Person类进行了修改呢?

我们首先把serialVersionUID给去掉。

import java.io.Serializable;

public class Person implements Serializable {

	private int age;
    private String name;
    private String sex;

    public int getAge() {
        return age;
    }
    public String getName() {
        return name;
    }

    public String getSex() {
        return sex;
    }

    public void setAge(int age) {
        this.age = age;
    }

    public void setName(String name) {
        this.name = name;
    }

    public void setSex(String sex) {
        this.sex = sex;
    }
}
再对其进行序列化和反序列化(请查看第2节的代码),结果与以前一样,序列化和反序列化成功。

接着我们在Person类中新添一个字段

private String address;
接着我们对Person类进行反序列化,此时就会抛出如下的异常信息:
Exception in thread "main" java.io.InvalidClassException: Person; local class incompatible: stream classdesc serialVersionUID = 4603642343377807741, local class serialVersionUID = 5706315374280860232
意思就是说,文件流中的class和classpath中的class,也就是修改过后的class,不兼容了,处于安全机制kao虑,程序抛出了错误,并且拒绝载入。那么如果我们真的有需求要在序列化后添加一个字段或者方法呢?应该怎么办? 那就是自己去指定serialVersionUID。在刚刚的例子中,没有指定Customer类的serialVersionUID的,那么java编译器会自动给这个class进行一个摘要算法,类似于指纹算法,只要这个文件多一个属性,得到的UID就会截然不同的,可以保证在这么多类中,这个编号是唯一的。所以,添加了一个字段后,由于没有显指定 serialVersionUID,编译器又为我们生成了一个UID,当然和前面保存在文件中的那个不会一样了,于是就出现了2个序列化版本号不一致的错误。因此,只要我们自己指定了serialVersionUID,就可以在序列化后,去添加一个字段,或者方法,而不会影响到后期的还原,还原后的对象照样可以使用,而且还多了方法或者属性可以用。

当我们增加了serialVersionUID后,反序列化成功。

4. 父类的序列化

情境:一个子类实现了 Serializable 接口,它的父类都没有实现 Serializable 接口,序列化该子类对象,然后反序列化后输出父类定义的某变量的数值,该变量数值与序列化时的数值不同。

解决:要想将父类对象也序列化,就需要让父类也实现Serializable 接口。如果父类不实现的话的,就需要有默认的无参的构造函数。在父类没有实现 Serializable 接口时,虚拟机是不会序列化父对象的,而一个 Java 对象的构造必须先有父对象,才有子对象,反序列化也不例外。所以反序列化时,为了构造父对象,只能调用父类的无参构造函数作为默认的父对象。因此当我们取父对象的变量值时,它的值是调用父类无参构造函数后的值。如果你kao虑到这种序列化的情况,在父类无参构造函数中对变量进行初始化,否则的话,父类变量值都是默认声明的值,如 int 型的默认是 0,string 型的默认是 null。

5. 关键字transient

当持久化对象时,可能有一个特殊的对象数据成员,我们不想用serialization机制来保存它。为了在一个特定对象的一个域上关闭serialization,可以在这个域前加上关键字transient。   
transient是Java语言的关键字,用来表示一个域不是该对象序列化的一部分。当一个对象被序列化的时候,transient型变量的值不包括在序列化的表示中,然而非transient型的变量是被包括进去的。  

我们熟悉使用transient关键字可以使得字段不被序列化,那么还有别的方法吗?根据父类对象序列化的规则,我们可以将不需要被序列化的字段抽取出来放到父类中,子类实现 Serializable 接口,父类不实现,根据父类序列化规则,父类的字段数据将不被序列化,形成类图如下图所示。

上图中可以看出,attr1、attr2、attr3、attr5 都不会被序列化,放在父类中的好处在于当有另外一个 Child 类时,attr1、attr2、attr3 依然不会被序列化,不用重复抒写 transient,代码简洁。

6. 序列化字节流格式

字符串对象的格式:74 2字节长度 字符串
字符串中的字符都是Unicode字符,采用modified UTF-8格式
类的描述信息格式:
72
2字节长度
类名
8字节指纹 //根据类,父类,接口,域类型和方法签名计算出来的唯一数据
1字节标志
2字节的数据域描述符计数
数据域描述符//1字节类型码+2字节域名长度+域名+类名(如果域为对象)
78(结束标记)
超类(如果没有则为70)
对象格式:73+类描述信息+对象数据

详细请参kao<<Core Java 2>> Volum I 12.5.2

7. 序列化存储规则

ObjectOutputStream out = new ObjectOutputStream(
	new FileOutputStream("result.obj"));
	Test test = new Test();
	//试图将对象两次写入文件
	out.writeObject(test);
	out.flush();
	System.out.println(new File("result.obj").length());
	out.writeObject(test);
	out.close();
	System.out.println(new File("result.obj").length());
	ObjectInputStream oin = new ObjectInputStream(new FileInputStream(
			"result.obj"));
	//从文件依次读出两个文件
	Test t1 = (Test) oin.readObject();
	Test t2 = (Test) oin.readObject();
	oin.close();			
	//判断两个引用是否指向同一个对象
	System.out.println(t1 == t2);

上述对同一对象两次写入文件,打印出写入一次对象后的存储大小和写入两次后的存储大小,然后从文件中反序列化出两个对象,比较这两个对象是否为同一对象。一般的思维是,两次写入对象,文件大小会变为两倍的大小,反序列化时,由于从文件读取,生成了两个对象,判断相等时应该是输入 false 才对。

结果:
31
36
true

我们看到,第二次写入对象时文件只增加了 5 字节,并且两个对象是相等的,这是为什么呢?

Java 序列化机制为了节省磁盘空间,具有特定的存储规则,当写入文件的为同一对象时,并不会再将对象的内容进行存储,而只是再次存储一份引用,上面增加的 5 字节的存储空间就是新增引用和一些控制信息的空间。反序列化时,恢复引用关系,使得清单 3 中的 t1 和 t2 指向唯一的对象,二者相等,输出 true。该存储规则极大的节省了存储空间。

举例:

ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("result.obj"));
Test test = new Test();
test.i = 1;
out.writeObject(test);
out.flush();
test.i = 2;
out.writeObject(test);
out.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(
					"result.obj"));
Test t1 = (Test) oin.readObject();
Test t2 = (Test) oin.readObject();
System.out.println(t1.i);
System.out.println(t2.i);

目的是希望将 test 对象两次保存到 result.obj 文件中,写入一次以后修改对象属性值再次保存第二次,然后从 result.obj 中再依次读出两个对象,输出这两个对象的 i 属性值。案例代码的目的原本是希望一次性传输对象修改前后的状态。

结果两个输出的都是 1, 原因就是第一次写入对象以后,第二次再试图写的时候,虚拟机根据引用关系知道已经有一个相同对象已经写入文件,因此只保存第二次写的引用,所以读取时,都是第一次保存的对象。在使用一个文件多次 writeObject 需要特别注意这个问题

Reference:

1. http://www.cnblogs.com/xdp-gacl/p/3777987.html

2. http://zhidao.baidu.com/link?url=3ck0ueH1cc6E5cruBjrqyeaWmPVO8rP-JMeVoc4sYm7kFFOlkGQLLjbvYSq9HjZHt8LW72LCJuxLhB6C1HR-u_

3. http://www.cnblogs.com/rollenholt/archive/2012/11/26/2789445.html

4. http://blog.csdn.net/csfreebird/article/details/1791332

5. http://www.blogjava.net/fhtdy2004/archive/2009/06/20/286112.html

6. http://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html?ca=drs-#ibm-pcon

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!