Java序列化

关于java序列化,一些核心的概念。

基本概念

序列化的定义

序列化是将Java对象转换成字节流文件,反序列化就是反过来。

字节流文件,很多人写成二进制字节流,我感觉并不准确,字节流文件是二进制文件不假(1个字节是8个比特),字节流文件打开后是0和1组成的比特流(当然可以用其他进制,比如十六进制查看),但二进制字节这种说法就很不准确,我看可以说成二进制位流或二级制比特流。

序列化是的作用

  • 对象的存储,jvm虚拟机生命周期结束,所有的对象的生命周期就都结束了(可能更短,比如不再被引用后,被垃圾回收),所以想把对象持久化,可以把对象序列化成字节流存储
  • 用于对象在网络中传输

序列化ID (serialVersionUID)

序列化对象的唯一标识。

  • 序列化流程:比如一个对象Object从A实例传输到B实例,序列化成字节流后通过网络传输,这个对象一定在两个实例上都是存在的(参考真实的使用场景)。从A实例传输过来的字节流包含了类属性字段的数据,在B实例处进行反序列化时,根据B实例本地的类Object信息,填充数据,生成对应的对象。
  • ID作用:序列化时,会将serialVersionUID,写入字节流文件,在反序列化时,与当地对象的serialVersionUID进行比较,一致才进行序列化,不一致报错。
  • 省略serialVersionUID:jvm会在编译时,动态的根据类的属性信息(具体生成规则,有待进一步研究)生成一个ID,可能会根据jvm版本不同,所以在运行着不同JVM实例之间进行序列化,可能会报错,不推荐使用。建议显示定义serialVersionUID

静态变量并不能序列化

序列化保存的是对象的状态,并不保存类的状态,所以对象中的静态变量并不会被序列化。

父类序列化

情境:一个子类实现了 Serializable 接口,它的父类都没有实现 Serializable 接口,序列化该子类对象,然后反序列化后输出父类定义的某变量的数值,该变量数值与序列化时的数值不同。

解决要想将父类对象也序列化,就需要让父类也实现****Serializable 接口。如果父类不实现的话的,就 需要有默认的无参的构造函数。在父类没有实现 Serializable 接口时,虚拟机是不会序列化父对象的,而一个 Java 对象的构造必须先有父对象,才有子对象,反序列化也不例外。所以反序列化时,为了构造父对象,只能调用父类的无参构造函数作为默认的父对象。因此当我们取父对象的变量值时,它的值是调用父类无参构造函数后的值。如果你考虑到这种序列化的情况,在父类无参构造函数中对变量进行初始化,否则的话,父类变量值都是默认声明的值,如 int 型的默认是 0,string 型的默认是 null。

​ 引用自—— 《Java 序列化的高级认识》

Transient 关键字

类中可能存在某些敏感的信息,我们是不想在网络中传输的,这时候我们就需要借助 transient 关键字了。被transient关键字标识的 field,不会进行序列化.
下面通过一个例子说明 transient 关键字的作用.现假设我们需要在网络中传输 Person 类:

public class Person implements Serializable{

    private static final long serialVersionUID = 1L;

    private String name;
    private String certNo; // 身份证号码
    private int age;

    public Person(String name, String certNo, int age) {
        this.name = name;
        this.certNo = certNo;
        this.age = age;
    }

    @Override
    public String toString() {
        return "Person{" +
                "name='" + name + '\'' +
                ", certNo='" + certNo + '\'' +
                ", age=" + age +
                '}';
    }
}

若不使用 transient 关键字,反序列化时输出的信息是 :

Person{name='tianya', certNo='12314', age=23}

我们知道,身份证号码属于敏感信息,并不想在网络中传输,这时我们就可以借助 transient 关键字,如下:

    private transient String certNo;

这个时候,通过反序列化获取的 Person 信息如下 :

Person{name='tianya', certNo='null', age=23}

序列化存储规则

Java 序列化机制为了节省磁盘空间,具有特定的存储规则,当写入文件的为同一对象时,并不会再将对象的内容进行存储,而只是再次存储一份引用,下面增加的 5 字节的存储空间就是新增引用和一些控制信息的空间。反序列化时,恢复引用关系。
下面示例中的 test1 和 test2 指向唯一的对象,二者相等,输出 true。该存储规则极大的节省了存储空间。

/**
 * 此示例展示序列化同一个对象的存储规则:同一个对象序列化两次,为了提高存储率,使用相同的引用。
 * 注:即使修改对象属性,依然无效,以第一个对象为准(都是引用第一个对象),值得注意!
 */
public class WriteTwiceObject {
    public static void main(String[] args) throws Exception{
        ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream("test.obj"));
        Test t = new Test();
        t.test = 1;
        objectOutputStream.writeObject(t);
        objectOutputStream.flush();
        System.out.println(new File("test.obj").length());
        t.test = 2;
        objectOutputStream.writeObject(t);
        objectOutputStream.close();
        System.out.println(new File("test.obj").length());

        ObjectInputStream objectInputStream = new ObjectInputStream((new FileInputStream("test.obj")));
        //对象属性的改变并没有生效
        Test test1 = (Test) objectInputStream.readObject();
        System.out.println(test1.test);
        Test test2 = (Test) objectInputStream.readObject();
        System.out.println(test2.test);
        //true 表明两个对象是同一个引用
        System.out.println(test1 == test2);

    }
}
    class Test implements Serializable{
        private final static long serialVersionUID = 1l;

        public int test;
    }

//output: 
56
61
1
1
true

Reference:

  • 《Java 序列化的高级认识》
  • stackoverflow原址:http://stackoverflow.com/questions/910374/why-does-java-have-transient-variables

你可能感兴趣的:(Java序列化)