前几天看到一个2016年挺有趣的一个故障复盘,有一哥们给底层的HSF服务返回值加了一个字段,秉承着“加字段一定是安全的”这种惯性思维就直接上线了,上线后发现这个接口成功率直接跌0,下游的服务抛出类似下面这个异常堆栈
java.io.InvalidClassException:com.taobao.query.TestSerializable;
local class incompatible: stream classdesc serialVersionUID = -7165097063094245447,local class serialVersionUID = 6678378625230229450
看到这个堆栈可能有老司机已经反应过来了,下面我们就看下这种异常到底是如何发生的
序列化机制允许将实现序列化的Java对象转换位字节序列,这些字节序列可以保存在磁盘上,或通过网络传输,以达到以后恢复成原来的对象。序列化机制使得对象可以脱离程序的运行而独立存在。
要想有序列化的能力,得实现Serializable
接口,就像下面的这个例子一样:
public class SerializableTest implements Serializable {
private static final long serialVersionUID = -3751255153289772365L;
}
这里面一个关键的点是serialVersionUID
,JVM会在运行时判断类的serialVersionUID
来验证版本一致性,如果传来的字节流中的serialVersionUID与本地相应类的serialVersionUID相同则认为是一致的,可以进行反序列化,否则就会出现序列化版本不一致的异常。
在上面的例子中,我们通过IDEA的插件已经自动为SerializableTest
生成了一个serialVersionUID
,如果我们不指定serialVersionUID
,编译器在编译的时候也会根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段 。
图片来源:https://dubbo.apache.org/zh/docs/v2.7/dev/design/
从Dubbo的调用链可以发现是有一个序列化节点的,其支持的序列化协议一共有四种:
从那个帖子看当时HSF服务提供集群设置的序列化方式是java序列化,而不是像现在一样默认hessian2,如果在RPC中使用了Java序列化,那下面的这三个坑一定注意不要踩
Serializable
接口,但是却没有指定serialVersionUID
我们之前在文中提过,如果实现了Serializable
的类没有指定serialVersionUID
,编译器编译的时候会根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段,这就决定了这个类在序列化上一定不是向前兼容的,前文中的那个故障就是踩了这个坑。我们在本地模拟一下这个case:
假如我们先有Student
这样的一个类
public class Student implements Serializable {
private static int startId = 1000;
private int id;
public Student() {
id = startId ++;
}
}
我们将其序列化到磁盘:
private static void serialize() {
try {
Student student = new Student();
FileOutputStream fileOut =
new FileOutputStream("/tmp/student.ser");
ObjectOutputStream out = new ObjectOutputStream(fileOut);
out.writeObject(student);
out.close();
fileOut.close();
System.out.printf("Serialized data is saved in /tmp/student.ser");
} catch (
IOException i) {
i.printStackTrace();
}
}
然后给Student
类加一个字段
public class Student implements Serializable {
private static int startId = 1000;
private int id;
// 注意这里我们已经加了一个属性
private String name;
public Student() {
id = startId ++;
}
}
我们再去解码,发现程序会抛出异常:
java.io.InvalidClassException: com.idealism.base.Student; local class incompatible: stream classdesc serialVersionUID = -1534228028811562580, local class serialVersionUID = 630353564791955009
at java.io.ObjectStreamClass.initNonProxy(ObjectStreamClass.java:699)
at java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:2001)
at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1848)
at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2158)
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1665)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:501)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:459)
at com.idealism.base.SerializableTest.deserialize(SerializableTest.java:34)
at com.idealism.base.SerializableTest.main(SerializableTest.java:9)
其实到这里我们就完整的模拟了前文中的那个故障,其根因是RPC的参数实现了Serializable
接口,但是没有指定serialVersionUID
,编译器会根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段,当服务端类升级之后导致了服务端发送给客户端的字节流中的serialVersionUID
发生了改变,因此当客户端反序列化去检查serialVersionUID
字段的时候发现发生了变化被判定了异常。
Serializable
接口,并且指定了serialVersionUID
但是子类没有指定serialVersionUID
我们对前面的例子中的Student
类稍微改一下
public class Student extends Base{
private static int startId = 1000;
private int id;
public Student() {
id = startId ++;
}
}
其中父类长这样:
public class Base implements Serializable {
private static final long serialVersionUID = 218886242758597651L;
private Date gmtCreate;
}
如果我们按照之前的讨论在本地进行一次序列化和反序列化,程序依然抛异常:
java.io.InvalidClassException: com.idealism.base.Student; local class incompatible: stream classdesc serialVersionUID = 1049562984784675762, local class serialVersionUID = 7566357243685852874
at java.io.ObjectStreamClass.initNonProxy(ObjectStreamClass.java:699)
at java.io.ObjectInputStream.readNonProxyDesc(ObjectInputStream.java:2001)
at java.io.ObjectInputStream.readClassDesc(ObjectInputStream.java:1848)
at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2158)
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1665)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:501)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:459)
at com.idealism.base.SerializableTest.deserialize(SerializableTest.java:34)
at com.idealism.base.SerializableTest.main(SerializableTest.java:9)
我们在设计类的时候公共属性要放到基类,这条经验指导放到这个case中仍然不太正确,而且这个case比上一个还要隐蔽,问题出主要是通过IDEA插件生成的serialVersionUID
的修饰符是pivate
导致这个字段在子类中不可见,子类中的serialVersionUID
仍然是编译器自动生成的。当然可以把父类中serialVersionUID
的改为非private
来解这个问题,不过我仍然建议每个有序列化需求的类都显式指定serialVersionUID
的值。
如果序列化遇到类之间的组合或者继承关系,则Java按照下面的规则处理:
Serializable
接口Serializable
,则序列化时只序列化子类,不会序列化父类中的属性Serializable
,则序列化时子类和父类都会被序列化,异常场景如本例所指还有一点要注意:如果类的实例中有静态变量,改属性不会被序列化和反序列化
《阿里巴巴开发规约》中有这么一条:
【强制】二方库例可以定义枚举类型,参数可以使用枚举类型,但是接口返回值不允许使用枚举类型或者包含枚举类型的POJO对象。
说明:由于升级原因,导致双方的枚举类不尽相同,在接口解析,类反序列化时出现异常
这里会出现这样一个限制的原因是Java对枚举的序列化和反序列化采用完全不同的策略。序列化的结果中仅包含枚举的名字,而不包含枚举的具体定义,反序列化的时候客户端从序列化结果中读取枚举的name,然后调用java.lang.Enum#valueOf
根据本地的枚举定义获取具体的枚举值。
我们仍然用之前的代码举例:
public class Student implements Serializable {
private static final long serialVersionUID = 2528736437985230667L;
private static int startId = 1000;
private int id;
private String name;
// 新增字段,校服尺码,其类型是一个枚举
private SchoolUniformSizeEnum schoolUniformSize;
public Student() {
id = startId ++;
}
}
假如学生这个类中新增了一个校服尺码的枚举值
public enum SchoolUniformSizeEnum {
SMALL,
MEDIUM,
LARGE
}
假如服务端此时对这个枚举进行了升级,但是客户端的二方包中仍然只有三个值:
public enum SchoolUniformSizeEnum {
SMALL,
MEDIUM,
LARGE,
OVERSIZED
}
如果服务端有逻辑给客户端返回了这个新增的枚举值:
private static void serialize() {
try {
Student student = new Student();
// 服务端升级了枚举
student.setSchoolUniformSize(SchoolUniformSizeEnum.OVERSIZED);
FileOutputStream fileOut =
new FileOutputStream("/tmp/student.ser");
ObjectOutputStream out = new ObjectOutputStream(fileOut);
out.writeObject(student);
out.close();
fileOut.close();
System.out.printf("Serialized data is saved in /tmp/student.ser");
} catch (
IOException i) {
i.printStackTrace();
}
}
因为客户端的二方包还没有升级,所以当客户端读到这个新的字节流并序列化的时候会因为找不到对应的枚举值而抛异常。
java.io.InvalidObjectException: enum constant OVERSIZED does not exist in class com.idealism.base.SchoolUniformSizeEnum
at java.io.ObjectInputStream.readEnum(ObjectInputStream.java:2130)
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1659)
at java.io.ObjectInputStream.defaultReadFields(ObjectInputStream.java:2403)
at java.io.ObjectInputStream.readSerialData(ObjectInputStream.java:2327)
at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:2185)
at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1665)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:501)
at java.io.ObjectInputStream.readObject(ObjectInputStream.java:459)
at com.idealism.base.SerializableTest.deserialize(SerializableTest.java:36)
at com.idealism.base.SerializableTest.main(SerializableTest.java:9)
看到这里可能有小伙伴觉得,我这辈子都不可能去修改Dubbo的序列化方式,就让他hessian2
到底吧,我不得不承认确实是这样的。如果把序列化光限制在RPC这一个场景,未免有些狭隘。以阿里为例,其分布式缓存中间件Tair
的写接口可接受的入参就是一个Serializable
,好在我们平常往缓存中塞东西都是以String
为key的,但万一有前辈真的用了一个实现了Serializable
的类,并且恰好没有指定serialVersionUID
,那新来的你不就正好踩坑了么。所以在遇到序列化的地方需要仔细查看有没有踩文章中列举的三个坑。