hadoop序列化与Java序列化比较

什么是序列化

序列化就是把内存中的对象转化为字节序列,以便于存储到磁盘和进行网络传输。
反序列化就是将收到的字节序列或者是磁盘的持久化数据,转换为内存中的对象。

为什么要进行序列化

一般来说,活的对象只生存在内存中,关机断电后就会失效;而且活的对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机,然而序列化可以存储活的对象,可以将活的对象发送到远程的计算机中。

Java序列化

Java序列化是一个重量级序列化框架,一个对象被序列化后,会附带很多额外的信息(校验信息流量,header,继承体系等),不便于在网络中高效传输。

Hadoop序列化

Hadoop序列化是一个轻量级的序列化框架,能够高效使用存储空间,读写数据的额外开销小,扩展性强,支持多语言的交互。

你可能感兴趣的:(Hadoop)