hadoop序列化框架

A 默认序列化框架是 Writable接口,   缺点: 缺乏语言的可移植性

B 不使用java Serialization,  缺点: 不够精简, 用起来非常纠结, 无法做到  精简,快速, 可扩展, 支持互操作

C Apache Thrift  一般用来作为二进制 数据的永久存储格式, Mapreduce格式对该类的支持有限

D Google Protocol框架  一般用来做二进制数据的永久存储格式,Mapreduce格式对该类的支持有限

E: Avro   更加有生命力, 与编程语言无关, 非常使用hadoop的大规模数据处理。

Avro模式议案使用JSON来写, 数据通常采用二进制格式来编码

和其他序列化类库想比, Avro的性能更好。


 =======================================================================================

hadoop权威指南 第三版 page 127  

你可能感兴趣的:(__MapReduce,********HDFS)