云计算简单知识整理


MapReduce 是一种算法,用于超大型数据集的并行运算;


HDFS 支持千万级的大型分布式文件系统;


HBase 是一个面向列的分布式数据库;


Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作;


Zookeeper 提供的功能包括:配置维护、名字服务、分布式同步、组服务等,用于分布式系统的可靠协调系统;


Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算;


Chukwa 是基于Hadoop集群中监控系统;


Avro 是一个数据序列化系统,设计用于支持大批量数据交换的应用。



你可能感兴趣的:(云计算简单知识整理)