HDFS,HBase据库简单解析

Hadoop文件分发系统 ( Hadoop Distributed File System (HDFS) )和Hadoop数据库(HBase)是大数据生态系统的关键组成部分。


HBase非关系型数据库

HBase是一个分布式的基于列存储的非关系型数据库。HBase的查询效率很高,主要由于查询和展示结果。

HBase可以认为是hdfs的一个包装。他的本质是数据存储,是个NoSql数据库;hbase部署于hdfs之上,并且克服了hdfs在随机读写方面的缺点。

HBase的架构

HDFS,HBase据库简单解析_第1张图片
e



Hive是一个基于HDFS的数据仓库工具,可以将Hive SQL转化为MapReduce进行数据处理查询的工具.主要用来并行分布式处理大量数据。hive中的所有查询除了"select * from table;"都是需要通过Map\Reduce的方式来执行的。 Hive把脚本和SQL语言翻译成MapReduce程序,丢给计算引擎去计算。

你可能感兴趣的:(HDFS,HBase据库简单解析)