HBase对比HDFS

什么是HDFS(Hadoop分布式文件系统):HDFS允许以分布式和冗余方式存储大量数据。

HDFS组件
• NameNode
• DataNode
NameNode:NameNode可以被视为系统的管理者。它维护系统文件树以及系统中存在的所有文件和目录的元数据。其中“命名空间镜像(Namespace image)”和“编辑日志”用于存储元数据信息。 Namenode包含所有数据节点的数据块信息,但是,它不会持久存储数据节点数据块位置信息。系统启动时,每次从数据节点重建此信息。
DataNode:是集群中的从属者,提供实际存储。它主要负责为客户提供读写请求服务。

HDFS架构:
HBase对比HDFS_第1张图片
什么是Hbase: Hbase是一个可以运行在Hadoop集群上的NoSQL数据库。
Hbase组件
• Hbase Master
• Region Server
• Region
• Zookeeper
Hbase的架构图如下图所示:
HBase对比HDFS_第2张图片

Hbase与HDFS对比
HBase对比HDFS_第3张图片
总结一下:什么时候选用Hbase,什么场景使用HDFS进行存储?
1. 对于经常需要修改原有的数据的场景使用Hbase进行存储;
2. 对于性能要求不高且只需要支持单条数据查询或者小批量数据进行查询,两者均可;
3. 对于需要经常进行全表扫描进行大批量的查询的选择HDFS;

那么有没有一种存储方式既能满足实时的更新,又能满足大量的数据分析工作,这时候可以考虑一下使用kudu。

你可能感兴趣的:(大数据,大数据)