hbase的基本原理

HBase是一个分布式的、面向列的开源数据库,该技术来源于 FayChang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
hbase的基本原理_第1张图片

hbase的基本原理_第2张图片

重要知识点:

行键Row Key:主键是用来检索记录的主键,访问hbasetable中的行,只能储存64k数据

列族Column Family:Table在水平方向有一个或者多个ColumnFamily组成,一个ColumnFamily中可以由任意多个qualifier组成,即ColumnFamily支持动态扩展,无需预先定义qualifier的数量以及类型,所有qualifier均以二进制格式存储,用户需要自行进行类型转换
列qualifier:由Hbase中的列族ColumnFamily + 列的名称(cell)组成列。

timestamp : 时间戳用来支持版本,数据精确写入的时间毫秒级别。

单元格cell:HBase中通过row和columns确定的为一个存贮单元称为cell。

版本version:每个 cell都保存着同一份数据的多个版本。版本通过时间戳来索引

HBASE数据结构例子

hbase的基本原理_第3张图片

hbase的基本原理_第4张图片

hbase的基本原理_第5张图片

hbase的基本原理_第6张图片

hbase的基本原理_第7张图片

hbase的基本原理_第8张图片

hbase的基本原理_第9张图片

 

 

 

你可能感兴趣的:(hadoop,hbase)