hbase简介

行健

时间戳

列簇<family>

限定符<qualifier>

元素

 

HBase以表的形式存储数据,每个表由行和列组成,每个列属于一个特定的列族。 

表中由行和列确定的存储单元称为一个元素,每个元素保存里同一份数据的多个版本,有时间戳来标识。

行健是数据行在表中的唯一标识,并作为检索记录的主键。

在HBase中访问表中的行只有三种方式:通过单个行健访问;给定行健的范围访问;全表扫描。

行健可以是任意字符串(最大长度64KB),并按照字典序进行存储。

时间戳对应着每条数据操作所关联的时间,可以由系统自动生成,也可以由用户显式地赋值。注意,如果应用程序需要避免数据版本冲突,则必须显式地生成时间戳。

HBase提供了两种数据版本的回收方式:一是对每个数据单元,只存储指定个数的最新版本;二是保存最近一段时间内的版本(比如7天)。

 

Region

HRegionServer(Region服务器程序)

HRegion(Region实例)

HLog(WAL,Write-Ahead Log预写式日志)

Store

memStore

StoreFile

HMaster

 

.META.

ROOT

你可能感兴趣的:(hadoop,hbase,物理模型,逻辑模型)