hbase读写请求流程详解

要理解读写流程,先要清除hbase的架构图。以0.96版本以下的三层架构为例:

Hbase的架构

hbase是主从架构,主节点是HMaster,从节点是HRegionServer。

HMaster:负责regionserver的运行状态和region负载均衡。

HRegionServer:负责存储表格,以及响应client的连接。包含一个HLog和多个HRegion。

zk负责保证HMaster的高可用和region server的注册。

-----------------------------------------------------------------------------------------------------------------------------------------------

1、hbase的读请求流程

hbase读请求

Ⅰ从zk中获取regionserver的meta信息。

Ⅱ通过root表,根据meta信息找到对应的regioonserver位置信息

Ⅲ找到对应的regionserver,获取table的meta信息

Ⅳ通过table的meta信息,找到实际存储table的regionserver

Ⅴ客户端直接连接表所在的regionserver,获取数据

--注:为了让客户端找到包含特定主键的region,HBase提供了两张特殊的目录表,包含.root和.meta。root表用来查询所有meta表中的region位置。hbase的设计中只有一个root region,即root region从不进行拆分。从而保证类似于B+树的三层查找结构。第一层是ZK中包含root region的节点,第二层是从root中查找对应meta region的位置,第三层是从meta表中查找用户表对应的region的位置信息。

2、hbase的写请求过程?

hbase写请求过程

1、client先从缓存中定位region,如果没有缓存则访问zk,找到最先写入的region信息。

2、将更新写到WAL中。为了防止发生数据丢失。

3、将数据写入到memstore中

4、数据达到阈值(默认128m)会触发flush操作,生成多个storefile文件。

5、当storefile文件过多,会触发compact操作,合并文件,生成Hfile。

6、当HFile文件大于阈值(默认10g),会触发split操作,新拆分的两个region会被master分发到对应的两个regionserver上。

-----------------------------------------------------------------------------------------------------------------------------------------------

注:0.96以上版本采用双层架构,删除了root表,只使用meta定位数据。meta表的一个region以12m来计算,可以定位16T的行键范围。如果1个行键范围包含10条数据,则有160T的数据,所以不需要root表。

你可能感兴趣的:(hbase读写请求流程详解)