4.Hbase工作机制

在hbase中

1、一个表会按照行(看数据量)划分为若干个region

每一个region分配给一台特定的regionserver管理

2、每一个region内部还要依据列族划分为若干个HStore

3、每个HStore中的数据会落地到若干个HFILE文件中


4、region体积会随着数据插入而不断增长,到一定阈值后会分裂

5、随着region的分裂,一台regionserver上管理的region会越来越多

6、HMASTER会根据regionserver上管理的region数做负载均衡


7、region中的数据拥有一个内存缓存:memstore,数据的访问优先在memstore中进行

8、memstore中的数据因为空间有限,所以需要定期flush到文件storefile中,每次flush都是生成新的storefile

9、storefile的数量随着时间也会不断增加,regionserver会定期将大量storefile进行合并(merge)


你可能感兴趣的:(it)