超详细梳理HBase核心知识点(下)【建议收藏】

上一篇:超详细梳理HBase核心知识点(上)–建议收藏

本篇主要介绍:
① Region的拆分和合并,及相关经验总结。
② Region自动均衡
③ HFile的合并(compaction)
④ BlockCache 和 BloomFilter

一、Region拆分与合并

一个Region就是一个表 的一段Rowkey的数据集合。当Region太大的时候HBase会拆分它。这么做的原因是:当某个Region太大的时候读取效率太低了。Region的拆分分为自动拆分和手动拆分。自动拆分可以采用不同的策略。

1.1 Region自动拆分

Hbase的Region自动拆分有几种策略。这里简单介绍一下概念,拆分策略的具体内容读者可以下去自行深入研究。

  • ConstantSizeRegionSplitPolicy

早在0.94版本的时候HBase只有一种拆分策略,这个策 略就是按照固定大小来拆分Region。它唯一用到的参数是:

hbase.hregion.max.filesize: region最大大小,默认10GB

当单个Region大小超过了10GB,就会被HBase拆分成为2个Region。

  • IncreasingToUpperBoundRegionSplitPolicy(默认)

0.94版本之后,有了IncreasingToUpperBoundRegionSplitPolicy 策略。这种策略从名字上就可以看出是限制不

你可能感兴趣的:(HBase全方位实战,hbase,big,data,数据库)