HBase了解遗留待确认问题

问题
1. 其介绍的HFile结构中知道DataBlock和IndexBlock是一个文件中不同区域的。但是因为HDFS是面向流的,上面说的StoreFile是不断增长直到会导致定期split是如何实现的?
因为多个regin共享一个HLOG。当数据在内存(MemStore)和HLOG,MemStore达到阀值输出StoreFile。是所有的regin都输出么?如果这样,某些StoreFile很小是否会导致小文件很多HFile,才会又后面的compact?

自动compact(相同的键文件合并)应该是多个版本的MemStore格式化的结果导致相同的key分布很多个Store里边,进行Compact有助于查询?(最新的store中说其已经是合并过了,则就结束,否则要往前遍历直至找到合并过的记录或者文件查询完)。

2.  是否按照键的hash值来对数据选择Table的Regin?



3.  HDFS的特点,第一份BLOCK优先本地,然后是同机架,后面是远机架。因此读取文件速度也是有保证的(参加文章 HBase 数据文件在HDFS上的存储

你可能感兴趣的:(hbase,table,存储)