HBase总结

1、HBase的定义:面向列、可伸缩

HBase数据库与关系型数据库的区别

为什么会出现HBase?

什么场景下使用HBase?

2、HBase核心概念:namespace table columnfamily rowkey qualifier timestamp cell

3、HBase shell基本语法:创建表 扫描 清空 删除

4、HBase架构:Master Regionserver  region zookeeper 

5、Hadoop集群运行脚本之间的关系

6、HBase的读写流程

7、HBase的javaAPI:增删改查

查:除了前缀匹配的过滤器、还有很多其他的过滤器

8、HBase与MapReduce整合,HBase与Hive整合

使用命令把文件导入HBase

9、HBase底层的文件格式:HFile--DataBlock key-value 为了方便我们去设计表

10、表的设计:

1)应用场景(数据量大、场景简单、查询条件固定化)

2)预分region 要进行测试

3)rowkey的设计 长度原则(最好是8的倍数)、唯一、分散(hash算法)

11、常用命令:

tools 大合并 小合并

table属性 压缩格式 学会编译开源软件  压缩格式之间的区别

文件格式:列式的文件格式

blockcache in memory=false的作用

你可能感兴趣的:(HBase总结)