Hbase

Hbase是一种NoSQL数据库(Key-Value键值对存储),这意味着它不像传统的RDBMS数据库那样支持SQL作为查询语言,因为必须通过key来查询。

Hbase适合大规模数据实时处理。HDFS(Hadoop的分布式存储组件)是Hbase运行的底层文件系统,HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储技术,支持大数据,那么为什么那么快和稳定呢?

稳定可靠是HDFS带来的,可伸缩是Hbase自身的列式结构带来的,那么那么大数据,高性能是怎么回事呢?

1、hbase会自动将数据分region,是分区的;这样你要查找的范围就会缩小

2、存储都是排好序的,可以通过一些算法快速查询到

3、各级缓存支持,布隆过滤器等技术支持

4、新增、修改数据时候,其实都是新增新的版本号的数据,而且是内存中进行,后续才会同步到磁盘中。

 

Hbase存储结构:(行键RowKey;列族ColumnFamily;列Column;单元格Cell;时间戳Time Stamp)

Hbase_第1张图片

 

 

缺点:

1、不强调数据之间的关系,数据与数据之间的关系是解耦的,查询必须要有key,用功能的单一性换来的大数据实时处理能力。

2、业务上处理效果其实不如分库分表的方案。优势是量大,适合作为NoSQl辅助工具使用。同一份数据按照key不同存储多份,也可以满足复杂的业务需求,但是应该很少有人这么做。

 

 

 

你可能感兴趣的:(杂记)