大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理

文章目录

        • 第8章:HBase的应用场景及架构原理
          • HBase能做什么
          • HBase在实际业务场景中的应用
          • HBase的特点
          • HBase数据模型并举例说明
          • HBase表结构模型并举例说明

第8章:HBase的应用场景及架构原理

HBase能做什么
  • 海量数据存储
    • 海量存储与”关系型“数据库对比:海量-HBase一个表能够存储上百亿的行上百万的列;关系型数据库表里一般列设计不超过30个字段,行一般不超过5百万,否则要分表存储。
  • 准实时查询
    • 海量数据能够准实时查询得到。
  • HBase是针对海量数据,只有针对海量数据时才会发挥它的优势。如果只有上百万行的话,普通的关系型数据库就可以使用。
HBase在实际业务场景中的应用
  • 交通

    • 例如GPS信息、路口摄像头数据
  • 金融

    • 交易信息:取款、贷款信息……
  • 电商

    • 淘宝、京东……
  • 移动电话信息

    • 通话记录……
HBase的特点

1.容量大
在这里插入图片描述
2.面向列
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第1张图片3.多版本
在这里插入图片描述4.稀疏性
在这里插入图片描述
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第2张图片(左边:关系型数据库,确定了列数之后,每一行的数据相应列没有值必须赋空对象。
右边:列式存储。不需要确定列数,每一行数据需要多少列就存储多少列)

5.扩展性
底层依赖hdfs,磁盘不够的时候,可以直接添加datanode节点就好了。不需要像关系型数据库那样还要做数据迁移。

6.高可靠性
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第3张图片高性能
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第4张图片

HBase数据模型并举例说明

大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第5张图片举例:(面向列存储的表模型)
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第6张图片
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第7张图片
(在设计表的时候,不需要设计有几个列,因为列数是没有上线、动态增加的。只需要设计有多少”列簇“就好了)
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第8张图片(一张表数据很多时,会划分为多个region。会自动切分、也可以人工干预。)
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第9张图片(但是HBase不支持条件查询,只支持row-key查询。所以关系型数据库的优势就在于复杂的条件查询。)

HBase表结构模型并举例说明

HBase表结构设计
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第10张图片设计只需要指定列簇。列根据数据情况动态增加
举例:
大数据实战项目之新闻话题分析 学习笔记(七)——HBase的应用场景及架构原理_第11张图片


说明:
此系列文章为网课学习时所记录的笔记,希望给同为小白的学习者贡献一点帮助吧,如有理解错误之处,还请大佬指出。学习不就是不断纠错不断成长的过程嘛~

你可能感兴趣的:(技术学习)