大数据存储复习

文章目录

  • 第一、二章
    • 1 . 大数据的特点
    • 2. 大数据需要怎样的存储系统
    • 3. 基于“中间件”的客户/服务器的体系结构(举例说明)
    • 4. 关系型分布式数据库系统的模式结构
    • 5. 分布式数据库系统的数据透明性(定义,举例)
    • 6. 多数据库系统和分布式数据库系统的区别与联系
  • 第三章
    • (1)HBase解决了HDFS的哪些问题?具有哪些特点?
    • (2)HBase数据库中region的含义及其特性。同一个表不同行的数据可以存放在不同的服务器,同一个表相同行的数据也可以存放在不同的服务器。这句话如何理解?
    • (3)HBase增删改查的真正操作内容是什么?
    • (4)KeyValue被持久化到HDFS的过程
    • (5)HBase的读写流程
  • 第四章 HBase Shell 语句
    • (1)建表
    • (2)向表中插入一个数值{键值,列族,列,值,时间戳} • (3)修改列族的属性
    • (4)用get查询信息
    • (5)用scan查询信息
    • (6)用filter查询信息(联合多个过滤器)
  • 第五章 HBase的索引结构
    • (1)跳跃表
      • 1.时间复杂度
      • 2.查找和插入的伪代码(流程)
    • (2)LSM树 • 结构
      • 1.什么是compaction?分为哪两种类型
      • 2.为什么说LSM树是一种写入友好的数据结构?
    • (3)布隆过滤器
      • 1.解决的问题类型
      • 2.构造方法和查询过程
  • 第七章 分布式事务管理
    • (1)嵌套事务及依赖性(提交依赖性和废弃依赖性)
    • (2)分布式数据库的一致性级别的内容,并可举例说明
    • (3)分布式数据库的CAP理论和BASE理论的内容
    • (4)分布式事务的实现(两阶段提交协议流程,存在的问题,解决的方法)
    • (5)HBase的一致性
    • (6)HBase的隔离性(写写并发,读写并发)
    • (7)HBase的原子性(行级事务)
    • (8)HBase的持久性(不要求)

第一、二章

1 . 大数据的特点

大数据存储复习_第1张图片

2. 大数据需要怎样的存储系统

大数据存储复习_第2张图片

3. 基于“中间件”的客户/服务器的体系结构(举例说明)

大数据存储复习_第3张图片
在这里插入图片描述

4. 关系型分布式数据库系统的模式结构

大数据存储复习_第4张图片

5. 分布式数据库系统的数据透明性(定义,举例)

定义:
大数据存储复习_第5张图片
举例:
大数据存储复习_第6张图片
大数据存储复习_第7张图片
大数据存储复习_第8张图片
大数据存储复习_第9张图片
大数据存储复习_第10张图片

6. 多数据库系统和分布式数据库系统的区别与联系

大数据存储复习_第11张图片
大数据存储复习_第12张图片

第三章

(1)HBase解决了HDFS的哪些问题?具有哪些特点?

大数据存储复习_第13张图片
大数据存储复习_第14张图片

(2)HBase数据库中region的含义及其特性。同一个表不同行的数据可以存放在不同的服务器,同一个表相同行的数据也可以存放在不同的服务器。这句话如何理解?

含义
大数据存储复习_第15张图片
特性大数据存储复习_第16张图片大数据存储复习_第17张图片
水平分片

大数据存储复习_第18张图片
垂直分片
大数据存储复习_第19张图片

(3)HBase增删改查的真正操作内容是什么?

大数据存储复习_第20张图片
大数据存储复习_第21张图片

(4)KeyValue被持久化到HDFS的过程

大数据存储复习_第22张图片

(5)HBase的读写流程

读取:
大数据存储复习_第23张图片
写入
大数据存储复习_第24张图片

第四章 HBase Shell 语句

(1)建表

(2)向表中插入一个数值{键值,列族,列,值,时间戳} • (3)修改列族的属性

(4)用get查询信息

(5)用scan查询信息

(6)用filter查询信息(联合多个过滤器)

第五章 HBase的索引结构

(1)跳跃表

1.时间复杂度

大数据存储复习_第25张图片
查询时间复杂度
大数据存储复习_第26张图片

2.查找和插入的伪代码(流程)

查找
大数据存储复习_第27张图片
插入
大数据存储复习_第28张图片

(2)LSM树 • 结构

1.什么是compaction?分为哪两种类型

在这里插入图片描述

大数据存储复习_第29张图片

2.为什么说LSM树是一种写入友好的数据结构?

大数据存储复习_第30张图片

(3)布隆过滤器

1.解决的问题类型

在这里插入图片描述

2.构造方法和查询过程

大数据存储复习_第31张图片
大数据存储复习_第32张图片

第七章 分布式事务管理

(1)嵌套事务及依赖性(提交依赖性和废弃依赖性)

大数据存储复习_第33张图片
大数据存储复习_第34张图片

(2)分布式数据库的一致性级别的内容,并可举例说明

大数据存储复习_第35张图片
举例
大数据存储复习_第36张图片

(3)分布式数据库的CAP理论和BASE理论的内容

大数据存储复习_第37张图片
大数据存储复习_第38张图片
大数据存储复习_第39张图片
BASE理论
大数据存储复习_第40张图片
在这里插入图片描述
大数据存储复习_第41张图片

(4)分布式事务的实现(两阶段提交协议流程,存在的问题,解决的方法)

大数据存储复习_第42张图片
存在的问题
大数据存储复习_第43张图片
解决办法
大数据存储复习_第44张图片
大数据存储复习_第45张图片

(5)HBase的一致性

在这里插入图片描述
大数据存储复习_第46张图片

(6)HBase的隔离性(写写并发,读写并发)

写写并发
大数据存储复习_第47张图片
读写并发
大数据存储复习_第48张图片

(7)HBase的原子性(行级事务)

大数据存储复习_第49张图片

(8)HBase的持久性(不要求)

大数据存储复习_第50张图片
大数据存储复习_第51张图片

你可能感兴趣的:(HBase,hbase,大数据,分布式存储)