大数据学习 ------- Hbase的基本概念

       首先在了解hbase之前需要进行一个区分,主要hive和hbase的区别? hive是数据仓库的工具,hive不是真正保存数据的。而对hdfs上的数据进行了映射。而hbase 是一个数据库 数据是由hbase来进行保存的

 

hive的主要目的是为了分析数据, hbase的目的是保存海量的数据

 

Hbase的来源:

之前在讲解hadoop的时候 hadoop的诞生源自于谷歌的三大论文:

GFS              HDFS

MapReduce       MapReduce 

Bigtable          Hbase  (hadoop base )

 

BigTable 背景:爬取网页,都是非结构化的数据 如何有效的存储? bigtable的设计思想为

多行三列的大表        

Hbase 正是继承了这种思想,开发hbase数据库,是一个面向列,可扩展的,非关系型数据库(no sql 数据库)

非关系型的数据库:

               Mongodb: c++编写 基于文档的方式存储,存储格式都是json格式

               Redis:基于内存的,key-value的形式 出现的。通过key可以快速的找到value

关系型数据库:

               MySQL

               Oracle   

               Sqlserver

Hbases的解决的问题与诞生背景:

               互联网的公司数据一般都是爬取过来的,大量的数据如何存储,并且都是非结构化,传统的数据库不能满足需求了

交通部门的探头,每天拍照的内容,都是图像,不能保存在关系型数据库中

总结: hbase适合存储海量数据,能够将查询速度范围控制在秒的级别,并且hbase是面向列存储的

你可能感兴趣的:(文档,hive,HBASE)