3.分类:

3.1(最常见的键值存储)

a.临时性的:保存在内存中,可以进行快速的保存和读取操作, 数据有可能丢失

b.永久性:在磁盘上保存数据,可以进行快读的读写(没有内存中快),数据不会丢失

c.两者兼具:内存和硬盘同时保存数据,可以进行快速的读写操作, 硬盘上有数据不会丢失, 适合处理数组类型的数据

 

3.2(面向文档的(MongoDB,CouchDB))

a.存储方式:没有表结构,类似于jason。

b.可以进行复杂的查询条件

 

3.3(面向列的数据库Hbase)

a.关系型数据库是面向行的,对少量行进读写,而面向列的数据库,对大量行少数列进行读写,对所有特定的列进行通时更新。

b.高拓展性(特别是写入)

c.应用十分困难

d.对大量数据更新和查询有优势

 

 

3.1详解:memcached(临时性键值存储):

a.高速的响应

b.作为高速缓存使用(通过关系型数据库建立索引也可以获得高速响应):在处理大量的数据时候,他可以当作关系型数据库中间量,充当缓存来获得高速的响应速度,通过快速的读取里面的数据来弥补可能丢掉数据的可能性。

c.存储方式:散列表方式存储在内

d.通信:简单的文本协议,对数据的操作就是类似于保存和键值相对应的值,只能对字符类型数据进行操作(其它格式的数据可以利用jason来处理进行格式化,这样就可以跨平台传输)。

e.对数据操作简单,

f.memcached增加服务器时的经典算法:一致性散列:

g.缺点:因为他的数据时在内存中的,1.所以容易造成数据的丢失。解决方法:只用它来解决数据的拷贝,而把原始的数据放在安全的地方。2.web服务用的多(国外的网站基本都会引入memcached),

 

两种情况下它的威力大:1.有些网页需要执行一些好使的SQL文,响应很慢,有些网页访问率高,负载大,(关系型数据库解决这种问题的方法:增加临时表,批处理)

 

Tokyo Tyrant(永久性键值存储,是存储在硬盘上的)

1.优势:他的数据虽然是存储在银盘上的,但是它数据的操作硬盘的io处理无关,可以实现高速的访问(而且还不用担心数据会丢失)

2.它还有一个优点就是它能根据数据的类型选着存储的结构,所以它在查询时就有了自己优势,不仅能像关系型数据库范围查询还能进行key—value进行完全一致条件的查询。

3.数据类型:a.缓存数据库 ,以key-value形式来存储 b.

4.它把复制作为作为一项标准的功能

5.缺点:安装难度大(ruby)

 

Redis(临时性/持久性键值存储)

1.快速处理数组形式的数据

2.通过虚拟内存可以和操作系统进行互换结构,通过内存中的保存的所有数据的键来实现高效的处理。

3.引用;github, 微笑直播的观众人数统计

4,.应用:时间线形式的web应用

5.适合处理时间序列的数据

 

MongoDB(高性能和可扩展)

1.面向文档

2.关系型数据库的结构是事先定义好的,碰到不需要改变表结构的的信息存储的时候,还是挺可观的,但是如果在后来的处理中碰到了要改变表结构才能存储的数据,那时候,处理起来就比较麻烦了。

3.普通的关系型数据库实现(反复的表结构变换),可以通过json把数据进行系列化,然后保存到表格中,然后读取数据的时候反系列化,然后筛选出自己需要的数据也可以解决,但是这下来时间开销就会增大。

3。不需要定义表结构的数据库,可以根据KEY值可以进行关系数据库那样的查询亦可以添加索引。

4.数据的保存形式:BSON(JSON的二进制产物)把值和键进行制关联。

5,他不能进行jion查询,但是它可以通过嵌套达到同样的效果。

6.优势:没有表结构,可以灵活的指定查询条件。比如正则表达式查询或者对特定数组元素的查询都可以

7.实例应用:问卷调查数据的保存

 

几种基本的NoSQL的数据库的性能验证:

 

 

 

NoSQL化的关系型数据库

1.将MySQL数据库NoSQL化的HandlerSocket的方法:

 

特征:

1.高速地完成单纯的数据的插入和读取处理

2.可以使用SQL和Handlersocket对同一数据访问

3.可以通过协议独立访问MySQL的数据

4.不支持事物处理

 

handlesocket机构图:

 

它可以直接访问Handler的接口,但是一般的都要通过SQL层来实现访问(免去了解析SQL和锁表和解锁的处理)

 

不足:只能支持带有索引的查询数据,

 

总结:插入数据部分:比一般的关系型数据库快,虽然没memcached快。读取速度可以和Redis相仿

 

 

Berkeley DB

1.存储形式:key-多value形式

2.不支持网络访问,程序是通过进程内的API访问的

3.架构及其简单,

4,介于内存数据库和关系数据库之间

选用四种算法:B+数算法:平衡的二叉树,按其关键字有序存储,和HASH算法

1.访问速度快。

2.节约硬盘空间

3.大多数系统都用它,支持多进程和事物

4.有XMl接口,可以存储XML数据

5,兼容一些老的Unix数据库(DBM)