关系型数据库与nosql数据库的比较

传统的关系型数据库如oracle、mysql在过去很长一段时间内占据了数据库领域的统治地位,随着互联网以及移动互联网的爆发,近年开始流行的nosql以及newsql的崛起似乎撼动了他们的地位。

社区讨论中常看到nosql数据库(如mongodb、redis之类)比关系型数据库快的说法,我尝试分析一下。

关系型数据库在进行数据库建模的时候,通常是遵循三大范式,根据数据本身之间的关系进行建模,如用户-订单这样一个简单的关系,在关系型数据库中,建模可能如下:

用户表

user_id    user_name

订单表

order_id    user_id    item_id   item_count

商品表

item_id    item_name    item_price

这样的表结构设计,在查询用户的所有订单时,需要聚合三张表的数据(join),由于数据库中的数据是按照表的不同顺序存储的,所以在关系型数据库中聚合数据意味着更多的磁盘扫描。

nosql数据库是面向聚合的,是no schema的,更多的从查询场景出发,例如,已知有获取用户所有订单这样的查询,将用户订单作为数据的一个聚合,结构如下:

{user_id : @user_id,user_name:@user_name,

    orders :[

                {order_id :@order_id,

                               items:[

                                        {item_id:@item_id,item_name:@item_name,item_price:@item_price,item_count:item_count}

                                        ]

                }

                ]

}

这种结构在查询用户所有订单的时候,只有一条数据库记录,在大部分nosql数据库中,同一条数据库记录是保存在磁盘中连续的块中的(不同于oracle中的行链接、行迁移机制),这也就意味着更少的磁盘扫描,但同时造成了数据的冗余。

大部分nosql数据库都是分布式的,根据分布式中的CAP理论,最多只能保证一致性、可用性、分区容错性中的两个,出现了最终一致性等说法。

nosql数据库又分为k-v,memory,document,big-table,graph几种,不一一细说。

nosql数据库并不是普适的,传统的关系型数据库的地位不可替代。

推荐阅读:nosql distilled

你可能感兴趣的:(关系型数据库与nosql数据库的比较)