如何一文读懂分布式数据库中CAP原理CAP+BASE

文章目录

  • 1.传统的ACID
    •    1.A(Atomicity)原子性
    •    2.C(Consistency)一致性
    •    3.I(Isolation)独立性
    •    4.D(Durability)持久性
  • 2.分布式的CAP(CAP只能三选二)
    •    1.C(Consistency)强一致性
    •    2.A(Availability)可用性
    •    3.P(Partition tolerance)分区容错性
  • 4.BASE是什么
  • 5.分布式+集群简介

1.传统的ACID

   1.A(Atomicity)原子性

       原子性就是说事务里的所有操作要么全部做完,要么都不做,事物成功的条件是事务里的所有操作都成功,只要有一个操作失败,整个事务就失败,需要回滚。比如银行转账,从A账户转100元至B账户,分为两个步骤:1)从A账户取100元;2)存入100元至B账户。这两步要么一起完成,要么一起不完成,如果只完成第一步,第二步失败,钱会莫名其妙少了100元。

   2.C(Consistency)一致性

       一致性就是说数据库要一直处于一致的状态,事务的运行前后数据符合逻辑运算,如转账操作前A:800,B:200;操作后A:600,B:400。

   3.I(Isolation)独立性

       所谓的独立性是指并发的事物之间不会互相影响,如果一个事务要访问的数据正在被另外一个事务修改,只要另外一个事务未提交,它所访问的数据就不受未提交事务的影响。比如有个交易是从A账户转100元至B账户,在这个交易还未完成的情况下,如果此时B查询自己的账户,是看不到新增加的100元的。

   4.D(Durability)持久性

       持久性是指一旦事务提交后,他所做的修改将会永久的保存在数据库上,即使出现宕机也不会丢失。

2.分布式的CAP(CAP只能三选二)

   1.C(Consistency)强一致性

       指的是所有节点在同一时间的数据完全一致,对于关系型数据库,要求更新过的数据能立刻被后续的访问都能看到,这是强一致性。例如:一人点赞,其他访问者可以实时知道点赞数的增加,在高并发分布式之下强一致性通常被无奈舍弃,而实现弱一致性

   2.A(Availability)可用性

       可用性指服务一直可用,而且是正常响应时间。不管什么时候访问,都可以正常的获取数据值。而不会出现问题。好的可用性主要是指系统能够很好的为用户服务,不出现用户操作失败或者访问超时等用户体验不好的情况。例如:系统不可崩溃,利用缓存技术可降低数据库压力

   3.P(Partition tolerance)分区容错性

       分区容错的意思是区间通信可能失败。比如,一台服务器放在中国,另一台服务器放在美国,这就是两个区,它们之间的通信可能会失败。在分布式架构中,由于当前的网络硬件肯定会出现延迟丢包等问题,所以分区容错性是必须实现的。

CAP理论的核心是:一个分布式系统不可能同时很好地满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。因此,根据CAP原理将NoSQL数据库分成了满足CA原则或CP原则或AP原则三大类:

  • CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。(传统Oracle数据库)
  • CP - 满足一致性,分区容错性的系统,通常性能不是特别高。(Redis、Mongodb)
  • AP - 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。(大多数网站架构的选择)

4.BASE是什么

BASE就是为了解决关系数据库强一致性引起的问题而引起的可用性降低而提出的解决方案。
它是下面三个词的缩写

  • 基本可用(Basically Available)
  • 软状态(Soft state)
  • 最终一致(Eventually consistent)
    它的思想是通过让系统放松对某一时刻数据一致性的要求来换取系统整体伸缩性和性能上改观,这么说的缘由是在大型系统中,往往存在由于地域分布和极高性能的要求,不可能采用分布式事务来完成这些指标,要想获得这些指标,我们必须采用另外一种方式来完成,这里BASE就是解决这个问题的办法。

5.分布式+集群简介

分布式系统(distributed system)
   由多台计算机和通信的软件组件通过计算机网络连接(本地网络或局域网)组成。分布式系统是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。分布式系统可以应用在不同的平台上如:Pc、工作站、局域网广域网上等。

简单来说:

  • 分布式:不同的多台服务器上面部署不同的服务模块(工程),他们之间通过Rpc/Rmi之间通信和调用,对外提供服务和组内协作。(一份工作分成不同的四个小任务,分别交给四个人干)
  • 集群:不同的多台服务器上面部署相同的服务模块,通过分布式调度软件进行统一的负载均衡调度,对外提供服务和访问。(一份工作四个人同时干)

你可能感兴趣的:(NoSQL-Redis数据库)