编程 || CAP原理

现在的系统基本都是分布式的。
但其实分布式这个事儿日常能用的就是个分布式锁,控制好竞争状态即可。其他的分布式数据库、缓存、消息队列啥的,用中间件都已经给你封装好了。封装好的东西干嘛还要去管它,我还要去写二进制和汇编吗?

了解CAP什么的,就像是做一个思维体操。好的就来体操一下吧。

CAP是Consitency、Availabiltiy、Partition tolerance的缩写。
Consistency是一致性,指每个节点的数据都一致。
Availability是可用性,指永远会提供服务。
Partition tolerance是分区容忍性,指出现分区错误时也能正常运作。比如一个原本所有服务都在一个大区,现在分成了两个小区,互不连通。

CAP就是说,这三者只能满足其二,不能全都满足。不过,既然是理论,我们要知道它无非是一种概括性的总结。哪天有更好的理论替代的也是有可能的,毕竟它是如此的不简洁不直观。

既然只能三选二,如何去选择呢?
在各个场景中,我们可以先抓一个必须要的,在从另外两个中去取舍。

比如银行转账业务,那C是必须的,不一致就一定出错。那接下来就是A和P的选择,我们可反过来不要A或不要P会发生什么。不要P就不是分布之系统了,确实剩下的这一台机器只要还活着,就能提供服务,但这违背了分布式的初衷。不要A的话就意味着请求会一直阻塞,直到分布式系统完成了数据的同步。总的来看,不要P是一点好处都没有,不要A还有机会挽回。所以从收益最大化角度,tradeoff掉那个A,所以最终是个CP服务。

对于大部分分布式系统,P都是必须的。

有哪些系统A是必须的,比如短视频服务,分区1提供系列1,分区2提供系列2,有啥问题呢,但是刷不出来可就不行了吧。那剩下就是CP之间取舍,P又是分布式系统的根本。所以最终是AP。

再回头看来,其实都是AP和CP之间做取舍。甚至CAP原则可以再描述成:当发生P情况时,AC如何选择。即当发生节点双方一时联系不上对方时,是保证一致性,还是保证可用性。

还有一个要注意的是,CAP的tradeoff其实是在考虑出问题的情况。正常运行的情况下,分布式系统既能一致又能可用。

你可能感兴趣的:(编程 || CAP原理)