分布式理论与场景浅谈

基本理论

FLP/CAP/BASE/ACID

FLP不可能原理
在异步模型中,分布式系统中只要有一个进程不可用,就可能无法达成整体的共识.
在工程中的分布式系统实现中, 通过解决活锁等问题, 来使系统在一定时间内可以达到一致性.

上图里CP还少一个常见的: zookeeper

ACID对应刚性事务, 追求强一致性, 以MySql等RDBMS为代表;
BASE对应柔性事务, 牺牲强一致性来换取一定的可用性, 过种中会存在中间状态, 但会达到最终一致性, 以Spanner等分布式系统为代表.

CAP理论
分布式系统中C、A、P三者不能同时满足,最多只能满足其中两个.
通常来说, 使用网络通信的分布式系统,无法舍弃P性质, 会根据选择的不同去达到AP或CP.
不过三者选二的情况很容易发生误解,

  1. 分区很少发生,那么在系统不存在分区的情况下没什么理由牺牲C或A。
  2. A与C的取舍可以在同一系统内反复发生, A与C的程度都有很多的层次, 比如可用性的变化和一致性等级的变化等

所以实际使用中可根据应用场景进行适当取舍

以zookeeper为例, 它的CAP分别为:

  • C: 最终一致性, 一般十几秒内可以Sync到各个节点
  • A: 数据总是可用, 超过一半的节点的数据是最新的, 但想保证读到最新的数据需手动调用Sync函数
  • P: 一是节点多了会导致写数据时同步延时非常大, 二是节点多了Leader选举非常耗时, 可引入 observer节点缓解

zookeeper是一个CP系统, 因为在任何时刻对它的访问请求能得到一致的数据结果, 但不保证每次服务请求的可用性(比如发生网络分区时), 所以其实它做服务发现并不如AP的eureka合适

分布式事务

业务上实现最终一致性有几种模式

  • 可靠事件模式, MQ配合本地或外部事件表
  • 业务补偿模式, 用于业务/技术异常时补偿
  • TCC模式, 应用层的2PC
  • Saga

最近阿里还开源了Fescar.

分布式事务的需求, 主要是因为数据库的水平拆分以及应用SOA化, 服务调用中会使用到跨库事务.
从某种角度来说, 只有拥有复杂业务(如金融), 全球性服务(如谷歌), 和拥有大数据量(分库)的公司才会有这种需求的场景.

常见的一致性协议

  • ZAB
  • Raft
  • Viewstamped Replication
  • Quorum
  • Gossip

本质都是Paxos协议的变种

常见的类Paxos分布式事务实现

  • MySQL的XA
  • TCC, Try-Confirm-Cancel, 有开源实现

很好的一篇
核心金融场景分布式事务

分布式锁

通常的选择

  • 单机Redis或官方分布式锁RedLock
  • Zookeeper

可根据不同的业务场景来使用, 如果对锁的要求不是很高的话, 比如1%的重复加锁可接受, 使用单机Redis最简单方便

分布式的实际业务场景

  • 微信 PaxosStore
  • 阿里 AliSQL X-Cluster
  • TiDB (multi raft group)
  • 谷歌Spanner等

你可能感兴趣的:(分布式)