什么是数据库的因果一致性

不同于其他问题,讨论因果一致性,不得不讨论分区,因为因果一致性只会发生在分区(也称为分片)的分布式数据库中。

分区后,每个节点并不会包含全部数据(考虑存储开销)。然而不同的节点是独立运行的,全局写入顺序是无法保障的。

最经典的,如果用户A 在节点1 提交一个问题,用户B 在节点2 提交了回答。因为异地节点同步延迟等原因,发起查询的用户可能会先看到回答,再看到问题,显然,这是不符合我们对事务的认知和理解逻辑的。

为了防止这种异常,需要另一种一致性保证:因果一致性。 即如果一系列写入按某个逻辑顺序发生(时间上其实是天然的),那么任何人读取这些写入时,会看见它们以正确的逻辑顺序出现(但在分片数据的情况下不一定做到)。

因此,这个问题在逻辑上是简单的,但是实际放到分区的时候就很难保障。

一种方案是应用保证将问题和对应的回答写入相同的分区。但是这会存在许多问题,一是,并不是所有的数据都能如此轻易地判断因果依赖关系,这从源头上有天然的障碍;二是跨域写会可能会增加传输成本或者间接降低用户体验。

你可能感兴趣的:(DB,数据库)