分布式概念:数据复制

数据复制是实现数据可靠性的关键方法。对数据进行备份,以提高数据的可用性和可靠性,而实现数据备份的关键技术就是“数据复制技术”。

可以保证存储在不同节点上的同一份数据是一致的。这样当一个节点故障后,可以从其他存储该数据的节点获取数据,避免数据丢失,进而提高了系统的可靠性。

主备数据库
主备数据库中的数据保持一致。

1.比较注重一致性,比如同步复制技术;

当用户请求更新数据时,主数据库必须要同步到备数据库之后才可给用户返回,即如果主数据库没有同步到备数据库,用户的更新操作会一直阻塞。这种方式保证了数据的强一致性,但牺牲了系统的可用性。
示例:读写分离
(1)有两个节点,分别作为主节点和备节点。
(2)两个节点均可接收用户读请求,然后将本节点的数据及时返回给用户。读请求响应快;
(3)如果是写请求,写操作必须由主节点进行,即使用户将写请求发送到备节点,备节点也会将该请求转发给主节点,响应比较慢。
场景:写操作响应慢,会影响用户体验,经常用于分布式数据库主备场景,或对数据一致性有严格要求的场合,比如金融、交易之类的场景。

2.注重可用性,比如异步复制技术;

当用户请求更新数据时,主数据库处理完请求后可直接给用户响应,而不必等待备数据库完成同步。保证了系统的可用性,但牺牲了数据的一致性。
主备数据库同步的流程:
(1)主数据库完成写操作后,可直接给用户回复执行成功,将写操作写入 binary log 中,binary log 中记录着主数据库执行的所有更新操作,以便备数据库获取更新信息。
(2)备数据库启动一个 IO 线程专门读取 binary log 中的内容然后写入 relay log 中。
(3)备数据库启动一个 SQL 线程会定时检查 relay log 里的内容,如发现有新内容则会立即在备数据库中执行,从而实现数据的一致。
场景:购物网站等面向实际用户

3.介于前两者之间的,比如半同步复制技术;

用户发出写请求后,主数据库会执行写操作,并给备数据库发送同步请求,但主数据库不用等待所有备数据库回复数据同步成功便可响应用户。
两种模式:
(1)当主数据库收到多个备数据库中的某一个回复数据同步成功后,便可给用户响应写操作完成;
(2)主数据库等超过一半节点(包括主数据库)回复数据更新成功后,再给用户响应写操作成功;

解决不一致情况
Raft 算法,主数据库等超过一半节点(包括主数据库)回复数据更新成功后,再给用户响应写操作成功。当有 Follower 节点的数据与 Leader 节点数据不一致时,采用强制复制策略来解决不一致情况
当产生冲突时,以 Leader 节点为准。Leader 节点上会对比与自己数据不一致的 Follower 节点所存储的信息,找到两者最后达成一致的地方,然后强制将这个地方之后的数据复制到该 Follower 节点上。


 

你可能感兴趣的:(分布式)