一致性哈希算法分区

目录

  • 1. 哈希算法分区的缺点
  • 2. 一致性哈希算法
    • 2.1 一致性哈希环的概念
    • 2.2 将服务器映射到Hash环
    • 2.3 数据落入服务器规则
    • 2.4 一致性哈希算法分区优缺点
      • 2.4.1 优点
      • 2.4.2 缺点

1. 哈希算法分区的缺点

虽然哈希算法能做到数据分区,能起到负载均衡+分而治之的作用

缺点:每次扩容缩容,数据和服务器的映射关系都会发生变化,需要将所有数据进行再平衡

2. 一致性哈希算法

一致性哈希算法解决了哈希算法的问题。当服务器的数量发生变化,尽量只对部分服务器产生影响

2.1 一致性哈希环的概念

一致性Hash算法是对 2 32 2^{32} 232取模,会产生0 ~ 2 32 − 1 2^{32}-1 2321的值,这些值构成一个hash空间。将它们顺序排列且首尾相连,构成一个环形空间(Hash环)
一致性哈希算法分区_第1张图片

2.2 将服务器映射到Hash环

将服务器的IP或主机名作为关键字进行哈希取模,这样每台机器在哈希环上就有一个位置。假如4个服务器节点A、B、C、D,使用IP地址求哈希再取模,再Hash环上的位置如下:

一致性哈希算法分区_第2张图片

2.3 数据落入服务器规则

对数据进行哈希取模,这样每台机器在哈希环上就有一个位置。从此位置沿环顺时针“行走”,遇到的第一服务器,就是数据储存目标服务器

假设有Object A、Object B、Object C、Object D四个数据对象,经过哈希取模计算后,在Hash环空间上的位置如下。根据一致性Hash算法分区,数据A会被定位到Node A上,B被定位到Node B上,C被定位到Node C上,D被定位到Node D上

一致性哈希算法分区_第3张图片

2.4 一致性哈希算法分区优缺点

2.4.1 优点

容错性:假设Node C宕机,Object A、B、D不会受到影响,只有Object C被重定位到Node D
一致性哈希算法分区_第4张图片
扩展性:例如增加一台服务器节点NodeX,X的位置在A和B之间,那受到影响的也就是A到X之间的数据,重新把A到X的数据录入到X上即可供正确读取数据
一致性哈希算法分区_第5张图片

2.4.2 缺点

一致性Hash算法在服务器节点太少时,容易因为节点分布不均匀而造成数据倾斜

一致性哈希算法分区_第6张图片

你可能感兴趣的:(#,数据结构和算法,一致性哈希分区,一致性hash分区,一致性哈希环,一致性hash环,一致性哈希算法)