redis集群哈希一致性算法和哈希槽

 

先说普通哈希算法:让数据id的哈希值和redis集群的个数取模,得到的是几这个数据就存放在哪个redis服务器上

普通哈希算法存在数据迁移的问题,即当集群数量增加或减少,原来数据的key与Redis序号对应的集群关系会改变,可能第一次数据1落在0号Redis上,第二次数据1就落在了2号机器上。这样就会出现”缓存穿透

 

一致性哈希算法

一致性哈希算法首先弄了一个虚拟环,环上有n个节点,比如2的32次方个节点。这个环仅仅是逻辑上的一个算法。它先用redis机器序号+redis的ip生成唯一的一个哈希值。用redis的哈希值取模2的32次方,这样会生产一个点,落在这个环上的某一个点,这个点也叫做redis1的起始节点。同理算出redis2的起始节点。有2给其实节点后就会勾勒出2给redis缓存的数据范围。

现在我们把要存入对象的hash值算出来,用这个hash值取模2的32次方。算出的点要么会落在redis1的管辖范围中,要么会落在redis2的管辖范围中。然后redis1机器缓存对应的kv,redis2机器缓存对应的kv

一致性哈希算法相比普通哈希大大减少了数据迁移问题,假如在redis1和redis2中间新增了一个redis3,只需要把1-3中间的数据进行数据迁移。

但一致性哈希算法会造成数据倾斜,即很可能少量redis上有大量的缓存, 大量的redis上有少量的缓存

 

哈希槽解决数据倾斜问题

哈希槽的思想是对每台redis都进行逻辑上的分片,存储原理和一致性哈希算法类似,只不过把环变成了槽。可允许自定义设置槽数,最多可有16384个,当槽足够多,每个槽的数据会分布的更加均匀。解决了倾斜的问题

 

我们也可以自己实现,在逻辑上给每个redis分割成多个虚拟节点node,进行存储数据~

你可能感兴趣的:([Redis])