hash算法

一、hash算法的一些基础知识

概念:hash算法根据一个数的值通过hash函数来确定其存储的位置,尽可能的达到存储和查找都能是O(1)的复杂度

hash算法_第1张图片

计算hash函数的几种方法:

1、直接取值法

取关键数的某个线性函数作为存储位置

2、取模寻址法

将关键值除以一个固定数,获取余数作为存储位置


但是这两种方法都存在一定的冲突问题,所以需要一些解决冲突的方法:

1、开放寻址法

当存在冲突时,根据获取到的存储位置,顺序寻找不超过hash表长度的存储位置

2、拉链法

将存在冲突的关键值,存储的一个链表中,来解决冲突

hash算法_第2张图片

二、hash算法应用场景

1、请求的负载均衡

根据客户端的ip地址或者路径或者参数,获取到hash值,分配到hash值对应的服务器中

2、分布式存储

使用hash算法计算出要存储数据的位置节点

三、普通hash带来的问题

使用普通hash时,当进行扩缩容时,关键值对应的请求或者存储的路径会发生变化,产生一些不必要的问题,因此我们可以使用hash环来尽量的减少出现的问题。

四、hash环

将服务器节点或者存储数据的节点映射到一个hash环中,当要请求数据或者存储数据,通过计算的到的hash值顺时针去查找hash环中服务器的位置

hash算法_第3张图片

假设此时服务器节点2,挂了之后,那么hash值1的请求路径发生了变化,顺时针查找到服务器节点1,而hash值2和hash值3的请求路径不发生变化


此时,也存在一个问题,当hash环中的服务器较少时,而服务器在hash环中位置分配不均匀时,就会发生一个服务器要处理大量请求的情况,例如:
hash算法_第4张图片

面对这种情况,我们可以使用虚拟的节点映射真正的服务器的位置,来尽可能的达到均匀的映射服务器的位置。

5)]

面对这种情况,我们可以使用虚拟的节点映射真正的服务器的位置,来尽可能的达到均匀的映射服务器的位置。

hash算法_第5张图片

你可能感兴趣的:(理论知识,hash)