2021-06-09 散列【1】

?xml version="1.0" encoding="UTF-8"?

更优化的查找方案?

在前面的内容里,我们利用数据项之间的排列关系,将查找算法进行了提升(顺序and二分查找)。

如果数据已经排好序的话,用二分查找可以进一步降低算法复杂度

能不能进一步降低算法复杂度?

现在我们来构造一个新的数据结构,能使得查找算法的复杂度降为O(1),这种概念称为”散列“

散列

要能使得查找的次数降低到常数级别,我们对数据项所处的位置就必须有更多的先验知识,最好是拿到一个列表的数,经过一定的处理之后,把每个数据项都排好坑,输入参数之后,算出坑位,然后直接去这个位置看看数据项是否存在

即由数据项的值来确定其存放位置

实现这个想法可以使用散列数据结构:

1.散列表(hash table )是一种数据集,其中每一个存储位置,称为槽(slot),可以用来保存数据项,每个槽有一个唯一的名称

2.散列函数可以实现数据项到槽名称的转换,散列函数接受数据项作为参数,返回函数0~10,表示数据项存储的槽号(名称)

3.这个”散列函数”并不是唯一确定的,是可以自行设计的。

现在我们设计第一个散列函数,有一种常用的方法就是“求余数”,将数据项除以散列表的大小,得到的余数作为槽号

因为散列函数返回的槽号必须在散列表大小范围之内,所以一般会对散列表大小求余

4.按照散列函数h(item)为每个数据项计算出存放位置之后,就可以将数据项存入相应的槽中

数据项都保存到散列表后,要查找某个数据项是否存在于表中,我们只需要使用同一个散列函数,对查找项进行计算,测试下返回的槽号对应的槽中是否有数据项即可。

到此就实现了复杂度为O(1)的查找方法,但也还存在冲突的问题

你可能感兴趣的:(2021-06-09 散列【1】)