散列表的原理与实现

哈希表的实现原理

  • 还是利用数组来实现,直接下标查找,增加,删除,效率较高

    思路:将字符串转成下标值,根据下标直接查找、增加和修改数据

  • 找到一种合适的编码方式

    • 方案一:每个字符代表的数字相加构成字符串对应数值(生成的数字很大可能重复)
    • 方案二:幂的连乘(得到的数字又较大,浪费空间)
  • 哈希化

    需要一种压缩方法,把幂的连乘方案得到的巨大整数范围压缩到可以接受的数组范围

    • 取余操作(得到的余数也会有重复,但概率小了许多)

    概念:将大数字转化成数组范围内下标的过程,我们就称之为哈希化

  • 哈希函数

    概念:将字符串转成大数字,大数字再进行哈希化的代码实现放在一个函数中,我们称这个函数为哈希函数

  • 哈希表

    概念:最终我们将得到的数据插入到这个数组,对整个结构的封装,我们称之为一个哈希表

  • 针对取余后仍有重复的数字(称之为冲突)的解决方法

    • 方案一:链地址法(拉链法)

      将数字对应的下标存入成一个数组或者链表,不再是单数字的形式,插入到首端(使用链表),插入到末端(使用数组)

    • 方案二:开放地址法

      寻找空白的单元格来存储重复的数据

      • 线性探测

        线性查找空白的的位置,步长为1,逐个查找,在查找过程中遇到空白位置就停止,

        删除一个位置的数据项时不能设置为null,会影响后续的查找,可以将它进行特殊处理(比如设置为-1)

        存在聚集的问题,影响性能,需要查找很长才能找到空白位置

      • 二次探测

        主要优化探测时的步长(1,4,9...这样很规律的查找)

      • 再哈希法

        把关键字用另一个哈希函数,再做一次哈希化,用这次哈希化的结果作为步长

        这个哈希函数的要求:

        1. 和第一个哈希函数不同
        2. 不能输出为0
        3. stepSize = constant - (key % constant),constant是质数,且小于数组的容量
  • 装填因子

    概念:装填因子 = 总数据项 / 哈希表的长度

    装填因子决定了哈希表的效率

  • 哈希函数的要求

    • 快速的计算

      j尽量减少乘法与除法,使用霍纳法则

    • 均匀的分布

      使用质数作为哈希表的长度

  • JavaScript代码实现

    // 哈希表的实现
    class HashTable {
        constructor(storage=[], count=0, limit=7){
            this.storage = storage
            this.count = count
            this.limit = limit
        }
        // 实现哈希函数
        hashFunc(str, size) {
            // 定义hashCode变量
            var hashCode = 0
            // 霍纳法则,计算hashCode的值
            for(var i=0; i this.limit * 0.75) {
                var newSize = this.limit * 2
                var newPrime = this.gerPrime(newSize)
                this.resize(newPrime)
            }
        }
        // 获取操作
        get(key) {
            // 1. 根据key获取对应的index
            var index = this.hashFunc(key, this.limit)
            // 2. 根据index获取对应bucket
            var bucket = this.storage[index]
            // 3. 判断bucket是否为null,如果为null,直接返回
            if (bucket == null) return null
            // 4. 线性查找 bucket中每一个key是否等于传入的key
            for (var i=0; i 7 && this.count < this.limit * 0.25) {
                        var newSize = Math.floor(this.limit / 2)
                        var newPrime = this.getPrime(newSize)
                        this.resize(newPrime)
                    }
                }
            }
            //  5. 依然没有找到,返回 null
            return null
      }
        // 判断哈希表是否为空
        isEmpty() {
            return this.count === 0
        }
        // 获取哈希表中元素的个数
        size() {
            return this.count
        }
        // 哈希表的扩容/缩容
        resize(newLimit) {
              // 1. 保存数组的内容
              var oldStorage = this.storage
              // 2. 重置所有属性
              this.storage = []
            this.count = 0
            this.limit = newLimit
            // 3. 遍历oldStorage中有bucket
            for(var i=0; i

你可能感兴趣的:(散列表的原理与实现)