硬核!从零开始手写 HashMap!

硬核!从零开始手写 HashMap!_第1张图片

作者:张丰哲

来源:http://dwz.date/eYc8

HashMap是Java中常用的集合,而且HashMap的一些思想,对于我们平时解决业务上的一些问题,在思路上有帮助,基于此,本篇博客将分析HashMap底层设计思想,并手写一个迷你版的HashMap!

对HashMap的思考

硬核!从零开始手写 HashMap!_第2张图片

开始之前,我们先分析一下 HashMap 的底层数据结构:

第一,如图所示,HashMap有3个要素:hash函数+数组+单链表。

第二,对于hash函数而言,需要考虑些什么?

要快,对于给定的Key,要能够快速计算出在数组中的index。

那么什么运算够快呢?显然是位运算!

要均匀分布,要较少碰撞。说白了,我们希望通过hash函数,让数据均匀分布在数组中,不希望大量数据发生碰撞,导致链表过长。

那么怎么办到呢?

也是利用位运算,通过对数据的二进制的位进行移动,让hash函数得到的数据散列开来,从而减低了碰撞的概率。

如果发生了碰撞怎么办?上面的图其实已经说明了JDK的HashMap是如何处理hash冲突的,就是通过单链表解决的。那么除了这个方法,还有其他思路么?

比如说,如果发生冲突,那么记下这个冲突的位置为index,然后在加上固定步长,即index+step,找到这个位置,看一下是否仍然冲突,如果继续冲突,那么按照这个思路,继续加上固定步长。其实这就是所谓的线性探测来解决Hash冲突的方法!

实践

接口定义

定义一个接口,对外暴露快速存取的方法。

注意MyMap接口内部定义了一个内部接口Entry。

硬核!从零开始手写 HashMap!_第3张图片

属性

HashMap的要素之一,就是数组,自然在这里,我们要定义数组,数组的初始化大小,还要考虑扩容的阀值。

硬核!从零开始手写 HashMap!_第4张图片

结构方法

看MyHashMap的构造,构造方法有什么好说的呢?仔细观察下,你会发现,其实这里使用到了“门面模式”。这里的2个构造方法其实指向的是同一个,但是对外却暴露了2个“门面”!

硬核!从零开始手写 HashMap!_第5张图片

Entry

HashMap的要素之一,单链表的体现就在这里!

硬核!从零开始手写 HashMap!_第6张图片

put方法实现

第一,要考虑是否扩容?

HashMap中的Entry的数量(数组以及单链表中的所有Entry)是否达到阀值?

第二,如果扩容,意味着新生成一个Entry[],不仅如此还得重新散列。

第三,要根据Key计算出在Entry[]中的位置,定位后,如果Entry[]中的元素为null,那么可以放入其中,如果不为空,那么得遍历单链表,要么更新value,要么形成一个新的Entry“挤压”单链表!

硬核!从零开始手写 HashMap!_第7张图片

hash方法实现

MyHashMap提供的hash函数

硬核!从零开始手写 HashMap!_第8张图片

JDK的HashMap提供的hash函数

硬核!从零开始手写 HashMap!_第9张图片

我这里参考了JDK的HashMap的hash函数的实现,这里也再次说明了:要想散列均匀,就得进行二进制的位运算!

resize和rehash

这里可以看出,对于HashMap而言,如果频繁进行resize/rehash操作,是会影响性能的。

resize/rehash的过程,就是数组变大,原来数组中的entry元素一个个的put到新数组的过程,需要注意的是一些状态变量的改变。

硬核!从零开始手写 HashMap!_第10张图片

get实现

get很简单,只需要注意在遍历单链表的过程中使用== or equals来判断下即可。

硬核!从零开始手写 HashMap!_第11张图片

测试

利用MyHashMap进行存取

硬核!从零开始手写 HashMap!_第12张图片

运行结果

硬核!从零开始手写 HashMap!_第13张图片

OK,一个迷你版的HashMap就写好了,你学到了么?


推荐阅读

  • 树结构系列开篇:聊聊如何学习树结构?

  • 树结构系列(一):从普通树到二叉查找树

  • 树结构系列(二):平衡二叉树、AVL树、红黑树

  • 树结构系列(三):B树、B+树

  • 硬核!史上最全的工厂模式文章,从零到一全面讲解!

  • 2 月份看了 17 本书,我只推荐这 8 本!

你可能感兴趣的:(hashmap,hash,html,哈希,js)