Java中的HashMap

自己在上看了不少的别人总结,那么在借鉴前人(miaoLoveCode)基础上自己再总结一番。

HashMap1.8实现分析

数据结构

1.8的HashMap数据结构是由数组+(链表或红黑树)实现。

构造方法

Java中的HashMap_第1张图片
JDK8的构造方法

几个基本量:

  • capacity:容量,bucket数组长度,默认长度为16;
  • loadFactor:装载因子,默认值为0.75,它决定了bucket填充程度;
  • threshold:决定了HashMap能够放进去的数据量。
    对于threshold的初始化会调用tableSizeFor方法计算出一个比initialCapacity大的第一个2的n次幂的值存入threshold。
Java中的HashMap_第2张图片
tableSizeFor

bucket的初始化一般都是在第一次调用put方法时完成的。

Hash

JDK 8 中在进行get和put操作时,会先根据key的hashCode进行再散列,再进行bucket对应节点位置计算,请看以下示例:

Java中的HashMap_第3张图片
hash及下标计算

可以看出:h >>> 16,高16位补0,由于任意数跟0异或不变,所以hash的作用就是高16位不变,低16位和高16位做异或运算,来达到减少碰撞的目的。
hash方法的实现:

hash方法

为了提高碰撞下的性能,当链表节点等于8时,JDK8用红黑树代替链表,将原有链表部分查询的时间复杂度o(n)提升为o(logn),继续看JDK 8中的put方法的具体实现。

  • put方法
put实现
  • putVal
Java中的HashMap_第4张图片
putVal实现

具体流程如下:
1.如果当前bucket为空时,调用resize()方法初始化;
2.根据key的hash值计算出所在的bucket节点的位置;
3.如果没有冲突,也就是

p = tab[i = (n - 1) & hash]=null

调用newNode方法封装key-value键值对,并将其挂到 bucket对应位置下,否则,跳转到步骤4;
4.如果发生冲突

  • 遍历链表,如果该key已经存在,则更新原有的oldValue为新的value,并返回oldValue。直到链表末尾没有相同的key的hash值和key(equals,==),则在末尾插入新节点;
  • 如果key所在的节点为treeNode,调用rbtree(红黑树)的putTreeVal方法将改节点挂到rbtree上;
  • 如果插入节点后,当前bucket节点下链表长度超过8,需要将原有的数据结构链表变为rbtree;

5.数据put完成之后,如果当前数组长度 > threshold,调用resize方法扩容。

resize()

Java中的HashMap_第5张图片
resize前半部分

resize的前半部分主要完成了新的capacity和threshold的计算。从代码实现可以看出,每一次扩容,newCapacity和newThreshold均是扩容前值的两倍,如此设计师为什么?先看个例子来说明这样子设计的原因:

Java中的HashMap_第6张图片
resize后index计算

从小例子可以看出,resize后,key所在bucket的节点位置保持不变。首先,table.length也就是capacity肯定是2的n次方,根据所在bucket节点下标计算公式:index = hash & (table.length - 1),其实在进行&运算的时候,只是多了一个最高位1,那么新位置要么保持原位置不变,要么在原位置 + oldCapacity,这个设计的巧妙就在于节省了一部分重新计算hash的时间,而且hash值高位出现0和1的概率均等,在resize的过程又将节点平均分配到两个bucket节点。

resize的后半部分对数据做了transfer,具体实现如下:

Java中的HashMap_第7张图片
resize后半部分

总结

HashMap在JDk1.8比JDK1.7的优化主要在:
1.引入rbtree,在bucket节点下链表长度 = 8时将链表变成rbtree;
2.优化hash和resize,减少resize带来的hash性能消耗。

你可能感兴趣的:(Java中的HashMap)