说到容器,你肯定会想到 Java中对象存储容器还有ArrayList,LinkedList,HashSet等,而HashMap 相对这些容器来说,可以理解为多了一层指向关系,可以用指定Key找到指定Value。
打个比方:
现在有一个Java Bean 用于存储职员的信息,字段包括(职员姓名,职员年龄,职员身高,职员体重,职员教育程度 ... 等等),我是一名人力资源管理,我需要将员工信息整理好发给老板。
图示:
★ 问题:
这个时候你必须要想到,如果两个人名字一样可咋办,查到的到底是谁的信息呢?前者信息会被覆盖吗?带着问题来学习一下HashMap数据结构及其工作原理。
HashMap 数据结构为 数组+链表,其中:链表的节点存储的是一个 Entry 对象,每个Entry 对象存储四个属性(hash,key,value,next)
三句话,说清它的数据结构:
首先,初始化 HashMap,提供了有参构造和无参构造,无参构造中,
然后,这里我们拿 PUT 方法来做研究:
第一步:通过 HashMap 自己提供的hash 算法算出当前 key 的hash 值
第二步:通过计算出的hash 值去调用 indexFor 方法计算当前对象应该存储在数组的几号位置
第三步:判断size 是否已经达到了当前阈值,如果没有,继续;如果已经达到阈值,则先进行数组扩容,将数组长度扩容为原来的2倍。
> 请注意:size 是当前容器中已有 Entry 的数量,不是数组长度。
第四步:将当前对应的 hash,key,value封装成一个 Entry,去数组中查找当前位置有没有元素,如果没有,放在这个位置上;如果此位置上已经存在链表,那么遍历链表,如果链表上某个节点的 key 与当前key 进行 equals 比较后结果为 true,则把原来节点上的value 返回,将当前新的 value替换掉原来的value,如果遍历完链表,没有找到key 与当前 key equals为 true的,就把刚才封装的新的 Entry中next 指向当前链表的始节点,也就是说当前节点现在在链表的第一个位置,简单来说即,先来的往后退。
OK!现在,我们已经将当前的 key-value 存储到了容器中。
为什么我选择聊 PUT 方法?
因为 PUT 是操作HashMap的最基础操作,了解了 PUT 的机制后,再去看 API其他方法源码的时候你会有所眉目,你可以带着这种初知去探究 HashMap 的其他方法,你一定会豁然开朗。
===
扩容机制:
HashMap 使用 “懒扩容” ,只会在 PUT 的时候才进行判断,然后进行扩容。
需要注意的是,每次扩容之后,都要重新计算原来的 Entry 在新数组中的位置,为什么数组扩容了,Entry 在数组中的位置发生变化了呢?所以我们会想到计算位置的 indexFor 方法,为什么呢,我摘出了该方法的源码如下:
static int indexFor(int h, int length) { // h 为key 的 hash值;length 是数组长度
return h & (length-1);
}
由源码得知,元素所在位置是和数组长度是有关系的,既然扩容后数组长度发生了变化,那么元素位置肯定是要发生变化了。HashMap 计算元素位置采用的是 &运算,不了解此运算的我在这里给个简单的例子:
捡知识:
计算 8 & 6 = 0的过程如下:
1 0 0 0 // 8的二进制数
& 0 1 1 0 // 6的二进制数
___________ // 运算规则:该位置上有一个是0 结果就是0
0 0 0 0 // 二进制数计算结果
还记得我们(1)中提到的问题了吗?知道答案了吗?
答:HashMap 中equals 相同的两个key, 容器中只会保留后进来的key 的value。进入问题中即:我先存储了 Lucy的信息,后来又有一个 Lucy,这个时候再存储 Lucy,容器中保留的是第二个 Lucy 的信息,这种情况,我们可以考虑使用 List
初始化 HashMap 的时候,我们可以自定义数组容量及加载因子的大小。所以,优化 HashMap 从这两个属性入手,但是,如果你不能准确的判别你的业务所需的大小,请使用默认值,否则,一旦手动配置的不合适,效果将适得其反。
===
threshold = (int)( capacity * loadFactor );
阈值 = 容量 X 负载因子;
初始容量默认为16,负载因子(loadFactor)默认是0.75; map扩容后,要重新计算阈值;当元素个数 大于新的阈值时,map再自动扩容;以默认值为例,阈值=16*0.75=12,当元素个数大于12时就要扩容;那剩下的4个数组位置还没有放置对象就要扩容,造成空间浪费,所以要进行时间和空间的折中考虑;
所以,务必合理的初始化 HashMap
比如有一组关键字{12,13,25,23,38,34,6,84,91},Hash表长为14,Hash函数为address(key)=key%11,
当插入12,13,25时可以直接插入,而当插入23时,地址1被12占用了(12%11=1,23%11=1),所以会放在同一个链,如下图:
PS:下图12、23的位置只是方便理解,实际情况下,23是会插入到12前面的,即34--->23--->12 这样排列
---------------------
作者:一小页
来源:CSDN
原文:https://blog.csdn.net/weixin_35586546/article/details/81153793
版权声明:本文为博主原创文章,转载请附上博文链接!