HashMap 是一个散列表,它存储的内容是键值对(key-value)映射。它继承了AbstractMap,实现了Map、Cloneable、java.io.Serializable
接口。
HashMap的实现是不同步的,这意味着线程不安全。并发的环境下建议使用ConcurrentHashMap
。
HashMap的key、value都可以为null(除了不同步和允许使用 null 之外,HashMap与 Hashtable大致相同)。此外,HashMap中的映射是无序的。
HashMap 的实例有两个参数影响其性能:“初始容量” 和 “加载因子”。容量是哈希表中桶的数量,初始容量是哈希表在创建时的容量。
loadFactor加载因子是控制数组存放数据的疏密程度,loadFactor越趋近于1,那么 数组中存放的数据(entry)也就越多,也就越密,会导致查找元素效率低;loadFactor越小,也就是趋近于0,数组中存放的数据(entry)也就越少,也就越稀疏,但会导致数组的利用率低。
通常,默认加载因子是0.75,这是在时间和空间成本上寻求一种折衷。在设置初始容量时应该考虑到映射中所需的条目数及其
加载因子,以便最大限度地减少 rehash 操作次数。
JDK1.7中HashMap是数组+链表结合在一起使用的链表散列。HashMap 定义了扰动函数hash()
来减少碰撞,当两个不同元素经过计算发现在数组中的位置一样时,就通过拉链法解决冲突。
所谓 “拉链法” 就是,将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可。
HashMap在JDK1.7中详细实现可参考深入理解HashMap(jdk7)一文。
众所周知,数组的查询效率为O(1),链表的查询效率是O(n),红黑树的查询效率是O(log n),n为桶中的元素个数。
所有当位于链表中的结点过多,显然通过key值依次查找效率就太低了。因此JDK1.8在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为8)时,将链表转化为红黑树,以提高查询效率。
也就是说,JDK1.8之后,HashMap底层数据结构是数组+链表+红黑树。
Node节点类源码:
// 继承自 Map.Entry
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;// 哈希值,存放元素到hashmap中时用来与其他元素hash值比较
final K key;// 键
V value;// 值
// 指向下一个节点
Node<K,V> next;// 链表的next指针
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
public final K getKey() {
return key; }
public final V getValue() {
return value; }
public final String toString() {
return key + "=" + value; }
// 重写hashCode()方法
public final int hashCode() {
return Objects.hashCode(key) ^ Objects.hashCode(value);
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;
}
// 重写 equals() 方法
public final boolean equals(Object o) {
if (o == this)
return true;
if (o instanceof Map.Entry) {
Map.Entry<?,?> e = (Map.Entry<?,?>)o;
if (Objects.equals(key, e.getKey()) &&
Objects.equals(value, e.getValue()))
return true;
}
return false;
}
}
TreeNode节点类源码:
// 转变为红黑树后的结点类
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K,V> parent; // 父节点
TreeNode<K,V> left; // 左子树
TreeNode<K,V> right; // 右子树
TreeNode<K,V> prev; // needed to unlink next upon deletion
boolean red; // 判断颜色
TreeNode(int hash, K key, V val, Node<K,V> next) {
super(hash, key, val, next);
}
// 返回当前节点的根节点
final TreeNode<K,V> root() {
for (TreeNode<K,V> r = this, p;;) {
if ((p = r.parent) == null)
return r;
r = p;
}
}
--- omit ---
}
// 序列号
private static final long serialVersionUID = 362498820763181265L;
// 桶默认的初始容量,2的4次方,即16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认的加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 树化阈值。当上某个桶(bucket)的结点数大于这个值时会转成红黑树
static final int TREEIFY_THRESHOLD = 8;
// 链表还原阈值。当某个桶(bucket)上的结点数小于这个值时树转链表
static final int UNTREEIFY_THRESHOLD = 6;
// 桶中链表结构转化为红黑树对应的table的最小容量
static final int MIN_TREEIFY_CAPACITY = 64;
// 哈希桶数组
transient Node<k,v>[] table;
// 保存缓存的entrySet
transient Set<map.entry<k,v>> entrySet;
// 桶的实际元素个数 != table.length。
transient int size;
// 每次扩容和更改map结构 计数器都会+1
transient int modCount;
// 扩容门槛,当实际大小(容量*加载因子)超过扩容门槛时,会进行扩容。是衡量数组是否需扩容的一个标准。
int threshold;
// 加载因子
final float loadFactor;
HashMap 中有四个构造方法,它们分别如下:
// 默认构造函数。
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
}
// 调用putMapEntries将Map中的值加入新的Map集合中
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);// 在构造函数使用的时候是false其他时候是true
}
// 指定“容量大小”的构造函数
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
// 指定“容量大小”和“加载因子”的构造函数
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " + initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " + loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);// 扩容门槛为大于initialCapacity的最小二次幂。
}
可以发现,不论是哪个构造构造方法,loadFactor一定会被初始化。
第二个构造方法是将传入的Map集合元素添加到Map实例中,源码如下:
// 传递的Map集合中的所有元素加入本Map实例中
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
// 传入Map的元素个数
int s = m.size();
if (s > 0) {
// 判断table是否已经初始化
if (table == null) {
// 因为会计算出小数因此+1.0F向上取整
float ft = ((float)s / loadFactor) + 1.0F;
// 判断ft是否小于最大容量
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
// 计算得到的t大于扩容门槛,则重新计算阈值
if (t > threshold)
threshold = tableSizeFor(t);
}
// 已初始化,并且m中元素个数大于扩容门槛,进行扩容处理
else if (s > threshold)
resize();
// 遍历,将m中的所有元素添加至HashMap中
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
tableSizeFor(int cap) 静态方法是用来计算合理的初始容量,返回大于等于参数 cap的最小 2 次幂。
// 返回大于cap的最小的二次幂数值
static final int tableSizeFor(int cap) {
int n = cap - 1;
// >>> 无符号右移,忽略符号位,空位都以0补齐。对于正数移位来说等同于:>>。
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
// n<0返回1
// n>最大容量,返回最大容量MAXIMUM_CAPACITY
// 否则返回n+1
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
**这里为什么cap - 1
呢?**先来分析有关n位操作部分:
假设n的二进制为01xxx…xxx。
对n右移1位:001xx…xxx,再位或:011xx…xxx(1 与 0 或1
位或的结果都为 1)
对n右移2为:00011…xxx,再位或:01111…xxx
… …
同理,如果有8个1,右移8位肯定会让后八位也为1。综上可得,该算法让最高位的1后面的位全变为1。
最后再让结果n+1,即得到了2的整数次幂的值了。
回过头再来看int n = cap - 1;
,就明白用cap-1
赋值给n是为了找出大于或等于原值的目标值。
例如,二进制数0100,即4。如果不进行减1操作,通过运算会等到1000,即8,直接翻倍了,不符合结果。进行减1操作后,二进制数为0011,再进行运算会得到0100,即4。
不管增加、删除、查找键值对,定位到哈希桶数组的位置都是关键的第一步。
HashMap先是通过扰动函数hash(Object key)
处理key的hashCode而得到其hash 值,然后通过 (n - 1) & hash
判断当前元素存放的位置(这里的 n 指的是数组的长度)。
该方法是 HashMap 的核心静态方法,用于计算 key 的 hash 值。我们在使用HashMap存放数据时,当然希望元素位置分布均匀一点。而使用hash算法计算位置的时,可以直接确定位置,不用遍历链表,大大优化了查询的效率。
JDK1.7的 HashMap 的 hash 方法源码:
static int hash(int h) {
--- omit ---
h ^= k.hashCode();
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
}
JDK 1.8 的 hash方法 相比于 JDK 1.7 hash 方法更加简化,但是原理不变。(JDK 1.7 的 hash方法的性能会稍差一点点,毕竟扰动了 4 次。)
JDK1.8中 HashMap 的 hash 方法源码:
// 通过位运算减少 Hash 冲突
static final int hash(Object key) {
int h;
// key.hashCode() 传入key的散列值
// 按位异或^,如果相对应位值相同,则结果为0,否则为1
// h ^ (h >>> 16) 高位参与运算
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
key.hashCode()函数调用的是key键值类型自带的哈希函数public native int hashCode();
,返回的hashcode是int类型。如果直接拿散列值做数组下标,那么索引范围就是‑2147483648到2147483648,前后加起来大概40亿的映射空间,很难出现碰撞。问题是默认的初始容量最大才16,这就说明散列值是不能直接用来访问。
在JDK1.7中,散列值使用前需要对数组长度取模运算,到的余数才能用来访问数组下标。源码中模运算是在这个indexFor( )函数里完成。
bucketIndex = indexFor(hash, table.length);
static int indexFor(int h, int length) {
// 散列值和数组长度做一个“与”操作
return h & (length-1);
}
位与运算符&
运算规则是只有二进制位同时为 1,那么计算结果才为 1,否则为 0。所有说,“与”操作的结果就是将散列值的高位全部归0,只保留低位值用来做数组下标访问。
以初始长度8为例,8-1=7。2进制表示为00000000 00000000 00000111。与某散列值做“与”操作,结果就是截取了最低4位。
10100101 11000100 00100101
& 00000000 00000000 00000111
----------------------------------
00000000 00000000 00000101
在JDK1.8中,putVal() 中寻址部分如下,原理跟上面一样。
tab[i = (n - 1) & hash]
问题来了,就算散列值再松散,总是截取最后几位,碰撞还是会很严重。比如初始长度为16,16-1=15。与某散列值做“与”操作结果跟之前是一样的。也就是说,(n - 1) & hash
就是截取hash的最低m
位(n=2的m次幂)。
11110101 10000101 00110100
& 00000000 00000000 00001111
----------------------------------
00000000 00000000 00000101
这时候,”扰动函数“的价值就体现出来了。
右位移16位,正好是32的一半,自己的高半区与低半区做异或,就是为了混合原始哈希码的高位与低位,以此来加大低位随机性。而混合后的低位参杂了高位部分特征,高位信息也参入了寻址计算(进行扰动)。
由之前的分析可知,桶下标计算公式即是(capacity - 1) & hash
。之所以不使用hash % capacity
方式取模,是因为HashMap中规定了哈希表长度为2 的幂,在这种情况下,位与运算更快, resize() 扩容时也可以更高效地重新计算桶下标。
put方法中调用了putVal方法,传递的参数是调用了hash()方法计算key的hash值,主要逻辑写在putVal中。
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 步骤1:桶数组未初始化或者长度为0,进行扩容
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 步骤2:指定桶为空,新生成结点直接放入
// (n - 1) & hash 计算元素在哪个桶中
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
// 指定位置已经存在元素
else {
Node<K,V> e; K k;
// 步骤3: 如果桶中第一个元素的key与待插入元素的key相同,保存到e中用于后续修改value值
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
// 将第一个元素赋值给e,用e来记录
e = p;
// 步骤4:如果第一个元素是树节点,则调用树节点的putTreeVal插入元素
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 步骤5:为链表结点,遍历链表进行操作
else {
// inCount用于存储链表中元素的个数
for (int binCount = 0; ; ++binCount) {
// 到达链表的尾部还没有找到相同key的元素,则在尾部插入新结点
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 结点数量达到扩容门槛,转化为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);
break;
}
// 判断链表中结点的key值与插入的元素的key值相等,则退出循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
// 用于遍历桶中的链表,与前面的e = p.next组合,可以遍历链表
p = e;
}
}
// 步骤6:表示在桶中找到key值、hash值与插入元素相等的结点
if (e != null) {
// 记录e的旧value
V oldValue = e.value;
// 判断是否要置换旧值
if (!onlyIfAbsent || oldValue == null)
// 直接覆盖,并返回旧值
e.value = value;
// 访问后回调
afterNodeAccess(e);
// 返回旧值
return oldValue;
}
}
++modCount;
// 步骤7:判断是否扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
对putVal方法添加元素的分析如下:
e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value)
将元素添加进入。具体流程如下:
进行扩容,会伴随着一次重新hash分配,并且会遍历hash表中所有的元素,是非常耗时的。在编写程序中,要尽量避免resize。
final Node<K,V>[] resize() {
// 旧数组
Node<K,V>[] oldTab = table;
// 旧容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 旧扩容门槛
int oldThr = threshold;
// 新容量,新扩容门槛
int newCap, newThr = 0;
// 步骤1:根据旧容量判断是否扩容
if (oldCap > 0) {
// 如果旧容量达到了最大容量,则不再进行扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 旧容量小于最大容量且大于默认初始容量,就扩容为原来的2倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // 新扩容门槛等于旧扩容门槛的两倍
}
// 步骤2:初始化数组时,若是threshold中已经保存初始容量
else if (oldThr > 0)
// 使用 非默认构造方法 ,指定了initialCapacity,threshold被初始化成大于initialCapacity的最小的2的次幂
// 则用threshold作为table的实际大小
newCap = oldThr;
// 步骤3:初始化数组时,threshold中没有保存初始容量
else {
// 调用 默认构造方法 ,未指定initialCapacity,旧容量与旧扩容门槛都是0
// 说明还未初始化过,则newCap=默认初始化容量(16),新扩容门槛=默认容量*默认加载因子=12
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 步骤4:计算新扩容门槛
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);
}
// 将新扩容门槛设为扩容门槛
threshold = newThr;
// 步骤5:实例化新table数组
@SuppressWarnings({
"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
// 把原来table里面的值全部搬到新的table里面
if (oldTab != null) {
// 步骤6:把每个bucket都移动到新的bucket中
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
// 清空Node的引用,便于GC回收
oldTab[j] = null;
// 如果旧桶中只有一个元素,直接将它放到新桶中
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
// 桶内部结构为树,则拆分树
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
// 桶内部结构为链表
else {
// 低位链表的头节点与尾节点
Node<K,V> loHead = null, loTail = null;
// 高位链表的头节点与尾节点
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
// 循环遍历碰撞节点
do {
next = e.next;
// (e.hash & oldCap) == 0的元素放在低位链表中
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
// (e.hash & oldCap) == 1的元素放在高位链表中
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
// 遍历完成分化成两个链表
// 低位链表放到新table的j位置上,j为旧table中桶的索引,即低位链表位置相对旧表位置不变
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
// 高位链表放到新table的j+oldCap位置上,即高位表位置相对旧表中位置向右移动oldCap位
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
针对链表的拆分,再进行分析说明一下。需要明确的是:
oldCap一定是2的整数次幂, 这里假设是2^m
newCap是oldCap的两倍, 则会是2^(m+1)
hash对数组大小取模(n - 1) & hash
其实就是取hash的低m
位(上面hash()方法有讲到)
以容量oldCap=16扩展为newCap=32为例:
假如在桶的14位置上有两个hash值:
hash1 = 0000 0000 1101 0000 0000 0000 0000 1110
hash2 = 0000 0000 0000 0000 0000 1111 0001 1110
未扩容前桶中位置为:
16-1 = 0000 0000 0000 0000 0000 0000 0000 1111
hash1 = 0000 0000 1101 0000 0000 0000 0000 1110
(n - 1) & hash hash2 = 0000 0000 0000 0000 0000 1111 0001 1110
------------------------------------------------------------------------
(16-1)&hash1 = 0000 0000 0000 0000 0000 0000 0000 1110
(16-1)&hash2 = 0000 0000 0000 0000 0000 0000 0000 1110
扩容后在桶中位置为:
32-1 = 0000 0000 0000 0000 0000 0000 0001 1111
hash1 = 0000 0000 1101 0000 0000 0000 0000 1110
(n - 1) & hash hash2 = 0000 0000 0000 0000 0000 1111 0001 1110
------------------------------------------------------------------------
(32-1)&hash1 = 0000 0000 0000 0000 0000 0000 0000 1110 // 1110
(32-1)&hash2 = 0000 0000 0000 0000 0000 0000 0001 1110 // 1110 + 10000
可见,在扩充 HashMap 的时候,不需要重新计算 hash值,只需要检查二进制 hash 中与二进制桶下标中新增的有效位的位置相同的那个位(简称“新增位”)是0还是1即可,是0的话索引没变,是1的话索引变成“原索引+oldCap”。
至于新增位是0还是1,可以认为是随机的,这样就均匀的把之前碰撞的节点分散到新旧桶中。
小结:
oldCap
(原table的大小).public V get(Object key) {
Node<K,V> e;
// 该方法返回指定键所映射到的值,如果不包含该键对应的映射关系,则返回 null。
// 实际上HashMap的键也可以为null,如果需要验证是否真的存在该键对应的映射关系可以调用 containsKey()方法。
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
// 桶的数量不为空且所查询的桶的第一个元素不为空
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
// 查的是桶的第一个元素,直接返回0
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
// 桶中不止一个节点
if ((e = first.next) != null) {
// 桶的数据结构是树,则按树的方式查找
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
// 否则遍历整个链表查找该元素
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
可见,查询元素时:
上面分析可知,当插入元素时:
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);
链表的长度大于等于8则判断是否需要树化。若当前table数组的容量小于 MIN_TREEIFY_CAPACITY(64)就会选择扩容。
final void treeifyBin(Node<K, V>[] tab, int hash) {
int n, index;
Node<K, V> e;
// 如果当前 table 数组的容量小于 64 就放弃树化,选择扩容。
if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
// 因为扩容之后,链表会分化。
resize();
else if ((e = tab[index = (n - 1) & hash]) != null) {
// 链表头节点与尾节点
TreeNode<K, V> hd = null, tl = null;
// 把所有节点换成树节点
do {
TreeNode<K, V> p = replacementTreeNode(e, null);
if (tl == null)
hd = p;
else {
p.prev = tl;
tl.next = p;
}
tl = p;
} while ((e = e.next) != null);
// 如果进入过上面的循环,则从头节点开始树化
if ((tab[index] = hd) != null)
// 调用treeify真正树化
hd.treeify(tab);
}
}
final void treeify(Node<K,V>[] tab) {
// 定义一个根节点
TreeNode<K,V> root = null;
// 遍历已转为树节点的链表
// x指向当前节点,next指向下一个节点
for (TreeNode<K,V> x = this, next; x != null; x = next) {
next = (TreeNode<K,V>)x.next;
// 初始化当前节点的左子树和右子树,先都为null
x.left = x.right = null;
// 如果还未初始化root节点
if (root == null) {
// 就设置当前节点为root节点,并设置是黑节点。
x.parent = null;
x.red = false;
root = x;
}
// 已初始化root节点,就开始构建红黑树
else {
K k = x.key;// 获取当前节点的key赋值给k
int h = x.hash;// 获取当前节点的哈希值赋值给h
Class<?> kc = null;// 定义key所属的Class
// 从root节点开始遍历,插入新节点(开始构建红黑树)
for (TreeNode<K,V> p = root;;) {
// dir标识方向,是在root节点的左侧还是右侧;ph标识当前树节点的hash值
int dir, ph;
K pk = p.key;
// 比较当前节点的hash值与新节点的hash值
// 若是新节点hash值较小
if ((ph = p.hash) > h)
// 标识当前链表节点会放到当前root节点的左侧
dir = -1;
// 若是新节点的hash值较大
else if (ph < h)
// 标识当前链表节点会放到当前root节点的右侧
dir = 1;
// 若是新节点与当前节点的hash值相等
else if ((kc == null &&
// 如果新节点的key没有实现Comparable接口
(kc = comparableClassFor(k)) == null) ||
// 或者实现了Comparable接口但是k.compareTo(pk)结果为0
(dir = compareComparables(kc, k, pk)) == 0)
// 则调用tieBreakOrder继续比较大小
dir = tieBreakOrder(k, pk);
TreeNode<K,V> xp = p;
// 如果新节点经比较后小于等于当前节点且当前节点的左子节点为null,则插入新节点,反之亦然
if ((p = (dir <= 0) ? p.left : p.right) == null) {
// 当前链表节点作为当前树节点的子节点
x.parent = xp;
if (dir <= 0)
// 左子树
xp.left = x;
else
// 右子树
xp.right = x;
// 平衡红黑树
root = balanceInsertion(root, x);
break;
}
}
}
}
// 确保给定的root节点是所在桶的第一个节点
moveRootToFront(tab, root);
}
可见,树形化过程如下:
TreeNode相关操作的其他方法分析可以参考死磕 java集合之HashMap源码分析一文。
遍历主要有以下几种:
(1)调用map.entrySet()
的集合迭代器
Map map = new HashMap();
Iterator<Map.Entry<?, ?>> iter = map.entrySet().iterator();
while (iter.hasNext()) {
Map.Entry<?, ?>> entry = iter.next();
Object key = entry.getKey();
Object val = entry.getValue();
}
(2) 调用map.keySet()
的集合迭代器
Map map = new HashMap();
Iterator<?> iter = map.keySet().iterator();
while (iter.hasNext()) {
Object key = iter.next();
Object val = map.get(key);
}
(3)for each map.entrySet()
Map<?, ?> map = new HashMap<?, ?>();
for (Entry<?, ?> entry : map.entrySet()) {
entry.getKey();
entry.getValue();
}
(4) for each map.entrySet()
,临时变量保存map.entrySet()
Map<?, ?> map = new HashMap<?, ?>();
Set<Entry<?, ?> entrySet = map.entrySet();
for (Entry<?, ?> entry : entrySet) {
entry.getKey();
entry.getValue();
}
(5)for each map.keySet()
Map<?, ?> map = new HashMap<?, ?>();
for (Object key : map.keySet()) {
map.get(key);
}
推荐使用第一种方式。
至于其他遍历方法可参考HashMap 的 7 种遍历方式与性能分析!一文。
HashMap源码分析
HashMap(JDK1.8)源码+底层数据结构分析
深入理解HashMap(jdk7)
全网把Map中的hash()分析的最透彻的文章,别无二家
JDK 源码中 HashMap 的 hash 方法原理是什么?
死磕 java集合之HashMap源码分析
深入理解HashMap(四): 关键源码逐行分析之resize扩容
HashMap 的 7 种遍历方式与性能分析!