HashMap 的底层结构

几个重要的成员变量:
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
static final int MAXIMUM_CAPACITY = 1 << 30; // 最大容量
/**
* 构造函数中没有指明负载因子的时候默认为0.75
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
// 数化的阈值
static final int TREEIFY_THRESHOLD = 8;
// 退化为链表的阈值
static final int UNTREEIFY_THRESHOLD = 6;
/**
* 可对桶进行树型化(变为红黑树)的最小表容量。
*(否则,如果一个桶中的节点太多,则会调整表的大小。)
* 应至少为4*TREEIFY_THRESHOLD,以避免调整大小和树调整阈值之间的冲突。
*/
static final int MIN_TREEIFY_CAPACITY = 64; // 链表变为红黑树时数组容量的最小值

// resize 的阈值 (capacity * load factor).
int threshold;

HashMap是一个用于存储Key-Value键值对的集合,每一个键值对也叫做Node(jdk 1.7 中为Entry)。

transient Node[]table;
 static class Node implements Map.Entry {
        final int hash;
        final K key;
        V value;
        Node next;
       consrtuctor;
       Getter /setter ;
       hashCode;
       equals;
       ...
}

常使用的是两个方法:Get 和 Put。

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}
public V putIfAbsent(K key, V value) {
   return putVal(hash(key), key, value, true, true);
}

put 和putIfAbsent 的区别就在于传入的一个参数(onlyIfAbsent)的不同。也就是putIfAbsent方法插入数据的时候,如果没有出现过这个值,就插入,出现过这个值就不覆盖,不写入。put方法在插入数据时,如果出现过,直接覆盖之前的数据。

Java8之前是头插法,就是说新来的值会取代原有的值,原有的值就顺推到链表中去。Java7 的时候是采用头插法,但是在多线程的情况下会出现死循环的情况。
Jdk1.8开始采用尾插法

Put()方法的过程:

例如 map.put("key01","value01");

刚开始,如果tab 是空的或者表长度为0,就会对tab 进行扩容。
然后根据key的 hash 值去计算key 在tab 中的下标。(n - 1) & hash。我们将计算的结构记为i,即tab[i]代表当前节点。如果tab[i]为null ,那么直接将该节点插入这个位置。

如果不是相同的节点,它就会判断书否为一个红黑树的节点,如果是的话,就将该节点插入红黑树。
如果不是红黑树的节点,那么会遍历整个链表,并判断是否存在和当前节点(key)相同的节点,如果存在相同的节点,那么将这个节点的value 覆盖之前的,并且会检查当前链表的大小,如果大于阈值,会将这个链表进行树化,变为一颗红黑树。最后会对这个tab的大小进行检查,看增加节点后的tab 是否需要进行扩容,这个阈值等于容量乘负载因子。

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
        Node[] tab;
         Node p; 
         int n, i;
        // 如果tab为空或者长度为0 ,则resize()扩容
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
         // 计算index 
        if ((p = tab[i = (n - 1) & hash]) == null)
         // tab[i]为null,直接插入
            tab[i] = newNode(hash, key, value, null);
        else {
         //  tab[i]不为空的情况下
            Node e; K k;
            // 判断tab[i]的key.hash是否和当前插入节点的key的hash相等
            if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
               // e 节点指向tab[i],也就是p
                e = p;
            // 如果不相等,判断是否是一个树节点 
            else if (p instanceof TreeNode)
              // 是一个树节点,那么将这个节点插入这可红黑树中
                e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
            else {
                // 不是一颗树节点
                for (int binCount = 0; ; ++binCount) {// 遍历链表到达尾部
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        // 判断是否达到树化的阈值
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 对tab进行树化
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 判断两个节点的key是否相同,相同则跳出循环
                    if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                 // 是否需要对原来的进行覆盖
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

为啥tab 的大小必须为2的n次的幂

为啥是这样算的呢?因为

计算出来的hash值有些不在tab 中,为了映射到tab中,就需要对hash值进行取模运算,即 hash%n。当n为2的幂的时候,hash%n 就等于 (n - 1) & hash 了。采用二进制位操作 &,相对于%能够提高运算效率, 这也就是为什么tab 的长度为2的幂了。

举例:

若 a = 10 , b = 8 , 10与8取余应得2.

8的二进制为: 1000 ; 7的二进制为: 0111.

10---> 1011

7 ---> 0111

1011

0111


0011

resize() 方法这篇文章不错-->深入理解HashMap(四): 关键源码逐行分析之resize扩容

你可能感兴趣的:(hashmap)