HashMap源码浅析

HashMap个人感觉是根据hash值分了类别的的链表或者红黑树。

public class HashMap extends AbstractMap implements Map, Cloneable, Serializable {

    private static final long serialVersionUID = 362498820763181265L;
    // 默认的HashMap的存储容量大小
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    // 最大存储容量
    static final int MAXIMUM_CAPACITY = 1 << 30;
    // 默认的负载因子大小
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    // 每条链表长度到达8时开始转化为红黑树
    static final int TREEIFY_THRESHOLD = 8;
    // 每个红黑树存储结点个数为减少至6时解除红黑树,转化为链表
    static final int UNTREEIFY_THRESHOLD = 6;
    // 转化为红黑树的最小容量,table的长度超过64时,链表才会转化为红黑树
    static final int MIN_TREEIFY_CAPACITY = 64;
    // 存放结点的数组
    transient Node[] table;
    // 用来保存缓存
    transient Set> entrySet;
    // 当前存储的键值对的个数
    transient int size;
    // 修改次数
    transient int modCount;
    // 使用的table容量size到达多少时进行扩容,一般为12
    int threshold;
    // 负载因子,当table使用到达负载因子大小时,进行table的扩容,DEFAULT_LOAD_FACTOR = 0.75f就说明,到达75%时扩容
    // 默认容量是16,那么使用容量到达12时进行扩容
    final float loadFactor;

    // 链表时期所使用的结点
    static class Node implements Map.Entry {
        final int hash;
        final K key;
        V value;
        Node next;

        Node(int hash, K key, V value, Node next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }

        // hash值为key的hashcode与value的hashcode进行异或
        public final int hashCode() {
            return Objects.hashCode(key) ^ Objects.hashCode(value);
        }

        public final boolean equals(Object o) {
            if (o == this)
                return true;
            if (o instanceof Map.Entry) {
                Map.Entry e = (Map.Entry) o;
                if (Objects.equals(key, e.getKey()) && Objects.equals(value, e.getValue()))
                    return true;
            }
            return false;
        }
    }

    // hash值为hashcode与hashcode右移16位进行异或
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

    // 除了这个无参构造,还有3个有参构造
    // 其中两个有参构造是可以设置初始的hashmap默认大小和负载因子大小
    // 剩下的一个是可以直接将一个map作为参数复制到本hashmap中
    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

    // 我们平时最常用的put操作
    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

    // put操作调用该方法,onlyIfAbsent为false的话如果存在旧值会用新的值覆盖
    // evict的调用在void afterNodeInsertion(boolean evict){ }方法,可以看到这是一个空的方法
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
        // tab将指向存储结点的成员变量table
        Node[] tab;
        // p将指向索引位置的那个结点
        Node p;
        // n将为table的长度,不是table中所存储的键值对的个数,因为table有可能有一部分是null
        // i将为根据hash辅助计算出的索引位置
        int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            // 如果table没有初始化,resize将重新设置table的大小
            n = (tab = resize()).length;
        // p指向根据hash值辅助计算所指向的那个结点
        // i为该索引位置,其计算方式为key的hash值和table的长度值减1进行与操作得出的值
        // 所以键值对只要key的hashcode向右移16位后的低几位的数字只要相同就会是同一个索引位置,放到同一个链表中,并不需要hashcode完全一致
        if ((p = tab[i = (n - 1) & hash]) == null)
            // p是null,说明那个索引位置就是空的,所以不需要去遍历链表或者红黑树来看是否已经存在这么一个结点
            // 如果是这样,那就会返回索引位置原来所存储的null
            tab[i] = newNode(hash, key, value, null);
        else {
            // p不是null,说明那个索引位置是有一条链表或者一个红黑树的,需要进行遍历检查要存储的键值对是否已经存在
            // e将指向查询出的那个结点
            Node e;
            // 当前遍历的结点的key,也就是p的key
            K k;
            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
                // 如果p所存储的键值对和我们现在要存储的键值对相等,那运气很好,毕竟数组第一个结点就是
                e = p;
            else if (p instanceof TreeNode)
                // 如果p是一个树结点,那么应该使用遍历树的方式来遍历查询
                e = ((TreeNode) p).putTreeVal(this, tab, hash, key, value);
            else {
                // 否则说明当前是链表,那么应该使用遍历链表的方式来遍历查询
                for (int binCount = 0;; ++binCount) {
                    if ((e = p.next) == null) {
                        // 进入if,说明已经遍历到了链表的末尾了,这里e为null
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            // 当前链表所存储的结点已经超过了8,需要转换为红黑树
                            treeifyBin(tab, hash);
                        break;
                    }
                    // 链表中的每个结点都需要进行比较
                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            // 经过上面的遍历,e可能已经指向了旧的结点
            if (e != null) { // existing mapping for key
                V oldValue = e.value;

                if (!onlyIfAbsent || oldValue == null)
                    // 如果可以进行值覆盖
                    e.value = value;
                // afterNodeAccess(e)是个空的方法
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        // 当前的table是否已经空间不足,需要重新设置大小
        if (++size > threshold)
            resize();
        // afterNodeInsertion(evict)是个空的方法
        afterNodeInsertion(evict);
        return null;
    }

    // 内部树结点类
    static final class TreeNode extends LinkedHashMap.Entry {
        TreeNode parent; // red-black tree links
        TreeNode left;
        TreeNode right;
        TreeNode prev; // needed to unlink next upon deletion
        boolean red;

        TreeNode(int hash, K key, V val, Node next) {
            super(hash, key, val, next);
        }

        final TreeNode putTreeVal(HashMap map, Node[] tab, int h, K k, V v) {
            // key的class
            Class kc = null;
            // 是否查询,需要遍历一遍当前的红黑树,看是否已经存在这么一个键值对
            boolean searched = false;
            // root是树的根结点
            TreeNode root = (parent != null) ? root() : this;
            // 这里是根据每个结点的存的key的hash值来作为结点间的比较
            for (TreeNode p = root;;) {
                // dir作为当前结点的key的hash值比这个要存入的键值对的hash值大还是小
                // 以此来判断应该接下来是去遍历左孩子还是右孩子
                // ph是当前结点的key的hash值
                int dir, ph;
                K pk;
                if ((ph = p.hash) > h)
                    dir = -1;
                else if (ph < h)
                    dir = 1;
                else if ((pk = p.key) == k || (k != null && k.equals(pk)))
                    // 如果相等说明要存储的键值对已经在当前结点中
                    return p;
                else if ((kc == null && (kc = comparableClassFor(k)) == null)
                        // 根据两个key的copare方法进行比较是否key相同
                        || (dir = compareComparables(kc, k, pk)) == 0) {
                    if (!searched) {
                        // 只有遍历的是根结点才根据hash值、key以及class遍历整个树进行查找
                        TreeNode q, ch;
                        searched = true;
                        if (((ch = p.left) != null && (q = ch.find(h, k, kc)) != null)
                                || ((ch = p.right) != null && (q = ch.find(h, k, kc)) != null))
                            return q;
                    }
                    // tieBreakOrder(k, pk)根据hashcode值比较k与pk的大小,返回-1或1
                    // 前面比较的相当于是损失了精度的hashcode,hash是hashcode与hashcode右移16位进行异或后的值,而tieBreakOrder(k,
                    // pk)是直接比较hashcode
                    dir = tieBreakOrder(k, pk);
                }
                // xp指向当前遍历的结点p,因为马上p就会指向它的孩子,有可能p会变为null
                TreeNode xp = p;
                if ((p = (dir <= 0) ? p.left : p.right) == null) {
                    // p为null,说明整个红黑树没有找到当前要存储的这个键值对
                    Node xpn = xp.next;
                    // newTreeNode方法为return new TreeNode<>(hash, key, value,
                    // next);
                    TreeNode x = map.newTreeNode(h, k, v, xpn);
                    // 设定这个新结点为当前为左孩子还是右孩子
                    if (dir <= 0)
                        xp.left = x;
                    else
                        xp.right = x;
                    // 需要设置next、prev,因为有可能这个红黑树一会儿还会再转换为链表
                    xp.next = x;
                    x.parent = x.prev = xp;
                    if (xpn != null)
                        // xpn不为null,说明后面还有结点
                        ((TreeNode) xpn).prev = x;
                    moveRootToFront(tab, balanceInsertion(root, x));
                    return null;
                }
            }
        }

        // 确保树符合红黑树,现在最下层的结点,也就是叶子点有可能有问题,总的想法是用变色让发生问题的结点逐步趋向上层,用旋转达到平衡
        static  TreeNode balanceInsertion(TreeNode root, TreeNode x) {
            // 新加入的结点永远初始状态为红色,因为如果是黑色,会直接违反每条路径上的黑色结点数目相同这一约定
            x.red = true;
            for (TreeNode xp, xpp, xppl, xppr;;) {
                if ((xp = x.parent) == null) {
                    x.red = false;
                    // 已经遍历到根节点
                    return x;
                } else if (!xp.red || (xpp = xp.parent) == null)
                    // 父结点为黑色,那么就能直接加入,所以根节点还是原来的,直接返回
                    // 或者父节点为黑色,说明父结点为已经完成平衡的更新后的根结点
                    // 如果xpp为空,说明父结点为根结点,也直接返回
                    return root;
                if (xp == (xppl = xpp.left)) {
                    // *到这里,父节点为红色且为祖结点的左孩子*
                    if ((xppr = xpp.right) != null && xppr.red) {
                        // 叔结点不为空且叔结点为红色
                        // 这种情况只进行变色,虽然可以右旋加变换一次新加入的结点的颜色达到同样的效果,但是那样步骤多,耗时
                        // 父和叔均变为黑色,现在父和叔以及新加入的结点没有问题了
                        // 有问题的结点从祖结点开始,祖结点变为红色
                        // 在这之后会有相应的左旋或右旋操作,最终完成时,根结点会更新,变为其它的结点
                        xppr.red = false;
                        xp.red = false;
                        xpp.red = true;
                        x = xpp;
                    } else {
                        // 叔结点为空或颜色为黑色,将有问题的结点向上推,只能选择旋转加变色
                        if (x == xp.right) {
                            // 这里左旋是为了之后的右旋
                            // 经过这一步操作,只关心颜色的话红色结点变为由右孩子变为左孩子
                            // rotateLeft第二个参数是围绕哪个结点进行左旋,这里是父节点,结点的顺序旋转后会有些变化
                            root = rotateLeft(root, x = xp);
                            xpp = (xp = x.parent) == null ? null : xp.parent;
                        }
                        // 经过上面的左旋后,原本的父节点变为x,旧的x变为父节点,但是祖结点还是原来的祖结点
                        // 这里围绕祖结点进行右旋,祖结点变色
                        if (xp != null) {
                            xp.red = false;
                            if (xpp != null) {
                                xpp.red = true;
                                root = rotateRight(root, xpp);
                            }
                        }
                        // 经过上面的左旋和右旋加变色,新加入的结点或者父节点二者之一成为了祖结点,原本的祖结点变为了现在祖结点的右孩子(红色)
                        // 而叔结点变为原本的祖结点的右孩子,符合红色结点的孩子结点为黑色,此时二叉树平衡
                        // 只有旋转才能平衡,如果进入了这个else,经过上面的步骤就完成了平衡
                    }
                } else {
                    // 同上
                    if (xppl != null && xppl.red) {
                        xppl.red = false;
                        xp.red = false;
                        xpp.red = true;
                        x = xpp;
                    } else {
                        if (x == xp.left) {
                            root = rotateRight(root, x = xp);
                            xpp = (xp = x.parent) == null ? null : xp.parent;
                        }
                        if (xp != null) {
                            xp.red = false;
                            if (xpp != null) {
                                xpp.red = true;
                                root = rotateLeft(root, xpp);
                            }
                        }
                    }
                }
            }
        }

        // 将根节点设置到table索引位置,就是链表的头结点
        static  void moveRootToFront(Node[] tab, TreeNode root) {
            int n;
            if (root != null && tab != null && (n = tab.length) > 0) {
                int index = (n - 1) & root.hash;
                TreeNode first = (TreeNode) tab[index];
                if (root != first) {
                    Node rn;
                    tab[index] = root;
                    TreeNode rp = root.prev;
                    if ((rn = root.next) != null)
                        ((TreeNode) rn).prev = rp;
                    if (rp != null)
                        rp.next = rn;
                    if (first != null)
                        first.prev = root;
                    root.next = first;
                    root.prev = null;
                }
                assert checkInvariants(root);
            }
            // 总的来说,就是把原本的第一个结点first设置到root后面,也就是说first成为第二个结点
            // root结点的前后结点互相设置为相邻结点,root结点设置为头结点
        }

        // 前面的方法看过了,这里就很清楚的知道是要找到根结点和新插入的结点,做一次平衡插入,将新的根结点设置到table的相应索引位置
        final void treeify(Node[] tab) {
            TreeNode root = null;
            for (TreeNode x = this, next; x != null; x = next) {
                next = (TreeNode) x.next;
                x.left = x.right = null;
                if (root == null) {
                    x.parent = null;
                    x.red = false;
                    root = x;
                } else {
                    K k = x.key;
                    int h = x.hash;
                    Class kc = null;
                    for (TreeNode p = root;;) {
                        int dir, ph;
                        K pk = p.key;
                        if ((ph = p.hash) > h)
                            dir = -1;
                        else if (ph < h)
                            dir = 1;
                        else if ((kc == null && (kc = comparableClassFor(k)) == null)
                                || (dir = compareComparables(kc, k, pk)) == 0)
                            dir = tieBreakOrder(k, pk);

                        TreeNode xp = p;
                        if ((p = (dir <= 0) ? p.left : p.right) == null) {
                            x.parent = xp;
                            if (dir <= 0)
                                xp.left = x;
                            else
                                xp.right = x;
                            root = balanceInsertion(root, x);
                            break;
                        }
                    }
                }
            }
            moveRootToFront(tab, root);
        }
        
        //从根结点开始遍历
        final TreeNode getTreeNode(int h, Object k) {
            return ((parent != null) ? root() : this).find(h, k, null);
        }
        //kc为key的class
        final TreeNode find(int h, Object k, Class kc) {
            //这里的this通常为根结点或者根结点的左右孩子
            TreeNode p = this;
            do {
                int ph, dir; K pk;
                TreeNode pl = p.left, pr = p.right, q;
                if ((ph = p.hash) > h)
                    p = pl;
                else if (ph < h)
                    p = pr;
                else if ((pk = p.key) == k || (k != null && k.equals(pk)))
                    return p;
                else if (pl == null)
                    p = pr;
                else if (pr == null)
                    p = pl;
                else if ((kc != null ||
                          (kc = comparableClassFor(k)) != null) &&
                        //调用key的compare方法,比较两个key是否相等
                         (dir = compareComparables(kc, k, pk)) != 0)
                    p = (dir < 0) ? pl : pr;
                else if ((q = pr.find(h, k, kc)) != null)
                    return q;
                else
                    p = pl;
            } while (p != null);
            return null;
            //总之中序遍历整个树,找到了就返回,找不到返回空
        }

    }

    // 链表转树
    final void treeifyBin(Node[] tab, int hash) {
        int n, index;
        Node e;
        if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
            // 如果当前talbe的长度没有超过64个,扩容
            resize();
        else if ((e = tab[index = (n - 1) & hash]) != null) {
            // 如果当前talbe的长度超过64个,链表转化为红黑树
            // 每个链表中的每个结点都生成一个对应的树结点
            TreeNode hd = null, tl = null;
            do {
                // replacementTreeNode(e, null)方法返回为return new
                // TreeNode<>(p.hash, p.key, p.value, next);
                TreeNode p = replacementTreeNode(e, null);
                if (tl == null)
                    hd = p;
                else {
                    p.prev = tl;
                    tl.next = p;
                }
                tl = p;
            } while ((e = e.next) != null);
            // 前面已经对每一个链表中的结点都相应的生成了一个树结点,hd代表头结点,也是树暂时的根结点,此时这些树结点和table还没有关系
            if ((tab[index] = hd) != null)
                // 调用这个方法是为了对红黑树进行一次排序,并将真正的符合要求的根结点设置到table
                hd.treeify(tab);
        }
    }
    //我们平时常用的get方法
    public V get(Object key) {
        Node e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }
    //根据hash值和key获取一个结点
    final Node getNode(int hash, Object key) {
        Node[] tab; Node first, e; int n; K k;
        if ((tab = table) != null && (n = tab.length) > 0 &&
            (first = tab[(n - 1) & hash]) != null) {
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                //第一个结点的key相同就返回第一个结点
                return first;
            if ((e = first.next) != null) {
                //第一个结点不是,从第二个结点开始遍历
                if (first instanceof TreeNode)
                    //现在是一个树,那么用遍历树的方式去查询是否有这么一个结点
                    return ((TreeNode)first).getTreeNode(hash, key);
                
                do {
                    //否则是一个链表,遍历链表查看是否有这么一个结点
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        //没有找到符合的结点
        return null;
    }
    
}

上面的各个内部类的代码仅凭个人主观放了一部分,没有放全,其余的remove、isEmpty等方法有兴趣的同学可以自己看看。

你可能感兴趣的:(HashMap源码浅析)