简单聊聊 HashMap

哈喽,今天我们来聊聊HashMap。

HashMap相信大家在平时开发的时候也会经常用到,它是基于哈希表的 Map 接口的实现,以key-value的形式存在。

Java 1.8开始HashMap在存储方面用的是数组+链表+红黑树的组合形式。当链表元素达到一定个数时会转为红黑树,小于一定个数时会由红黑树转为链表。

public class HashMap extends AbstractMap implements Map, Cloneable, Serializable

HashMap实现了Map接口,继承AbstractMap。其中Map接口定义了键映射到值的规则,而AbstractMap类提供 Map 接口的骨干实现,以最大限度地减少实现此接口所需的工作。

重要参数

    //HashMap默认容量16。
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 

    //HashMap最大容量1 << 30。
    static final int MAXIMUM_CAPACITY = 1 << 30;

    //HashMap默认负载因子为0.75,如果HashMap中的元素个数达到了负载因子和容量的积的时候,
    //那么HashMap就会扩容,扩容后会重新排列元素位置,这样会消耗性能,所以负载因子的大小也很关键。
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

    //链表元素达到8个,会将链表转为红黑树。
    static final int TREEIFY_THRESHOLD = 8;

    //红黑树元素个数小于6个,会将红黑树转为链表。
    static final int UNTREEIFY_THRESHOLD = 6;

    //容量*负载因子
    int threshold;

Node

    static class Node implements Map.Entry {
        final int hash;
        final K key;
        V value;
        Node next;

        Node(int hash, K key, V value, Node next) {
            this.hash = hash;
            this.key = key;
            this.value = value;
            this.next = next;
        }
        ......
    }

这个是HashMap中的节点,hash是存放hash值。key和value分别对应存入HashMap时传入的key和value,next是在链表的时候指向下一个节点。

接下来看看HashMap的构造函数

HashMap()

    public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

这个构造函数初始化负载因子为默认值。

HashMap(int initialCapacity)

    public HashMap(int initialCapacity) {
        this(initialCapacity, DEFAULT_LOAD_FACTOR);
    }

这个构造函数直接调用了另一个构造函数HashMap(int initialCapacity, float loadFactor),并且传入了初始容量initialCapacity,负载因子依旧用的默认值。

HashMap(int initialCapacity, float loadFactor)

    public HashMap(int initialCapacity, float loadFactor) {
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal initial capacity: " +
                                               initialCapacity);
        if (initialCapacity > MAXIMUM_CAPACITY)
            initialCapacity = MAXIMUM_CAPACITY;
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal load factor: " +
                                               loadFactor);
        this.loadFactor = loadFactor;
        this.threshold = tableSizeFor(initialCapacity);
    }

这个构造函数分别传入了初始容量和负载因子。这里最后调用了tableSizeFor这个方法,因为HashMap的容量为2的次幂,所以当我们传入容量的时候会调用tableSizeFor方法来获取一个最接近我们传入容量的2的次幂。

肯定有人会异或这个threshold参数不是容量乘以负载因子吗,确实是,只不过这里还没有初始化table,在初始化table的时候这个值会重新进行计算的。

HashMap(Map m)

    public HashMap(Map m) {
        //将负载因子设置为默认值0.75。
        this.loadFactor = DEFAULT_LOAD_FACTOR;
        putMapEntries(m, false);
    }

    final void putMapEntries(Map m, boolean evict) {
        //获取传入Map的元素个数。
        int s = m.size();
        if (s > 0) {
            if (table == null) { // pre-size
                //计算出存入Map适合的HashMap容量。
                float ft = ((float)s / loadFactor) + 1.0F;
                int t = ((ft < (float)MAXIMUM_CAPACITY) ?
                         (int)ft : MAXIMUM_CAPACITY);
                if (t > threshold)
                    threshold = tableSizeFor(t);
            }
            else if (s > threshold)
                //如果传入Map元素个数大于HaspMap阀值,重新计算HashMap容量。
                resize();
            //将Map的元素存入HashMap中。
            for (Map.Entry e : m.entrySet()) {
                K key = e.getKey();
                V value = e.getValue();
                putVal(hash(key), key, value, false, evict);
            }
        }
    }

关键解释已经写在了代码中。

get(Object key)

    public V get(Object key) {
        Node e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

    final Node getNode(int hash, Object key) {
        Node[] tab; 
        Node first, e; 
        int n; 
        K k;
        //判断table是否为null,然后根据出入的hash计算出元素在table上相应的位置,并将获取得到元素赋值给first。
        //因为这里获取到的可能是链表或者红黑树的第一个元素。
        if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {
            //如果first的hash和key和传入的key相匹配,则返回first。
            if (first.hash == hash && // always check first node
                ((k = first.key) == key || (key != null && key.equals(k))))
                return first;
            if ((e = first.next) != null) {
                //如果为红黑树,则调用getTreeNode方法获取相对应的元素。
                if (first instanceof TreeNode)
                    return ((TreeNode)first).getTreeNode(hash, key);
                //如果是链表,则用循环来获取对应的元素。
                do {
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        return e;
                } while ((e = e.next) != null);
            }
        }
        //如果没有找到,则返回null。
        return null;
    }

关键解释已经在代码中。

put(K key, V value)

    public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
        //这里onlyIfAbsent传入的是false,则为将覆盖现有值。
        Node[] tab; 
        //数组对应位置上的第一个元素
        Node p; 
        int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            //如果table为null,则初始化table。
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            //如果数组相应位置上为null,则表示没有元素,直接将新元素添加到数组。
            tab[i] = newNode(hash, key, value, null);
        else {
            //key和hash值和传入的key相对应的元素
            Node e;
            K k;
            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
                //如果传入的key和已有的key一样,将元素赋值给e。
                e = p;
            else if (p instanceof TreeNode)
                //如果为红黑树,这调用putTreeVal方法添将元素赋值给e。
                e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
            else {
                //如果为链表,会判断是否有相同的key,有的话将该元素赋值给e,如果到链表末尾还是没有
                //则将元素添加到链表末尾。
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            //如果链表元素个数达到8个,则转换为红黑树
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }

            if (e != null) {
                //如果e不为null,证明找到了有相同key和hash的元素,则直接覆盖。
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
             //判断是否需要扩容。
            resize();
        afterNodeInsertion(evict);
        return null;
    }

关键解释已经写在代码中。

remove(Object key)

    public V remove(Object key) {
        Node e;
        return (e = removeNode(hash(key), key, null, false, true)) == null ?
            null : e.value;
    }

    final Node removeNode(int hash, Object key, Object value, boolean matchValue, boolean movable) {
        Node[] tab; 
        //数组对应位置的第一个元素。
        Node p; 
        int n, index;
        if ((tab = table) != null && (n = tab.length) > 0 && (p = tab[index = (n - 1) & hash]) != null) {
            Node node = null, e; 
            K k; 
            V v;
            if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
                //如果p相匹配,将p赋值给node。
                node = p;
            else if ((e = p.next) != null) {
                //如果是红黑树,则调用getTreeNode将对应元素找出并赋值给node。
                //如果为链表,则用循环将元素找出并赋值给node。
                if (p instanceof TreeNode)
                    node = ((TreeNode)p).getTreeNode(hash, key);
                else {
                    do {
                        if (e.hash == hash &&
                            ((k = e.key) == key ||
                             (key != null && key.equals(k)))) {
                            node = e;
                            break;
                        }
                        p = e;
                    } while ((e = e.next) != null);
                }
            }
            if (node != null && (!matchValue || (v = node.value) == value || (value != null && value.equals(v)))) {
                if (node instanceof TreeNode)
                    //如果为红黑树,调用removeTreeNode方法删除元素。
                    ((TreeNode)node).removeTreeNode(this, tab, movable);
                //不为红黑树,将对应值赋值给链表中的下一个元素。
                else if (node == p)
                    tab[index] = node.next;
                else
                    p.next = node.next;
                ++modCount;
                --size;
                afterNodeRemoval(node);
                return node;
            }
        }
        return null;
    }

关键解释写在了代码中。

clear()

    public void clear() {
        Node[] tab;
        modCount++;
        if ((tab = table) != null && size > 0) {
            size = 0;
            for (int i = 0; i < tab.length; ++i)
                tab[i] = null;
        }
    }

clear方法很简单,就是将数组所有元素设置为null。


到这里HashMap的基本方法就分析完了,里面涉及到红黑树的部分都是一笔带过,感兴趣的同学可以自行了解。

如果上文中有错误的地方欢迎大家指出。

3Q

你可能感兴趣的:(简单聊聊 HashMap)