Java并发编程札记-(五)JUC容器-03ConcurrentHashMap

今天来学习ConcurrentHashMap在JDK1.8中的实现。相比JDK1.7,JDK1.8中ConcurrentHashMap的实现有很大的不同。

结构

先来看下JDK1.7与JDK1.8中ConcurrentHashMap结构的不同。
JDK1.7结构
MarkdownPhotos/master/CSDNBlogs/concurrency/0503/ConcurrentHashMapDS1.7.png
在JDK1.7中,ConcurrentHashMap通过“锁分段”来实现线程安全。ConcurrentHashMap将哈希表分成许多片段(segments),每一个片段(table)都类似于HashMap,它有一个HashEntry数组,数组的每项又是HashEntry组成的链表。每个片段都是Segment类型的,Segment继承了ReentrantLock,所以Segment本质上是一个可重入的互斥锁。这样每个片段都有了一个锁,这就是“锁分段”。线程如想访问某一key-value键值对,需要先获取键值对所在的segment的锁,获取锁后,其他线程就不能访问此segment了,但可以访问其他的segment。

JDK1.8结构
MarkdownPhotos/master/CSDNBlogs/concurrency/0503/ConcurrentHashMapDS1.8.png
在JDK1.8中,ConcurrentHashMap放弃了“锁分段”,取而代之的是类似于HashMap的数组+链表+红黑树结构,使用CAS算法和synchronized实现线程安全。

相关内部类

  • Node。最基本的内部类,key-value键值对,不支持setValue方法。
  • TreeNode。红黑树节点,供TreeBins使用。
  • TreeBin。红黑树结构。该类并不包装key-value键值对,而是TreeNode的列表和它们的根节点。这个类含有读写锁。
  • ForwardingNode。不是传统的节点,不包含key-value键值对,包含一个nextTable指针,和find方法 。

核心方法

下面学习ConcurrentHashMap的核心方法,如get(Object)、put(K key, V value)。先来看个最简单的get(Object)方法热热身。

get
public V get(Object key) {
    Node[] tab; Node e, p; int n, eh; K ek;
    //计算key的哈希值
    int h = spread(key.hashCode());
    //如果表不为空,表长度大于0,key所在的桶的头结点不为null
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (e = tabAt(tab, (n - 1) & h)) != null) {
        if ((eh = e.hash) == h) {//如果查到的桶的头结点的key哈希值与参数key的哈希值相同
            if ((ek = e.key) == key || (ek != null && key.equals(ek)))//如果查到的桶的头结点的key参数key相等,返回桶的头结点的value
                return e.val;
        }
        else if (eh < 0)//如果查到的桶的头结点的key哈希值小于0,即要找的在树上
            return (p = e.find(h, key)) != null ? p.val : null;
        while ((e = e.next) != null) {//如果要找的节点既不是桶的头结点也不是在树上,那就说明在链表上
            if (e.hash == h &&
                ((ek = e.key) == key || (ek != null && key.equals(ek))))//遍历链表,找到节点,返回值
                return e.val;
        }
    }
    //如果都没找到,返回null
    return null;
}

可以将步骤总结如下:

  1. 通过key计算哈希值
  2. 通过哈希值找到桶
  3. 通过哈希值和桶来查找节点
    3.1. 以此判断桶的头结点是不是要找的节点
    3.2. 如果不是,判断桶的头节点的哈希值是否小于0,如果是则说明要找的节点在树上
    3.3. 如果以上两个条件都不满足,则说明要找的节点在链表上,遍历链表,查找节点
  4. 如果通过以上步骤找到了节点,返回节点的value。没找到,就返回null。

从源码中可以看出,上面的步骤并没有加锁。

put
public V put(K key, V value) {
    return putVal(key, value, false);
}

/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    //计算哈希值
    int hash = spread(key.hashCode());
    int binCount = 0;
    //死循环,只有插入成功才能跳出循环
    for (Node[] tab = table;;) {
        Node f; int n, i, fh;
        //如果table没有初始化,初始化table
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        //根据哈希值计算在table中的位置
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            //如果这个位置没有值,直接将键值对放进去,不需要加锁
            if (casTabAt(tab, i, null,
                         new Node(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        //如果要插入的位置是一个forwordingNode节点,表示正在扩容,那么当前线程帮助扩容
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        else {
            V oldVal = null;
            //进行到这一步,说明要插入的位置有值,需要加锁
            synchronized (f) {
                //确定f是tab中的头节点
                if (tabAt(tab, i) == f) {
                    //如果头结点的哈希值大于等于0,说明要插入的节点在链表中
                    if (fh >= 0) {
                        binCount = 1;
                        //遍历链表中的所有节点
                        for (Node e = f;; ++binCount) {
                            K ek;
                            //如果某一节点的key哈希值和key与参数相等,替换节点的value
                            if (e.hash == hash &&
                                ((ek = e.key) == key ||
                                 (ek != null && key.equals(ek)))) {
                                oldVal = e.val;
                                if (!onlyIfAbsent)
                                    e.val = value;
                                break;
                            }
                            Node pred = e;
                            //遍历到了最后一个节点,还没找到key对应的节点,根据参数新建节点,插入链表尾部
                            if ((e = e.next) == null) {
                                pred.next = new Node(hash, key,
                                                          value, null);
                                break;
                            }
                        }
                    }
                    //如果要插入的节点在树中,则按照树的方式插入或替换节点
                    else if (f instanceof TreeBin) {
                        Node p;
                        binCount = 2;
                        if ((p = ((TreeBin)f).putTreeVal(hash, key,
                                                       value)) != null) {
                            oldVal = p.val;
                            if (!onlyIfAbsent)
                                p.val = value;
                        }
                    }
                }
            }
            //如果binCount不为0,说明插入或者替换操作完成了
            if (binCount != 0) {
                //判断节点数量是否大于8,如果大于就需要把链表转化成红黑树
                if (binCount >= TREEIFY_THRESHOLD)
                    treeifyBin(tab, i);
                if (oldVal != null)
                    return oldVal;//如果在链表中找到了指定key的节点,返回被替换的value
                break;
            }
        }
    }
    //能执行到这一步,说明节点不是被替换的,是被插入的,所以要将map的元素数量加1
    addCount(1L, binCount);
    return null;
}

可以将步骤总结如下:

  1. 计算key哈希值
  2. 根据哈希值计算在table中的位置
  3. 根据哈希值执行插入或替换操作
    3.1 如果这个位置没有值,直接将键值对放进去,不需要加锁。
    3.2 如果要插入的位置是一个forwordingNode节点,表示正在扩容,那么当前线程帮助扩容
    3.3 加锁。以下操作都需要加锁。
    3.4 如果要插入的节点在链表中,遍历链表中的所有节点,如果某一节点的key哈希值和key与参数相等,替换节点的value,记录被替换的值;如果遍历到了最后一个节点,还没找到key对应的节点,根据参数新建节点,插入链表尾部。
    3.5 如果要插入的节点在树中,则按照树的方式插入或替换节点。如果是替换操作,记录被替换的值
  4. 判断节点数量是否大于8,如果大于就需要把链表转化成红黑树
  5. 如果操作3中执行的是替换操作,返回被替换的value。程序结束。
  6. 能执行到这一步,说明节点不是被替换的,是被插入的,所以要将map的元素数量加1。

可以看出,修改table结构使用了synchronized。进入addCount方法看看,

private final void addCount(long x, int check) {
    CounterCell[] as; long b, s;
    if ((as = counterCells) != null ||
        !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
        CounterCell a; long v; int m;
        boolean uncontended = true;
        if (as == null || (m = as.length - 1) < 0 ||
            (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
            !(uncontended =
              U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
            fullAddCount(x, uncontended);
            return;
        }
        if (check <= 1)
            return;
        s = sumCount();
    }
    if (check >= 0) {
        Node[] tab, nt; int n, sc;
        while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
               (n = tab.length) < MAXIMUM_CAPACITY) {
            int rs = resizeStamp(n);
            if (sc < 0) {
                if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                    sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                    transferIndex <= 0)
                    break;
                if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    transfer(tab, nt);
            }
            else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                         (rs << RESIZE_STAMP_SHIFT) + 2))
                transfer(tab, null);
            s = sumCount();
        }
    }
}

可以看出,修改table大小时使用了CAS算法。

JDK1.8与JDK1.7中的ConcurrentHashMap对比
待补充

ConcurrentHashMap与HashTable的对比

HashTable通过在每个方法上加Synchronized完成同步,效率低下。ConcurrentHashMap通过在链表上加锁来实现同步。相比之下ConcurrentHashMap增加了锁的个数,从而提高了效率。

未完待续。。

你可能感兴趣的:(Java并发,Java并发编程札记)