ConcurrentHashMap解析

一 ConcurrentHashMap 和 Hashtable 的区别

ConcurrentHashMap 和 Hashtable 的区别主要体现在实现线程安全的方式上不同。

  • 底层数据结构: JDK1.7 的 ConcurrentHashMap 底层采用分段的数组+链表 实现,JDK1.8采用的数据结HashMap1.8 的结构一样,数组+链表/红黑二叉树。 Hashtable 和JDK1.8 之前的 HashMap 的底层数据结构类似都是采用数组+链表 的形式,数组是HashMap 的主体,链表则是主要为了解决哈希冲突而存在的;

  • 实现线程安全的形式(重要):

  1. 在 JDK1.7 的时候, ConcurrentHashMap (分段锁)对整个桶数组进行了分割分段( Segment ),每一把锁只锁容器其中一部分数据,多线程访问容器里不同数据段的数据,就不会存在锁竞争,提高并发访问率。 到了 JDK1.8 的时候已经摒弃了 Segment 的概念,而是直接用Node 数组+链表+红黑树的数据结构来实现,并发控制使用synchronized 和 CAS 来操作。(JDK1.6 以后 对 synchronized 锁做了很多优化) 整个看起来就像是优化过且线程安全的 HashMap ,虽然在 JDK1.8 中还能看到Segment 的数据结构,但是已经简化了属性,只是为了兼容旧版本;
  2. Hashtable (同一把锁) :使用synchronized 来保证线程安全,效率非常低下。当多个线程访问同步方法时,其他线程也访问同步方法,可能会进入阻塞或轮询状态,如使使用put 添加元素,另一个线程不能使用put 添加元素,也不能使用get,竞争会越来越激烈效率越低。

JDK1.8 的 ConcurrentHashMap:
JDK1.8 的 ConcurrentHashMap 不在是 Segment 数组 + HashEntry 数组 + 链表,而是 Node 数
组 + 链表 / 红⿊树。不过,Node 只能用于链表的情况,红黑树的情况需要使用 TreeNode 。当
冲突链表达到一定程度时,链表会转换成红黑树。

二 ConcurrentHashMap线程安全的具体实现形式/底层具体实现

1.JDK1.7

  • 先将数据分为一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个
    段数据时,其他段的数据也能被其他线程访问。
    ConcurrentHashMap 是由 Segment 数组结构和 HashEntry 数组结构组成。
    Segment 实现了 ReentrantLock ,所以 Segment 是一种可重入锁,扮演锁的⻆色。 HashEntry 用
    于存储键值对数据。

    static class Segment extends ReentrantLock implements Serializable {
    }
    

    一个 ConcurrentHashMap 里包含一个Segment 数组。 Segment 的结构和HashMap 类似,是
    一种数组和链表结构,一个 Segment 包含一个 HashEntry 数组,每个HashEntry 是一个链表
    结构的元素,每个 Segment 守护着一个 HashEntry 数组里的元素,当对HashEntry数组的数
    据进行修改时,必须得先获得对应的Segment的锁。

  1. JDK1.8
  • ConcurrentHashMap 取消了Segment分段锁,采用CAS和synchronized 来保证并发安全。数
    据结构跟 HashMap1.8 的结构类似,数组+链表/红黑二叉树。Java 8 在链表长度超过一定阈值
    (8)时将链表(寻址时间复杂度为 O(N))转换为红黑树(寻址时间复杂度为 O(log(N)))
    synchronized 只锁定当前链表或红黑二叉树的首节点,这样只要 hash 不冲突,就不会产生并
    发,效率又提升 N 倍。

三 CAS

解决轻微冲突的多线程并发场景下使用锁造成性能损耗的一种机制,每一次操作都进行加锁和解锁的成本是很高的,在并发较低的情况下使用这种是很奢侈的,CAS是先比较如果不符合预期就进行重试,如果成功了或者达到了某个阈值就退出,他包括是三个操作要素,内存位置,预期原值和新值

public final int getAndIncrement(){
    for(;;){
        int current = get();
        int next = current +1;
        if (compareAndSet(current, next)){
            return current;
        }
    }
}

CAS的这波操作也有一个问题,就ABA问题,如果一个操作,本来的数据是A,然后被改成B,最后又被改成A,那么CAS是无法识别的,解决方案是记录数据的修改。

四 ConcurrentHashMap是在哪里加锁的

  • JDK1.7
    是锁在Segment上的,因为他继承了ReentrantLock
  • JDK1.8
    是通过CAS和synchronized来保证并发安全,CAS是判断数组中增加链表头节点时处理,synchronized是放在链表的首节点上。

你可能感兴趣的:(ConcurrentHashMap解析)