JUC详解(二)并发集合(3)CopyOnWriteArrayList

为什么用CopyOnWriteArrayList

CopyOnWriteArrayList引入

模拟传统的ArrayList出现线程不安全的现象

public class Demo1 {
    public static void main(String[] args) {
        //List list = new CopyOnWriteArrayList<>();
        List list = new ArrayList<>();

        //开启50个线程往ArrayList中添加数据
        for (int i = 1; i <= 50; i++) {
            new Thread(() -> {
                list.add(UUID.randomUUID().toString().substring(0, 5));
                System.out.println(list);
            }, String.valueOf(i)).start();
        }

    }
}

运行结果如下:由于fail-fast机制的存在,抛出了modcount修改异常的错误(modcount是ArrayList源码中的一个变量,用来表示修改的次数,因为ArrayList不是为并发情况而设计的集合类)

如何解决该问题呢?

方式一:可以使用Vector集合,Vector集合是线程安全版的ArrayList,其方法都上了一层synchronized进行修饰,采取jvm内置锁来保证其并发情况下的原子性、可见性、有序性。但同时也带来了性能问题,因为synchronized一旦膨胀到重量级锁,存在用户态到和心态的一个转变,多线程的上下文切换会带来开销。另一个问题是Vector集合的扩容没有ArrayList的策略好

List list = new Vector<>();

方式二:使用Collections.synchronizedList

List list = Collections.synchronizedList(new ArrayList<>());

方式三:采用JUC提供的并发容器,CopyOnWriteArrayList

List list = new CopyOnWriteArrayList<>();

CopyOnWriteArrayList容器允许并发读,读操作是无锁的,性能较高。至于写操作,比如向容器中添加一个元素,则首先将当前容器复制一份,然后在新副本上执行写操作,结束之后再将原容器的引用指向新容器。


image.png

CopyOnWriteArrayList源码分析

构造函数
 
    public CopyOnWriteArrayList() {
       //默认创建一个大小为0的数组
        setArray(new Object[0]);
    }

    final void setArray(Object[] a) {
        array = a;
    }
    
    public CopyOnWriteArrayList(Collection c) {
        Object[] elements;
        //如果当前集合是CopyOnWriteArrayList的类型的话,直接赋值给它
        if (c.getClass() == CopyOnWriteArrayList.class)
            elements = ((CopyOnWriteArrayList)c).getArray();
        else {
            //否则调用toArra()将其转为数组   
            elements = c.toArray();
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elements.getClass() != Object[].class)
                elements = Arrays.copyOf(elements, elements.length, Object[].class);
        }
        //设置数组
        setArray(elements);
    }
    
    public CopyOnWriteArrayList(E[] toCopyIn) {
        //将传进来的数组元素拷贝给当前数组
        setArray(Arrays.copyOf(toCopyIn, toCopyIn.length, Object[].class));
    }
    

读数据的几个操作,可见都没上锁
    final Object[] getArray() {
        return array;
    }
    public int size() {
        return getArray().length;
    }
   public boolean isEmpty() {
        return size() == 0;
    }
    public int indexOf(E e, int index) {
        Object[] elements = getArray();
        return indexOf(e, elements, index, elements.length);
    }
    public int lastIndexOf(Object o) {
        Object[] elements = getArray();
        return lastIndexOf(o, elements, elements.length - 1);
    }
    
    ........

修改时的add函数

可见其修改操作是基于fail-safe机制,像我们的String一样,不在原来的对象上直接进行操作,而是复制一份对其进行修改,另外此处的修改操作是利用Lock锁进行上锁的,所以保证了线程安全问题。

    public boolean add(E e) {
        //使用ReentrantLock上锁
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            //调用getArray()获取原来的数组
            Object[] elements = getArray();
            int len = elements.length;
            //复制老数组,得到一个长度+1的数组
            Object[] newElements = Arrays.copyOf(elements, len + 1);
            //添加元素,在用setArray()函数替换原数组
            newElements[len] = e;
            setArray(newElements);
            return true;
        } finally {
            lock.unlock();
        }
    }

remove操作
    public boolean remove(Object o) {
        Object[] snapshot = getArray();
        int index = indexOf(o, snapshot, 0, snapshot.length);
        return (index < 0) ? false : remove(o, snapshot, index);
    }

    private boolean remove(Object o, Object[] snapshot, int index) {
        final ReentrantLock lock = this.lock;
        //上锁
        lock.lock();
        try {
            Object[] current = getArray();
            int len = current.length;
            if (snapshot != current) findIndex: {
                int prefix = Math.min(index, len);
                for (int i = 0; i < prefix; i++) {
                    if (current[i] != snapshot[i] && eq(o, current[i])) {
                        index = i;
                        break findIndex;
                    }
                }
                if (index >= len)
                    return false;
                if (current[index] == o)
                    break findIndex;
                index = indexOf(o, current, index, len);
                if (index < 0)
                    return false;
            }
            //复制一个数组
            Object[] newElements = new Object[len - 1];
            System.arraycopy(current, 0, newElements, 0, index);
            System.arraycopy(current, index + 1,
                             newElements, index,
                             len - index - 1);
            //替换原数组
            setArray(newElements);
            return true;
        } finally {
            lock.unlock();
        }
    }

优缺点分析

了解了CopyOnWriteArrayList的实现原理,分析它的优缺点及使用场景就很容易了。

优点:

读操作性能很高,因为无需任何同步措施,比较适用于读多写少的并发场景。Java的list在遍历时,若中途有别的线程对list容器进行修改,则会抛出ConcurrentModificationException异常。而CopyOnWriteArrayList由于其"读写分离"的思想,遍历和修改操作分别作用在不同的list容器,所以在使用迭代器进行遍历时候,也就不会抛出ConcurrentModificationException异常了

缺点:

缺点也很明显。
一、内存占用问题,毕竟每次执行写操作都要将原容器拷贝一份,数据量大时,对内存压力较大,可能会引起频繁GC;
二、无法保证实时性,Vector对于读写操作均加锁同步,可以保证读和写的强一致性。而CopyOnWriteArrayList由于其实现策略的原因,写和读分别作用在新老不同容器上,在写操作执行过程中,读不会阻塞但读取到的却是老容器的数据。

CopyOnWriteArrayList 合适读多写少的场景,不过这类慎用**

因为谁也没法保证CopyOnWriteArrayList 到底要放置多少数据,万一数据稍微有点多,每次add/set都要重新复制数组,这个代价实在太高昂了。在高性能的互联网应用中,这种操作分分钟引起故障。

CopyOnWriteArrayList为什么并发安全且性能比Vector好?

Vector对单独的add,remove等方法都是在方法上加了synchronized; 并且如果一个线程A调用size时,另一个线程B 执行了remove,然后size的值就不是最新的,然后线程A调用remove就会越界(这时就需要再加一个Synchronized)。这样就导致有了双重锁,效率大大降低,何必呢。于是vector废弃了,要用就用CopyOnWriteArrayList 吧。

你可能感兴趣的:(JUC详解(二)并发集合(3)CopyOnWriteArrayList)