Java集合类不安全分析

我们平时编码时使用集合类,都是new 一个 ArrayList 或者 HashSet 或者 HashMap就直接开用,好像也没遇到啥问题。那这里为什么说集合不安全呢?下面一 一道来。

一、集合不安全之List

1、故障现象:
先看下面一段代码:

 List list = new ArrayList<>();
 for (int x = 0; x < 30; x ++){
        new Thread( () -> {
            list.add("哈哈");
        }).start();
 }
 System.out.println(list.toString());

这段代码很简单,就是创建30个线程,每个线程往list集合add元素,看似没啥问题,看代码的运行结果:


Java集合类不安全分析_第1张图片
运行结果

运行抛异常了,这便是并发修改异常。

2、导致原因:
并发修改异常是因为线程并发争抢修改导致。举个例子:上课的时候老师拿了一份名单要点名,说来了的同学就上去签自己的名字。这份名单就是集合,每个同学就是一个线程。上去签名就是往集合中添加元素的add操作。当张三同学上去签名的时候,刚写完 “张” 字,李四同学就上来把笔抢了去,结果就是张三同学的名只签了一半。这就是并发修改异常。

3、解决方案:

  • 第一种办法,可以使用线程安全的Vector类,它的方法都加了锁,可以保证线程安全。不过Vector现在很少人用,因为并发性不好。
  • 第二种办法,使用Collections工具类。如下:
List list = Collections.synchronizedList(new ArrayList<>());

这个方法顾名思义,就是可以把ArrayList变成安全的。所以它也可以解决并发修改异常。

  • 第三种办法,使用JUC包中的CopyOnWriteArrayList类。CopyOnWrite的意思是写时复制。看看如何使用它解决并发修改异常。
List list = new CopyOnWriteArrayList<>();

就是new 一个 CopyOnWriteArrayList就可以了。那么这个类为什么能保证线程安全呢?看一下它的源码:

 public boolean add(E e) {
        final ReentrantLock lock = this.lock;
        lock.lock();
        try {
            Object[] elements = getArray();
            int len = elements.length;
            Object[] newElements = Arrays.copyOf(elements, len + 1);
            newElements[len] = e;
            setArray(newElements);
            return true;
        } finally {
            lock.unlock();
        }
}

所谓写时复制,就是写的时候不是直接在原来的数组中写,而是先复制一份,写完后再引用这个新的。还是签名的例子:老师说同学们一个个地上来签名。张三上去了,把那份名单copy了一份,签上了自己的名字。在张三签名的过程中,其他同学还是可以读老师的那份名单的。当张三签完了,然后再告诉同学们,之前那份名单作废了,现在用这份新的。这就是整个过程,对应了上面的代码。首先用lock锁住这段代码,即张三签名过程中其他同学不能再来抢笔了;然后获取到原来的数组,定义一个新数组,长度为原来的数组加1,把原数组内容复制到新数组中,这是张三复制名单的过程;然后将要add的元素添加到新数组的最后,这就是张三写自己名字的过程;再后来将引用指向新数组,这是张三告诉大家用这份新名单的过程;最后释放锁,也就是张三把笔放下,下一个同学可以去签名了。
这也就是读写分离的思想,写的时候复制原来的,写操作完成前,读数据还是读原来的,写完成后,读新的。

二、集合不安全之Set

  • 在说Set不安全之前先简单地说一下HashSet底层是数据结构:
    HashSet底层是由HashMap实现的,HashMap的key就是set集合add的元素,而HashMap的value是一个Object类型的常量。

1、故障现象:

ist set = new HashSet<>();
 for (int x = 0; x < 30; x ++){
        new Thread( () -> {
            set.add("哈哈");
        }).start();
 }
 System.out.println(set.toString());

把上面的ArrayList换成HashSet,一样会报并发修改异常。导致原因也是一样的,下面直接看看解决原因。

2、解决方案:

  • 使用Collections工具类的synchronizedSet方法。
  • 使用CopyOnWriteArraySet类。注意这个类,实际上还是CopyOnWriteArrayList类。看它构造方法的源码就可以知道了。构造方法如下:
 public CopyOnWriteArraySet() {
        al = new CopyOnWriteArrayList();
 }

三、集合不安全之Map

Map集合同样会出现上述问题。很容易让人想到解决方案也是和上面一样,其实有点区别。首先,的确可以使用Collections工具类的synchronizedMap方法,其次,也可以使用HashTable。HashTable所有的方法都加了锁,所以可以保证安全。但是也正因它所有方法都加了锁,并发性不好,所以不推荐使用。第三种办法,可能会想到写时复制,其实java没有为map提供写时复制的类。我们可以使用ConcurrentHashMap,这个也是线程安全的,而且性能还不错。它是使用了CAS来保证安全性。我另一篇文章《Java源码解读---HashMap&ConcurrentHashMap》中有介绍,大家可以参考一下。

  • Collections.synchronizedXxx原理:
    上面说到解决List、Set、Map的安全问题都可以使用Collections工具类,那么它原理是什么呢?来看一下源码(拿synchronizedList来说明):
public static  List synchronizedList(List list) {
        return (list instanceof RandomAccess ?
                new SynchronizedRandomAccessList<>(list) :
                new SynchronizedList<>(list));
}

首先它判断你new的集合有没有实现RandomAccess接口 (这个接口是一个标记接口,ArrayList就实现了这个接口。作用就是,如果实现了这个接口,那么就说明支持快速随机访问,如果支持快速随机方法,那么取元素的时候就用for循环,否则就用迭代器。这是因为,如果不支持快速随机访问,用迭代器获取元素效率会更高。ArrayList由数组实现,可以通过索引获取元素,显然是支持快速随机访问) 。然后 new SynchronizedRandomAccessList<>(list);其实就是对传进去的list的方法加上了同步代码块,所以可以保证线程安全。它和Vector、HashTable的区别也就在于,它使用的是同步代码块,而后两者使用的是同步方法。

总结:

在多线程环境中,List、Set、Map都是不安全的,会出现并发修改异常,需要使用JUC包中对应的类进行处理。

你可能感兴趣的:(Java集合类不安全分析)