Vector和List 有关线程安全和线程同步的理解

最近在学习的时候,一直很疑惑Vector和List的两个容器的区别。

在网上查了好多资料,知道Vector的许多方法都是线程同步的,在多线程访问的时候,是线程安全的(这里的线程安全是有限的)。而List在多线程访问的时候,是非线程安全的。

原因是由于Vector在好多方法中加入了sychronized关键字修饰。比如addElement方法中:

public synchronized void addElement(E obj) {
        modCount++;
        ensureCapacityHelper(elementCount + 1);
        elementData[elementCount++] = obj;
    }

这样在多线程并发访问Vector实例的时候,保证了某一刻最多只能有一个线程调用Vector中被sychronized修饰的方法。

而反观List,例如ArrayList中的add方法:

  public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

有可能同一时刻有一个以上的线程访问该方法。

我们知道size++运算过程不是原子操作,有可能被中断。那么如果在size++的过程中被中断,而另外一个线程恰好执行了一次这个方法,就会造成脏数据的产生。

如果你的代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。
或者说:一个类或者程序所提供的接口对于线程来说是原子操作或者多个线程之间的切换不会导致该接口的执行结果存在二义性,也就是说我们不用考虑同步的问题。
线程安全问题都是由全局变量及静态变量引起的。
若每个线程中对全局变量、静态变量只有读操作,而无写操作,一般来说,这个全局变量是线程安全的;若有多个线程同时执行写操作,一般都需要考虑线程同步,否则的话就可能影响线程安全。
比如上例中一个 ArrayList 类,在添加一个元素的时候,它可能会有两步来完成:1. 在 Items[Size] 的位置存放此元素;2. 增大 Size 的值。
在单线程运行的情况下,如果 Size = 0,添加一个元素后,此元素在位置 0,而且 Size=1;
而如果是在多线程情况下,比如有两个线程,线程 A 先将元素存放在位置 0。但是此时 CPU 调度线程A暂停,线程 B 得到运行的机会。线程B也向此 ArrayList 添加元素,因为此时 Size 仍然等于 0 (注意哦,我们假设的是添加一个元素是要两个步骤哦,而线程A仅仅完成了步骤1),所以线程B也将元素存放在位置0。然后线程A和线程B都继续运行,都增加 Size 的值。
那好,我们来看看 ArrayList 的情况,元素实际上只有一个,存放在位置 0,而 Size 却等于 2。这就是“线程不安全”了。

也就是说像HashTable和Vector这样的容器实现了线程安全,是通过同步关键字实现的。

此外,我们又注意到,不管是Vector还是List容器,都有可能会出现ConCurrenceModificationException的异常。这是因为几乎所有的集合类都有快速失败的(Fail-Fast)校验机制。这是为了确保集合方法一致而设立的保护措施。他的实现原理就是modCount修改计数器。如在遍历列表的时候(使用迭代器的方式),这时候会保存当前的modCount值,当每次迭代器取值的时候,会通过checkForComodification()方法来校验modCount是否发生了改变。如果发生了改变,就会抛出ConCurrenceModificationException的异常。

public E next() {
            checkForComodification();
            int i = cursor;
            if (i >= size)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }
final void checkForComodification() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }

那么,即使是使用Vector仍可能会抛出这种异常,这是不是和它声称的线程安全所相悖呢?

其实这里的异常和线程同步是两码事。因为使用迭代器遍历容器的时候,这是记录了modCount值,然后调用了remove方法,这在单线程中本来就是不允许的,和多线程同步没有关系。

线程同步是为了实现线程安全,而在Vector中则是实现了线程的部分安全。

线程安全性不是一个非真即假的命题。 Vector 的方法都是同步的,并且 Vector 明确地设计为在多线程环境中工作。但是它的线程安全性是有限制的,即在某些方法之间有状态依赖(类似地,如果在迭代过程中 Vector 被其他线程修改,那么由 Vector.iterator() 返回的 iterator会抛出ConcurrentModifiicationException。

以上是个人理解,如有不对的地方请大家批评指正。

你可能感兴趣的:(Vector和List 有关线程安全和线程同步的理解)