讲讲ArrayList

在之前《Java中的Collection》文章中简单粗略的介绍了Java中Collection前世今生及常用的Collection，这篇文章我们就单独聊聊ArrayList—一个Java开发者开发过程中绕不开的数据结构。

public class ArrayList extends AbstractList
        implements List, RandomAccess, Cloneable, java.io.Serializable

通过这个可以查看到ArrayList继承了AbstractList并实现List、RandomAccess、Cloneable，Serializable等接口；通过这些接口我们大概知道了ArrayList拥有的基本的特性：

必须保持元素特定的顺序(是一个List)
支持快速（通常是固定时间）随机访问(RandomAccess)
支持对象clone，是浅复制还是深复制，看是如何实现clone()方法（Cloneable）
支持对象序列化(Serializable)

他是List

既然他是List，那么他就应该拥有List的一切特性—add/remove/iterator。
我们先看看ArrayList的构造

    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

通过以上代码我们可以发现，当构造一个ArrayList对象时创建了一个initialCapacity大小的数组—一个elementData成员变量。通过这个构造方法我们不会得到太多的信息，我们只知道ArrayList创建了一个指定大小的数组。

    public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

上面就是List特性之一的add方法，他返回的结果永远都是true，另外执行了ensureCapacityInternal方法接着将e对象塞入elementData数组中。我们知道数组的大小不可变的，但是ArrayList不断的add对象进来，迟早会把elementData数组撑爆的，所以按照这个园里来推算，ArrayList是一个可变的"数组"，那么ensureCapacityInternal方法中应该进行了两个操作：

判断elementData当前的容量是否足够
按照扩容后大小迁移elementData中的数据

那么他是如何进行这些操作呢？看看下面的grow方法

    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

从这个方法可以看出elementData新容量永远比老容量要高出1.5倍，扩容后进行copy操作创建新elementData，在这过程中JVM将elementData中的元素进行复制迁移到新的elementData中。

    private void ensureExplicitCapacity(int minCapacity) {
        modCount++;
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

grow是一个扩容、复制迁移数组的方法，那么ensureExplicitCapacity方法就是条件—判断是否需要执行grow方法。从条件判断语句我们可以清楚的看出，只要elementData.length比当前要求的最小容量大就足以跳过grow了，这个条件告诉我们设置按业务所需设置elementData的初始大小是非常重要，他可以间接的减少grow方法执行次数—例如你有一个数据流以20的倍数下发，这时候可以使用以20*0.75作为elementData的初始大小（具体根据业务情况而定）。

下面我们看看他的remove方法。

 public E remove(int index) {
        rangeCheck(index);
        modCount++;
        E oldValue = elementData(index);
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index, numMoved);
        elementData[--size] = null; // clear to let GC do its work
        return oldValue;
    }

首先对index进行范围界定，该方法（rangeCheck）会抛出IndexOutOfBoundsException异常，然后通过elementData方法取出index位置上的对象。

 E elementData(int index) {
        return (E) elementData[index];
    }

这是简单不能再简单的取值方法了，所以remove前必须保证index有效范围，否则会抛出数组越界异常。

 int numMoved = size - index - 1;
     if (numMoved > 0)
          System.arraycopy(elementData, index+1, elementData, index, numMoved);
     elementData[--size] = null; // clear to let GC do its work

从以上代码我们可以大概知道他有以下意图：

重组elementData数组（将index对应的value移除）
将重组后的elementData最后一个元素设置为null

例如elementData中有5个元素，remove的index是3，所以numMoved为1，接着代码看就是显示为：

System.arraycopy(elementData, 4, elementData, 3, 1);

意思就是elementData从第4个位置(含)开始移动到elementData第三个位置，有效位置为1。通过这样的一个copy操作就把需要移除的index对应的elementData元素给移除了（被以前第4个位置的元素替代了），但是我们发现elementData大小没变，并且新的elementData数组第3个元素和第4个元素是一样的，故需要将多余的重复的预算置为null。如下

   elementData[--size] = null; // clear to let GC do its work

ArrayList迭代器

   /**
     * An optimized version of AbstractList.Itr
     */
    private class Itr implements Iterator {
        int cursor;       // index of next element to return
        int lastRet = -1; // index of last element returned; -1 if no such
        int expectedModCount = modCount;
        public boolean hasNext() {
            return cursor != size;
        }
        @SuppressWarnings("unchecked")
        public E next() {
            checkForComodification();
            int i = cursor;
            if (i >= size)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }
        public void remove() {
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();
            try {
                ArrayList.this.remove(lastRet);
                cursor = lastRet;
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }
        @Override
        @SuppressWarnings("unchecked")
        public void forEachRemaining(Consumer consumer) {
            Objects.requireNonNull(consumer);
            final int size = ArrayList.this.size;
            int i = cursor;
            if (i >= size) {
                return;
            }
            final Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length) {
                throw new ConcurrentModificationException();
            }
            while (i != size && modCount == expectedModCount) {
                consumer.accept((E) elementData[i++]);
            }
            // update once at end of iteration to reduce heap write traffic
            cursor = i;
            lastRet = i - 1;
            checkForComodification();
        }
        final void checkForComodification() {
            if (modCount != expectedModCount)
                throw new ConcurrentModificationException();
        }
    }

上面就是ArrayList实现Iterator接口实现的next、forEachRemaining等特性。这篇文章我们也主要针对next方法进行探讨。

        @SuppressWarnings("unchecked")
        public E next() {
            checkForComodification();
            int i = cursor;
            if (i >= size)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            return (E) elementData[lastRet = i];
        }

从上面next方法可以看出，诸多index的if判断语句并且这些判断语句都有抛出异常的可能，这对于应用或者系统来说这是致命的。因此在执行迭代器操作的过程中一定要保证elementData 数组的数据完整性(禁忌对elementData 数组进行增删改操作)[此处在应用的过程中出现的问题比较多]。那如何避免呢？

在创建迭代器后，使用迭代器内部的增删改方法。
使用Collections.synchronizedList 方法将该列表“包装”起来，达到同步效果。
创建的ArrayList创建一个副本，clone出一个副本。

支持快速随机访问

我们可以打开RandomAccess这个接口发现，发现他是一个空接口，那么他有什么用呢？
答案是他肯定有用的，不然Java不会设计这么个接口，他一般给一些Collections工具提供了判断依据，例如Collections的shuffle方法。

   public static void shuffle(List list, Random rnd) {
        int size = list.size();
        if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {
            for (int i=size; i>1; i--)
                swap(list, i-1, rnd.nextInt(i));
        } else {
            Object arr[] = list.toArray();

            // Shuffle array
            for (int i=size; i>1; i--)
                swap(arr, i-1, rnd.nextInt(i));

            // Dump array back into list
            // instead of using a raw type here, it's possible to capture
            // the wildcard but it will require a call to a supplementary
            // private method
            ListIterator it = list.listIterator();
            for (int i=0; i


可以看出，当你实现了RandomAccess时，他会调用另外一套代码块而达到区分。同理copy方法也是同样的道理。
    public static  void copy(List dest, List src) {
        int srcSize = src.size();
        if (srcSize > dest.size())
            throw new IndexOutOfBoundsException("Source does not fit in dest");

        if (srcSize < COPY_THRESHOLD ||
            (src instanceof RandomAccess && dest instanceof RandomAccess)) {
            for (int i=0; i di=dest.listIterator();
            ListIterator si=src.listIterator();
            for (int i=0; i

另外我们可以发现ArrayList的兄弟类LinkedList没有实现RandomAccess，一个实现了一个没实现，在算法上使用肯定有区别的，具体我们在以后的文章细说。
 支持对象clone
clone方法是Object的方法，我们都知道一切皆是对象，那么世界万物都是Object的子类，所以clone方法也就被传下来的了。那么仅仅重写clone()方法就可以达到复制效果么？
答案肯定是错误的。我们知道clone()是伴有CloneNotSupportedException异常的—Object的clone()方法是一个native方法，当你调用它的clone的方法，发现这个对象时不支持clone就会抛出异常，详细后面的文章细讲。
    public Object clone() {
        try {
            ArrayList v = (ArrayList) super.clone();
            v.elementData = Arrays.copyOf(elementData, size);
            v.modCount = 0;
            return v;
        } catch (CloneNotSupportedException e) {
            // this shouldn't happen, since we are Cloneable
            throw new InternalError(e);
        }
    }

从上面代码可以看出，ArrayList的clone是一种浅拷贝，关于对象的拷贝方式（浅拷贝、深拷贝），在后面的文章细讲
对象序列化
这个话题比较大，可以单独用一篇文章讲解，这里我就简单说明下—看看ArrayList如何实现的。
一个对象序列化(serialize)肯定必然出现反序列化(deserialize)，他们所对应的方法writeObject和readObject。
   private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException{
        // Write out element count, and any hidden stuff
        int expectedModCount = modCount;
        s.defaultWriteObject();
        // Write out size as capacity for behavioural compatibility with clone()
        s.writeInt(size);
        // Write out all elements in the proper order.
        for (int i=0; i

上面是序列化方法，也就是Object to byte[]的过程，我们可以看出，他是先将size写入，然后依次转换数组中的各个Object。
   private void readObject(java.io.ObjectInputStream s)
        throws java.io.IOException, ClassNotFoundException {
        elementData = EMPTY_ELEMENTDATA;
        // Read in size, and any hidden stuff
        s.defaultReadObject();
        // Read in capacity
        s.readInt(); // ignored
        if (size > 0) {
            // be like clone(), allocate array based upon size not capacity
            ensureCapacityInternal(size);
            Object[] a = elementData;
            // Read in all elements in the proper order.
            for (int i=0; i

上面是反序列化的方法，首先可以看出发序列化先确定size，然后通过size确定当前size的大小，然后再反序列化各个Object。并且谁先write ，就先read谁，write的什么样的类型，read的也就是什么样的类型。关于序列化，我们在后面的文章详细讲到。
从上面的代码中我们可以看出，在序列化的过程中，如果执行了elementData 数组的数据完整
 性的操作，将会抛出异常，这和在迭代的过程中，不能进行操作是一致的。执行完序列化后，再进行增删改操作，接着反序列化，中途的操作将会被反序列化操作所覆盖。

讲讲ArrayList

你可能感兴趣的:(讲讲ArrayList)