Java集合(二)--ArrayList简析

通过上一篇文章的内容，我们简单了解了集合的框架。从本章开始，我们将开始分析集合的具体的实现类。我们先从ArrayList开始。

ArrayList的定义

先看一下ArrayList的定义：

public class ArrayList extends AbstractList
        implements List, RandomAccess, Cloneable, java.io.Serializable
{}

具体分析一下：

1、继承了AbstractList，实现了List接口，即拥有List基本的添加、删除及修改等等。并且部分方法因为继承了AbstractList，所以也无需重写。

2、实现了RandomAccess接口，RandomAccess支持快速（通常是恒定时间）随机访问。所以，ArrayList也支持快速的随机访问。

3、实现了Cloneable接口，即支持clone。

4、实现了Serializable接口，即可以序列化，可以通过序列化去传输数据。

注意，ArrayList是有大小的，随着列表中元素的增加，它会自动扩容。ArrayList不是线程安全的，如果多个线程同时访问ArrayList的实例，并且至少有一个线程在结构上修改了列表，则必须在外部同步。

接下来，我们就通过源码，一步步分析一下ArrayList。

ArrayList的源码简析

首先，是ArrayList的创建。它提供了三个构造函数：

//构造具有指定初始容量的空列表,初始容量可以理解为initialCapacity。
public ArrayList(int initialCapacity) {}

//构造一个初始容量为10的空列表
public ArrayList() {}

//构造一个包含指定集合元素的列表
public ArrayList(Collection c) {}

在这里，我们从无参的构造函数入手分析。在调用了无参构造函数后，会执行以下代码：

this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;

嗯？this.elementData是个啥？DEFAULTCAPACITY_EMPTY_ELEMENTDATA又是什么鬼？赶紧去属性声明的地方看一下。

transient Object[] elementData;

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

哦，就是初始化了一个空的数组。

注意：elementData是存储ArrayList元素的数组缓冲区。 ArrayList的容量是此数组缓冲区的长度。
size属性是动态数组的实际大小（接下来要用）。

欸？空的数组？那初始容量10是怎么来的？嗯。。。我们想一下，每次我们实例化完一个ArrayList之后，一般会干什么？是添加元素对吧。那我们去add()方法里看看：

public boolean add(E e) {
        //确定数组大小
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //将新元素加入数组
        elementData[size++] = e;
        return true;
    }

我们看到他调用了一个ensureCapacityInternal()方法，并且，传递了一个参数"size + 1"。那这个方法是干嘛用的，又做了些什么事，我们去看看：

private static final int DEFAULT_CAPACITY = 10;

private void ensureCapacityInternal(int minCapacity) {
        //判断当前数组是否为默认数组
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            //取10和minCapacity的最大值作为新的数组的长度，调用无参构造函数生成ArrayList的话，添加第一个元素时minCapacity是1
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        //根据minCapacity判断是否要对数组扩容
        ensureExplicitCapacity(minCapacity);
    }

private void ensureExplicitCapacity(int minCapacity) {
        //将修改记录加1
        modCount++
        //判断数组当前容量是否可以容纳当前元素的个数
        if (minCapacity - elementData.length > 0)
            //当前容量无法容纳当前元素的个数，对数组扩容
            grow(minCapacity);
    }

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private void grow(int minCapacity) {
        //接下来的操作，就是通过一系列判断，对数组扩容
        int oldCapacity = elementData.length;
        //右移一位可以理解为除以2，所以newCapacity扩容了oldCapacity的3/2
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //如果minCapacity(新的元素个数)比newCapacity还大，则取minCapacity
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        //对数组扩容，拷贝原数组中的元素，将其放到一个新的容量为newCapacity的数组中，并返回新数组
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

private static int hugeCapacity(int minCapacity) {
        //如果要创建的新的数组的长度小于0，抛出异常
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        //确定新建数组的长度
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

通过分析上面的源码，相信大家已经知道为什么默认长度是10了。也知道了ArrayList每次扩容都是原基础的3/2。

添加第一个元素时，任何带有elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA的空ArrayList都将扩展为DEFAULT_CAPACITY（DEFAULT_CAPACITY = 10）。
modCount主要由iterator()和listIterator()方法返回的迭代器和列表迭代器实现使用，是从AbstractList继承过来的一个属性，具体的后面会讲。

接下来的get()和set()方法就相对容易了，请看：

public E get(int index) {
        //判断是否数组越界，数组越界就抛出异常
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
        //返回指定位置的元素
        return (E) elementData[index];
    }

//
public E set(int index, E element) {
        //判断是否数组越界，数组越界就抛出异常
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
        //先用一个局部变量接收此位置的旧的元素
        E oldValue = (E) elementData[index];
        //在指定的位置添加新的元素，替换旧值
        elementData[index] = element;
        //返回修改之前的元素
        return oldValue;
    }

接下来我们分析一下remove(int index)方法：

public E remove(int index) {
        //判断是否数组越界，越界则抛出异常
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        //数组修改次数加1
        modCount++;
        //获取index位置的当前的元素
        E oldValue = (E) elementData[index];
        //根据删除的元素的角标及数组的长度，判断要拷贝的数组长度
        int numMoved = size - index - 1;
        if (numMoved > 0)
            //将修改后的数组拷贝到一个新的数组
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //置空方便GC工作
        elementData[--size] = null;
        //返回移除掉的元素
        return oldValue;
    }

现在，我们分析完了一些常用的方法。接下来，我们再看一下刚开始说的ArrayList的clone：

public Object clone() {
        try {
            ArrayList v = (ArrayList) super.clone();
            //复制数据
            v.elementData = Arrays.copyOf(elementData, size);
            //将操作数置为0
            v.modCount = 0;
            //返回克隆好的数组
            return v;
        } catch (CloneNotSupportedException e) {
            // this shouldn't happen, since we are Cloneable
            throw new InternalError(e);
        }
    }

以及序列化的读写：

//将ArrayList实例的状态保存到流中（即序列化它）。
private void writeObject(java.io.ObjectOutputStream s)
        throws java.io.IOException{
        // 写出数组中数据改变的次数等
        int expectedModCount = modCount;
        s.defaultWriteObject();

        //写出数组的容量
        s.writeInt(size);

        // 按正确的顺序写出所有元素。
        for (int i=0; i 0) {
            //根据大小而不是容量来分配数组
            ensureCapacityInternal(size);

            Object[] a = elementData;
            // 按正确的顺序读入所有元素
            for (int i=0; i

 
 好了，ArrayList暂时就分析到这。其他的如果需要，后续再写。现在来总结一下： 
 1、ArrayList是通过elementData数组(Object类型)去操作数据的。这就是我们所说的，ArrayList的底层是数组，而且是一个动态数组。 
 2、使用无参的构造函数创建的ArrayList默认长度为10。当ArrayList的容量不足以容纳全部的元素，ArrayList会自己扩容：新的容量=3/2旧的容量。当然，容量最大不超过0x7fffffff(是一个16进制的数，值为：2^31 - 1，是最大的int数值)。 
 3、克隆，就是将已有的元素复制到一个新的数组 
 4、序列化的时候会先写入数组改变的次数以及数组的容量，然后再写入元素；反序列化的时候，会将数组大小即数组容量等全部读取出来，然后根据数组的大小来分配数组，最后读入所有的元素。 
 5、 ArrayList非线程安全。如果有并发修改，会抛出ConcurrentModificationException异常。这涉及到fail-fast机制，我们后面会讲到。 
 6、每次调用add()、addAll()方法时，如果元素个数超过了数组的当前容量，ArrayList都会去扩容，扩容需要将旧的元素拷贝到一个新的数组。所以，在可以知道最大容量的情况下，最好给ArrayList一个初始的容量值。 
 7、ArrayList为什么改、查快？因为它底层是数组，通过角标就可以改变或者查询对应位置的元素。为什么增、删慢？是因为增加、删除的操作会导致元素从旧的数组拷贝到一个新的数组。

Java集合(二)--ArrayList简析

ArrayList的定义

ArrayList的源码简析

你可能感兴趣的:(Java集合(二)--ArrayList简析)