ArrayList源码分析

前言

对于List接口集合来说，我们在工作中使用最多的应该就是ArrayList了吧，相比于Vector，ArrayList的性能更高，但它不能保证线程安全，所以我们在并发场景中需要谨慎行事。

ArrayList 是什么？

ArrayList是List接口的一个实现类，它是一个集合容器，我们通常会通过指定泛型来存储同一类数据，ArrayList默认容器大小为10，自身可以自动扩容，当容量不足时，扩大为原来的1.5倍，和上篇文章的Vector的最大区别应该就是线程安全了，ArrayList不能保证线程安全，但我们也可以通过其他方式来实现线程安全。

源码分析

为了解开ArrayList的真像，阅读源码是最好的途径，接下来我们一起看看ArrayList的源码（jdk 1.8）

重要的属性

 // 默认容器大小
 private static final int DEFAULT_CAPACITY = 10;
// 真正存储数据的地方，没错，也是个数组
transient Object[] elementData;
// 容器数据大小
private int size;
// 创建容器时，如果根据有参构造方法创建，且参数是0，则使用此空数组
private static final Object[] EMPTY_ELEMENTDATA = {};
// 如果使用无参构造方法，则使用此数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

构造方法
ArrayList为我们提供了三个构造方法

// 无参构造方法很简单，就是将DEFAULTCAPACITY_EMPTY_ELEMENTDATA复制给容器
public ArrayList() {
  this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
/*
 * 此构造方法可以指定容量大小
 */
public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        // 创建一个指定容量的数组
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
         // 将EMPTY_ELEMENTDATA复制给容器，创建一个没有容量的容器
          this.elementData = EMPTY_ELEMENTDATA;
     } else {
        throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    }
}
/**
 *  传入一个集合，并将集合数据存储到容器中
 */
public ArrayList(Collection c) {
     // 将集合参数转成数组
     elementData = c.toArray();
     // 如果入参集合不是空的
     if ((size = elementData.length) != 0) {
         // c.toArray might (incorrectly) not return Object[] (see 6260652)
         // 传入的集合如果不是object，强行转为object
         if (elementData.getClass() != Object[].class)
             elementData = Arrays.copyOf(elementData, size, Object[].class);
     } else {
         // 入参是空的，那就指向EMPTY_ELEMENTDATA空数组
         // replace with empty array.
         this.elementData = EMPTY_ELEMENTDATA;
     }
}

以上就是ArrayList提供的三个构造方法，值得注意的是无参构造方法和指定容量的构造方法在使用EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA的不同，容器需要扩容的时候会会通过这两个空数组进行判断，走同的逻辑，后边遇到了进行分析。

add
创建了容器后，就需要向容器中添加元素，没错，就是add方法，add方法也提供了两个，参数不同，我们挨个分析

public boolean add(E e) {
    // 扩容逻辑入口，入参size+1其实就是当前插入数据需要的最小容量大小
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    // 在容器后边新增数据
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 计算最小容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
    /*
     * 这里用到了DEFAULTCAPACITY_EMPTY_ELEMENTDATA
     * 当我们通过无参构造方法创建容器时，此时这个容器的引用就是DEFAULTCAPACITY_EMPTY_ELEMENTDATA，
     * 所以第一次调用该方法时会走if，然后初始容量大小为DEFAULT_CAPACITY=10
     */ 
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        return Math.max(DEFAULT_CAPACITY, minCapacity);
    }
   // 如果不是第一次调用这个方法 或者 已经扩容过了，那就直接返回入参minCapacity
    return minCapacity;
}
// 判断是否需要扩容
private void ensureExplicitCapacity(int minCapacity) {
   // 这个属性和Iterator有关，不明白的看上篇Vector的文章
    modCount++;
    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity); // 需要扩容
}
// 扩容
private void grow(int minCapacity) {
        // overflow-conscious code
        // 获取当前容器大小
        int oldCapacity = elementData.length;
        // 计算新容器大小 其实就是扩容1.5倍
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        // 将旧容器数据复制到新容器，完成扩容
        elementData = Arrays.copyOf(elementData, newCapacity);
}

以上就是add(E e)方法的全部逻辑，很简单

先判断当前容器是否能够存储新数据，如果可以，直接容器后边新增数据
如果不能存储，这需要扩容，扩容为原来的1.5倍
将旧容器复制到新容器中，完成扩容

void add(int index, E element)
此方法可以指定添加的位置，代码就不贴了，和以上的add方法大同小异，区别在于将插入位置之后的数据往后移动，然后插入数据，自己看源码，真的很简单。
public E set(int index, E element)
此方法可以对容器中的数据进行修改，代码如下

/*
 *  修改指定位置的数据并返回就数据
 *  @param index  要修改的位置
 *  @param element 修改后的数据
 */
public E set(int index, E element) {
        // 校验index是否大于等于0，小于等于size，否者抛异常
        rangeCheck(index);
        // 先获取旧的数据
        E oldValue = elementData(index);
        // 修改数据
        elementData[index] = element;
        return oldValue;
    }

是不是也很简单

数据插入分析完成了，我们来看看如何获取数据
get(int index)

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}

此方法特别简单，先校验index下标是否合法，不合法抛异常，合法直接返回直接位置的数据即可

remove
删除数据提供了两个方法，remove(int index) 和 remove(Object obj),逻辑基本一样

找到要删除数据的位置 index
删除数据，数据往前移动
size--

容器还提供了很多方法，就不一一介绍了，感兴趣的自己阅读，或者留言说说自己感兴趣的方法，一起讨论。

思考

为什么定义了两个空数组属性？

private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

我们使用不同构造方法实例化的情况下容器会使用不同的空数组，在添加数据的时候如果我们使用的是DEFAULTCAPACITY_EMPTY_ELEMENTDATA ，这初始容量为10，之后就不会在使用了。如果使用EMPTY_ELEMENTDATA ，则在初始容量时就是你新增的数据量大小。

我认为EMPTY_ELEMENTDATA 的主要作用是为了空间复用，为了不浪费空间而使用。
你们对此怎么看，欢迎讨论。

总结

ArrayList底层用数组进行存储，当容量不足时，进行动态扩容
ArrayList不能保证线程安全，多线程情况下谨慎使用
对数据进行操作时，会涉及数据的移动，数组的拷贝，频繁的操作数据，会影响性能。

以上就是我们分析，如果问题，烦请支出更正，一起学习。

下篇文章我们来分析 LinkedList，看看它有什么特殊的地方

我是一个爱看源码的老谢，知道越多，不知道的越多。

ArrayList源码分析

前言

ArrayList 是什么？

源码分析

思考

总结

你可能感兴趣的:(ArrayList源码分析)