ArrayList
可以说是在Java开发中最常用的集合容器了,今天就来分析一下ArrayList
的源码,可以更加深入的理解ArrayList
实现原理。
ArrayList
的成员变量:
// 初始容量:10
private static final int DEFAULT_CAPACITY = 10;
// 空数组,没有元素数据
private static final Object[] EMPTY_ELEMENTDATA = {};
// 空数组,默认容量为空,没有元素数据
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
// 数组,用来存储ArrayList的元素
transient Object[] elementData;
// size为ArrayList的大小,在elementData不为空数组的情况下,size是小于elementData.length的
private int size;
根据elementData
也能看出来,ArrayList
的内部是通过数组来实现的,ArrayList
对元素的增删改查实际上都是对数组的操作。
ArrayList
的构造函数:
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
}
}
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
public ArrayList(Collection extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
构造ArrayList
时,可以指定容器的初始容量initialCapacity
,构造一个给定初始大小的数组作为数据集;使用无参构造时,则默认容量为空的数组作为初始数据集;也可以使用其他任意的集合Collection
作为构造参数,可以看到,源码中就是直接将集合c
转换数组来作为数据集(如果数据集是非Object
数组,比如多维数组,则将元素拷贝到数据集数组中)。ArrayList
的构造实际上就是对其内部数组的初始化。
add
方法:
public boolean add(E e) {
// 确保当前数据集数组能够放得下新加入的元素
ensureCapacityInternal(size + 1); // Increments modCount!!
// 将列表大小size自增1,并在数据集数组中放入元素e
elementData[size++] = e;
return true;
}
public void add(int index, E element) {
// 检查新加入的位置index是否越界
rangeCheckForAdd(index);
// 确保当前数据集数组能够放得下新加入的元素,如果需要扩容的话就扩容
ensureCapacityInternal(size + 1); // Increments modCount!!
// 将index位置及后面的元素都向后移动一位
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
// 将index位置的元素设置为新建如的element
elementData[index] = element;
size++;
}
在添加元素时,如果不指定加入的位置,会添加到内部数组中已有元素的最后一位,也就是添加到了ArrayList
的末尾。如果指定了添加位置index,判断index是否越界,是否需要扩容,最后移动index位置后的元素,并将index位置设置为新添加的元素。
需要注意的是,添加的元素并没有判空,所以ArrayList
中的元素是可以为null
的。
在add方法中,都调用了ensureCapacityInternal(int minCapacity)
这个方法来确保数据集数组能够放得下新的元素:
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
// 如果添加新元素需要的最小容量大于数组的长度,就需要扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
看下扩容的方法grow(int minCapacity)
:
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 扩展至新的容量newCapacity为旧的容量的1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
// 将之前的数组中的元素复制到扩展后的新的数组中
elementData = Arrays.copyOf(elementData, newCapacity);
}
数组扩容的过程,实际上是新建了一个需要扩容的长度的数组,然后将原素组中的元素拷贝到这个新建的数组中,新的数组指定为ArrayList
内部数据集数组。
总结:ArrayList在添加元素时,首先会判断添加的位置是否在内部数组中越界,如果越界,抛出异常;如果没有越界,则判断数组能否放得下新添加的元素,如果放得下,则直接存放到数组中;如果放不下,则将数组扩容,扩容后再存放到数组中。
remove
方法:
public E remove(int index) {
// 检查越界
rangeCheck(index);
modCount++;
// 需要移除的元素
E oldValue = elementData(index);
// 需要移动位置的元素的数量
int numMoved = size - index - 1;
// 将需要移除元素的位置后的所有元素复制到index位置开始后的numMoved个位置
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
// size减1,并将之前的最后一个位置元素置空
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
remove
还有一个重载的方法,是移除给定的元素,它的实现就是遍历数组,找到元素的索引值,然后调用remove(int index)
方法,根据索引值去删除。
总结:ArrayList
在删除元素时,根据删除的索引值判断是否越界,如果越界,抛出异常;如果没有越界,取出要删除的元素,然后将这个元素后面所有的元素向前移动一位。
set
方法:
public E set(int index, E element) {
rangeCheck(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
set方法即修改列表中指定位置的元素值。它的实现非常简单:直接修改数组指定位置的值。
get
方法:
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
E elementData(int index) {
return (E) elementData[index];
}
get
方法实现非常简单只需要堆获取位置判断是否越界,然后直接从数组中取值即可。
从上面分析的源码中可以看出,ArrayList的实现就是对数组的操作,在添加和删除元素的时候,会涉及到数组的扩容和数组元素位置的移动,相对查询和修改元素要复杂一些,所以ArrayList适合用在查询和修改比较频繁,而添加和删除较少的情况下。