前言
对于List接口集合来说,我们在工作中使用最多的应该就是ArrayList了吧,相比于Vector,ArrayList的性能更高,但它不能保证线程安全,所以我们在并发场景中需要谨慎行事。
ArrayList 是什么?
ArrayList是List接口的一个实现类,它是一个集合容器,我们通常会通过指定泛型来存储同一类数据,ArrayList默认容器大小为10,自身可以自动扩容,当容量不足时,扩大为原来的1.5倍,和上篇文章的Vector的最大区别应该就是线程安全了,ArrayList不能保证线程安全,但我们也可以通过其他方式来实现线程安全。
源码分析
为了解开ArrayList的真像,阅读源码是最好的途径,接下来我们一起看看ArrayList的源码(jdk 1.8)
重要的属性
// 默认容器大小
private static final int DEFAULT_CAPACITY = 10;
// 真正存储数据的地方,没错,也是个数组
transient Object[] elementData;
// 容器数据大小
private int size;
// 创建容器时,如果根据有参构造方法创建,且参数是0,则使用此空数组
private static final Object[] EMPTY_ELEMENTDATA = {};
// 如果使用无参构造方法,则使用此数组
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
构造方法
ArrayList为我们提供了三个构造方法
// 无参构造方法很简单,就是将DEFAULTCAPACITY_EMPTY_ELEMENTDATA复制给容器
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
/*
* 此构造方法可以指定容量大小
*/
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
// 创建一个指定容量的数组
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
// 将EMPTY_ELEMENTDATA复制给容器,创建一个没有容量的容器
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
}
}
/**
* 传入一个集合,并将集合数据存储到容器中
*/
public ArrayList(Collection extends E> c) {
// 将集合参数转成数组
elementData = c.toArray();
// 如果入参集合不是空的
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
// 传入的集合如果不是object,强行转为object
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// 入参是空的,那就指向EMPTY_ELEMENTDATA空数组
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
以上就是ArrayList提供的三个构造方法,值得注意的是无参构造方法和指定容量的构造方法在使用EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA的不同,容器需要扩容的时候会会通过这两个空数组进行判断,走同的逻辑,后边遇到了进行分析。
add
创建了容器后,就需要向容器中添加元素,没错,就是add方法,add方法也提供了两个,参数不同,我们挨个分析
public boolean add(E e) {
// 扩容逻辑入口,入参size+1其实就是当前插入数据需要的最小容量大小
ensureCapacityInternal(size + 1); // Increments modCount!!
// 在容器后边新增数据
elementData[size++] = e;
return true;
}
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
// 计算最小容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
/*
* 这里用到了DEFAULTCAPACITY_EMPTY_ELEMENTDATA
* 当我们通过无参构造方法创建容器时,此时这个容器的引用就是DEFAULTCAPACITY_EMPTY_ELEMENTDATA,
* 所以第一次调用该方法时会走if,然后初始容量大小为DEFAULT_CAPACITY=10
*/
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
// 如果不是第一次调用这个方法 或者 已经扩容过了,那就直接返回入参minCapacity
return minCapacity;
}
// 判断是否需要扩容
private void ensureExplicitCapacity(int minCapacity) {
// 这个属性和Iterator有关,不明白的看上篇Vector的文章
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity); // 需要扩容
}
// 扩容
private void grow(int minCapacity) {
// overflow-conscious code
// 获取当前容器大小
int oldCapacity = elementData.length;
// 计算新容器大小 其实就是扩容1.5倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
// 将旧容器数据复制到新容器,完成扩容
elementData = Arrays.copyOf(elementData, newCapacity);
}
以上就是add(E e)方法的全部逻辑,很简单
- 先判断当前容器是否能够存储新数据,如果可以,直接容器后边新增数据
- 如果不能存储,这需要扩容,扩容为原来的1.5倍
- 将旧容器复制到新容器中,完成扩容
void add(int index, E element)
此方法可以指定添加的位置,代码就不贴了,和以上的add方法大同小异,区别在于将插入位置之后的数据往后移动,然后插入数据,自己看源码,真的很简单。
public E set(int index, E element)
此方法可以对容器中的数据进行修改,代码如下
/*
* 修改指定位置的数据并返回就数据
* @param index 要修改的位置
* @param element 修改后的数据
*/
public E set(int index, E element) {
// 校验index是否大于等于0,小于等于size,否者抛异常
rangeCheck(index);
// 先获取旧的数据
E oldValue = elementData(index);
// 修改数据
elementData[index] = element;
return oldValue;
}
是不是也很简单
数据插入分析完成了,我们来看看如何获取数据
get(int index)
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
此方法特别简单,先校验index下标是否合法,不合法抛异常,合法直接返回直接位置的数据即可
remove
删除数据提供了两个方法,remove(int index) 和 remove(Object obj),逻辑基本一样
- 找到要删除数据的位置 index
- 删除数据,数据往前移动
- size--
容器还提供了很多方法,就不一一介绍了,感兴趣的自己阅读,或者留言说说自己感兴趣的方法,一起讨论。
思考
为什么定义了两个空数组属性?
private static final Object[] EMPTY_ELEMENTDATA = {};
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
我们使用不同构造方法实例化的情况下容器会使用不同的空数组,在添加数据的时候如果我们使用的是DEFAULTCAPACITY_EMPTY_ELEMENTDATA ,这初始容量为10,之后就不会在使用了。如果使用EMPTY_ELEMENTDATA ,则在初始容量时就是你新增的数据量大小。
我认为EMPTY_ELEMENTDATA 的主要作用是为了空间复用,为了不浪费空间而使用。
你们对此怎么看,欢迎讨论。
总结
- ArrayList底层用数组进行存储,当容量不足时,进行动态扩容
- ArrayList不能保证线程安全,多线程情况下谨慎使用
- 对数据进行操作时,会涉及数据的移动,数组的拷贝,频繁的操作数据,会影响性能。
以上就是我们分析,如果问题,烦请支出更正,一起学习。
下篇文章我们来分析 LinkedList,看看它有什么特殊的地方
我是一个爱看源码的老谢,知道越多,不知道的越多。