ArrayList类继承了AbstractList抽象类,AbstractList抽象类对于一些通用的方法提供了默认实现。ArrayList类实现了接口List、RandomAccess、Cloneable和Serializable。后三者都是语义标志接口,不提供任何实现,标记这个类具有某种功能。RandomAccess标记类具有随机访问的功能,Cloneable标记类具有克隆功能,Serializable标记类具有序列化功能。
ArrayList类底层是由数组实现的,使用一个Object[]类型的变量来保存这个list的值。这个值不参与序列化,类中重写了writeObject()和readObject()方法来序列化该值。
transient Object[] elementData;
变量size记录值的大小。
private int size;
ArrayList有两个构造方法——有参构造方法和无参构造方法。
无参构造时,将数组列表的值赋为DEFAULTCAPACITY_EMPTY_ELEMENTDATA。
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
有参构造时,指定容量大于0,就构造一个指定容量大小的数组,如果指定容量为0,就将值赋为EMPTY_ELEMENTDATA。
private static final Object[] EMPTY_ELEMENTDATA = {};
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
也可以根据一个集合构造一个数组集合,将集合转为数组直接赋值给elementData。当值大小为0时,就将值赋为EMPTY_ELEMENTDATA。
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
那么,无参构造和有参构造产生的空值有什么区别呢?从表面上看来是一样的,在变量elementData上有这样一句注释,“ 添加第一个元素时,任何带有elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA的空ArrayList都将扩展为DEFAULT_CAPACITY。”
DEFAULT_CAPACITY指定为10。
private static final int DEFAULT_CAPACITY = 10;
注释的意思是说,无参构造产生的空值在第一次添加元素时,将容量扩展至10。那么我们来看下add方法。
add方法首先将数组容量加1,这就涉及到了ArrayList的扩容机制,我们一步步来看。
public boolean add(E e) {
ensureCapacityInternal(size + 1);
elementData[size++] = e;
return true;
}
首先,判断目前数组的值是不是DEFAULTCAPACITY_EMPTY_ELEMENTDATA,即该数组是不是无参构造出的空数组。如果是,就取DEFAULT_CAPACITY和minCapacity的最大值,否则就扩展至指定的容量。第一次添加元素时,minCapacity为1,也就是说将数组扩展至10,如果是有参构造的空数组,就扩展至1。
private void ensureCapacityInternal(int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
接下来要判断扩展的容量是否足够存放数组的值,足够存放就开始扩容工作。第一次添加元素时,数组长度为0,可以进入扩容工作。
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
grow方法是ArrayList扩容机制的核心,可以看出,扩容的机制是扩展原来容量的0.5倍。如果扩容至1.5倍之后依旧无法达到指定容量大小或者大小超出了int类型的大小,就使用指定容量进行扩容。如果扩容容量大于数组最大容量,就扩容至Integer类型的最大值。最后重新申请一个数组,并进行数组的复制完成扩容工作。当第一次添加元素时,就数组的容量为0,扩容至1或10。
这里有一个疑问,既然ArrayList是数组来保存值的,数组的容量最大是Integer.MAX_VALUE - 8(查资料说是需要空间来保存一些头部信息),那么为什么ArrayList的容量还可以扩大至Integer.MAX_VALUE呢?
private void grow(int minCapacity) {
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
elementData = Arrays.copyOf(elementData, newCapacity);
}
private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0)
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}
由此可以看出,EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA就是为了区分有参构造和无参构造的空数组,从而使用不同的扩容规则。
我们可以注意到,上面方法中有一个modCount变量加1的操作。这个变量是从父类AbstractList中继承来的,它标记一个list被修改的次数。它主要是为了在迭代器中判断list是否被其他操作改变,进入迭代器会保存一个modCount值的副本,如果modCount的值变了,就抛出异常。
protected transient int modCount = 0;
方法trimToSize将数组中多余容量释放。当使用容量小于数组容量时,如果使用容量为0,将数组设为空值,否则重新生成一个长度为size的数组。
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
size方法可以获取list的大小。
public int size() {
return size;
}
isEmpty方法判断list是否为空,即size是否为0.
public boolean isEmpty() {
return size == 0;
}
contains方法判断数组是否包含参数。如果参数o在数组的位置不小于0,就说明数组中存在参数。
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
indexOf方法判断参数在数组中的位置。如果参数o为null,那么在数组中找到一个null值的位置就好,不为空就是用equals方法找到数组中o的位置,找不到就返回-1。
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
lastIndexOf方法从后往前遍历,判断参数在数组中的位置。
public int lastIndexOf(Object o) {
if (o == null) {
for (int i = size-1; i >= 0; i--)
if (elementData[i]==null)
return i;
} else {
for (int i = size-1; i >= 0; i--)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
clone方法克隆一个list。注意,该克隆是浅克隆,数组元素并没有复制。
public Object clone() {
try {
ArrayList<?> v = (ArrayList<?>) super.clone();
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
throw new InternalError(e);
}
}
toArray方法将list转为数组。如果参数a的长度不够容纳list元素,就重新生成一个数组,否则就直接复制元素。a中有空余位置的话将size位置置为null。
public Object[] toArray() {
return Arrays.copyOf(elementData, size);
}
@SuppressWarnings("unchecked")
public <T> T[] toArray(T[] a) {
if (a.length < size)
return (T[]) Arrays.copyOf(elementData, size, a.getClass());
System.arraycopy(elementData, 0, a, 0, size);
if (a.length > size)
a[size] = null;
return a;
}
get方法返回指定位置的元素。首先检查index是否越界,然后返回数组index位置的元素。
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
set方法设置指定位置的元素。首先检查index是否越界,然后拿到index位置的旧值,将index位置的值设为新值,最后返回旧值。
public E set(int index, E element) {
rangeCheck(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
add方法向list中添加元素。不指定元素添加位置时默认添加到数组末尾,首先确保数组的容量,然后在数组后面添加一个元素,最后返回true。指定元素添加位置时,首先检查指定位置是否越界,然后确保数组的容量,然后将index以及之后的元素向后移动一位,将index位置设为指定元素,最后返回true。
public boolean add(E e) {
ensureCapacityInternal(size + 1);
elementData[size++] = e;
return true;
}
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1);
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
remove方法移除指定位置的元素或移除指定元素。当指定的是元素位置时,先检查指定位置是否越界,然后获取指定位置的旧值,将指定位置之后的元素向前移动一个位置,然后将最后一位设为null,最后返回旧值。当指定的是元素时,就先判断元素的位置,移除那个位置元素,最后返回布尔值。
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null;
return oldValue;
}
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null;
}
clear方法清除list中的元素。将数组中的每个元素设为null,并将大小设为0。
public void clear() {
modCount++;
for (int i = 0; i < size; i++)
elementData[i] = null;
size = 0;
}
addAll方法向list中添加集合。不指定位置时,默认向末尾添加集合元素。
public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew);
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}
public boolean addAll(int index, Collection<? extends E> c) {
rangeCheckForAdd(index);
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew);
int numMoved = size - index;
if (numMoved > 0)
System.arraycopy(elementData, index, elementData, index + numNew,
numMoved);
System.arraycopy(a, 0, elementData, index, numNew);
size += numNew;
return numNew != 0;
}
removeAll方法移除指定集合中的所有元素,retainAll方法保留指定集合中的所有元素。这两个方法类似,只是逻辑是反的,Java设计者很巧妙的运用了一个boolean类型的参数来区分两种逻辑,以便使同一个方法。在try中的for循环就已经将需要留下的元素放到了数组的前一部分,即w位置之前。注释说contains方法可能会有异常,当异常发生,就将没有遍历到的元素全部留下,这个逻辑我也不太明白。最后将w位置之后的元素设为null,返回布尔值。
public boolean removeAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, false);
}
public boolean retainAll(Collection<?> c) {
Objects.requireNonNull(c);
return batchRemove(c, true);
}
private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
if (w != size) {
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}
forEach方法可以使用lambda表达对每一个元素进行相同的操作。在操作之前,会先拿到数组修改的次数,然后重新申请一个与list数组元素相同的数组进行操作。注意,此复制是浅复制,两个数组共用一套元素。最后判断list是否被其他操作改变了,如果被改变了就抛出异常。
@Override
public void forEach(Consumer<? super E> action) {
Objects.requireNonNull(action);
final int expectedModCount = modCount;
@SuppressWarnings("unchecked")
final E[] elementData = (E[]) this.elementData;
final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) {
action.accept(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
removeIf方法移除掉满足参数条件的元素。首先将满足参数条件的元素的位置放到一个set集合中,然后再遍历将其重新整合。
@Override
public boolean removeIf(Predicate<? super E> filter) {
Objects.requireNonNull(filter);
int removeCount = 0;
final BitSet removeSet = new BitSet(size);
final int expectedModCount = modCount;
final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) {
@SuppressWarnings("unchecked")
final E element = (E) elementData[i];
if (filter.test(element)) {
removeSet.set(i);
removeCount++;
}
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
final boolean anyToRemove = removeCount > 0;
if (anyToRemove) {
final int newSize = size - removeCount;
for (int i=0, j=0; (i < size) && (j < newSize); i++, j++) {
i = removeSet.nextClearBit(i);
elementData[j] = elementData[i];
}
for (int k=newSize; k < size; k++) {
elementData[k] = null;
}
this.size = newSize;
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
modCount++;
}
return anyToRemove;
}
replaceAll方法对数组的每个元素执行传入方法。
@Override
@SuppressWarnings("unchecked")
public void replaceAll(UnaryOperator<E> operator) {
Objects.requireNonNull(operator);
final int expectedModCount = modCount;
final int size = this.size;
for (int i=0; modCount == expectedModCount && i < size; i++) {
elementData[i] = operator.apply((E) elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
modCount++;
}
sort方法使用传入的比较方法对数组进行排序。
@Override
@SuppressWarnings("unchecked")
public void sort(Comparator<? super E> c) {
final int expectedModCount = modCount;
Arrays.sort((E[]) elementData, 0, size, c);
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
modCount++;
}
ArrayList拥有自己的两种迭代器,Itr和ListItr。
Itr实现了接口Iterator,定义了三个变量,cursor,代表下一个元素的位置,lastRet,代表上一个元素的位置,expectedModCount,数组之前的修改次数。
int cursor;
int lastRet = -1;
int expectedModCount = modCount;
Itr迭代器有4个方法,hasNext(),next(),remove(),forEachRemaining()。
hasNext方法判断可以向后迭代。
public boolean hasNext() {
return cursor != size;
}
next方法返回下一个元素,并将cursor和lastRet向前移动一个位置。
@SuppressWarnings("unchecked")
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
remove方法移除掉上一个遍历过的元素,并将cursor指向上一个元素的位置,将lastRet设为-1。
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
forEachRemaining方法遍历所有剩下的元素。在使用Iterator迭代器使用next方法循环list,如果没有循环完整个list,可以使用该方法循环完整个list。
@Override
@SuppressWarnings("unchecked")
public void forEachRemaining(Consumer<? super E> consumer) {
Objects.requireNonNull(consumer);
final int size = ArrayList.this.size;
int i = cursor;
if (i >= size) {
return;
}
final Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length) {
throw new ConcurrentModificationException();
}
while (i != size && modCount == expectedModCount) {
consumer.accept((E) elementData[i++]);
}
cursor = i;
lastRet = i - 1;
checkForComodification();
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
ListItr继承了Itr类,实现了接口ListIterator。除了提供了一个构造方法之外,还添加了向前遍历的方法。
ListItr的构造方法可以为迭代器指定开始迭代的位置。
ListItr(int index) {
super();
cursor = index;
}
hasPrevious方法判断是否可以向前迭代。
public boolean hasPrevious() {
return cursor != 0;
}
nextIndex方法返回下一个迭代元素的位置。
public int nextIndex() {
return cursor;
}
previousIndex方法返回前一个迭代元素的位置。
public int previousIndex() {
return cursor - 1;
}
previous方法返回前一个迭代的元素。
@SuppressWarnings("unchecked")
public E previous() {
checkForComodification();
int i = cursor - 1;
if (i < 0)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i;
return (E) elementData[lastRet = i];
}
set方法设置上一个遍历过的元素值为e。
public void set(E e) {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.set(lastRet, e);
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
add方法向cursor位置添加一个元素,并将cursor指向下一个位置,将lastRet设为-1。
public void add(E e) {
checkForComodification();
try {
int i = cursor;
ArrayList.this.add(i, e);
cursor = i + 1;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
接下来就是一个子列表SubList。
SubList继承AbstractList抽象类,实现RandomAccess接口,有四个属性,在构造方法中可以看出这四个属性的意义。
private final AbstractList<E> parent;
private final int parentOffset;
private final int offset;
int size;
parent就是母列表,parentOffset是母列表的偏移,offset是子列表相对于母列表的偏移,size是子列表的大小,同时记录了母列表被修改的次数。
SubList(AbstractList<E> parent,
int offset, int fromIndex, int toIndex) {
this.parent = parent;
this.parentOffset = fromIndex;
this.offset = offset + fromIndex;
this.size = toIndex - fromIndex;
this.modCount = ArrayList.this.modCount;
}
SubList提供了列表简单的操作 ,set,get,size,add,remove,removeRange,addAll,iterator,listIterator等方法。注意,这些方法虽然在子列表调用的,但是都是直接操作母列表对应位置的元素的。比如set方法,会去修改母列表元素offset+index位置的元素的值。
public E set(int index, E e) {
rangeCheck(index);
checkForComodification();
E oldValue = ArrayList.this.elementData(offset + index);
ArrayList.this.elementData[offset + index] = e;
return oldValue;
}
ArrayList使用subList方法返回列表的子列表。注意,如果修改子列表的元素,母列表的元素也会被修改。
public List<E> subList(int fromIndex, int toIndex) {
subListRangeCheck(fromIndex, toIndex, size);
return new SubList(this, 0, fromIndex, toIndex);
}
最后,ArrayList还有一个内部类ArrayListSpliterator,这个以后再研究吧,目前有些看不懂。