ArrayList源码深入解析

最近在看《算法与数据结构Java版》这本书,正好看到第三章线性表,就顺便看了一下ArrayList和LinkedList的源码,深入的了解了他们之间的区别和性能方面的优缺点。先单独说一下ArrayList的实现原理。

概要

ArrayList的实现原理其实就是数组,它是线程不安全的,允许其中元素为null。
它实现了 List, RandomAccess, Cloneable, java.io.Serializable接口,
其中RandomAccess代表了其拥有随机快速访问的能力,ArrayList可以以O(1)的时间复杂度去根据下标访问元素。

因为其底层结构是数组,所以它是占据了一块连续的内存空间,其长度就是数组的大小,因此它有数组的缺点,空间效率不高,但是也有优点,就是查询速度快,时间效率很高

当集合中的元素超出数组的长度是,数组就会进行扩容操作,扩容操作是ArrayList存储操作缓慢的主要原因,尤其是当数据量越来越大,每次扩容消耗的时间会越来越多。

所以如果我们事先预知数据量的大小,可以通过public ArrayList(int initialCapacity) {}构造方法来指定集合的大小,以减少扩容次数,提高写入效率

构造方法详解

    //集合的初始容量为10
    private static final int DEFAULT_CAPACITY = 10;
    //默认构造函数里的空数组
    private static final Object[] EMPTY_ELEMENTDATA = {};
    //真正存放元素的数组
    private transient Object[] elementData;
    //自定义初始容量的构造方法
    public ArrayList(int initialCapacity) {
        super();
        //如果初始容量小于0则报IllegalArgumentException异常
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);
        this.elementData = new Object[initialCapacity];
    }
    //默认的构造方法
    public ArrayList() {
        super();
        //默认的构造方法是将空数组赋值给了elementData
        this.elementData = EMPTY_ELEMENTDATA;
    }
    //将别的集合直接赋值进行创建的构造方法
    public ArrayList(Collection<? extends E> c) {
        //直接用toArray()的方法获取集合的数组对象,并且直接赋值给elementData
        elementData = c.toArray();
        size = elementData.length;
        // 这里是当c.toArray出错,没有返回Object[]时,利用Arrays.copyOf 来复制集合c中的元素到elementData数组中
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, size, Object[].class);
    }

调用构造方法后,会构造出数组elementData和集合大小size。

常用API详解

1 添加元素

每次添加元素之前都会判断添加后的容量是否需要扩容。
    //添加单个元素
    public boolean add(E e) {
        //判断添加后的长度是否需要扩容
        ensureCapacityInternal(size + 1); 
        //在数组末尾添加上当前元素,并且修改size大小
        elementData[size++] = e;
        return true;
    }
    //集合的初始容量为10
    private static final int DEFAULT_CAPACITY = 10;
    //判断是否是第一次初始化数组
    private void ensureCapacityInternal(int minCapacity) {
        //判断当前数组是否 == EMPTY_ELEMENTDATA,因为默认构造函数创建时是将空数组EMPTY_ELEMENTDATA赋值给elementData
        if (elementData == EMPTY_ELEMENTDATA) {
            //判断默认容量10和当前数据长度的大小,取其中大的值作为判断本次是否需要扩容的依据,由于第一次数组是空的,所以默认要使数组扩容到10的长度
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        //判断是否需要扩容
        ensureExplicitCapacity(minCapacity);
    }
    //判断扩容的方法
    private void ensureExplicitCapacity(int minCapacity) {
        //如果需要扩容modCount++,此参数是指当前列表结构被修改的次数
        modCount++;
        // 判断当前数据量是否大于数组的长度
        if (minCapacity - elementData.length > 0)
            //如果大于则进行扩容操作
            grow(minCapacity);
    }
    //扩容方法
    private void grow(int minCapacity) {
        // 记录扩容前数组的长度
        int oldCapacity = elementData.length;
        //将原数组的长度扩大0.5倍作为扩容后新数组的长度(如果扩容前数组长度为10,那么经过扩容后的数组长度应该为15)
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        //如果扩容后的长度小于当前数据量,那么就将当前数据量的长度作为本次扩容的长度
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        //判断新数组长度是否大于可分配数组的最大大小
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            //将扩容长度设置为最大可用长度
            newCapacity = hugeCapacity(minCapacity);
        // 拷贝,扩容,构建一个新的数组
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
    //判断如果新数组长度超过当前数组定义的最大长度时,就将扩容长度设置为Interger.MAX_VALUE,也就是int的最大长度
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE : MAX_ARRAY_SIZE;
        }
向指定下标添加元素
    public void add(int index, E element) {
        //判断下标是否越界,如果越界直接报异常
        rangeCheckForAdd(index);
        //判断扩容
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //拷贝数组,将下标后面的元素全部向后移动一位
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);
        //将元素插入当前下标位置
        elementData[index] = element;
        size++;
    }
    //判断下标是否越界
    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
添加多元素
    //添加多个元素
    public boolean addAll(Collection<? extends E> c) {
            return addAll(this.size, c);
    }
    //添加多个元素到指定下标
    public boolean addAll(int index, Collection<? extends E> c) {
        //判断下标是否越界
        rangeCheckForAdd(index);
        //判断c的大小是否大于0
        int cSize = c.size();
        if (cSize==0)
            return false;
        checkForComodification();
        //将元素插入到数组中
        parent.addAll(parentOffset + index, c);
        //将修改次数赋值给modCount
        this.modCount = parent.modCount;
        this.size += cSize;
        return true;
    }
小结

add时先判断是否越界,是否需要扩容。如果扩容,就复制数组。然后设置对应下标元素值。
注意:
1如果需要扩容的话,默认扩容一半。如果扩容一半不够,就用目标的size作为扩容后的容量。
2在扩容成功后,会修改modCount。

2 删除元素

    //删除某个下标的元素,并且返回该下标元素值
    public E remove(int index) {
        //判断下标是否越界
        rangeCheck(index);
        //修改次数加一
        modCount++;
        //查询该下标的元素赋值为oldValue
        E oldValue = elementData(index);
        //计算出需要移动数组的数据长度(有一个10长度的数组,我要删除下标1的元素,所以下标在1之后的元素都要依次往前移动1,10 - 1 - 1 = 8,需要挪动的元素数量为8)
        int numMoved = size - index - 1;
        //判断挪动数量是否大于0
        if (numMoved > 0)
            //拷贝数组,重新赋值
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        //将空闲出来的位置赋值为null
        elementData[--size] = null;
        return oldValue;
    }
    //直接删除该下标的元素,不返回值
    private void fastRemove(int index) {
        modCount++;
        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index, numMoved);
        elementData[--size] = null; // clear to let GC do its work
    }
    //删除该元素在数组中出现的第一个位置上的数据。如果该数据存在返回true,否则返回false
    public boolean remove(Object o) {
        //判断删除元素是否为null
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    //删除元素
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    //删除元素
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }
    //批量删除
    public boolean removeAll(Collection<?> c) {
        return batchRemove(c, false);
    }
    //批量移动
    private boolean batchRemove(Collection<?> c, boolean complement) {
        //将数组赋值给一个新数组
        final Object[] elementData = this.elementData;
        //w表示批量删除后数组还剩多少元素
        int r = 0, w = 0;
        boolean modified = false;
        try {
            //保存两个集合的共有元素
            for (; r < size; r++)
                //如果c中不包含当前元素则保留
                if (c.contains(elementData[r]) == complement)
                    elementData[w++] = elementData[r];
        } finally {
            // 出现异常会导致r != size,则将出现异常的数据全部添加到保留的数组里,不进行删除
            if (r != size) {
                //将异常的数据插入要保留的数组里
                System.arraycopy(elementData, r, elementData, w, size - r);
                //修改w的数量,将剩余异常的数据长度加到要保留的长度上
                w += size - r;
            }
            //判断要保留的长度和集合长度是否一致,
            if (w != size) {
                // 将删除空出来的下标全部置为null
                for (int i = w; i < size; i++)
                    elementData[i] = null;
                //修改次数
                modCount += size - w;
                //集合大小等于最后保留的数据长度
                size = w;
                modified = true;
            }
        }
        return modified;
    }
如果删除的数据多与数组里的数据也不会出现问题,它只会删除掉它们共有的元素。
小结

1 删除操作会涉及到数组的复制,时间复杂度相对较高。
2 删除操作一定会修改modCount。

3 修改元素

修改元素时不会修改modCount,相对于增删操作是高效的操作。
    public E set(int index, E e) {
        //判断下标是否越界
        rangeCheck(index);
        //取出下标为index的元素值
        E oldValue = elementData(index);
        //重新赋值
        elementData[index] = element;
        //返回旧数据
        return oldValue;
    }

4 查找元素

查找元素时也不会修改modCount,相对于增删操作是高效的操作。
    public E get(int index) {
        //越界问题
        rangeCheck(index);
        //查询数据
        return elementData(index);
    }
    E elementData(int index) {
        return (E) elementData[index];
    }

5 是否包含 contains

    //检查是否包含某个元素
    public boolean contains(Object o) {
        return indexOf(o) >= 0;
    }
    //没什么好说的,只是做了null和非null情况的判断
    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

6 清空元素 clear

    public void clear() {
        //修改modCount
        modCount++;
    
        // 将所有下标数据都置为null,保留数组大小
        for (int i = 0; i < size; i++)
            elementData[i] = null;
        //修改size大小
        size = 0;
    }

7 判断是否空 isEmpty

很简单就是判断size是否等于0,直接贴代码,不多说了。
    public boolean isEmpty() {
        return size == 0;
    }

8 克隆集合 clone

    public Object clone() {
        try {
            @SuppressWarnings("unchecked")
            //直接调用父类的clone方法
            ArrayList<E> v = (ArrayList<E>) super.clone();
            //将elementData拷贝到v.elementData中
            v.elementData = Arrays.copyOf(elementData, size);
            v.modCount = 0;
            return v;
        } catch (CloneNotSupportedException e) {
            // this shouldn't happen, since we are Cloneable
            throw new InternalError();
        }
    }

9 迭代器 Iterator

    public Iterator<E> iterator() {
        return new Itr();
    }
    private class Itr implements Iterator<E> {
        int cursor;       // index of next element to return
        int lastRet = -1; // index of last element returned; -1 if no such
        //用来判断集合是否修改过结构的标志
        int expectedModCount = modCount;
        //判断是否还有下一个元素
        public boolean hasNext() {
            return cursor != size;
        }
        //获取下一个元素的值
        @SuppressWarnings("unchecked")
        public E next() {
            checkForComodification();
            int i = cursor;
            //判断下标是否越界
            if (i >= size)
                throw new NoSuchElementException();
            Object[] elementData = ArrayList.this.elementData;
            //还是判断下标越界
            if (i >= elementData.length)
                throw new ConcurrentModificationException();
            cursor = i + 1;
            //返回元素,并且设置上一次返回元素的下标
            return (E) elementData[lastRet = i];
        }
        //删除掉上一次next的元素
        public void remove() {
            //判断是否执行过next
            if (lastRet < 0)
                throw new IllegalStateException();
            checkForComodification();
            try {
                ArrayList.this.remove(lastRet);
                //要删除的下标
                cursor = lastRet;
                //防止重复删除,将下标置为-1
                lastRet = -1;
                expectedModCount = modCount;
            } catch (IndexOutOfBoundsException ex) {
                throw new ConcurrentModificationException();
            }
        }
            //判断是否修改过集合的结构,如果修改过直接抛出异常
            final void checkForComodification() {
                if (modCount != expectedModCount)
                    throw new ConcurrentModificationException();
            }
        }

总结

1 增删改查操作中,增需要扩容modCount,删除一定会修改modCount。修改和查询一定不会修改modCount。
2 增操作会导致数组扩容和数组复制,批量删除会找出两个数组的交集,以及数组复制操作,所以,增删操作时间复杂度相对较高。而修改和查询的效率很高。

3 当然上述情况都是建立在数据量比较大的情况下,小数据量相差无几,所以在查询和修改操作较多的情况下建议使用ArrayList。

你可能感兴趣的:(Java,ArrayList)