关于Java ArrayList那些事

public class ArrayList extends AbstractList
        implements List, RandomAccess, 
        Cloneable, java.io.Serializable

ArrayList继承自AbstractList,并实现了List、RandomAccess、Cloneable、Serializable4个接口
咱先不管这玩意是啥,有啥优点缺点,原理是啥,直接看看api咋用,撸起袖子一把唆就完事了

image.png

image.png

具体的使用还是需要自己一行一行代码去敲,实践的,这边就不多讲ArrayList的用法啦

我们来看看get的方法的源码

    transient Object[] elementData;
    public E get(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));

        return (E) elementData[index];
    }

我们发现ArrayList取值是从一个叫elementData的数组获取的,其实我们对ArrayList的所有get、set、add、remove都是通过管理elementData数组实现的。
那么问题来了:

数组一旦声明,其大小是不可变的,那么我们add的时候内部发生了什么呢

其实正是因为数组的长度是不可变的,所以每次add的时候都是对数组进行扩容处理,我们来看看扩容是怎么实现的(add方法)

    ArrayList list = new ArrayList<>();
    list.add("这是第一个参数");

此时刚new出来的ArrayList的size为0,我们来看看该场景下add方法里面做了什么

   /**
     * Appends the specified element to the end of this list.
     *
     * @param e element to be appended to this list
     * @return true (as specified by {@link Collection#add})
     */
    public boolean add(E e) {
       这里我们可以知道传参的值 0+1 =>1
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

    private void ensureCapacityInternal(int minCapacity) {
       
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            这边特判为空时候,取DEFAULT_CAPACITY(10)
            与minCapacity(1)的最大值
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

    private void ensureExplicitCapacity(int minCapacity) {
        这个先不管,这是父类AbstractList的值
        modCount++;

        // overflow-conscious code
        这个注解的意思为溢出考虑
        我一开始乍一看的时候感觉这步有点多此一举的感觉,
        回过头发现原来是自己思维固定在ArrayList为空时扩容的情景下
        我们回到上面的ensureCapacityInternal方法,如果elementData 本身就不为空时扩容,
        那是会直接进入ensureExplicitCapacity这个方法,那么就有可能存在minCapacity>int的最大值(也就是变为了负数)
        if (minCapacity - elementData.length > 0)
       
            grow(minCapacity);
    }

     */
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    /**
     * Increases the capacity to ensure that it can hold at least the
     * number of elements specified by the minimum capacity argument.
     *
     * @param minCapacity the desired minimum capacity
     */
    private void grow(int minCapacity) {
        // overflow-conscious code(这里还是溢出考虑)

        int oldCapacity = elementData.length;

        注意:这里是有可能出现溢出的问题,>>1相当于右移1位即除以2
        那么newCapacity 就相当于oldCapacity x1.5有可能存在溢出
        这里jdk1.7、1.8是1.5倍扩容,1.6则是1.5倍+1扩容
        至于为啥是1.5倍扩容呢,俺也不知道,有知道的大佬带带小弟
        int newCapacity = oldCapacity + (oldCapacity >> 1);

        如果上方int值溢出了,那这步得到的结果也是小于0
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
         所以会在这步进行溢出检测
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
     检测到溢出后进入到该方法
    private static int hugeCapacity(int minCapacity) {
        这个抛异常没有看懂,因为理论上<0是连上方grow()这个方法也无法进入的
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
       /这个就是溢出处理了没啥好讲的,大家都懂XD
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

我们总结一下上方add干的事情

  • 判断扩容数组传入的值minCapacity(size+1)是否int溢出,溢出则不作操作,否则进行扩容
  • 取原先的ArrayList的size进行1.5倍扩容,判断1.5size的值是否小于minCapacity,小于则取minCapacity为最后扩容数组的长度,否则取1.5size。接着判断最后的扩容数组长度是否溢出int最大值,溢出则做溢出处理,最后进行扩容处理(new一个新的数组,并将旧的数组的值拷贝过去)
  • 所以我们平时对ArrayList做的addremove操作都是极其耗时的,因为需要将数组整个前移或后移,但是读取则是非常快

上方的总结其实比较片面,因为不单单只有add(E e)(size+1)会进入该方法,addAll(Collection c)(size+c.lengh)最后也是会进入该方法的,删除的话也是同理,这里就不谈了

我们再来看看ArrayList的构造方法跟一些变量


    /**
     * Default initial capacity.
     * 默认的数组扩容长度
     */
    private static final int DEFAULT_CAPACITY = 10;

    /**
     * Shared empty array instance used for empty instances.
     * 用于空实例的共享空数组实例
     */
    private static final Object[] EMPTY_ELEMENTDATA = {};

    /**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     * 用于默认长度的空实例的共享空数组。我们以第一次添加元素的时候即可知道我们需要
     *填充多少来区分EMPTY_ELEMENTDATA 
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};


    // Android-note: Also accessed from java.util.Collections


    transient Object[] elementData; 

    /**
     * The size of the ArrayList (the number of elements it contains).
     * 用来返回ArrayList的长度
     * @serial
     */
    private int size;


    /**
     * Constructs an empty list with the specified initial capacity.
     *
     * @param  initialCapacity  the initial capacity of the list
     * @throws IllegalArgumentException if the specified initial capacity
     *         is negative
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
         
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    /**
     * Constructs a list containing the elements of the specified
     * collection, in the order they are returned by the collection's
     * iterator.
     *
     * @param c the collection whose elements are to be placed into this list
     * @throws NullPointerException if the specified collection is null
     */
    public ArrayList(Collection c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }
elementData为什么被transient修饰

关于为什么使用transient 修饰,大家可以看看这位大佬的解释
ArrayList中elementData为什么被transient修饰?

为什么ArrayList.size()不直接返回elementData.size,而是另外记录一个size值返回

我们可以发现ArrayList.size()方法


    /**
     * Returns the number of elements in this list.
     *
     * @return the number of elements in this list
     */
    public int size() {
        return size;
    }

是返回的size的长度而不是elementData 的数组长度,这是因为扩容以后数组的长度不一定就等于实际ArrayList元素的个数,譬如本来ArrayList长度为10,我们给新加一个参数此时就需要扩容了,假设扩容到了15,那么此时的ArrayList的元素实际只占了11个位置,自然就不能返回elementData.size(15)了

EMPTY_ELEMENTDATA 与DEFAULTCAPACITY_EMPTY_ELEMENTDATA 区别?

然后再是Object[] EMPTY_ELEMENTDATA = {}Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}这两个值,从三个构造方法中我们可以看出:

  • 当指定了默认的数组长度,但数组长度为0时,则被赋值为EMPTY_ELEMENTDATA
  • 但是有的时候我又不想指定数组长度,譬如我们上方ArrayList list = new ArrayList<>();,这个时候则被赋值DEFAULTCAPACITY_EMPTY_ELEMENTDATA

“唯一”有“大用”的地方在

    public void ensureCapacity(int minCapacity) {
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            // any size if not default element table
            ? 0
            // larger than default for default empty table. It's already
            // supposed to be at default size.
            : DEFAULT_CAPACITY;

        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

扩容数组时候,elementDataEMPTY_ELEMENTDATA,只要minCapacity(扩容传参)不为0则扩容,为DEFAULTCAPACITY_EMPTY_ELEMENTDATA时,若minCapacity>10则扩容
其实,讲道理,在笔者看来这二者没有什么区别,在jdk1.7中甚至是没有DEFAULTCAPACITY_EMPTY_ELEMENTDATA这个变量的,看代码嘛,别把自己绕进去,不然一天很快就过去了= =

总结

ArrayList 增删慢,查询快,存放的数据有序

注: 本文基于jdk1.8,关于上方的c.toArray might (incorrectly) not return Object[] (see 6260652)的问题;clone()延伸的浅拷贝深拷贝问题;其余List对比问题等一系列问题会在后续的集合系列的文章一一展开讨论

你可能感兴趣的:(关于Java ArrayList那些事)