JAVA容器效率深度分析List

本文中的测试代码来源于《think in java》第四版

附件中有测试代码

1、各种List的各种操作的耗时

JAVA容器效率深度分析List

size:每一个list的元素数量,从10到10W

 

操作:add增加到list末端,get随机访问,set修改某个元素值,insert在list中间插入(代码中只是插入到了第五个元素,放大了随机插入的操作时间),rmMiddle从list中间删除元素(代码中是删除了第五个元素,放大了从list.size()/2的操作时间,rmLast从list末端删除,rmFirst从list首部删除

 

操作时间:是指每一次操作所用的时间,单位纳秒

 

环境:64bit JDK7

 

ArrayList和Vector都是基于数组实现的,区别就是Vector是同步的,以下将统称为“数组list”

2、分析

2.1 add操作,数组和链表旗鼓相当

首先,当list仅有10个元素的add耗时,要大于100/1k/1w/10w元素的add耗时,这里可能是因为“JIT的热点优化”导致。可以通过增加循环次数来验证,在我的机器上:“往一个list增加10个元素”,循环13W次时,每次的操作耗时降到 2位数

其次,比较数组list和链表list,向末端增加时,操作耗时几乎不随着list元素数变化而变化。

 

数组元素add时的扩容动作最终调用的方法:

    public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }

 无疑,native方法System.arraycopy的效率是高的,几乎不随list.size()变化而变化。

 

因为System.arraycopy的高效,在这里不得不提到一点,链表在add操作时比数组list要复杂的多(LinkedList是双向链表),当list.size()数量超过百万时,链表的add可能就会比数组add要慢,这一点有待验证。

 

2.2get随机访问,数组完胜

数组list的get耗时,在list.size()增长时,无变化

链表list的get耗时,在list.size()增长时,性能下降。

 

值得一提的就是jdk5中遍历操作的foreach写法,如下:

 

   for (String x : list) { 
            System.out.println(x); 
        } 

此种写法是基于集合的iterator迭代器,只要是实现了Iterable接口的类,均可使用此种写法。数组的迭代器访问,本质还是基于数组的随机访问,和get随机访问比,将无变化。而链表的迭代器访问,与get随机访问相比,性能将有大幅度提升,应该和数组的随机访问差不多,而且不会因为list.size()的增长而导致系能下降

 

2.3set修改,数组完胜

修改操作,数组list不随size增大而导致效率降低,链表则随着list.size()增大导致效率降低,看链表set源码

 

    public E set(int index, E element) {
        //查找Entry
        Entry<E> e = entry(index);
        E oldVal = e.element;
        e.element = element;
        return oldVal;
    }

    private Entry<E> entry(int index) {
        if (index < 0 || index >= size)
            throw new IndexOutOfBoundsException("Index: "+index+
                                                ", Size: "+size);
        Entry<E> e = header;//从header开始
        //index小于size一半,则向后遍历,否则向前遍历
        if (index < (size >> 1)) {
            for (int i = 0; i <= index; i++)
                e = e.next;
        } else {
            for (int i = size; i > index; i--)
                e = e.previous;
        }
        return e;
    }
 

 

也就是说,每次set时候,都会从header向前或向后遍历链表。由此可以想到,修改第"list.size/2"个元素,则是代价最大的修改。

 

2.4 insert插入,链表完胜数组

1)无论链表还是数组,insert操作的效率将会随着list.size()的增大而降低

2)数组需要将insert元素,以后的元素,整体后移动

    public void add(int index, E element) {
	if (index > size || index < 0)
	    throw new IndexOutOfBoundsException(
		"Index: "+index+", Size: "+size);

	ensureCapacity(size+1);  // Increments modCount!!
	System.arraycopy(elementData, index, elementData, index + 1,
			 size - index);
	elementData[index] = element;
	size++;
    }

 

2.5 remove删除,链表小胜

    public E remove(int index) {
	RangeCheck(index);

	modCount++;
	E oldValue = (E) elementData[index];

	int numMoved = size - index - 1;
	if (numMoved > 0)
	    System.arraycopy(elementData, index+1, elementData, index,
			     numMoved);
	elementData[--size] = null; // Let gc do its work

	return oldValue;
    }

 数组list每次删除都有System.arraycopy操作,因此效率最低的应该是remove first删除list中的第一个元素。耗时最少的删除是remove last删除最后一个元素。

链表则无论是第一个删除、中间删除、末尾删除,都无需考虑效率问题,而且,删除效率不随list.size()增大而降低

如果是从末尾删除,数组甚至比链表要快。

 

结论:List中首选Arraylist,基于数组实现list平均性能是最好的,如果有大量的insert或者从首部/中部删除元素的操作,则应该选择LinkedList

其实LinkedList作为队列、堆栈来操作,无疑,应该是首选,效率够高

 

 

你可能感兴趣的:(java)