Java数据结构-ArrayList最细致的解析笔记

ArrayList是一个类,这个类有一个数组参数elementData,ArrayList集合中的元素正是保存在这个数组中,它继承了数组查询的高性能,参考第3篇。ArrayList还封装了很多方法,便于对数组中的数据进行操作处理,其中就包括上一篇说的扩容,建议先理解第3篇数组。

扩容原理

在eclipse中调试以下代码,如下设置四个断点,打开调试视图。

public static void main(String[] args) { List list = new ArrayList(); System.out.println("断点1"); list.add(1); System.out.println("断点2"); list.add(2); list.add(3); list.add(4); list.add(5); list.add(6); list.add(7); list.add(8); list.add(9); list.add(10); System.out.println("断点3"); list.add(11); System.out.println("断点4"); } 

断点1:list的数组参数elementData的值为Object[0],表示数组初始长度为0。

Java数据结构-ArrayList最细致的解析笔记_第1张图片

断点2:在集合中添加了第一个元素,elementData数组长度变成了10。即初始扩容长度为10。

Java数据结构-ArrayList最细致的解析笔记_第2张图片

断点3:在集合中一共添加了10个元素,elementData长度仍然为10,此时无需扩容。

Java数据结构-ArrayList最细致的解析笔记_第3张图片

断点4:添加第11个元素,即超出了原数组长度。elementData长度扩容为15,即第二次以后的扩容,长度为原长度的1.5倍。

Java数据结构-ArrayList最细致的解析笔记_第4张图片
注意看图,elementData在断点1时标识是29,在断点2和断点3处的标识都是31,而在断点4时标识46,第2篇讲过,这说明elementData引用变量前后一共指向了三个不同的数组对象。也就是说,elementData并没有真正的扩容,而是创建了一个容量更大的数组对象来替代之前的数组,并且复制之前的数组内容。

元素类型Object

第3篇讲过,数组元素的长度必须是一致的。而以上代码中,我添加的都是int类型数据。假如我添加一个long型数据,如下,也是可以的。而int(4字节 )和long(8字节 )的长度是不一样的,这是为什么?

list.add(1); list.add(1l); 

假如声明时使用List,就指定了固定元素类型。而我的代码中并没有使用泛型,所以它的类型可以是任意Object,但不能是基本类型。当添加int元素时,会自动转换为Integer。当添加long元素时,会自动转换为Long。因此,最终list所有的元素类型都是引用类型(4字节),长度相同,这是实现数组高性能查询所必需的。以后讲其他集合的元素类型时,也和ArrayList是一样的原理,不再解释。

在尾部添加

第3篇在数组中添加了5亿个元素,很快就执行完成。假如用同样的方法在ArrayList中添加5亿元素会怎么样?

int size=500000000; List list = new ArrayList(); long t1 = System.currentTimeMillis(); for(int i=0;i<size;i++){ list.add(i); } long t2 = System.currentTimeMillis(); System.out.println(t2-t1); 

运行结果:内存溢出

一直运行了n分钟没有结果,最终报错内存溢出。因为在这个过程中,会不断的扩容,不断的创建新数组对象,最终把内存撑爆。要解决这个问题,可以在创建ArrayList时传入一个int参数,根据参数值会直接初始一个较大的数组,就不用再频繁的扩容了。注意:如果初始数组太大又不使用,也会让费内存空间。修改代码,将new ArrayList()改成new ArrayList(size)

List list = new ArrayList(size); 

只是这样做还不够,因为上面说了,list.add(i)实际上是创建了5亿个对象,数据量太大内存仍然不足。再次修改添加代码,将list.add(i)改成list.add(1),1会转换成new Integer(1),5亿个new Integer(1)仍然是5亿个对象。但是java对一些对象做了缓存,其中包括new Integer(0至127),以后会讲。现在只需知道,i改成1后只会有一个new Integer(1)对象,而不会创建5亿个对象。之后文章都会使用1作为集合参数,不再解释。修改代码如下 ,再次运行

list.add(1); 

耗时:1080毫秒

add()方法默认是在尾部添加数据,ArrayList的size可以帮助数组瞬间完成定位,然后直接添加,所以这样的性能是很高的。

Java数据结构-ArrayList最细致的解析笔记_第5张图片

在指定位置添加

list.add(int index,E element)方法是在位置index处添加,如下

int size=500000000; List list = new ArrayList(size); long t1 = System.currentTimeMillis(); for(int i=0;i<size;i++){ list.add(0,1); } long t2 = System.currentTimeMillis(); System.out.println(t2-t1); 

耗时:无限

Java数据结构-ArrayList最细致的解析笔记_第6张图片

 

上图可以看出,向指定位置0插入元素时,其后面的所有元素都要一个个的向后移动,即每添加一个元素要移动n次元素。虽然没有创建对象,不会内存溢出,但是时间性能实在太低。

删除的性能

和添加同理,在尾部删除性能很高。但在指定位置删除也存在性能问题,需要把后面元素一个一个的往前移。

Java数据结构-ArrayList最细致的解析笔记_第7张图片

特性

有序列表:集合中的元素按照添加顺序排列,先添加进集合的排在前面,后添加的排在后面。
底层就是数组:操作尾部数据时,其性能是最高的。操作越靠前的数据,性能越低。
封装了数组:操作更简便,代码可读性更高。但是也封装了额外操作,比如安全检查,数组是否越界等,这也带来一些性能开销,所以ArrayList性能会比数组稍稍低那么一点点。

应用场景

做普通项目时,对性能没有那么严格的要求,如果想要快速开发,使用封装过的ArrayList是第一选择。
关于从指定位置添加和删除,是ArrayList的性能缺陷。我们要做的是将其优点发挥到其擅长的场景,将其不擅长的场景交给其他数据结构来处理,扬长避短。后续要介绍的集合都是一样,没有哪一种结构是完美的,只有其最适合哪种场景。

 

百人微信讨论群,如果群二维码失效请加微信拉你入群 shengruxiahua3596 ,加微信请备注 程序员-java

Java数据结构-ArrayList最细致的解析笔记_第8张图片
发布于 10:39
开启

你可能感兴趣的:(Java数据结构-ArrayList最细致的解析笔记)