摘要:
总结很重要、他能客观的体现出你对这个体系的理解程度、首先要对整体的结构框架要掌握、再细化到每个分支的特点、再比较不同分支之间的相同点、不同点、再根据他们不同的特性分析他们的应用场景。
线条简单说明:
1、上图中虚线且无依赖字样、说明是直接实现的接口
2、虚线但是有依赖字样、说明此类依赖与接口、但不是直接实现接口
3、实线是继承关系、类继承类、接口继承接口
类或接口说明:
1、Collection:高度抽象出来的集合、定义某一类集合所具有的基本的方法、标准。
2、Iterable:标识性接口、要求子类提供获取Iterator方法、并且要实现Iterator具有的几个方法。
3、Iterator:迭代器、用于迭代Collection中元素、要求子类必须实现获取Iterator的方法、
4、ListIterator:用于迭代List集合的迭代器、要求List子类必须实现获取ListIterator方法、并且实现其必须方法。
5、List:以队列的形式存储、操作元素、定义了这种形式的集合所具有的基本方法、以及方法的定义。要求List实现类集合中每个元素都有索引、索引值从0开始、
6、Queue:以队列的数据结构存储、操作元素、Queue对于插入、提取和检查操作。每个方法都存在两种形式:一种抛出异常(操作失败时),另一种返回一个特殊值(null 或 false,具体取决于操作)。
7、Deque:实现Queue、使子类可以以双向链表的数据结构形式存储、操作数据、从这可以看出其子类的灵活性较大。
8、Enumeration:枚举、用于Vector及其子类迭代元素、他避免了fail-fast机制、使得Vector及其子类在迭代元素的时候可以保证线程安全。
9、AbstractCollection:Collection的实现类、要求需要实现Collection接口的类都必须从它继承、目的是用于简化编程。
10、 AbstractList:继承AbstractCollection、实现List接口中定义方法、目的也是简化编程、并且其内部提供了获取Iterator、ListIterator的方法。
11、 AbstractSequencedList:继承AbstractList、使得List支持有序队列、比如链表形式存储操作元素。
12、 ArrayList:继承AbstractList、以动态数组的形式存储、操作元素、
13、 LinkedList:继承AbstractSequencedList、实现Deque、List接口、以双向链表的形式存储、操作元素。
14、 Vector:继承AbstractList、以动态数组的形式存储、操作元素、线程安全
15、 Stack:继承Vector、在Vector的基础上新增以栈的形式存储、操作元素。
a)都直接或者间接继承了AbstractList、都支持以索引的方式操作元素
b)都不必担心容量问题、ArrayList是通过动态数组来保存数据的、当容量不足时、数组会自动扩容、而LinkedList是以双向链表来保存数据的、不存在容量不足的问题
c) 都是线程不安全的、一般用于单线程的环境下、要想在并发的环境下使用可以使用Collections工具类包装。
a)ArrayList是通过动态数组来保存数据的、而LinkedList是以双向链表来保存数据的
b)相对与ArrayList而言、LinkedList实现了Deque接口、Deque继承了Queue接口、同时LinkedList继承了AbstractSequencedList类、使得LinkedList在保留使用索引操作元素的功能的同时、也实现了双向链表所具有的功能、这就决定了LinkedList的特定
c)对集合中元素进行不同的操作效率不同、LinkedList善于删除、添加元素、ArrayList善于查找元素。本质就是不同数据结构之间差异。
a) 都是继承AbstractList、拥有相同的方法的定义、
b)内部都是以动态数组来存储、操作元素的、并且都可以自动扩容。
a) 线程安全:ArrayList是线程不安全的、适用于单线程的环境下、Vector是线程安全的、使用与多线程的环境下。
b)构造方法:Vector有四个构造方法、比ArrayList多一个可以指定每次扩容多少的构造方法
c) 扩容问题:每当动态数组元素达到上线时、ArrayList扩容为:“新的容量”=“(原始容量x3)/2 + 1”、 而Vector的容量增长与“增长系数有关”,若指定了“增长系数”,且“增长系数有效(即,大于0)”;那么,每次容量不足时,“新的容量”=“原始容量+增长系数”。若增长系数无效(即,小于/等于0),则“新的容量”=“原始容量 x 2”。
d) 效率问题:因为Vector要同步方法、这个是要消耗资源的、所以效率会比较低下
e)Vector为摆脱fail-fast机制、自己内部多提供了一种迭代方法Enumeration、
关于上面四个集合加一个数组、在这里给出一个表格用于表示他们的不同的操作的效率的排名、这样更直观、
|
实现机制 |
随机访问 |
迭代操作 |
插入操作 |
删除操作 |
|
数组 |
连续内存区保护元素 |
1 |
不支持 |
不支持 |
不支持 |
|
ArrayList |
以数组保存元素 |
2 |
2 |
2 |
2 |
|
Vector |
以数组保存元素 |
3 |
3 |
3 |
3 |
|
Stack |
以数组保存元素 |
3 |
3 |
3 |
3 |
|
LinkedList |
以链表保存元素 |
4 |
1 |
1 |
1 |
通过实例来验证上面表格的内容、由于数组比较特殊、他是牺牲的长度的变化直接在内存中开辟空间来存储元素、所以查询效率是毋庸置疑的、同时由于size一旦确定就不能改变、所以插入删除不支持。所以下面验证没有关于Array的的验证
package com.chy.collection.example;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;
import java.util.Stack;
import java.util.Vector;
public class EfficiencyTest {
private static ArrayList arrayList = new ArrayList();
private static Vector vector = new Vector();
private static Stack stack = new Stack();
private static LinkedList linkedList = new LinkedList();
/**
* 测试插入方法(每次都将新增加的元素插入到集合开始处)、注意不要写成 add(Object o)方法、具体原因自己分析
*/
private static void testInsert(){
testInsert(arrayList);
testInsert(vector);
testInsert(stack);
testInsert(linkedList);
}
/**
* 测试随机访问效率
*/
private static void testRandomAccess(){
testRandomAccess(arrayList);
testRandomAccess(vector);
testRandomAccess(stack);
testRandomAccess(linkedList);
}
/**
* 测试Iterator迭代效率
*/
private static void testIterator(){
testIterator(arrayList);
testIterator(vector);
testIterator(stack);
testIterator(linkedList);
}
/**
* 测试删除效率
*/
private static void testDelete(){
testDelete(arrayList);
testDelete(vector);
testDelete(stack);
testDelete(linkedList);
}
private static void testInsert(List list){
long start = currentTime();
for (int i = 0; i < 10000; i++) {
list.add(0,"a");
}
long end = currentTime();
System.out.println("the add method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");
}
private static void testRandomAccess(List list){
long start = currentTime();
for (int i = 0; i < list.size(); i++) {
list.get(i);
}
long end = currentTime();
System.out.println("the random access method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");
}
private static void testIterator(List list){
long start = currentTime();
Iterator it = list.iterator();
while(it.hasNext()){
it.next();
}
long end = currentTime();
System.out.println("the iterator method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");
}
private static void testDelete(List list){
long start = currentTime();
for (int i = 0; i < 10000; i++) {
if(!list.isEmpty()){
list.remove(0);
}
}
long end = currentTime();
System.out.println("the delete method of " + list.getClass().getName() + " use time : " + (end - start) + "ms");
}
private static long currentTime(){
return System.currentTimeMillis();
}
public static void main(String[] args) {
testInsert();
System.out.println("==========================================================");
testRandomAccess();
System.out.println("==========================================================");
testIterator();
System.out.println("==========================================================");
testDelete();
}
}
运行结果:
the add method of java.util.ArrayList use time : 32ms
the add method of java.util.Vector use time : 47ms
the add method of java.util.Stack use time : 31ms
the add method of java.util.LinkedList use time : 15ms
==========================================================
the random access method of java.util.ArrayList use time : 15ms
the random access method of java.util.Vector use time : 16ms
the random access method of java.util.Stack use time : 17ms
the random access method of java.util.LinkedList use time : 47ms
==========================================================
the iterator method of java.util.ArrayList use time : 16ms
the iterator method of java.util.Vector use time : 15ms
the iterator method of java.util.Stack use time : 17ms
the iterator method of java.util.LinkedList use time : 16ms
==========================================================
the delete method of java.util.ArrayList use time : 47ms
the delete method of java.util.Vector use time : 31ms
the delete method of java.util.Stack use time : 32ms
the delete method of java.util.LinkedList use time : 15ms
在这里不会主要讨论所有的差异、而是通过源码的方式分析LinkedList与Arraylist、ArrayList与Vector在随机访问、插入、删除元素方面的差异原因、至于迭代Iterator、他们都是用从AbstractList继承的获取Iterator方法、差异不大、不再比较。
ArrayList与LinkedList
a)ArrayList的随机访问效率高于LinkedList:
随机访问是通过索引去查找元素的、LinkedList关于获取指定索引处值的源码:
/** 获取index处的元素*/
public E get(int index) {
return entry(index).element;
}
/** 获取双向链表LinkedList中指定位置的节点、是LinkedList实现List中通过index操作元素的关键*/
private Entry entry(int index) {
if (index < 0 || index >= size)
throw new IndexOutOfBoundsException("Index: "+index+ ", Size: "+size);
Entry e = header;
if (index < (size >> 1)) {
for (int i = 0; i <= index; i++)
e = e.next;
} else {
for (int i = size; i > index; i--)
e = e.previous;
}
return e;
}
关于获取指定索引处的值的源码:
/** 检测下标是否越界*/
private void RangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(
"Index: "+index+", Size: "+size);
}
/** 获取ArrayList中索引为index位置的元素*/
public E get(int index) {
RangeCheck(index);
return (E) elementData[index];
}
对比两者源码可以看出、LinkedList获取指定索引处的值是通过二分法先确定索引所在范围之后、在逐个查找、直到找到指定索引处、并且对每个索引都是如此、相比于ArrayList直接定位到index处的值来讲、无疑是非常浪费时间、消耗资源的、
b)ArrayList的插入、删除操作效率低于LinkedList的原因:
对于指定index处的插入、删除、ArrayList和LinkedList都是先通过索引查找到指定位置、然后进行下一步的插入删除操作、上面我们知道LinkedList是先通过二分法查找index范围再确定index具体位置、但是ArrayList是直接定位到index处、为什么LinkedList反而快?依然通过源码找原因。
ArrayList关于指定位置的元素的插入:
/**
* 确保此ArrayList的最小容量能容纳下参数minCapacity指定的容量、
* 1、minCapacity大于原来容量、则将原来的容量增加(oldCapacity * 3)/2 + 1;
* 2、若minCapacity仍然大于增加后的容量、则使用minCapacity作为ArrayList容量
* 3、若minCapacity不大于增加后的容量、则使用增加后的容量。
*/
public void ensureCapacity(int minCapacity) {
modCount++;
int oldCapacity = elementData.length;
if (minCapacity > oldCapacity) {
Object oldData[] = elementData;
int newCapacity = (oldCapacity * 3)/2 + 1;
if (newCapacity < minCapacity)
newCapacity = minCapacity;
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
}
/** 将指定元素添加到指定的索引处 、
* 注意:
* 1、如果指定的index大于Object[] 的size或者小于0、则抛IndexOutOfBoundException
* 2、检测Object[]是否需要扩容
* 3、 将从index开始到最后的元素后移一个位置、
* 4、将新添加的元素添加到index去。
*/
public void add(int index, E element) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(
"Index: "+index+", Size: "+size);
ensureCapacity(size+1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
LinkedList关于指定位置的元素的插入:
/** 在index前添加节点,且节点的值为element*/
public void add(int index, E element) {
addBefore(element, (index==size ? header : entry(index)));
}
/** 获取双向链表LinkedList中指定位置的节点、是LinkedList实现List中通过index操作元素的关键*/
private Entry entry(int index) {
if (index < 0 || index >= size)
throw new IndexOutOfBoundsException("Index: "+index+ ", Size: "+size);
Entry e = header;
if (index < (size >> 1)) {
for (int i = 0; i <= index; i++)
e = e.next;
} else {
for (int i = size; i > index; i--)
e = e.previous;
}
return e;
}
//新建节点、节点值是e、将新建的节点添加到entry之前
private Entry addBefore(E e, Entry entry) {
//觉得难理解的可以先花个几分钟看一下链式结构资料、最好是图片形式的
//新建节点实体
Entry newEntry = new Entry(e, entry, entry.previous);
//将参照节点原来的上一个节点(即插在谁前面的)的下一个节点设置成newEntry
newEntry.previous.next = newEntry;
//将参照节点(即插在谁前面的)的前一个节点设置成newEntry
newEntry.next.previous = newEntry;
size++;
modCount++;
return newEntry;
}
对比上面代码可以看出来ArrayList每当插入一个元素时、都会调用System.arraycopy()将指定位置后面的所有元素后移一位、重新构造一个数组、这是比较消耗资源的、而LinkedList是直接改变index前后元素的上一个节点和下一个节点的引用、而不需要动其他的东西、所以效率很高。
ArrayList与Vector:
ArrayList、Vector都是继承与AbstractList、并且在类结构上没有多少差异、但是因为Vector要同步方法、所以在性能上不如ArrayList、从源码也可以看出Vector许多方法都是使用关键字synchronized修饰的。不再贴源码
学以致用、最后总结下上述List集合体系的各个类的使用环境:
1、当需要对集合进行大量的查询时、并且是单线程环境下使用ArrayList
2、当需要对集合进行大量添加、删除时、并且是单线程环境下使用LinkedList、
3、当多线程时、需要对集合进行大量的查询时、可以考虑使用Vector或者Stack、但是不建议、我们可以使用多次提到的Collections类包装。