本篇文章主要是总结了java容器中的相关知识点,包括容器层次结构、类图结构,Collection接口的详细信息,以及Collection的一个重要子接口List接口的相关知识点总结。其中涉及到一些类如ArrayList、LinkedList、Vector、Stack、CopyOnWriteArrayList等的底层数据结构、实现机制及用法等的学习总结。
一.基本概念
Java容器类库的用途是保存对象,根据数据结构不同将其划分为两个不同的概念
(1) Collection,一个独立元素的序列,其中List按照元素的插入顺序保存元素,而set不能有重复元素,Queue按照先进先出(FIFO)的方式来管理数据,Stack按照后进先出(LIFO)的顺序管理数据。
(2) Map,一组键值对(key-value)对象的序列,可以使用key来查找value,其中key是不可以重复的,value可以重复。我们可以称其为字典或者关联数组。其中HashMap是无序的,TreeMap是有序的,WeakHashMap是弱类型的,Hashtable是线程安全的。
下面这张图来自于Thinking in Java Fourth Edition第十七章:
除上面图中画到的内容外在java.util.concurrent包中也实现了大量的线程安全的集合类,可以很方便的使用。如ConcurrentHashMap、CopyOnWriteArrayList、CopyOnWriteArraySet等。
二.Collection接口
Ø 由集合类图结构可以得知Collection接口是Java语言中最基本的集合接口,在JDK中没有直接提供Collection接口的具体实现类,Collection的功能实现类主要是对它的两个更具体的子接口List和Set的具体实现类。但是在Collection接口中定义了一套通用操作的实现方法和命名规则。
Ø 在JDK帮助文档中可以看到Collection接口以及各个子接口、各种形式实现类的说明。
Ø 对Collection接口的实现类构造方法一般至少有下面两种:一个是void(无参数)构造方法,用于创建空的Collection对象实例;另一个是带有一个Collection类型参数的构造方法,用于创建一个具有与其参数相同元素的Collection对象实例。例如HashSet类的构造方法有下面四种:
a) HashSet():构造一个初始容量为16、加载因子为0.75的HashSet类的实例对象;
b) HashSet(Collection extends E> c):构造一个包含指定集合对象的HashSet类的对象实例。
c) HashSet(int initialCapacity):构造一个指定初始容量的HashSet类的实例对象。
d) HashSet(int initialCapacity, float loadFactor):构造一个指定初始容量以及指定加载因子的HashSet类的实例对象。
Ø Collection接口中共定义了15个通用的方法:
a) Collection接口方法清单
a) 添加和删除集合中的某个元素
• boolean add(E o) : 将指定的元素追加到集合当中
• boolean remove(Object o) : 将指定的元素从集合中删除
b) 查询与集合有关的数据
• int size() : 返回此集合中元素的个数
• boolean isEmpty() : 测试此集合是否为空
• boolean contains(Object element) : 测试此集合中是否有该元素
• Iterator
c) 对若干个元素以组为单位进行操作
• boolean containsAll(Collection> c) : 判断此集合是否包含给定的一组元素,包含返回true,否则false
• boolean addAll(Collection extends E> c) : 将指定集合中的所有元素都添加到当前集合中
• void clear() : 移除此集合中的所有元素
• boolean removeAll(Collection> c) : 移除此集合中那些也包含在指定集合中的元素(求集合的差集)
• boolean retainAll(Collection> c) : 仅保留此集合中那些也包含在指定集合中的元素(求集合的交集)
d) 将集合转换成Object类型的对象数组
• Object[] toArray() : 返回包含此集合中所有元素的数组
•
1. List接口及其实现类
List接口中方法清单
List可以将元素维护在特定的序列中,并且允许一个相同元素在集合中多次出现。List接口在Collection接口的基础上增加了大量的方法,使得可以在List中间插入和移除元素。除了Abstract类之外,在学习中比较常用的类有ArrayList(基于数组实现),LinkedList(基于循环链表实现),Vector(基于数组实现,线程安全),Stack(是Vector的子类,基于数组实现),CopyOnWriteArrayList(基于数组实现,线程安全)
List接口中提供的面向位置操作的各种方法:(集合中已有的方法略去)
• void add(int index, E element) : 在列表的指定位置插入指定元素。
• boolean addAll(int index, Collection extends E> c) : 将指定集合中的所有元素插入到集合中的指定位置。
• E get(int index) : 返回集合中指定位置的元素。
• int indexOf(Object o) : 返回指定对象在集合中第一次出现的索引,从0位置开始,返回-1为不存在该元素。
• int lastIndexOf(Object O) : 返回指定对象在集合中最后一次出现的索引位置,返回-1为不存在。
• ListIterator
• ListIterator
• E remove(int index) : 移除集合中指定位置的元素。
• E set(int index, E element) : 用指定元素替换集合中指定位置的元素。
• List
List接口提供了名称为ListIterator的特殊迭代器。
List在数据结构中分别表现为数组、向量、链表、堆栈、队列等形式。
Ø ArrayList的特点、实现机制及使用方法
a) ArrayList特点:
ArrayList顾名思义,它是用数组实现的一种线性表。常规数组不具备自动递增的功能,但是ArrayList在使用时我们不必考虑这个问题。可以直接按位置进行索引,查找和修改速度较快,缺点是插入或者删除速度较慢。在执行插入删除时调用的是System.arraycopy方法,是一个native方法。
b) ArrayList的实现机制:
在JDK源码中可以看到ArrayList总共只有两个属性,一个是Object数组类型的elementData,一个是int型的size。
在构造方法中也可以看到,无参构造方法调用的是this(10),调用的带一个参数的构造方法,默认无参构造方法分配一个size为10的数组。按照Collection接口中定义的构造方法,它必须有一个通过其它集合对象构造自身对象的方法。这是一个相对比较简单的线性表。并且JDK中提供了大量的比较好用的方法可以使用。该动态数组在存储空间不足时按照下面方法重新分配空间:
newCapacity = (oldCapacity*3)/2 + 1;
if(newCapacity < minCapacity) newCapacity = minCapacity;
c) 使用方法(ArrayList的使用方法其实是比较简单,但是也是比较常用和好用的,个人感觉)
下面例子为了尽可能多的用到ArrayList的方法,可能看起来没有多大意义
Ø LinkedList的特点、实现机制及使用方法
a) LinkedList的特点:
现在发现java中类的命名真是太好了,比如这个吧,一看就知道它使用链表实现的。链表操作的优点就是插入删除比较快,但是不能按索引直接存取,所以执行更新操作比较快,执行查询操作比较慢。它的整体特性由于ArrayList。
b) LinkedList实现机制:
查看jdk源码可以得知每个元素在LinkedList中都是一个LinkedList.Entry的实例对象。该类定义如下:
在构造方法中这样的定义:
header.next = header.previous = header;
也就是说LinkedList底层使用一个循环双向链表实现的。
LinkedList实现了许多对first和last元素进行操作的方法,比如set、get、remove等。
虽然LinkedList获取指定位置的元素时较ArrayList按索引获取较慢,但是JDK中对get方法做了优化:
虽然还是顺序挨个查找,但是已经做了优化。size>>1 == size/2,移位运算要比除法运算效率高的多。
c) LinkedList和ArrayList的使用方法类似,只是看自己的需要进行选择了。除此之外LinkedList还实现了栈操作的所有方法。
Ø Vector的特点、实现机制及使用方法
a) Vector的特点:
ArrayList实现的是一种动态数组,LinkedList是一种双向循环链表,Vector并未在前两者的基础上做实现,而是直接实现了List接口。Vector中的所有方法前面都有一个synchronized关键字做修饰。Vector是有序可重复的。
b) Vector的实现机制:
我暂时还不理解为什么要实现Vector这个类,和ArrayList基本是一样的,不一样的是Vector是线程安全的,但是Collections里面提供了将非线程安全的集合转换成线程安全的集合的方法。
c) Vector的使用方法(与ArrayList使用方法类似)
Ø Stack的特点、实现机制及使用方法
a) Stack的特点:
Stack(栈)是一种后进先出的序列,主要操作有判空、压栈、退栈、取栈顶元素等。
b) Stack的实现机制:
Stack继承自Vector,同样使用数组保存数据,根据该数据结构的特点进行了限制性操作。JDK中共提供了6个方法用于实现特定要求的操作:
• Stack() : 构造一个空的栈
• empty() : 判断栈是否为空
• peek() : 查看栈顶元素并返回栈顶对象
• pop() : 删除栈顶元素并返回栈顶对象
• push(E element) : 将一个元素压入当前栈中
• search(Object o) : 查看指定对象是否在当前栈中
c) Stack的使用方法
Ø CopyOnWriteArrayList的特点、实现机制及使用方法
a) CopyOnWriteArrayList的特点:
CopyOnWriteArrayList是java.util.concurrent包中的一个类,此类是一个线程安全类。由于用到了ReentrantLock(重入锁)同步,所以在修改效率上较ArrayList差。
b) CopyOnWriteArrayList的实现机制:
刚开始觉得这个名字好长,并且感觉奇怪,为什么要这样命名?首先这是一个为了实现并发同步而设计的类,那么在所有与修改方法相关的地方均会使用lock来保证同步。Copy-on-write的英文释义是“写时拷贝、写时复制”,现在看来觉得这个名字就更容易理解了,那么这个类到底是怎么实现的呢?面试官说:“踏踏实实看源码”。-_-|||
首先说一下写方法:
• public E set(int index, E element) : 将指定位置的元素使用element替换掉。JDK中的源码如下:
在源码中可以看出,首先执行写入(包括set,add,remove等)操作时,首先得到一把当前对象的重入锁,其次获得当前对象元素的一个拷贝(写时拷贝),再次用修改后的元素替换掉原来的元素,最终释放锁。
这里引用两个常识:
1、JAVA中“=”操作只是将引用和某个对象关联,假如同时有一个线程将引用指向另外一个对象,一个线程获取这个引用指向的对象,那么他们之间不会发生ConcurrentModificationException,他们是在虚拟机层面阻塞的,而且速度非常快,几乎不需要CPU时间。
2、JAVA中两个不同的引用指向同一个对象,当第一个引用指向另外一个对象时,第二个引用还将保持原来的对象。
• public void add(E e) : 向当前对象中加入指定元素。实现方式与set相同,均是copy-on-write。
• 还有remove等修改内容的操作。
除写方法(修改,删除,添加)外,CopyOnWriteArrayList类还提供了ArrayList相类似和功能更齐全的方法供选择使用。
• public ListIterator
使用方法与ArrayList类似,只是用时选择的问题。因为在写操作时大量使用了System.arrayCopy方法,所以在效率上会有所降低。因此它适合使用在读操作远远大于写操作的场景中。