java基础印象加深——集合框架理解

集合框架体系组成

java基础印象加深——集合框架理解_第1张图片

在集合框架的类继承体系中,最顶层有两个接口:

  • Collection表示一组纯数据
  • Map表示一组key-value对

一般继承自CollectionMap的集合类,会提供两个“标准”的构造函数:

  • 没有参数的构造函数,创建一个空的集合类
  • 有一个类型与基类(CollectionMap)相同的构造函数,创建一个与给定参数具有相同元素的新集合类

因为接口中不能包含构造函数,所以上面这两个构造函数的约定并不是强制性的,但是在目前的集合框架中,所有继承自CollectionMap的子类都遵循这一约定。

 

集合框架主要实现类

 

Collection

Collection体系中有三种集合:Set、List、Queue

  • Set(集): 元素是无序的且不可重复。
  • List(列表):元素是有序的且可重复。
  • Queue(队列):封装了数据结构中的队列。

1、List:元素是有序的,而且可以重复。通过索引可以访问每个元素。

     实现类组成:

  • ArrayList: 数组结构,实现了可变大小的数组,就像传统的数组一样。

       1:ArrayList允许存放所有的元素,允许为null

       2:size,isEmpty,get,set方法运行时间为常数,但add方法运行时间为分摊的常数,添加n个元素需要O(n)的时间

       3:ArrayList也是非同步的(unsynchronized)

       4:ArrayList适合随机访问,使用索引可以很快的找到元素位置

  • LinkedList:LinjkedList 实现了List接口,双向链表存储数据

       1:LinkedList也是非同步的(unsynchronized)

       2:ArrayList适合随机访问LinkedList更适合插入和删除,在对性能没有很大要求是是可以忽略这个差别的。

       3:LinkedList使用双向链表实现存储,按序号索引数据需要进行向前或向后遍历,但是插入数据时只需要记录本项的前后项即可,所以插入数度较快

  • Vector: Vector与ArrayList其实是差不多的,只不过Vector是同步的。

       1:Vector是同步的

       2:采用数组方式存储数据

       3:Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差

 

2、Set:不包括重复元素的Collection,允许null值但是只有一个

  • HashSet:内部由哈希code来实现,堪称查询最快的集合,内部顺序由哈希码来实现的。
  • TreeSet:基于TreeMap,生成一个总是处于排序状态的set,内部以TreeMap来实现。它是使用元素的自然顺序对元素进行排序,或者根据创建Set 时提供的Comparator进行排序,具体取决于使用的构造方法。
  • LinkedHashSet:底层是链表实现的,是set集合中唯一一个能保证怎么存就怎么取的集合对象,因为是HashSet的子类,所以也是保证元素唯一的,与HashSet的原理一样。

 

3、Queue接口

  • 阻塞式队列(BlockingQueue):队列满了以后再插入元素则会抛出异常,主要包括ArrayBlockQueue、PriorityBlockingQueue、LinkedBlockingQueue。

 1:ArrayBlockingQueue :一个由数组支持的有界队列。

ArrayBlockingQueue特点的简单介绍

  • 一个由数组支持的有界队列,此队列按**FIFO(先进先出)**原则对元素进行排序。
  • 新元素插入到队列的尾部,队列获取操作则是从队列头部开始获得元素
  • 这是一个简单的“有界缓存区”,一旦创建,就不能在增加其容量
  • 在向已满队列中添加元素会导致操作阻塞,从空队列中提取元素也将导致阻塞
  • 此类支持对等待的生产者线程和使用者线程进行排序的可选公平策略。默认情况下,不保证是这种排序的。然而通过将公平性(fairness)设置为true,而构造的队列允许按照FIFO顺序访问线程。公平性通常会降低吞吐量,但也减少了可变性和避免了“不平衡性”

ArrayBlockingQueue常用的操作包括 add ,offer,put,remove,poll,take,peek。

前三者add offer put 是插入的操作。后面四个方法是取出的操作。他们之间的区别和关联:

  • add: 内部实际上获取的offer方法,当Queue已经满了时,抛出一个异常。不会阻塞。
  • offer:当Queue已经满了时,返回false。不会阻塞。
  • put:当Queue已经满了时,会进入等待,只要不被中断,就会插入数据到队列中。会阻塞,可以响应中断。

取出方法中 remove和add相互对应。也就是说,

  • 调用remove方法时,假如对列为空,则抛出异常。
  • poll与offer相互对应。take和put相互对应,假如对列为空,返回false。不会阻塞。
  • peek方法比较特殊,前三个取出的方法,都会将元素从Queue的头部溢出,但是peek不会,实际上只是获取队列头的元素。当队列为空时,peek方法也不会阻塞,直接返回Null。


 2:LinkedBlockingQueue :一个由链接节点支持的可选有界队列。

LinkedBlockingQueue特点进行简单的了解:

  • LinkedBlockingQueue是一个基于已链接节点的,范围任意的blocking queue
  • 此队列按FIFO(先进先出)排序元素
  • 新元素插入到队列的尾部,并且队列获取操作会获得位于队列头部的元素
  • 链接队列的吞吐量通常要高于基于数组的对列(ArrayBlockingQueue),但是在大多数并发应用程序中,其可预知的性能要低
  • 可选的容量范围构造方法参数作为防止队列过度扩展的一种方法,如果未指定容量,则等于Integer.MAX_VALUE,除非插入节点会使队列超出容量,否则每次插入后会动态地创建链接节点


  * PriorityBlockingQueue :一个由优先级堆支持的无界优先级队列。
  * DelayQueue :一个由优先级堆支持的、基于时间的调度队列。
  * SynchronousQueue :一个利用 BlockingQueue 接口的简单聚集(rendezvous)机制。

阻塞队列的操作可以根据它们的响应方式分为以下三类:aad、removee和element操作在你试图为一个已满的队列增加元素或从空队列取得元素时 抛出异常。当然,在多线程程序中,队列在任何时间都可能变成满的或空的,所以你可能想使用offer、poll、peek方法。这些方法在无法完成任务时 只是给出一个出错示而不会抛出异常。

注意:poll和peek方法出错进返回null。因此,向队列中插入null值是不合法的

最后,我们有阻塞操作put和take。put方法在队列满时阻塞,take方法在队列空时阻塞。直到队列能够操作。

上面这些queue的方法api跟前面说的ArrayBlockingQueue的api差不多,一样的理解.

  • 双端队列(Deque):支持在头、尾两端插入和移除元素,主要包括:ArrayDeque、LinkedBlockingDeque、LinkedList。

 

Map

由一系列键值对组成的集合,提供了key到Value的映射。

不能存在相同的key值,当然value值可以相同

  • HashMap:HashMap使用hash映射来存取数据,这个速度是相当快。HashMap是非同步的,并且允许null,即null value和null key。是线程不同步的
  • TreeMap:键以某种排序规则排序(自然顺序),内部以red-black(红-黑)树数据结构实现。
  • Hashtable:实现一个key-value映射的哈希表。任何非空(non-null)的对象都可作为key或者value。线程同步的

 

三、总结

    1.Vector和ArrayList

      1)vector是线程同步的,所以它也是线程安全的,而arraylist是线程异步的,是不安全的。如果不考虑到线程的安全因素,一般用arraylist效率比较高。

       2)如果集合中的元素的数目大于目前集合数组的长度时,vector增长率为目前数组长度的100%,而arraylist增长率为目前数组长度的50%.如过在集合中使用数据量比较大的数据,用vector有一定的优势。

       3)如果查找一个指定位置的数据,vector和arraylist使用的时间是相同的,都是0(1),这个时候使用vector和arraylist都可以。而如果移动一个指定位置的数据花费的时间为0(n-i)n为总长度,这个时候就应该考虑到使用linklist,因为它移动一个指定位置的数据所花费的时间为0(1),而查询一个指定位置的数据时花费的时间为0(i)。

      4)ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要设计到数组元素移动等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比ArrayList要差,LinkedList使用双向链表实现存储,按序号索引数据需要进行向前或向后遍历,但是插入数据时只需要记录本项的前后项即可,所以插入数度较快!

     2.Aarraylist和Linkedlist

       1)ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。

         2)对于随机访问get和set,ArrayList觉得优于LinkedList,因为LinkedList要移动指针。

         3)对于新增和删除操作add和remove,LinedList比较占优势,因为ArrayList要移动数据。

         4)这一点要看实际情况的。若只对单条数据插入或删除,ArrayList的速度反而优于LinkedList。但若是批量随机的插入删除数据,LinkedList的速度大大优于ArrayList. 因为ArrayList每插入一条数据,要移动插入点及之后的所有数据。

    3.HashMap与TreeMap

      1)HashMap通过hashcode对其内容进行快速查找,而TreeMap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用TreeMap(HashMap中元素的排列顺序是不固定的)。HashMap中元素的排列顺序是不固定的)。

       2)在Map 中插入、删除和定位元素,HashMap 是最好的选择。但如果您要按自然顺序或自定义顺序遍历键,那么TreeMap会更好。使用HashMap要求添加的键类明确定义了hashCode()和 equals()的实现。 这个TreeMap没有调优选项,因为该树总处于平衡状态。

    4.Hashtable与HashMap

      1)历史原因:Hashtable是基于陈旧的Dictionary类的,HashMap是Java 1.2引进的Map接口的一个实现 。

       2)同步性:Hashtable是线程安全的,也就是说是同步的,而HashMap是线程序不安全的,不是同步的 。

       3)值:只有HashMap可以让你将空值作为一个表的条目的key或value 。

你可能感兴趣的:(java基础)