编程思想--第17章--容器深入研究

容器深入研究

一、完整的容器分类法

以下是集合类库更完备的图,包括抽象类和遗留构件(不包括Queue的实现):

虚线表示abstract类。

二、填充容器

fill()方法和addAll()方法。

一种Generator:事实上所有的Collection子类型都有一个接收另一个Collection对象的构造器,用所接收的Collection对象中的元素来填充新的容器。

Map生成器:Map适配器可以使用各种不同的Generator,Iterator和常量值的组合来填充Map初始化对象。

使用Abstract类:一种解决方式是创建定制的Collection和Map实现。

三、Collection的功能方法

Map不是继承Collection。

四、可选操作

执行各种不同的添加和移除的方法在Collection接口中都是可选操作。这意味着实现类并不需要为这些方法提供功能定义。

容器应易学易用。未获支持的操作是一种特例,可以延迟到需要时再实现。为了使这种方式能够工作:

1,UnsupportedOperationException必须是一种罕见事件。

2,如果一个操作是未获支持的,那么在实现接口的时候可能就会导致UnsupportedOperationException异常。

值得注意的是,未获支持的操作只有在运行时才能探测到,因此它们表示动态类型检查。

未获支持的操作,都来源于背后由固定尺寸的数据结构支持的容器。

五、List的功能方法

基本的List很容易使用,大多数时候只是调用add()添加对象,使用get()一次取出一个元素,以及调用iterator()获取用于该序列的Iterator。

六、Set和存储顺序

Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set和Collection有完全一样的接口。Set接口不保证维护元素的次序。

HashSet 为了快速查找设计的Set,存入HashSet的元素必须定义HashCode().

TreeSet 保持次序的Set,底层为树结构。使用它可以从Set中提取有序的序列。元素必须实现Comparable接口。

LinkedHashSet 具有HashSet的查询速度,且内部使用链表维护元素的顺序。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。元素也必须定义hashCode()方法。

SortedSet中的元素可以保证处于排序状态,这使得它可以通过在SortedSet接口中的下列方法提供附加功能。

七,队列

除了并发应用,Queue在Java SE5中仅有的两个实现是LinkedList和PriorityQueue,他们的差异在于排序行为而不是性能。

优先级队列PriorityQueue,排序顺序是通过实现Comparable进行控制的。双向队列就像是一个队列,但是你可以在任何一端添加或移除元素。LinkedList包含支持双向队列的方法,但是JAVA标准类库中没有任何显式的用于双向队列的接口。

八、理解Map

Map的集中基本实现包HashMap,TreeMap,LinkedHashMap,WeakHashMap,ConcurrentHashMap,IdentityHashMap,它们都有相同的基本接口Map,但是行为特征各不相同,这表现在效率,键值对的保存及呈现次序,对象的保存周期,映射表如何在多线程程序中工作和判定键等价的策略等方面。

性能是映射表中一个重要问题,HashMap使用了特殊的值,称作散列码,来取代对键的缓慢搜索。hashCode()是根类Object中的方法,因此所有的Java对象都能产生散列码。

SortedMap(TreeMap是其现阶段唯一实现),可以确保键处于排序状态。为了提高速度,LinkedHashMap散列化所有的元素,遍历键值对时,以元素的插入顺序返回键值对。

九、散列与散列码

默认的Object.equals()只是比较对象的地址。散列结构要覆盖hashCode()和equals()方法可以正确处理散列数据结构的键,能够完全确定对象的身份。

线性查询是最慢的查询方式,散列的价值在于速度,散列使得查询得以快速进行。

数组并不保存键本身,而是通过键对象生成一个数字,将其作为数组的下标,这个数字就是散列码。查询一个值的过程首先就按计算散列码,然后使用散列码查询数组。

十、选择接口的不同实现

尽管容器只有四种:Map,List,Set和Queue,但是每种接口都有不止一个实现版本。

对于LinkedList中的插入和移除代价相当低廉,比呢且不随列表尺寸发生变化,但是对于ArrayList,插入和删除的操作代价特别高昂,并且其代价将随表尺寸的增加而增加。

避免使用Vector,它只存在于支持遗留代码的类库中。CopyOnWriteArrayList是List的一个特殊实现,专门用于并发编程。

HashSet的性能总体上比TreeSet好特别是添加和查询元素时。TreeSet存在的唯一原因是它可以维持元素的排序状态。对于插入操作,LinkedHashSet比HashSet的代价更高,这是由维护链表所带来额外开销造成的。

除了IdentityHashMap,所有的Map实现插入操作都会随着Map尺寸变大而明显变慢,但是查找的代价通常比插入要小的多。

HashMap性能大体上与HashMap相当。因为HashMap是用来替代HashTable的,它们是用了相同的底层存储和查找机制。

TreeMap通常比HashMap要慢,TreeMap是一种创建有序列表的方式。树的行为是:总是保证有序,并且不必进行特殊的排序。

LinkedHashMap在插入时比HashMap慢一点,因为它维护散列数据结构的同时还要维护链表。正是由于列表,使得迭代速度更快。

十一、实用方法

Java中有大量用于容器卓越的使用方法,它们被表示为java.util.Collection类内部的静态方法。

Collection类有办法能够自动同步整个容器。

快速报错:Java容器有一种保护机制,能够防止多个进程同时修改同一个容器的内容。如一个进程迭代容器数据,一个进程删除增加数据,就会初夏你问题。

十二、持有引用

java.lang.ref类库包括了一组类,这些类为垃圾回收提供了更大的灵活用。当存在可能会耗尽内存的大对象的时候,这些类显得特别有用,有三个继承自抽象类Reference的类:SoftReference,WeakReference和PhantomReference。当垃圾回收器正在考察的对象只能通过某个Reference对象才可获得时,上述这些不同的派生类为垃圾回收器提供了不同级别的间接性指示。

十三、Java1.0/1.1的容器

写新的程序时,决不应该使用旧的容器。

Vector和Enumeration。

HashTable,Stack,BitSet

十四、总结

容器类库对于面向对象语言来说是重要的类库,大多数编程工作对容器的使用比对其他类库中的构架都要多。

你可能感兴趣的:(编程思想--第17章--容器深入研究)