一、集合简介
1.Java中的集合分为三类:
1.1 Set(集)
1.2 List(列表)
1.3 Map(映射)
2. 集合解释
List:相当于可以自动扩展的数组
set:没有重复的数组
TreeSet,TreeList,Tree**:自动排序的数组
3. 集合的实现
几乎所有的集合都是基于数组实现的。
因为集合是对数组做的封装,所以,数组永远比任何一个结合要快。
4. 集合的优点
任何一个集合,比数组提供的功能要多。
4.1 数组声明了它容纳的元素的类型,而集合不声明。这是因为集合是Object形式来存储他们的元素。
4.2 一个数组实例具有固定的大小,不能伸缩。集合则可根据需要动态改变大小。
4.3 数组是一种可读/可写数据结构-----没有办法创建一个只读数组。然而可以使用集合提供的ReadOnly方法,以只读方式来使用集合。该方法将返回一个集合只读版本。
5. Array的用法和优点
Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。
5.1 效率高,但容量固定无法动态改变。array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。
5.2 Java中有个Array类,专门用来操作array。arrays中拥有一组static函数。
5.2.1 equals():比较两个array是否相等。array拥有相同的元素个数,且对应元素两两相等。
5.2.2 fill():将值填入array中。
5.2.3 sort():用来对array进行排序。
5.2.4 binarySearch():在排好序的array中寻找元素。
5.2.5 System arraycopy:array的复制。
二、 Collection接口
Collection接口是最基本的集合接口,声明了适用于JAVA集合(只包括Set和List)的通用方法。Set和List都继承了Conllection,Map。
2.1 Collection接口的方法
2.1.1 boolean add(Object o):向集合中添加有一个对象的引用。
2.1.2 void clear():删除集合中所有对象,即不在持有这些对象的引用。
2.1.3 boolean isEmpty():判断集合是否为空。
2.1.4 boolean contains(Object o):判断集合中是否持有特定对象的引用。
2.1.5 Iterator iterator():返回一个iterator对象,可以遍历集合中的元素。
2.1.6 boolean remove(Object o):从集合中删除一个对象的引用。
2.1.7 int size():返回集合中元素的数目。
2.1.8 Object[] toArray():返回一个数组,该数组中包括集合中的所有元素。
2.2 Iterator接口声明了如下方法:
2.2.1 hasNext():判断集合中元素是否遍历完毕,如果没有,就返回true。
2.2.2 next():返回下一个元素。
2.2.3 remove():从集合中删除上一个有next()方法返回的元素。
2.3 Set(集合)
Set是最简单的一种集合,集合中的对象不按特定的方式排序,并且没有重复对象。Set接口主要实现了两个实现类:
2.3.1 HashSet:HashSet类按照哈希算法来存取集合中的对象,存取速度比较快。
2.3.2 TreeSet:TreeSet类实现了SortedSet接口,能够对集合中的对象进行排序。
Set 的用法:存放的是对象的引用,没有重复对象。
Set 的 add()方法是如何判断对象是否已经存放在集合中?
boolean isExists=false; Iterator iterator=set.iterator(); while(it.hasNext()) { String oldStr=it.next(); if(newStr.equals(oldStr)){ isExists=true; } }
Set : 存入Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。
HashSet:为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。
TreeSet: 保存次序的Set, 底层为树结构。使用它可以从Set中提取有序的序列。
LinkedHashSet:具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。
2.4 List(列表)
List的特征是其元素以线性方式存储,集合中可以存放重复对象。
List接口的实现类包括:
ArrayList:代表长度可以改变的数组。可以对元素进行随机的访问,向ArrayList()中插入与删除 元素的速度慢。
LinkedList():在实现中采用链表数据结构,插入和删除速度快,访问速度慢。
实际上有两种List:一种是基本的ArrayList,其优点在于随机访问元素,另一种是更强大的LinkedList,它并不是为快速随机访问设计的,而是具有一套更通用的方法。
ArrayList:由数组实现的List。允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历 ArrayList,而不是用来插入和移除元素。因为那比LinkedList开销要大很多。
LinkedList :对顺序访问进行了优化,向List中间插入与删除的开销并不大。随机访问则相对较慢。(使用ArrayList代替。)还具有下列方 法:addFirst(), addLast(), getFirst(), getLast(), removeFirst() 和 removeLast(), 这些方法 (没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。
2.5 Map(映射)
Map是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。Map没有继承与Collection接口。从Map集合中检索元素只要给出键对象,就会返回对应的值对象。
Map的常用方法:
2.5.1 Object put(Object key,Object value);向集合中加入元素。
2.5.2 Object remove(Object key):删除与KEY相关的元素。
2.5.3 void putall(Map t):将来自特定映像的所有元素添加给该映像。
2.5.4 void clear():从映像中删除所有映像。
2.5.5 Object get(Object key):获得与关键字key相关的值 。Map集合中的键对象不允许重复,也就说,任意两个键对象通过equals()方法比较的结果都是false.,但是可以将任意多个键独享映射到同一个值对象上
HashMap就是使用对象的hashCode()进行快速查询的。此方法能够显着提高性能。
Map : 维护“键值对”的关联性,使你可以通过“键”查找“值”
HashMap:Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。
LinkedHashMap: 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。
TreeMap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在 于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。
WeakHashMao :弱键(weak key)Map,Map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。
IdentifyHashMap: : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。
容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。
Collection
--List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
--ArrayList / LinkedList / Vector
--Set : 不能含有重复的元素
--HashSet / TreeSet
Map
--HashMap
--HashTable
--TreeMap
List,Set,Map将持有对象一律视为Object型别。
Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
总结
1. 如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
3. 在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们 的效率更高。
4. 要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。
6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。
注意:
1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
5、Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
HashMap会利用对象的hashCode来快速找到key。
6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。
为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。
引用自:
http://blog.csdn.net/speedme/article/details/22398395