转载请注明出处:http://blog.csdn.net/smartbetter/article/details/51452313
Java集合类也被称为“容器类”,位于java.util包下,Java5之后还在java.util.concurrent包下提供了一些多线程支持的集合类。Java集合主要由两个接口派生而出:Collection和Map,如下图是Java集合类的思维导图(淡绿色圆角矩形框表示接口,淡灰色圆角矩形框表示实现类,实际开发最常用的我已经用红色五角星标注了,建议重点掌握其底层实现原理)。
建议:要养成阅读Java API和Java源码的习惯,这个很重要!
下面是集合关系的示意图,Map集合和Set集合就像是“罐子”,访问List集合元素可直接根据元素索引访问;访问Map集合元素可根据元素key来访问value;访问Set集合元素只能根据元素本身访问,这也是Set集合不允许重复的原因之一。
Map(也被称为字典或关联数组)用于保存具有映射关系的数据(key-value),key不允许重复。从Java源码来看,Java先实现了Map,然后通过包装一个所有value都为null的Map就实现了Set集合。
特点:无序;非同步;集合元素值允许为null。
来看看hash(哈希、散列)算法的功能:能保证快速查找被检索的对象,hash算法的价值在于速度,当查询某个元素时,hash算法可以直接根据该元素的hashCode值计算出该元素的存储位置,从而快速定位。下面示例了Map的基本功能。
public class MapTest {
public static void main(String[] args) {
Map map = new HashMap();
// 成对放入多个key-value对,多次放入的key-value对中value可以重复
map.put("C", 100);
map.put("C++", 80);
map.put("Java", 90);
// 放入重复的key时,新的value会覆盖原有的value
map.put("Java", 70);
System.out.println(map); // 输出的Map集合包含3个key-value对
// 判断是否包含指定key
System.out.println("是否包含值为C++的key:" + map.containsKey("C++"));
// 判断是否包含指定value
System.out.println("是否包含值为90的value:" + map.containsValue(90));
// 获取Map集合的所有key组成的集合,通过遍历key来实现遍历所有key-value对
for (Object key : map.keySet() ) {
// map.get(key)方法获取指定key对应的value
System.out.println(key + ":" + map.get(key));
}
map.remove("C++"); // 根据key来删除key-value对。
System.out.println(map); // 输出结果不再包含C++=80 的key-value对
}
/** * 运行结果: * {C=100, C++=80, Java=70} * 是否包含值为C++的key:true * 是否包含值为90的value:false * C:100 * C++:80 * Java:70 * {C=100, Java=70} */
}
Java8也为Map新增了很多方法,例如replace()方法替换value值等,新特性建议多阅读API。
特点:有序;非同步;集合元素值允许为null。
红黑树数据结构,每个key-value对即作为红黑树的一个节点。TreeMap支持两种排序方式:自然排序和定制排序,TreeMap的使用方法这里不再详细给出,建议查看API文档学习。
速度对比:HashMap(最快) > Hashtable > TreeMap
对于一般场景,程序应多考虑使用HashMap,因为HashMap正是为快速查询设计的。
public class CollectionTest {
public static void main(String[] args) {
Collection list = new ArrayList();
// 1.添加元素
list.add("Java");
list.add(6); // 虽然集合里不能放基本类型的值,但Java支持自动装箱
System.out.println("list集合的元素个数为:" + list.size());
// 2.删除指定元素
list.remove(6);
System.out.println("list集合的元素个数为:" + list.size());
// 3.判断是否包含指定字符串
System.out.println("list集合的是否包含\"Java\"字符串:" + list.contains("Java"));
list.add("Java EE");
System.out.println("list集合的元素:" + list);
Collection set = new HashSet();
set.add("Java EE");
set.add("Android");
System.out.println("list集合是否完全包含set集合?" + list.containsAll(set));
// 4.用list集合减去set集合里的元素
list.removeAll(set);
System.out.println("list集合的元素:" + list);
// 5.删除list集合里所有元素
list.clear();
System.out.println("list集合的元素:" + list);
// 6.控制set集合里只剩下list集合里也包含的元素
set.retainAll(list);
System.out.println("set集合的元素:" + set);
/** * 运行结果: * list集合的元素个数为:2 * list集合的元素个数为:1 * list集合的是否包含"Java"字符串:true * list集合的元素:[Java, Java EE] * list集合是否完全包含set集合?false * list集合的元素:[Java] * list集合的元素:[] * set集合的元素:[] */
}
}
Java8为Iterable接口新增了一个forEach(Consumer action)默认方法,所需参数为一个函数式接口,Iterable接口是Collection接口的父接口,所以Collection集合可以直接调用forEach方法。
public class CollectionEach {
public static void main(String[] args) {
// 创建一个集合
Collection set = new HashSet();
set.add("Java");
set.add("Java EE");
set.add("Android");
// 调用forEach()方法遍历集合
set.forEach(obj -> System.out.println("迭代集合元素:" + obj));
}
}
Iterator接口也被称为迭代器,向程序提供了遍历Collection集合元素的统一编程接口。对于遍历List集合元素,ArrayList最好使用随机访问方法(get)来遍历,这样性能最好;LinkedList则最好用迭代器(Iterator)来遍历集合元素。
public class IteratorTest {
public static void main(String[] args) {
// 创建集合、添加元素
Collection set = new HashSet();
set.add("Java");
set.add("Java EE");
set.add("Android");
// 获取set集合对应的迭代器
Iterator it = set.iterator();
while(it.hasNext()) {
// it.next()方法返回的数据类型是Object类型,因此需要强制类型转换
String s = (String)it.next();
System.out.println(s);
if (s.equals("Java EE")) {
// 从集合中删除上一次next方法返回的元素
it.remove();
}
// 对s变量赋值,不会改变集合元素本身
s = "哈哈哈";
}
System.out.println(set);
}
/** * 运行结果: * Android * Java EE * Java * [Android, Java] */
}
public class IteratorEach {
public static void main(String[] args) {
// 创建集合、添加元素
Collection set = new HashSet();
set.add("Java");
set.add("Java EE");
set.add("Android");
// 获取set集合对应的迭代器
Iterator it = set.iterator();
// 使用Lambda表达式(目标类型是Comsumer)来遍历集合元素
it.forEachRemaining(obj -> System.out.println("迭代集合元素:" + obj));
}
}
当使用foreach循环迭代访问Collection集合里的元素时,该集合不能被改变。
public class ForeachTest {
public static void main(String[] args) {
// 创建集合、添加元素
Collection set = new HashSet();
set.add(new String("Java"));
set.add(new String("Java EE"));
set.add(new String("Android"));
for (Object obj : set) {
// 此处的s变量也不是集合元素本身
String s = (String)obj;
System.out.println(s);
// if (s.equals("Android")) {
// // 当使用foreach循环迭代访问Collection集合里的元素时,该集合不能被改变
// 下面代码会引发ConcurrentModificationException异常
// set.remove(s);
// }
}
System.out.println(set);
}
/** * 运行结果: * Android * Java EE * Java * [Android, Java EE, Java] */
}
HashSet和TreeSet是Set的两个典型实现。
特点:无序;非同步;集合元素值允许为null。
HashSet判断两个元素相等的标准:两个对象通过equals()方法比较相等;两个对象的hashCode()返回值也相等。
HashSet的基本操作同Collection
特点:有序;非同步;集合元素值允许为null。
可以确保集合元素处于排序状态,TreeSet采用红黑树的数据结构来存储集合元素,支持两种排序方法:自然排序和定制排序,默认自然排序。如下示例了TreeSet的用法:
public class TreeSetTest {
public static void main(String[] args) {
TreeSet treeSet = new TreeSet();
// 向TreeSet中添加四个Integer对象
treeSet.add(10);
treeSet.add(30);
treeSet.add(20);
treeSet.add(-15);
// 输出集合元素,看到集合元素已经处于排序状态
System.out.println(treeSet);
// 输出集合里的第一个元素
System.out.println(treeSet.first());
// 输出集合里的最后一个元素
System.out.println(treeSet.last());
// 返回小于25的子集,不包含25
System.out.println(treeSet.headSet(25));
// 返回大于10的子集,如果Set中包含10,子集中还包含10
System.out.println(treeSet.tailSet(10));
// 返回大于等于-10,小于20的子集
System.out.println(treeSet.subSet(-10 , 20));
}
/** * 运行结果: * [-15, 10, 20, 30] * -15 * 30 * [-15, 10, 20] * [10, 20, 30] * [10] */
}
HashSet和TreeSet:
HashSet性能总是比TreeSet好,特别是添加、查询等操作,因为TreeSet需要额外的红黑树算法来维护集合元素次序。只有当需要一个保持排序的Set时才用TreeSet。
有序可重复,ArrayList是线程不安全的,当多个线程访问同一个ArrayList集合时,如果有超过一个线程修改了ArrayList集合,则必须手动保证该集合的同步性。ArrayList的基本操作同Collection。
有序可重复,既可以被当作“栈”使用,也可以当成队列使用。如下示例了LinkedList的用法:
public class LinkedListTest {
public static void main(String[] args) {
LinkedList linkedList = new LinkedList();
// 将字符串元素加入队列的尾部
linkedList.offer("Java");
// 将一个字符串元素加入栈的顶部
linkedList.push("Java EE");
// 将字符串元素添加到队列的头部(相当于栈的顶部)
linkedList.offerFirst("Android");
// 以List的方式(按索引访问的方式)来遍历集合元素
for (int i = 0; i < linkedList.size(); i++ ) {
System.out.println("遍历中:" + linkedList.get(i));
}
// 访问、并不删除栈顶的元素
System.out.println(linkedList.peekFirst());
// 访问、并不删除队列的最后一个元素
System.out.println(linkedList.peekLast());
// 将栈顶的元素弹出"栈"
System.out.println(linkedList.pop());
// 下面输出将看到队列中第一个元素被删除
System.out.println(linkedList);
// 访问、并删除队列的最后一个元素
System.out.println(linkedList.pollLast());
// 下面输出:[Java EE]
System.out.println(linkedList);
}
/** * 运行结果: * 遍历中:Android * 遍历中:Java EE * 遍历中:Java * Android * Java * Android * [Java EE, Java] * Java * [Java EE] */
}
Deque接口实现了Queue接口,代表双端队列,Deque接口里定义了一些双端队列的方法,这些方法允许从两端来操作队列的元素。Deque接口提供了一个典型的实现类ArrayDeque,ArrayDeque是基于数组实现的双端队列,ArrayDeque不仅可以当成“栈”使用,而且还可以当成“队列”使用。
把ArrayDeque当成“栈”使用:
public class ArrayDequeStack{
public static void main(String[] args){
ArrayDeque stack = new ArrayDeque();
// 依次将三个元素push入"栈"
stack.push("Java");
stack.push("Java EE");
stack.push("Android");
System.out.println(stack);
// 访问第一个元素,但并不将其pop出"栈"
System.out.println(stack.peek());
System.out.println(stack);
// pop出第一个元素
System.out.println(stack.pop());
System.out.println(stack);
}
/** * 运行结果: * [Android, Java EE, Java] * Android * [Android, Java EE, Java] * Android * [Java EE, Java] */
}
把ArrayDeque当成“队列”使用:
public class ArrayDequeQueue {
public static void main(String[] args) {
ArrayDeque queue = new ArrayDeque();
// 依次将三个元素加入队列
queue.offer("Java");
queue.offer("Java EE");
queue.offer("Android");
System.out.println(queue);
// 访问队列头部的元素,但并不将其poll出队列"栈"
System.out.println(queue.peek());
System.out.println(queue);
// poll出第一个元素
System.out.println(queue.poll());
System.out.println(queue);
}
/** * 运行结果: * [Java, Java EE, Android] * Java * [Java, Java EE, Android] * Java * [Java EE, Android] */
}
ArrayList和LinkedList:
由于数组以一块连续内存区保存所有数组元素,所以内部以数组作为底层实现的集合在随机访问时性能最好;而内部以链表作为底层实现的集合在执行插入、删除操作时有较好的性能。总体ArrayList性能优于LinkedList,大部分考虑使用ArrayList。
注意:
1.对于遍历List集合元素,ArrayList最好使用随机访问方法(get)来遍历,这样性能最好;LinkedList则最好用迭代器(Iterator)来遍历集合元素。
2.如果要经常插入删除大量数据的List,建议使用LinkedList。
Collections提供了大量方法对集合元素进行排序、查询、修改等操作。
List list = new ArrayList();
... // 添加集合元素
排序,Collections提供了用于对List集合元素进行排序的方法:
Collections.reverse(list); // 将List集合元素的次序反转
Collections.sort(list); // 将List集合元素的按自然顺序排序
Collections.shuffle(list); // 将List集合元素的按随机顺序排序
查找、替换:
Collections.max(list); // 获取List集合最大元素
Collections.min(list); // 获取List集合最小元素
Collections.replaceAll(list , 0 , 1); // 将List中的0使用1来代替(假设0、1为集合元素值)
Collections.frequency(list , 1); // 判断1在List集合中出现的次数(假设1为集合元素值)
Collections.binarySearch(list , 1); // 使用二分法搜索指定的List集合,以获得List集合中的索引,只有排序后的List集合才可用二分法查询
同步控制,下面程序创建了四个线程安全的集合对象:
Collection c = Collections.synchronizedCollection(new ArrayList());
List l = Collections.synchronizedList(new ArrayList());
Set s = Collections.synchronizedSet(new HashSet());
Map m = Collections.synchronizedMap(new HashMap());
设置不可变集合:
List unList = Collections.emptyList(); // 创建一个空的、不可改变的List对象
Set unSet = Collections.singleton("Java"); // 创建一个只有一个元素,且不可改变的Set对象
Map map = new HashMap(); // 创建一个普通Map对象
map.put("HTML5" , 90);
map.put("CSS3" , 80);
Map unMap = Collections.unmodifiableMap(map); // 返回普通Map对象对应的不可变版本
// 下面任意一行代码都将引发UnsupportedOperationException异常
unList.add("C");
unSet.add("C");
unMap.put("C" , 100);
使用工具类Collections,上面已经提到过了:
/** * 同步控制 * 下面程序创建了四个线程安全的集合对象 */
Collection c = Collections.synchronizedCollection(new ArrayList());
List l = Collections.synchronizedList(new ArrayList());
Set s = Collections.synchronizedSet(new HashSet());
Map m = Collections.synchronizedMap(new HashMap());
java.util.concurrent包提供了映射表、有序集和队列的高效实现:ConcurrentHashMap、ConcurrentSkipListMap、ConcurrentSkipListSet、ConcurrentLinkedDeque。
这些集合使用复杂的算法,通过允许并发地访问数据结构的不同部分来使竞争极小化。