Java集合框架 探险

Java集合类也被称为“容器类”,位于java.util包下,Java5之后还在java.util.concurrent包下提供了一些多线程支持的集合类。

Java集合主要由两个接口派生而出:Collection和Map,如下图是Java集合类的思维导图(淡绿色圆角矩形框表示接口,淡灰色圆角矩形框表示实现类,实际开发最常用的我已经用红色五角星标注了,建议重点掌握其底层实现原理)。

建议:要养成阅读Java API和Java源码的习惯,这个很重要!

Java集合框架 探险_第1张图片

下面是集合关系的示意图,Map集合和Set集合就像是“罐子”,访问List集合元素可直接根据元素索引访问;访问Map集合元素可根据元素key来访问value;访问Set集合元素只能根据元素本身访问,这也是Set集合不允许重复的原因之一。

Java集合框架 探险_第2张图片


1.Map集合


Map(也被称为字典或关联数组)用于保存具有映射关系的数据(key-value),key不允许重复。从Java源码来看,Java先实现了Map,然后通过包装一个所有value都为null的Map就实现了Set集合。

1.HashMap

特点:无序;非同步;集合元素值允许为null。

来看看hash(哈希、散列)算法的功能:能保证快速查找被检索的对象,hash算法的价值在于速度,当查询某个元素时,hash算法可以直接根据该元素的hashCode值计算出该元素的存储位置,从而快速定位。下面示例了Map的基本功能。

public class MapTest {
	public static void main(String[] args) {
		Map map = new HashMap();
		// 成对放入多个key-value对,多次放入的key-value对中value可以重复
		map.put("C", 100);
		map.put("C++", 80);
		map.put("Java", 90);
		// 放入重复的key时,新的value会覆盖原有的value
		map.put("Java", 70);
		System.out.println(map); // 输出的Map集合包含3个key-value对
		
		// 判断是否包含指定key
		System.out.println("是否包含值为C++的key:" + map.containsKey("C++")); 
		// 判断是否包含指定value
		System.out.println("是否包含值为90的value:" + map.containsValue(90));
		
		// 获取Map集合的所有key组成的集合,通过遍历key来实现遍历所有key-value对
		for (Object key : map.keySet() ) {
			// map.get(key)方法获取指定key对应的value
			System.out.println(key + ":" + map.get(key));
		}
		
		map.remove("C++"); // 根据key来删除key-value对。
		System.out.println(map); // 输出结果不再包含C++=80 的key-value对
	}
	/**
	 * 运行结果:
	 * {C=100, C++=80, Java=70}
	 * 是否包含值为C++的key:true
	 * 是否包含值为90的value:false
	 * C:100
	 * C++:80
	 * Java:70
	 * {C=100, Java=70}
	 */
}
Java8也为Map新增了很多方法,例如replace()方法替换value值等,新特性建议多阅读API。


2.TreeMap

特点:有序;非同步;集合元素值允许为null。

红黑树数据结构,每个key-value对即作为红黑树的一个节点。TreeMap支持两种排序方式:自然排序和定制排序,TreeMap的使用方法这里不再详细给出,建议查看API文档学习。



2.各Map实现类的性能分析


速度对比:HashMap(最快) > Hashtable > TreeMap

对于一般场景,程序应多考虑使用HashMap,因为HashMap正是为快速查询设计的。



3.Collection和Iterator


1.操作Collection集合里的元素

public class CollectionTest {
	public static void main(String[] args) {
		Collection list = new ArrayList();
		// 1.添加元素
		list.add("Java"); 
		list.add(6); // 虽然集合里不能放基本类型的值,但Java支持自动装箱
		System.out.println("list集合的元素个数为:" + list.size());
		// 2.删除指定元素
		list.remove(6);
		System.out.println("list集合的元素个数为:" + list.size());
		// 3.判断是否包含指定字符串
		System.out.println("list集合的是否包含\"Java\"字符串:" + list.contains("Java"));
		list.add("Java EE");
		System.out.println("list集合的元素:" + list);

		Collection set = new HashSet();
		set.add("Java EE");
		set.add("Android");
		System.out.println("list集合是否完全包含set集合?" + list.containsAll(set));
		// 4.用list集合减去set集合里的元素
		list.removeAll(set); 
		System.out.println("list集合的元素:" + list);
		// 5.删除list集合里所有元素
		list.clear(); 
		System.out.println("list集合的元素:" + list);
		// 6.控制set集合里只剩下list集合里也包含的元素
		set.retainAll(list); 
		System.out.println("set集合的元素:" + set);
		/**
		 * 运行结果:
		 * list集合的元素个数为:2
		 * list集合的元素个数为:1
		 * list集合的是否包含"Java"字符串:true
		 * list集合的元素:[Java, Java EE]
		 * list集合是否完全包含set集合?false
		 * list集合的元素:[Java]
		 * list集合的元素:[]
		 * set集合的元素:[]
		 */
	}
}


2.使用Lambda表达式遍历集合(Java8新特性)

Java8为Iterable接口新增了一个forEach(Consumer action)默认方法,所需参数为一个函数式接口,Iterable接口是Collection接口的父接口,所以Collection集合可以直接调用forEach方法

public class CollectionEach {
	public static void main(String[] args) {
		// 创建一个集合
		Collection set = new HashSet();
		set.add("Java");
		set.add("Java EE");
		set.add("Android");
		// 调用forEach()方法遍历集合
		set.forEach(obj -> System.out.println("迭代集合元素:" + obj));
	}
}

3.使用Iterator遍历集合元素

Iterator接口也被称为迭代器,向程序提供了遍历Collection集合元素的统一编程接口。对于遍历List集合元素,ArrayList最好使用随机访问方法(get)来遍历,这样性能最好;LinkedList则最好用迭代器(Iterator)来遍历集合元素。

public class IteratorTest {
	public static void main(String[] args) {
		// 创建集合、添加元素
		Collection set = new HashSet();
		set.add("Java");
		set.add("Java EE");
		set.add("Android");
		// 获取set集合对应的迭代器
		Iterator it = set.iterator();
		while(it.hasNext()) {
			// it.next()方法返回的数据类型是Object类型,因此需要强制类型转换
			String s = (String)it.next();
			System.out.println(s);
			if (s.equals("Java EE")) {
				// 从集合中删除上一次next方法返回的元素
				it.remove();
			}
			// 对s变量赋值,不会改变集合元素本身
			s = "哈哈哈";
		}
		System.out.println(set);
	}
	/**
	 * 运行结果:
	 * Android
	 * Java EE
	 * Java
	 * [Android, Java]
	 */
}

4.使用Lambda表达式遍历Iterator(Java8新特性)

public class IteratorEach {
	public static void main(String[] args) {
		// 创建集合、添加元素
		Collection set = new HashSet();
		set.add("Java");
		set.add("Java EE");
		set.add("Android");
		// 获取set集合对应的迭代器
		Iterator it = set.iterator();
		// 使用Lambda表达式(目标类型是Comsumer)来遍历集合元素
		it.forEachRemaining(obj -> System.out.println("迭代集合元素:" + obj));
	}
}

5.使用foreach遍历集合元素

当使用foreach循环迭代访问Collection集合里的元素时,该集合不能被改变。

public class ForeachTest {
	public static void main(String[] args) {
		// 创建集合、添加元素
		Collection set = new HashSet();
		set.add(new String("Java"));
		set.add(new String("Java EE"));
		set.add(new String("Android"));
		for (Object obj : set) {
			// 此处的s变量也不是集合元素本身
			String s = (String)obj;
			System.out.println(s);
//			if (s.equals("Android")) {
//				// 当使用foreach循环迭代访问Collection集合里的元素时,该集合不能被改变
				// 下面代码会引发ConcurrentModificationException异常
//				set.remove(s); 
//			}
		}
		System.out.println(set);
	}
	/**
	 * 运行结果:
	 * Android
	 * Java EE
	 * Java
	 * [Android, Java EE, Java]
	 */
}


4.Set集合


HashSet和TreeSet是Set的两个典型实现。

1.HashSet(开发首选)

特点:无序;非同步;集合元素值允许为null。

HashSet判断两个元素相等的标准:两个对象通过equals()方法比较相等;两个对象的hashCode()返回值也相等。

HashSet的基本操作同Collection


2.TreeSet

特点:有序;非同步;集合元素值允许为null。

可以确保集合元素处于排序状态,TreeSet采用红黑树的数据结构来存储集合元素,支持两种排序方法:自然排序和定制排序,默认自然排序。如下示例了TreeSet用法:

public class TreeSetTest {
	public static void main(String[] args) {
		TreeSet treeSet = new TreeSet();
		// 向TreeSet中添加四个Integer对象
		treeSet.add(10);
		treeSet.add(30);
		treeSet.add(20);
		treeSet.add(-15);
		// 输出集合元素,看到集合元素已经处于排序状态
		System.out.println(treeSet);
		// 输出集合里的第一个元素
		System.out.println(treeSet.first());
		// 输出集合里的最后一个元素
		System.out.println(treeSet.last());
		// 返回小于25的子集,不包含25
		System.out.println(treeSet.headSet(25));
		// 返回大于10的子集,如果Set中包含10,子集中还包含10
		System.out.println(treeSet.tailSet(10));
		// 返回大于等于-10,小于20的子集
		System.out.println(treeSet.subSet(-10 , 20));
	}
	/**
	 * 运行结果:
	 * [-15, 10, 20, 30]
	 * -15
	 * 30
	 * [-15, 10, 20]
	 * [10, 20, 30]
	 * [10]
	 */
}


5.各Set实现类性能分析


HashSet和TreeSet:

HashSet性能总是比TreeSet好,特别是添加、查询等操作,因为TreeSet需要额外的红黑树算法来维护集合元素次序。只有当需要一个保持排序的Set时才用TreeSet。



6.List集合


1.ArrayList

有序可重复,ArrayList是线程不安全的,当多个线程访问同一个ArrayList集合时,如果有超过一个线程修改了ArrayList集合,则必须手动保证该集合的同步性。

ArrayList的基本操作同Collection


2.LinkedList

有序可重复,既可以被当作“栈”使用,也可以当成队列使用。如下示例了LinkedList的用法:

public class LinkedListTest {
	public static void main(String[] args) {
		LinkedList linkedList = new LinkedList();
		// 将字符串元素加入队列的尾部
		linkedList.offer("Java");
		// 将一个字符串元素加入栈的顶部
		linkedList.push("Java EE");
		// 将字符串元素添加到队列的头部(相当于栈的顶部)
		linkedList.offerFirst("Android");
		// 以List的方式(按索引访问的方式)来遍历集合元素
		for (int i = 0; i < linkedList.size(); i++ ) {
			System.out.println("遍历中:" + linkedList.get(i));
		}
		// 访问、并不删除栈顶的元素
		System.out.println(linkedList.peekFirst());
		// 访问、并不删除队列的最后一个元素
		System.out.println(linkedList.peekLast());
		// 将栈顶的元素弹出"栈"
		System.out.println(linkedList.pop());
		// 下面输出将看到队列中第一个元素被删除
		System.out.println(linkedList);
		// 访问、并删除队列的最后一个元素
		System.out.println(linkedList.pollLast());
		// 下面输出:[Java EE]
		System.out.println(linkedList);
	}
	/**
	 * 运行结果:
	 * 遍历中:Android
	 * 遍历中:Java EE
	 * 遍历中:Java
	 * Android
	 * Java
	 * Android
	 * [Java EE, Java]
	 * Java
	 * [Java EE]
	 */
}



7.Queue集合


1.ArrayDeque

Deque接口实现了Queue接口,代表双端队列,Deque接口里定义了一些双端队列的方法,这些方法允许从两端来操作队列的元素。Deque接口提供了一个典型的实现类ArrayDeque,ArrayDeque是基于数组实现的双端队列,ArrayDeque不仅可以当成“栈”使用,而且还可以当成“队列”使用

把ArrayDeque当成“栈”使用:

public class ArrayDequeStack{
	public static void main(String[] args){
		ArrayDeque stack = new ArrayDeque();
		// 依次将三个元素push入"栈"
		stack.push("Java");
		stack.push("Java EE");
		stack.push("Android");
		System.out.println(stack);
		// 访问第一个元素,但并不将其pop出"栈"
		System.out.println(stack.peek());
		System.out.println(stack);
		// pop出第一个元素
		System.out.println(stack.pop());
		System.out.println(stack);
	}
	/**
	 * 运行结果:
	 * [Android, Java EE, Java]
	 * Android
	 * [Android, Java EE, Java]
	 * Android
	 * [Java EE, Java]
	 */
}

把ArrayDeque当成“队列”使用:

public class ArrayDequeQueue {
	public static void main(String[] args) {
		ArrayDeque queue = new ArrayDeque();
		// 依次将三个元素加入队列
		queue.offer("Java");
		queue.offer("Java EE");
		queue.offer("Android");
		System.out.println(queue);
		// 访问队列头部的元素,但并不将其poll出队列"栈"
		System.out.println(queue.peek());
		System.out.println(queue);
		// poll出第一个元素
		System.out.println(queue.poll());
		System.out.println(queue);
	}
	/**
	 * 运行结果:
	 * [Java, Java EE, Android]
	 * Java
	 * [Java, Java EE, Android]
	 * Java
	 * [Java EE, Android]
	 */
}


8.各种线性表性能分析(包括List、Queue)


ArrayList和LinkedList:

由于数组以一块连续内存区保存所有数组元素,所以内部以数组作为底层实现的集合在随机访问时性能最好;而内部以链表作为底层实现的集合在执行插入、删除操作时有较好的性能。总体ArrayList性能优于LinkedList,大部分考虑使用ArrayList。

注意:

1)对于遍历List集合元素,ArrayList最好使用随机访问方法(get)来遍历,这样性能最好;LinkedList则最好用迭代器(Iterator)来遍历集合元素。

2)如果要经常插入删除大量数据的List,建议使用LinkedList。



9.操作集合的工具类Collections


Collections提供了大量方法对集合元素进行排序、查询、修改等操作。

		
List list = new ArrayList();
... // 添加集合元素

/**
 * 1.排序
 * Collections提供了用于对List集合元素进行排序的方法
 */
Collections.reverse(list); // 将List集合元素的次序反转
Collections.sort(list); // 将List集合元素的按自然顺序排序
Collections.shuffle(list); // 将List集合元素的按随机顺序排序

/**
 * 2.查找、替换
 */
Collections.max(list); // 获取List集合最大元素
Collections.min(list); // 获取List集合最小元素
Collections.replaceAll(list , 0 , 1); // 将List中的0使用1来代替(假设0、1为集合元素值)
Collections.frequency(list , 1); // 判断1在List集合中出现的次数(假设1为集合元素值)
Collections.binarySearch(list , 1); // 使用二分法搜索指定的List集合,以获得List集合中的索引,只有排序后的List集合才可用二分法查询

/**
 * 3.同步控制
 * 下面程序创建了四个线程安全的集合对象
 */
Collection c = Collections.synchronizedCollection(new ArrayList());
List l = Collections.synchronizedList(new ArrayList());
Set s = Collections.synchronizedSet(new HashSet());
Map m = Collections.synchronizedMap(new HashMap());

/**
 * 4.设置不可变集合
 */
List unList = Collections.emptyList(); // 创建一个空的、不可改变的List对象
Set unSet = Collections.singleton("Java"); // 创建一个只有一个元素,且不可改变的Set对象
Map map = new HashMap(); // 创建一个普通Map对象
map.put("HTML5" , 90);
map.put("CSS3" , 80);
Map unMap = Collections.unmodifiableMap(map); // 返回普通Map对象对应的不可变版本
// 下面任意一行代码都将引发UnsupportedOperationException异常
unList.add("C"); 
unSet.add("C"); 
unMap.put("C" , 100); 

10.线程安全的集合


1.较早的线程安全集合,使用工具类Collections,上面已经提到过了

/**
 * 同步控制
 * 下面程序创建了四个线程安全的集合对象
 */
Collection c = Collections.synchronizedCollection(new ArrayList());
List l = Collections.synchronizedList(new ArrayList());
Set s = Collections.synchronizedSet(new HashSet());
Map m = Collections.synchronizedMap(new HashMap());

2.高效的映射表、集合和队列

java.util.concurrent包提供了映射表、有序集和队列的高效实现:ConcurrentHashMap、ConcurrentSkipListMap、ConcurrentSkipListSet、ConcurrentLinkedDeque。

这些集合使用复杂的算法,通过允许并发地访问数据结构的不同部分来使竞争极小化。



你可能感兴趣的:(list,map,set,Queue,java集合)