中级03 - Collection体系简介

没有 Collection,Java 只能算是玩具。

List
Set
hashCode约定
Map

一、Collection 体系

参考1

参考2

Collection 的体系

  • Collection的体系结构
  • List/Set约定

Collection 体系提供的常⽤⽅法:

  • new: new ArrayList(Collection), new ArrayList()
  • Read: size()/isEmpty()/contains()/for()/stream()
  • Cread/Update: add()/addAll()/retainAll()
  • Delete: clear()/remove()/removeAll()

retainAll()求交集
removeAll()求差集

1. List

有序可重复,最常用的是 ArrayList,本质上就是一个数组

Collection c = new LinkedHashSet<>();
        
// IntegerList
List list = new ArrayList<>(c);
        
// 等价于
List list2 = new ArrayList<>();
list2.addAll(c);
        
// 等价于
List list3 = new ArrayList<>();
for (Integer i : c) {
    list3.add(i);
}

add() 方法内部实现了数组的动态扩容:创建一个更大的空间,然后把原先的所有元素拷贝进去。

2. Set

无序且不可重复的元素集合。

只是简单通过object.contains()判断添加新元素时是否重复,从而实现去重的 Set 是很低效的,这就引出了对象的 hashcode。

Java世界⾥第⼆重要的约定:hashCode

  • 同⼀个对象必须始终返回相同的 hashCode
  • 两个对象的 equals 返回 true,必须返回相同的 hashCode
  • 两个对象不等,也可能返回相同的 hashCode

3. 哈希算法

哈希就是⼀个单向、一对多的映射,具有相同 hashCode 的东西存放在同一个 hash 桶中,
例⼦:从姓名到姓到哈希运算
从任意对象到⼀个整数(int)的 hashCode

4. HashSet

HashSet 是无序的,是最常用的 Set 实现。
可以利用 set 为 list 过滤去重:

List list = new ArrayList<>();

list.add(2);
list.add(3);
list.add(3);
list.add(3);
        
Set set = new HashSet<>(list); 

LinkedHashSet 是有序的,其维护了一个双向(doubly-linked)链表,顺序就是插入元素时的顺序。

5. Collections ⼯具⽅法集合

  • emptySet():返回一个方便的空集合
  • synchronizedCollection:将⼀个集合变成线程安全的
  • unmodifiableCollection:将⼀个集合变成不可变的(也可以
    使⽤ Guava 的 Immutable)
  • unmodifiableSet(): 可以获取不可变的 set,System.getenv() 内部就使用了这个方法将环境变量转换为不可变的 set。

6. Collection的其他实现

  • Queue/Deque
  • Vector/Stack(已废弃,现用 ArrayList/Deque)
  • LinkedList
  • ConcurrentHashMap
  • PriorityQueue

二、Map 体系

map 是 一个将 keys 映射到 values 的对象,键不能重复,每个键只能映射一个值,值可以重复。

Create/Update: put()/putAll()

Read:

  • get()/size()
  • containsKey()/containsValue()
  • keySet()/values()/entrySet()

Delete: remove()/clear()

image.png

keySet()返回键的集合,因为键不可重复,所以可以返回一个 set;
values()返回值的集合,因为值可以重复,所以返回的是 collection。
注意:keySet() 和 map 背后的 keys 是同一组数据,所以二者的修改会相互影响。

entrySet()返回键值对的集合(Set>),遍历时很有用:

Map map = new HashMap<>();

for (Map.Entry entry: map.entrySet()) {
    System.out.println(entry.getKey());
    System.out.println(entry.getValue());
}

1. HashMap

HashMap 是最常用、最高效的 Map 实现。

HashMap 的扩容,思路同样是创建更大的空间,然后把之前的数据 copy 进来。

HashMap 是多线程不安全的,可使用 ConcurrentHashMap。

HashMap在Java 7+后的改变(链表 --> 红⿊树):
因为 hashCode 是可能重复的(即发生碰撞),极端情况下如果一组数据的 hashCode 全部相同,那么会全放在同一个 hash 桶中成为了一个 List 链表,此时就丧失了 hash 桶的好处,性能会急剧恶化,所以 Java 7 开始会采用红黑树来代替链表。

HashMap 和 HashSet 本质上是同一个东西:
HashMap 的 key 集合(set)就是 HashSet,而 HashSet 内部其实就是个 HashMap,毕竟 HashSet 拥有的功能 HashMap 都有。

2. 有序集合TreeSet/TreeMap

TreeSet 可以排序(默认是自然顺序)。
HashSet、LinkedHashSet 与 TreeSet 对比:

import java.util.*;

public class Main {

    public static void main(String[] args) {
        List list = Arrays.asList(1000, -13, 0, -41656, 1250, 555);

        Set set1 = new HashSet<>(list);
        Set set2= new LinkedHashSet(list);
        Set set3 = new TreeSet(list);

        System.out.println(set1);
        System.out.println(set2);
        System.out.println(set3);
    }
}

[0, 1250, -41656, 1000, 555, -13]
[1000, -13, 0, -41656, 1250, 555]
[-41656, -13, 0, 555, 1000, 1250]

TreeMap 同理。
它们使⽤ Comparable 约定,认为排序相等的元素相等。

三、Guava

Google 开源的 Guava 提供了 JDK 没有的额外方法,不要重复发明轮⼦,尽量使⽤经过实战检验的类库。

  • Lists/Sets/Maps
  • ImmutableMap/ImmutableSet
  • Multiset/Multimap
  • BiMap

你可能感兴趣的:(中级03 - Collection体系简介)