com.google.common.collect
1、不可变集合
何为“不可变”
无法修改返回容器的内容,注意,这里指的是无法直接通过set或者add方法修改容器内reference的指向,而不是禁止reference指向内容的修改。
为什么要使用不可变集合
- 当对象被不可信的库调用时,不可变形式是安全的;
- 不可变对象被多个线程调用时,不存在竞态条件问题
- 不可变集合不需要考虑变化,因此可以节省时间和空间。所有不可变的集合都比它们的可变形式有更好的内存利用率(分析和测试细节);
- 不可变对象因为有固定不变,可以作为常量来安全使用。
JDK提供的不可变容器Collections.unmodifiableXXX有哪些缺点?
Collections.unmodifiableXXX返回的是原来容器的视图:
- 返回的容器无法修改
- 对原有容器进行修改,会影响返回容器的内容,没有做到真正的不可变:
例如:通过Collections.unmodifiablelist(originList)得到一个不可变容器unmodifiableList,当修改originList时,unmodifiableList也会受到影响。 - 透过视图查看容器的内容
- 容器内容的变更也会通过视图展现出来
Guava提供的不可变容器有哪些特点?
- 提供不可修改容器的功能,保证返回的容器不能被调用者修改,并且原容器的修改不会影响ImmutableXXX
- 对不可靠的客户代码库来说,它使用安全,可以再未受信任的类库中安全使用这些对象
- 线程安全的:Immutable对象在多线程下安全,没有竞态条件
- 不需要支持可变性,可以尽量节省空间和时间开销。所有的不可变集合实现都比可变集合更加有限的利用内存
- 可以被使用为一个常量,并且期望在未来也是保持不变的
Immutable的实现原理
- 返回的不是原对象的视图,而是原容器的一份拷贝;调用add() / set() 方法是报出异常
- 因为只是copy了原容器本身(reference),并不是deep copy,因此,对容器中的元素内容的修改,也会影响ImmutableXXX
Guava提供了哪些不可变集合
创建不可变集合
不可变集合可以用如下多种方式创建:
copyOf 方法,如:
ImmutableSet.copyOf(set);of 方法,如:
ImmutableSet.of(“a”, “b”, “c”)或 ImmutableMap.of(“a”, 1, “b”, 2);Builder 工具,如:
public static final ImmutableSetGOOGLE_COLORS =
ImmutableSet.builder()
.addAll(WEBSAFE_COLORS)
.add(new Color(0, 191, 255))
.build();
此外,对有序不可变集合来说,排序是在构造集合的时候完成的,如:
ImmutableSortedSet.of("a", "b", "c", "a", "d", "b");
会在构造时就把元素排序为 a, b, c, d。
asList视图
所有不可变集合都有一个 asList()方法提供 ImmutableList 视图,来帮助你用列表形式方便地读取集合元素。例如,你可以使用
sortedSet.asList().get(k)
从 ImmutableSortedSet 中读取第 k 个最小元素。
2、新集合类型
Guava 引入了很多 JDK 没有的、但我们发现明显有用的新集合类型。
Multiset
Multise的特定是可以多次添加相等的元素。
从数学概念上来讲,它是一个set:
维基百科从数学角度这样定义 Multiset:
Multiset是集合(set)概念的延伸,它的元素可以重复出现...
与set相同而与元组相反的是,Multiset 元素的顺序是无关紧要的:Multiset {a, a, b}和{a, b, a}是相等的。
Multiset继承自 JDK 中的 Collection 接口,而不是 Set 接口,可以用两种方式看待 Multiset:
- 没有元素顺序限制的 ArrayList
- Map
,键为元素,值为计数
Guava 的 Multiset API 也结合考虑了这两种方式:
(1)当把 Multiset 看成普通的 Collection 时,它表现得就像无序的 ArrayList:
- add(E)添加单个给定元素
- iterator()返回一个迭代器,包含 Multiset 的所有元素(包括重复的元素)
- size()返回所有元素的总个数(包括重复的元素)
(2)当把 Multiset 看作 Map
- count(Object)返回给定元素的计数。HashMultiset.count 的复杂度为 O(1),TreeMultiset.count 的复杂
度为 O(log n)。 - entrySet()返回 Set
,和 Map 的 entrySet 类似。 - elementSet()返回所有不重复元素的 Set,和 Map 的 keySet()类似。
- 所有 Multiset 实现的内存消耗随着不重复元素的个数线性增长。
由此可见,Mutilset很适合需要对元素计数的场景,比如下面的代码:
Map counts = new HashMap();
for (String word : words) {
Integer count = counts.get(word);
if (count == null) {
counts.put(word, 1);
} else {
counts.put(word, count + 1);
}
}
就可以换用Mutilset来进行统计。
Multimap
每个有经验的 Java 程序员都在某处实现过 Map
BiMap
传统上,实现键值对的双向映射需要维护两个单独的 map,并保持它们间的同步。但这种方式很容易出错,而且对于值已经在 map 中的情况,会变得非常混乱。
BiMap可以用来维护双向映射,可以用 inverse()反转 BiMap
Table
通常来说,当你想使用多个键做索引的时候,你可能会用类似 Map
ClassToInstanceMap
ClassToInstanceMap 是一种特殊的 Map:它的键是类型,而值是符合键所指类型的对象。
RangeSet
RangeSet描述了一组不相连的、非空的区间。当把一个区间添加到可变的RangeSet时,所有相连的区间会被合并,空区间会被忽略。
RangeMap
RangeMap 描述了”不相交的、非空的区间”到特定值的映射。和 RangeSet 不同,RangeMap 不会合并相邻的映射,即便相邻的区间映射到相同的值。
强大的集合工具类:java.util.Collections 中未包含的集合工具
静态工厂方法
Guava提供了静态通常方法用来更方便地生产集合:
Set copySet = Sets.newHashSet(elements);
List theseElements = Lists.newArrayList("alpha", "beta", "gamma");
注意:Guava 引入的新集合类型没有暴露原始构造器,也没有在工具类中提供初始化方法。而是直接在集合类中
提供了静态工厂方法,例如:
Multiset multiset = HashMultiset.create();
Iterables
Lists
除了静态工厂方法和函数式编程方法,Lists 为 List 类型的对象提供了若干工具方法。
partition(List, int) 把 List 按指定大小分割
reverse(List) 返回给定 List 的反转视图。注: 如果 List 是不可变的,考虑改用 ImmutableList.reverse()。
Sets
集合理论方法
union(Set, Set) 并集
intersection(Set, Set) 交集
difference(Set, Set) 差集 -> contained by set1 and not contained by set2
symmetricDifference(Set, Set) 对称差 The returned set contains all elements that are contained in either {@code set1} or {@code set2} but not in both. The iteration order of the returned set is undefined.
powerSet() 返回给定集合的所有子集
用 copyInto(Set) 拷贝进另一个可变集合;
用 immutableCopy()对自己做不可变拷贝。
Maps
Maps 类有若干值得单独说明的、很酷的方法。
uniqueIndex
Maps.uniqueIndex(Iterable,Function) 通常针对的场景是:有一组对象,它 们在某个属性上分别有独一无二的值,而我们希望能够按照这个属性值查找对象——译者注:这个方法返回一个 Map,键为 Function 返回的属性值,值为 Iterable 中相应的元素,因此我们可以反复用这个 Map 进行查找操作。
比方说,我们有一堆字符串,这些字符串的长度都是独一无二的,而我们希望能够按照特定长度查找字符串:
ImmutableMap stringsByIndex
= Maps.uniqueIndex(strings,new Function () {
public Integer apply(String string) {
return string.length();
}
});