Guava | 集合

Guava | 集合_第1张图片

com.google.common.collect

1、不可变集合

何为“不可变”

无法修改返回容器的内容,注意,这里指的是无法直接通过set或者add方法修改容器内reference的指向,而不是禁止reference指向内容的修改

为什么要使用不可变集合
  • 当对象被不可信的库调用时,不可变形式是安全的;
  • 不可变对象被多个线程调用时,不存在竞态条件问题
  • 不可变集合不需要考虑变化,因此可以节省时间和空间。所有不可变的集合都比它们的可变形式有更好的内存利用率(分析和测试细节);
  • 不可变对象因为有固定不变,可以作为常量来安全使用。
JDK提供的不可变容器Collections.unmodifiableXXX有哪些缺点?

Collections.unmodifiableXXX返回的是原来容器的视图:

  • 返回的容器无法修改
  • 对原有容器进行修改,会影响返回容器的内容,没有做到真正的不可变:
    例如:通过Collections.unmodifiablelist(originList)得到一个不可变容器unmodifiableList,当修改originList时,unmodifiableList也会受到影响。
  • 透过视图查看容器的内容
  • 容器内容的变更也会通过视图展现出来
Guava提供的不可变容器有哪些特点?
  • 提供不可修改容器的功能,保证返回的容器不能被调用者修改,并且原容器的修改不会影响ImmutableXXX
  • 对不可靠的客户代码库来说,它使用安全,可以再未受信任的类库中安全使用这些对象
  • 线程安全的:Immutable对象在多线程下安全,没有竞态条件
  • 不需要支持可变性,可以尽量节省空间和时间开销。所有的不可变集合实现都比可变集合更加有限的利用内存
  • 可以被使用为一个常量,并且期望在未来也是保持不变的
Immutable的实现原理
  • 返回的不是原对象的视图,而是原容器的一份拷贝;调用add() / set() 方法是报出异常
  • 因为只是copy了原容器本身(reference),并不是deep copy,因此,对容器中的元素内容的修改,也会影响ImmutableXXX
Guava提供了哪些不可变集合
Guava | 集合_第2张图片

Guava | 集合_第3张图片
创建不可变集合

不可变集合可以用如下多种方式创建:

  • copyOf 方法,如:
    ImmutableSet.copyOf(set);

  • of 方法,如:
    ImmutableSet.of(“a”, “b”, “c”)或 ImmutableMap.of(“a”, 1, “b”, 2);

  • Builder 工具,如:
    public static final ImmutableSet GOOGLE_COLORS =
    ImmutableSet.builder()
    .addAll(WEBSAFE_COLORS)
    .add(new Color(0, 191, 255))
    .build();

此外,对有序不可变集合来说,排序是在构造集合的时候完成的,如:

ImmutableSortedSet.of("a", "b", "c", "a", "d", "b");

会在构造时就把元素排序为 a, b, c, d。

asList视图

所有不可变集合都有一个 asList()方法提供 ImmutableList 视图,来帮助你用列表形式方便地读取集合元素。例如,你可以使用

sortedSet.asList().get(k)

从 ImmutableSortedSet 中读取第 k 个最小元素。

2、新集合类型

Guava 引入了很多 JDK 没有的、但我们发现明显有用的新集合类型。

Multiset

Multise的特定是可以多次添加相等的元素。
从数学概念上来讲,它是一个set:

维基百科从数学角度这样定义 Multiset:
Multiset是集合(set)概念的延伸,它的元素可以重复出现...
与set相同而与元组相反的是,Multiset 元素的顺序是无关紧要的:Multiset {a, a, b}和{a, b, a}是相等的。

Multiset继承自 JDK 中的 Collection 接口,而不是 Set 接口,可以用两种方式看待 Multiset:

  • 没有元素顺序限制的 ArrayList
  • Map,键为元素,值为计数

Guava 的 Multiset API 也结合考虑了这两种方式:

(1)当把 Multiset 看成普通的 Collection 时,它表现得就像无序的 ArrayList:

  • add(E)添加单个给定元素
  • iterator()返回一个迭代器,包含 Multiset 的所有元素(包括重复的元素)
  • size()返回所有元素的总个数(包括重复的元素)

(2)当把 Multiset 看作 Map时,它也提供了符合性能期望的查询操作:

  • count(Object)返回给定元素的计数。HashMultiset.count 的复杂度为 O(1),TreeMultiset.count 的复杂
    度为 O(log n)。
  • entrySet()返回 Set,和 Map 的 entrySet 类似。
  • elementSet()返回所有不重复元素的 Set,和 Map 的 keySet()类似。
  • 所有 Multiset 实现的内存消耗随着不重复元素的个数线性增长。

由此可见,Mutilset很适合需要对元素计数的场景,比如下面的代码:

Map counts = new HashMap();
for (String word : words) {
    Integer count = counts.get(word);
    if (count == null) {
      counts.put(word, 1);
    } else {
      counts.put(word, count + 1);
    }
}

就可以换用Mutilset来进行统计。

Multimap

每个有经验的 Java 程序员都在某处实现过 Map或 Map,并且要忍受这个结构的笨拙。例如,Map通常用来表示非标定有向图。Guava 的 Multimap 可以很容易地把一个键映射到多个值。换句话说,Multimap 是把键映射到任意多个值的一般方式。

BiMap

传统上,实现键值对的双向映射需要维护两个单独的 map,并保持它们间的同步。但这种方式很容易出错,而且对于值已经在 map 中的情况,会变得非常混乱。
BiMap可以用来维护双向映射,可以用 inverse()反转 BiMap的键值映射得到。

Table

通常来说,当你想使用多个键做索引的时候,你可能会用类似 Map>的实现,这种方式很丑陋,使用上也不友好。Guava 为此提供了新集合类型 Table,它有两个支持所有类型的键:”行”和”列”。Table 提供多种视图,以便你从各种角度使用它:

ClassToInstanceMap

ClassToInstanceMap 是一种特殊的 Map:它的键是类型,而值是符合键所指类型的对象。

RangeSet

RangeSet描述了一组不相连的、非空的区间。当把一个区间添加到可变的RangeSet时,所有相连的区间会被合并,空区间会被忽略。

RangeMap

RangeMap 描述了”不相交的、非空的区间”到特定值的映射。和 RangeSet 不同,RangeMap 不会合并相邻的映射,即便相邻的区间映射到相同的值。

强大的集合工具类:java.util.Collections 中未包含的集合工具

Guava | 集合_第4张图片
静态工厂方法

Guava提供了静态通常方法用来更方便地生产集合:

Set copySet = Sets.newHashSet(elements);
List theseElements = Lists.newArrayList("alpha", "beta", "gamma");

注意:Guava 引入的新集合类型没有暴露原始构造器,也没有在工具类中提供初始化方法。而是直接在集合类中
提供了静态工厂方法,例如:

Multiset multiset = HashMultiset.create();
Iterables
Lists

除了静态工厂方法和函数式编程方法,Lists 为 List 类型的对象提供了若干工具方法。

partition(List, int)  把 List 按指定大小分割
reverse(List)  返回给定 List 的反转视图。注: 如果 List 是不可变的,考虑改用 ImmutableList.reverse()。
Sets

集合理论方法

union(Set, Set) 并集
intersection(Set, Set) 交集
difference(Set, Set) 差集 -> contained by set1 and not contained by set2 
symmetricDifference(Set, Set) 对称差 The returned set contains all elements that are contained in either {@code set1} or {@code set2} but not in both. The iteration order of the returned set is undefined.
powerSet() 返回给定集合的所有子集

用 copyInto(Set) 拷贝进另一个可变集合;
用 immutableCopy()对自己做不可变拷贝。
Maps

Maps 类有若干值得单独说明的、很酷的方法。

uniqueIndex

Maps.uniqueIndex(Iterable,Function) 通常针对的场景是:有一组对象,它  们在某个属性上分别有独一无二的值,而我们希望能够按照这个属性值查找对象——译者注:这个方法返回一个 Map,键为 Function 返回的属性值,值为 Iterable 中相应的元素,因此我们可以反复用这个 Map 进行查找操作。

比方说,我们有一堆字符串,这些字符串的长度都是独一无二的,而我们希望能够按照特定长度查找字符串:
ImmutableMap stringsByIndex
 = Maps.uniqueIndex(strings,new Function () {
  public Integer apply(String string) {
    return string.length();
  }
});

你可能感兴趣的:(Guava | 集合)