JavaConcurrency-如何理解线程安全的集合CurrentHashMap为例

如果多线程要并发修改一个数据结构
例如: 散列表,
很容易会破坏这个数据结构,
例如:
一个线程可能要开始向表中插入一个新元素,假定在调整散列表各个桶之间的链接关系的过程中,被剥夺了控制权。
如果另一个线程也开始比那里同一个链表,可能使用无效的链接并造成混乱,会爆出异常or陷入死循环。

可以选择锁来保护共享数据结构,但是选择线程安全的实现作为替代可能更容易

高效的映射,集合和队列:
java.util.concurrent包提供了映射,有序集和队列的高效实现:
ConcurrentHashMap
ConcurrentSkipListMap
ConcurrentSkipListSet
ConcurrentLinkedQueue
这些几何使用复杂的短发,通过允许并发地访问数据结构的不同部分来使竞争极小化。

线程安全集合的原子更新:
ConcurrentHashMap 让计数代码自增,下面的代码是不安全的:

long oldValue=map.get(word);
long newValue=oldValue == null ?1:oldValue+1;
map.put(word,newValue);

多线程操作的时候 get和put代码不会破坏数据结构,不过,由于操作序列不是原子的,所以结果不可预知

正确做法是使用ConcurrentHashMap的replace方法,它会以原子方式用一个新值替换原值,前提是之前没有其他线程把原值替换为其他值。并且必须一直这么做,直到replace成功。 这是一个CAS操作

do{
	long oldValue=map.get(word);
	long newValue=oldValue == null ?1:oldValue+1;
}while(!map.replace(word,oldValue,newValue))

还可以使用:

map.putIfAbsent(word,new LongAdder());
map.get(word).increment();

第一个语句确保有一个LongAdder可以完成原子自增。由于putIfAbsent 返回映射的值(可能是原来的值,或者是新设置的值),可以组合成一句:

map.putIfAbsent(word,new LongAdder().increment());

computer方法时可以提供一个键和一个计算新值得函数。这个函数接收键和相关联的值(如果没有值,则为null),它会计算新值。
例如:可以如下更新一个整数计数器的映射:

map.computer(word,(k,v)-> ==null? 1 : v+1);

注意 ConcurrentHashMap中不允许有null值。有很多方法都是用null值来指示映射中某个给定的键不存在

另外还有computerIfPresent 和computeIfAbsent 方法:
他们分别只有在已经有原值的情况下计算新值 or 只有没有原值的情况下计算新值。可以如下更新一个LongAdder计数器映射:

map.computerIfAbsent(word,k->new LongAdder()).increment();

这与之前的putIfAbsent调用几乎一样的,不过LongAdder构造器只有确实需要一个新的计数器才会调用。

当新增一个键时通常需要做些特殊处理。利用merge方法可以非常方便地做到这一点。这个方法有一个参数表示键不存在时使用的初始值。
否则,就会调用你体统的函数来结合原值与初始值。

map.merge(word,1L,(existingValue,newValue) -> existingValue + newValue);
//或者更加简单的写为
map.merge(word,1L,Long::sum);

注意:如果传入computer or merge 的函数 返回null,将从映射中删除现有的条目。
使用computer or merge 时,要记住你提供的函数不能做太多的工作。这个函数运行时,可能会阻塞对映射的其他更新。当然,这个函数也不能更新映射的其他部分。

CurrentHashMap的批操作:
Java8为并发散列映射提供了批操作,即使有其他线程在处理映射,这些操作也能安全的执行,无需冻结当前映射的快照。
三种操作:

  • 搜索(search)为每个键or值提供一个函数,直到函数生成一个非null的结果。然后搜索终止,返回这个函数的结果
  • 规约(reduce)组合所有的键or值,这里要使用所提供的一个累加函数
  • forEach为所有的键or值提供一个函数

每个操作都有4个版本:
operationKeys:处理键
operationValues:处理值
operation:处理键和值
operationEntries:处理MapEntry对象

对于上述各个操作,需要指定一个参数化阈值(threshold)。如果映射包含的元素多于这个阈值,就会并行完成批操作。
如果希望批操作在一个线程中运行,可以使用阈值LongMAX_VALUE。吐过希望佣金可能多的线程运行批操作,可以使用阈值1。

String result =map.search(threshold,(k,v)-> 1000? k:null);

找出第一个出现次数超过1000次的单词,result会这是为第一个匹配的单词,如果操作函数对所有输入都返回null,则返回null。

forEach方法有两种形式。第一个只为各个映射条目提供一个消费者函数,例如:

map.forEach(threshold,(k,v)-> System.out.println(k+"->"+v));

第二种形式还有一个转换器函数,这个函数要先提供,其结果会传递到消费者:

map.forEach(threshold,(k,v)->k+"->"+v,//Transformer
			System.out::println);//Consumer

转换器可以用作为一个过滤器,只要转换器返回null ,这个值就会被悄无声息的跳过。
例如,只打印有大于1000的条目:

map.forEach(threshold,
			(k,v)-> v>1000? k+"->"+v : null,// filter and transformer
			System.out::println);//the nulls are not passed to the consumer

reduce操作用一个累加函数组合其输入
例如:
可以如下计算所有值得总和:

Long sum =map.reduceValues(threshold,Long::sum);

和forEach类似,也可以提供一个转换器函数,
可以如下计算最长的键的长度:

Integer maxLength=map.reduceKeys(threshold,
	String::length,//Transformer
	Integer::max) //Accumulator

转换器可以作为一个过滤器,通过返回null来排除不想要的输入:
比如:

Long count =map.reduceValues(threshold,
					v -> v>1000 ? 1L : null,
					Long::sum);

如果map为null,或者所有条目都被滤掉,reduce操作会返回null。如果只有一个元素,则返回器转换结果,不会应用累加器。

对于int,long 和double输出还有相应的特殊化操作,分别有后缀ToInt,ToLong 和ToDouble。 需要把输入转化为一个基本类型值,并指定一个默认值和一个累加器函数。map为null时返回默认值。

long sum =map.reduceValuesToLong(threshold,
			Long::longValue,//Transformer to primitive type
			0,//Default value for empty map
			Long::sum)//Primitive type accumulator

你可能感兴趣的:(JavaConcurrency)