并发容器:
- ConcurrentHashMap
- HashTable
ConcurrentHashMap的实现原理与使用
ConcurrentHashMap是线程安全且高效的HashMap.
为什么要使用ConcurrentHashMap?
- 并发编程中使用HashMap可能导致死循环.而线程安全的HashTable效率非常低下,便有了ConcurrentHashMap. HashMap在进行put操作时会引起死循环,因为多线程会导致HashMap的Entry链表形成环形数据结构,一旦形成,Entry的next节点永远不为空,会死循环获取Entry.
- 效率低下的HashTable:HashTable容器使用synchronized来保证线程安全,在线程竞争激烈时会效率低下.当进行put时,get方法也会被阻塞.
- ConcurrentHashMap的锁分段技术可有效提升并发访问率:将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问.
ConcurrentHashMap的结构
ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成.
Segment是一种可重入锁(ReentrantLock),在其中扮演锁的角色;
HashEntry则用于存储键值对数据.
一个ConcurrentHashMap里包含一个Segment数组.Segment的结构和HashMap类似,是一种数组和链表结构.一个Segment里包含一个HashEntry数组,每个HashEntry是一个链表结构的元素,每个Segment守护一个HashEntry数组里的元素,当对HashEntry进行修改时,需要先获得对应的Segment锁.
ConcurrentHashMap的操作
- get操作
- put操作
- size操作
ConcurrentLinkedQueue
并发编程中需要线程安全的队列.可以使用两种方式实现:
- 阻塞方法:队列使用一个锁(入队和出队用同一把锁),或两把锁(入队和出队不同的锁);
- 非阻塞方法:ConcurrentLinedQueue:是一个基于链接节点的无界线程安全的队列.
ConcurrentLinkedQueue结构:
由head节点和tail节点组成,每个节点(Node)由节点元素item和指向下一个节点next的引用组成,节点间关系通过next关联,默认情况下head节点存储的元素为空,tail节点等于head节点.
入队操作:
入队操作就是将入队节点添加到队列的尾部.默认情况下head节点等于tail节点.进行入队操作时,如果tail节点的next节点不为空,则将入队节点设置为tail节点.如果tail节点的next节点为空,则将入队节点设置为tail节点的next节点.所以tail节点不一定是尾节点.这么做的好处是可以减少cas更新tail节点的次数,提升入队效率.
称为HOPS.
入队方法永远返回true,所以不要通过返回值判断入队是否成功.
出队操作
出队操作就是从队列里返回一个节点元素,并清空对该节点元素的引用.
并不是每次出队时都更新head节点,当head节点里有元素时,直接弹出head节点里的元素,而不是更新head节点.当head里没有元素时,出队操作才更行head节点.通过hops变量来减少cas更新head节点的消耗.提高出队效率.
Java中的阻塞队列
是一个支持两个附加操作的队列,这两个附加的操作支持阻塞的插入和移除方法.
- 支持阻塞的插入方法:当队列满时,队列会阻塞插入元素的线程,直到队列不满.
- 支持阻塞的移除方法:在队列为空时,获取元素的线程会等待队列变为非空.
在阻塞不可用时,提供了4中处理方式:
方法/处理方式 | 抛出异常 | 返回特殊值 | 一直阻塞 | 超时退出 |
---|---|---|---|---|
插入方法 | add(e) | offer(e) | put(e) | offer(e,time,unit) |
移除方法 | remove() | poll() | take() | poll(time,unit) |
检查方法 | element() | peek() | 不可用 | 不可用 |
Java里的阻塞队列
提供了7个阻塞队列:
- ArrayBlockingQueue:数组结构的有界阻塞队列
- LinkedBlockingQueue:链表结构的有界阻塞队列
- PriorityBlockingQueue:支持优先级排序的无界阻塞队列
- DelayQueue:使用优先级排队实现的无界阻塞队列
- SynchronousQueue:不存储元素的阻塞队列
- LinkedTransgerQueue:链表结构的无界阻塞队列
- LinkedBlockingDeque:链表结构的双向阻塞队列
阻塞队列的实现原理
使用通知模式实现
Fork/Join框架
Fork/Join是Java7提供的一个并行执行任务的框架,是一个把大任务分割成若干小任务,最终汇总每个小人物后得到大人物结果的框架.
Fork就是将大任务分割成若干个子任务并行执行,Join就是汇总结果,最后得到最终结果.
工作窃取算法:是指某个线程从其他队列里窃取任务来执行.通常使用双端队列来避免任务竞争.
优点:充分利用线程进行并行计算,减少了线程间的竞争.
缺点:在某些情况下还是存在竞争,该算法会消耗更多的系统资源.
Fork/Join执行:
- 分割任务
- 执行任务并合并结果:分割的子任务都放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行.子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据.
Fork/Join的类:
- ForkJoinTask:任务类:
- RecursiveAction :用于没有返回值的任务
- RecursiveTask:用于有返回值的任务
- ForkJoinPool:Task通过Pool执行
异常处理:
//异常处理
if(task.isCompletedAbnormally()) {
System.out.println("exception:"+task.getException());
}
实现原理:
ForkJoinPool由ForkJoinTask数组和ForkJoinWorkerThread数组组成,ForkJoinTask负责将存放程序提交给ForkJoinPool的任务,而ForkJoinThread数组负责执行这些任务.