并发是一种能力,是一种将程序分为几个片段,在单独的处理器上运行每个片段,而不影响最终结果的能力。
可以显著提高程序在多处理器和多核系统中的速度。
多线程就是达到并发目的的一种手段。多线程,是指从软件或者硬件上实现多个线程并发执行的技术。应用程序可以使用多线程将程序分割为多个子任务,并让底层体系结构管理线程如何运行,可以并发在一个内核上,也可以并行在多个内核上运行。
线程是可以由调度程序独立管理的最小程序指令序列。
通俗的说,并发是多个任务交替执行,而并行是多个任务同时执行。两者的关键在于“同时”这个关键词。
在计算中,进程是正在执行的计算机程序的一个实例。线程是可以由调度程序独立管理的最小程序指令序列。一个进程可以由多个执行线程组成。
我认为Runnable和Callable的作用只是定义任务,创建线程还是需要Thread构造器来完成。
从上面的分析可以看到,一般情况下Runnable更有优势。
启动线程的方法是start方法。线程t启动后,t从新建状态转为就绪状态, 但并没有运行。 t获取CPU权限后才会运行,运行时执行的方法就是run方法。此时有t和主线程两个线程在运行,如果t阻塞,可以直接继续执行主线程中的代码。
直接运行run方法也是合法的,但此时并没有新启动一个线程,run方法是在主线程中执行的。此时只有主线程在运行,必须等到run方法中的代码执行完后才可以继续执行主线程中的代码。
Java中线程有哪些状态在Thread.State枚举中的介绍得很清楚。六种状态分别是NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING、TERMINATED。
wait()作用是在其他线程调用此对象的notify()方法或notifyAll()方法前,或者其他某个线程中断当前线程前,导致当前线程等待。wait(long timeout)、wait(long timeout, int nanos)作用是在已超过某个实际时间量前,或者其他某个线程中断当前线程前,导致当前线程等待。使用wait方法有个条件:当前线程必须持有对象的锁。执行wait后,当前线程会失去对象的锁,状态变为WAITING或者TIMED_WAITING状态。
notify()可以随机唤醒正在等待的多个线程中的一个。被唤醒的线程并不能马上参与对锁的竞争,必须等调用notify的线程释放锁后才能参与对锁的竞争。而且被唤醒的线程在竞争锁时没有任何优势。
同wait方法一样,使用notify方法有个条件:线程必须持有对象的锁。执行notify方法后,线程会继续执行,并不会马上释放对象的锁。所以才有了上文中的“被唤醒的线程并不能马上参与对锁的竞争,必须等调用notify的线程释放锁后才能参与对锁的竞争。”。
notifyAll()与notify()类似,区别是它可以唤醒在此对象监视器上等待的所有线程。
API中对yield()的介绍是可以暂停当前正在执行的线程对象,并执行其他线程。“暂停”代表着让出CPU,但不会释放锁。执行yield()后,当前线程由运行状态变为就绪状态。但不能保证在当前线程调用yield()之后,其它具有相同优先级的线程就一定能获得执行权,也有可能是当前线程又进入到运行状态继续运行!
yield()与无参的wait()的区别:
线程的休眠(暂停执行)与sleep(long millis)和sleep(long millis, int nanos)有关。API中的介绍是sleep(long millis) 方法可以在指定的毫秒数内让当前正在执行的线程休眠;sleep(long millis, int nanos) 可以在指定的毫秒数加指定的纳秒数内让当前正在执行的线程休眠。该线程不丢失任何监视器的所属权。简单来说就是sleep方法可以使正在执行的线程让出CPU,但不会释放锁。执行sleep方法后,当前线程由运行状态变为TIMED_WAITING状态。
sleep()与有参的wait()的区别是:
sleep()与yield()的区别是:
interrupt()常常被用来中断处于阻塞状态的线程。
interrupted()与isInterrupted()都可以测试当前线程是否已经中断。区别在于线程的中断状态由interrupted()清除。换句话说,如果连续两次调用interrupted(),则第二次调用将返回false。
每个线程都有一个优先级,高优先级线程的执行优先于低优先级线程。java 中的线程优先级的范围是1~10,默认的优先级是5。
setPriority(int newPriority)和getPriority()分别用来更改线程的优先级和返回线程的优先级。
join()的作用是等待该线程终止,常常被用来让主线程在子线程运行结束之后才能继续运行。如在主线程main中调用了thread.join(),那么主线程会等待thread执行完后才继续执行。join(long millis)、join(long millis , int nanos)功能与join()类似,但限定了等待时间,join(long millis)意味着等待该线程终止的时间最长为millis毫秒,join(long millis , int nanos)意味着等待该线程终止的时间最长为millis毫秒 + nanos 纳秒,超时将主线程将继续执行。join()等价于join(0),即超时为0,意味着要一直等下去。
从源码中可以了解到,join()的实现依赖于wait方法,所以join()释放锁。
Java中有两种线程:用户线程和守护线程。守护线程是一种特殊的线程,它的作用是为其他线程提供服务。例如GC线程就是守护线程。当正在运行的线程都是守护线程时,Java虚拟机退出,守护线程自动销毁。
setDaemon(boolean on)用于将该线程标记为守护线程或用户线程。该方法必须在启动线程前调用。isDaemon()用于测试该线程是否为守护线程。
在多线程编程中,可能会出现多个线程访问一个资源的情况,资源可以是同一内存区(变量,数组,或对象)、系统(数据库,web services等)或文件等等。如果不对这样的访问做控制,就可能出现不可预知的结果。这就是线程安全问题,常见的情况是“丢失修改”、“不可重复读”、“读‘脏’数据”等等。
Java中的volatile可以看做是“轻量级的synchronized”。synchronized可能会引起上下文切换和线程调度,同时保证可见性、有序性和原子性。volatile不会引起上下文切换和线程调度,但仅提供可见性和有序性保证,不提供原子性保证。
如果一系列(或者一个)操作是不可中断的,要么都执行,要么不执行,就称操作是原子操作,具有原子性。
拿移动支付举例,A用户向B用户付款100元,其中包含两个操作:A用户账户扣减100元,B用户账户增加100元。如果这两个操作不是原子操作就可能会出错,比如A账户账户扣减100元,但B用户账户并没有增加100元。
可见性指的是多个线程对共享资源的可见性。当一个线程修改了某一资源,其他线程能够看到修改结果。
有效性指程序按照代码的先后顺序执行。
总的来说volatile变量使用范围有限,不能替代synchronized,但在某些场景下,使用volatile更好。
从今天开始学习JUC。JUC是java.util.concurrent包的简称。下图是JUC的整体结构。参考JDK1.8的java.util.concurrent,画出下图。
以下是JUC中的锁,也称显示锁。
以下是JUC中的集合。
以下是JUC中与线程池有关的类。
以下是JUC中的工具类。
参考JDK1.8的java.util.concurrent.atomic包,画出如下图:
可以将包中的类分为五类:
AtomicBoolean、AtomicInteger、AtomicLong和AtomicReference的实例各自提供对相应类型单个变量的原子方式访问和更新功能。例如AtomicBoolean提供对int类型单个变量的原子方式访问和更新功能。
每个类也为该类型提供适当的实用工具方法。例如,类AtomicLong和AtomicInteger提供了原子增量方法,可以用于生成序列号。
AtomicStampedRerence维护带有整数“标志”的对象引用,可以用原子方式对其进行更新。AtomicMarkableReference维护带有标记位的对象引用,可以原子方式对其进行更新。
AtomicIntegerArray、AtomicLongArray和AtomicReferenceArray类进一步扩展了原子操作,对这些类型的数组提供了支持。例如AtomicIntegerArray是可以用原子方式更新其元素的int数组。
AtomicReferenceFieldUpdater、AtomicIntegerFieldUpdater和AtomicLongFieldUpdater是基于反射的实用工具,可以提供对关联字段类型的访问。例如AtomicIntegerFieldUpdater可以对指定类的指定volatile int字段进行原子更新。
DoubleAccumulator、LongAccumulator、DoubleAdder、LongAdder是JDK1.8新增的部分,是对AtomicLong等类的改进。比如LongAccumulator与LongAdder在高并发环境下比AtomicLong更高效。
原子类不是锁的常规替换方法。仅当对象的重要更新限定于单个变量时才应用它。
原子类不提供诸如hashCode和compareTo之类的方法。因为原子变量是可变的。
待补充。
原子类是基于CAS实现的。
CAS,compare and swap的缩写,意为比较并交换。CAS操作包含三个操作数:内存值(V),预期值(A)、新值(B)。如果内存值与预期值相同,就将内存值修改为新值,否则不做任何操作。
java.util.concurrent.atomic是建立在CAS之上的。下面以AtomicLong为例看下是如何使用CAS的。
下面看下AtomicLong的compareAndSet方法。
// Java不能直接访问操作系统底层,所以使用Unsafe类提供硬件级别的原子操作。
//Unsafe.compareAndSwapLong是CAS操作
private static final Unsafe unsafe = Unsafe.getUnsafe();
private static final long valueOffset;
/**
* 如果当前内存值等于预期值,原子更新当前值为新值value
*
* @param expect 预期值
* @param update 新值
* @return {@code true} 如果成功,则返回 true。返回 false 指示实际值与预期值不相等。
*/
public final boolean compareAndSet(long expect, long update) {
//使用unsafe来实现CAS
return unsafe.compareAndSwapLong(this, valueOffset, expect, update);
}
从源码中可以看到,AtomicLong.compareAndSet利用unsafe..compareAndSwapLong(this, valueOffset, expect, update)实现CAS操作,而unsafe通过调用JNI来完成CPU指令的操作。JNI是Java Native Interface的缩写,允许Java调用其他语言,unsafe.compareAndSwapLong方法就是借助C来调用CPU底层指令实现。其他的原子类中也大量使用了类似unsafe..compareAndSwap×××的方式。
CAS缺点
JUC锁位于java.util.concurrent.locks包下,为锁和等待条件提供一个框架的接口和类,它不同于内置同步和监视器。参考JDK1.8的java.util.concurrent.locks包,画出如下图:
CountDownLatch,CyclicBarrier和Semaphore不在包中,但也是通过AQS来实现的。因此,我也将它们归纳到JUC锁中进行介绍。
Lock
Lock实现提供了比使用synchronized方法和语句可获得的更广泛的锁定操作。
ReentrantLock
一个可重入的互斥锁,它具有与隐式锁synchronized相同的一些基本行为和语义,但功能更强大。
AbstractOwnableSynchronizer/AbstractQueuedSynchronizer/AbstractQueuedLongSynchronizer
AbstractQueuedSynchronizer就是被称之为AQS的类,为实现依赖于先进先出 (FIFO) 等待队列的阻塞锁和相关同步器(信号量、事件,等等)提供一个框架。ReentrantLock,ReentrantReadWriteLock,CountDownLatch,CyclicBarrier和Semaphore等这些类都是基于AQS类实现的。
AbstractQueuedLongSynchronizer以long形式维护同步状态的一个AbstractQueuedSynchronizer版本。
AbstractQueuedSynchronizer与AbstractQueuedLongSynchronizer都继承了AbstractOwnableSynchronizer。AbstractOwnableSynchronizer是可以由线程以独占方式拥有的同步器。
Condition
Condition又称等待条件,它实现了对锁更精确的控制。Condition中的await()方法相当于Object的wait()方法,Condition中的signal()方法相当于Object的notify()方法,Condition中的signalAll()相当于Object的notifyAll()方法。不同的是,Object中的wait(),notify(),notifyAll()方法是和synchronized组合使用的;而Condition需要与Lock组合使用。
ReentrantReadWriteLock
ReentrantReadWriteLock维护了一对相关的锁,一个用于只读操作,另一个用于写入操作。
LockSupport
用来创建锁和其他同步类的基本线程阻塞原语。
CountDownLatch
一个同步辅助类,在完成一组正在其他线程中执行的操作之前,它允许一个或多个线程一直等待。
CyclicBarrier
一个同步辅助类,它允许一组线程互相等待,直到到达某个公共屏障点。
Semaphore
一个计数信号量。从概念上讲,信号量维护了一个许可集。Semaphore通常用于限制可以访问某些资源的线程数目。
AQS,AbstractQueuedSynchronizer的缩写,是JUC中非常重要的一个类。javadoc中对其的介绍是:
为实现依赖于先进先出 (FIFO) 等待队列的阻塞锁和相关同步器(信号量、事件,等等)提供一个框架。此类的设计目标是成为依靠单个原子 int 值来表示状态的大多数同步器的一个有用基础。
AbstractQueuedSynchronizer是CountDownLatch、ReentrantLock、RenntrantReadWriteLock、Semaphore等类实现的基础。
待补充。。。
在任务协作中,关键问题是任务之间的通信。握手可以通过Object的监视器方法(wait()和notify()/notifyAll())和synchronized方法和语句来安全地实现。Java SE5的JUC提供了具有await()和signal()/signalAll()方法的Condition和Lock来实现。其中,Lock代替了synchronized方法和语句,Condition代替了Object的监视器方法。与Object相比,Condition可以更精细地控制线程的休眠与唤醒。
对比项 | Condition | Object监视器 | 备注 |
---|---|---|---|
使用条件 | 获取锁 | 获取锁,创建Condition对象 | |
等待队列的个数 | 一个 | 多个 | |
是否支持通知指定等待队列 | 支持 | 不支持 | |
是否支持当前线程释放锁进入等待状态 | 支持 | 支持 | |
是否支持当前线程释放锁并进入超时等待状态 | 支持 | 支持 | |
是否支持当前线程释放锁并进入等待状态直到指定最后期限 | 支持 | 不支持 | |
是否支持唤醒等待队列中的一个任务 | 支持 | 支持 | |
是否支持唤醒等待队列中的全部任务 | 支持 | 支持 |
ReentrantReadWriteLock是一种共享锁。ReadWriteLock维护了两个锁,读锁和写锁,所以一般称其为读写锁。写锁是独占的。读锁是共享的,如果没有写锁,读锁可以由多个线程共享。与互斥锁相比,虽然一次只能有一个写线程可以修改共享数据,但大量读线程可以同时读取共享数据,所以,在共享数据很大,且读操作远多于写操作的情况下,读写锁值得一试。
ReentrantReadWriteLock具有以下特性:(有待详细介绍)
优点
与互斥锁相比,虽然一次只能有一个写线程可以修改共享数据,但大量读线程可以同时读取共享数据。在共享数据很大,且读操作远多于写操作的情况下,ReentrantReadWriteLock值得一试。
缺点
只有当前没有线程持有读锁或者写锁时才能获取到写锁,这可能会导致写线程发生饥饿现象,即读线程太多导致写线程迟迟竞争不到锁而一直处于等待状态。StampedLock可以解决这个问题,解决方法是如果在读的过程中发生了写操作,应该重新读而不是直接阻塞写线程。
LockSupport是JUC锁中比较基础的类,用来创建锁和其他同步类的基本线程阻塞原语。比如,在AQS中就使用LockSupport作为基本线程阻塞原语。它的park()和unpark()方法分别用于阻塞线程和解除阻塞线程。与Thread.suspend()相比,它没有由于resume()在前发生,导致线程无法继续执行的问题。和Object.wait()对比,它不需要先获得某个对象的锁,能够响应中断请求(中断状态被设置成true),也不会抛出InterruptException异常。
此类以及每个使用它的线程与一个许可关联。如果许可可用,当前线程可获取许可执行。如果许可不可用,调用park()后,当前线程阻塞,等待获取许可。unpark(Thread thread)可使指定线程的许可可用。这与Semaphore相似,但LockSupport最多只能有一个许可。
三种形式的park(park(Object blocker)、parkNanos(Object blocker, long nanos)、parkUntil(Object blocker, long deadline))都支持blocker对象参数。此对象在线程受阻塞时被记录,以允许监视工具和诊断工具确定线程受阻塞的原因。监视工具和诊断工具可以使用方法getBlocker(java.lang.Thread)访问 blocker。建议最好使用这些形式,而不是不带此参数的原始形式。在锁实现中提供的作为blocker的普通参数是this。
Object.wait()对比,LockSupport.park();不需要先获得某个对象的锁,能够响应中断请求(中断状态被设置成true),也不会抛出InterruptException异常。
StampedLock是JDK1.8新增的一个锁,是对读写锁ReentrantReadWriteLock的改进。前面已经学习了ReentrantReadWriteLock,我们了解到,在共享数据很大,且读操作远多于写操作的情况下,ReentrantReadWriteLock值得一试。但要注意的是,只有当前没有线程持有读锁或者写锁时才能获取到写锁,这可能会导致写线程发生饥饿现象,即读线程太多导致写线程迟迟竞争不到锁而一直处于等待状态。StampedLock可以解决这个问题,解决方法是如果在读的过程中发生了写操作,应该重新读而不是直接阻塞写线程。
CountDownLatch是一个通用同步器,用于同步一个或多个任务。在完成一组正在其他线程中执行的任务之前,它允许一个或多个线程一直等待。
可以用一个初始计数值来初始化CountDownLatch对象,任何在这个对象上调用await()的方法都将阻塞,直至计数值到达0。每完成一个任务,都可以在这个对象上调用countDown()减少计数值。当计数值减为0,所有等待的线程都会被释放。CountDownLatch的计数值不能重置。如果需要重置计数器,请考虑使用CyclicBarrier。
CyclicBarrier允许一组线程互相等待,直到到达某个公共屏障点。如果你希望一组并行的任务在下个步骤之前相互等待,直到所有的任务都完成了下个步骤前的所有操作,才继续向前执行,那么CyclicBarrier很合适。
看过CyclicBarrier的方法列表后,有没有发现CyclicBarrier与CountDownLatch比较像。它们之间最大的区别在于CyclicBarrier的计数器可以重置,相当于可以循环使用。cyclic,意为可循环的,barrier,意为屏障,刚好映照了CyclicBarrier的两个特点。
一般的锁在任意时刻只允许一个线程访问一项资源,而计数信号量允许n个任务同时访问一项资源。我们可以将信号量看做一个许可集,可以向线程分发使用资源的许可证。获得资源前,线程调用acquire()从许可集中获取许可。该线程结束后,通过release()将许可还给许可集。
JUC提供了用于多线程上下文中的Collection实现与高效的、可伸缩的、线程安全的非阻塞FIFO队列。参考JDK1.8,画出下图。
JUC容器中List的实现只有CopyOnWriteArrayList。CopyOnWriteArrayList相当于线程安全的ArrayList。
JUC容器中Set的实现有CopyOnWriteArraySet与ConcurrentSkipListSet。CopyOnWriteArraySet相当于线程安全的HashSet,ConcurrentSkipListSet相当于线程安全的TreeSet。当set 大小通常保持很小,只读操作远多于可变操作,需要在遍历期间防止线程间的冲突时,CopyOnWriteArraySet优于同步的HashSet。ConcurrentSkipListSet是一个基于 ConcurrentSkipListMap 的可缩放并发 NavigableSet 实现。set的元素可以根据它们的自然顺序进行排序,也可以根据创建set时所提供的 Comparator 进行排序,具体取决于使用的构造方法。CopyOnWriteArraySet的实现依赖于CopyOnWriteArrayList。ConcurrentSkipListSet的实现依赖于ConcurrentSkipListMap。所以CopyOnWriteArraySet会在CopyOnWriteArrayList之后学习,ConcurrentSkipListSet会在ConcurrentSkipListMap之后学习。
JUC容器中Map的实现只有ConcurrentHashMap和ConcurrentSkipListMap。
ConcurrentHashMap是线程安全的哈希表,相当于线程安全的HashMap。ConcurrentSkipListMap是线程安全的有序的哈希表,相当于线程安全的TreeMap。
JUC容器中Queue的常用实现有ArrayBlockingQueue、LinkedBlockingQueue、LinkedBlockingDeque、ConcurrentLinkedDeque和ConcurrentLinkedQueue。
CopyOnWrite,简称COW。所谓写时复制,即读操作时不加锁以保证性能不受影响,写操作时加锁,复制资源的一份副本,在副本上执行写操作,写操作完成后将资源的引用指向副本。高并发环境下,当读操作次数远远大于写操作次数时这种做法可以大大提高读操作的效率。
写操作时使用的锁是ReentrantLock。
CopyOnWriteArrayList底层仍是数组。为了当写操作改变了底层数组array时,读操作可以得知这个消息,需要使用volatile来保证array的可见性。
有利就有弊,写时复制提高了读操作的性能,但写操作时内存中会同时存在资源和资源的副本,可能会占用大量的内存。
在JDK1.7中,ConcurrentHashMap通过“锁分段”来实现线程安全。ConcurrentHashMap将哈希表分成许多片段(segments),每一个片段(table)都类似于HashMap,它有一个HashEntry数组,数组的每项又是HashEntry组成的链表。每个片段都是Segment类型的,Segment继承了ReentrantLock,所以Segment本质上是一个可重入的互斥锁。这样每个片段都有了一个锁,这就是“锁分段”。
在JDK1.8中,ConcurrentHashMap放弃了“锁分段”,取而代之的是类似于HashMap的数组+链表+红黑树结构,使用CAS算法和synchronized实现线程安全。
ConcurrentSkipListMap是线程安全的有序的哈希表。与同是有序的哈希表TreeMap相比,ConcurrentSkipListMap是线程安全的,TreeMap则不是,且ConcurrentSkipListMap是通过跳表(skip list)实现的,而TreeMap是通过红黑树实现的。至于为什么ConcurrentSkipListMap不像TreeMap一样使用红黑树结构,在ConcurrentSkipListMap源码中Doug Lea已经给出解释:
The reason is that there are no known efficient lock-free insertion and deletion algorithms for search trees.
有必要详细了解下skip list。
引用作者William Pugh的一句话:
Skip lists are a probabilistic data structure that seem likely to supplant balanced trees as the implementation method of choice for many applications. Skip list algorithms have the same asymptotic expected time bounds as balanced trees and are simpler, faster and use less space.
大意为跳过列表是一种概率数据结构,可能取代平衡树作为许多应用程序的实现方法。跳过列表算法具有与平衡树相同的渐近期望时间界限,并且更简单,更快速并且使用更少的空间。下图是skip list的数据结构示意图。
从图中可以看出跳表主要有以下几个成员构成:
LinkedBlockingDeque是一个基于链表的、可指定大小的阻塞双端队列。“双端队列”意味着可以操作队列的头尾两端,所以LinkedBlockingDeque既支持FIFO,也支持FILO。
可选的容量范围构造方法参数是一种防止过度膨胀的方式。如果未指定容量,那么容量将等于 Integer.MAX_VALUE。只要插入元素不会使双端队列超出容量,每次插入后都将动态地创建链接节点。
ConcurrentLinkedQueue是一个基于链表的、无界的、线程安全的队列。此队列按照FIFO原则对元素进行排序。此队列不允许使用null元素,采用了有效的“无等待(wait-free)”算法(CAS算法)。
与大多数collection不同,size方法不是一个固定时间操作。由于这些队列的异步特性,确定当前元素的数量需要遍历这些元素。
前面的例子中总是需要线程时就创建,不需要就销毁它。但频繁创建和销毁线程是很耗资源的,在并发量较高的情况下频繁创建和销毁线程会降低系统的效率。线程池可以通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
参考JDK1.8中的相关类,画出下图。
(此图不是十分准确,有些类实现了两个接口,这里只展示出了一个)
本章只是简单地介绍下它们,在以后的文章中会选一些最重要的来学习。
此接口提供一种将任务提交与每个任务将如何运行的机制分离开来的方法。它只提供了execute(Runnable)这么一个方法,用于执行已提交的Runnable任务。
继承了Executor接口,用于提交一个用于执行的Runnable任务、试图停止所有正在执行的活动任务,暂停处理正在等待的任务、执行给定的任务。
提供了ExecutorService的默认实现。
提供一个可扩展的线程池实现,是最出名的“线程池”。
JDK1.7中新增的一个线程池,与ThreadPoolExecutor一样,同样继承了AbstractExecutorService。ForkJoinPool是Fork/Join框架的两大核心类之一。与其它类型的ExecutorService相比,其主要的不同在于采用了工作窃取算法(work-stealing):所有池中线程会尝试找到并执行已被提交到池中的或由其他线程创建的任务。这样很少有线程会处于空闲状态,非常高效。这使得能够有效地处理以下情景:大多数由任务产生大量子任务的情况;从外部客户端大量提交小任务到池中的情况。
ScheduledExecutorService继承了ExecutorService,可安排在给定的延迟后运行或定期执行命令。
ScheduledThreadPoolExecutor继承了ThreadPoolExecutor,实现了ScheduledExecutorService。
CompletionService接口是将生产新的异步任务与使用已完成任务的结果分离开来的服务。生产者利用submit()提交要执行的任务。使用者利用take()获取并移除已完成的任务的返回值,并按照完成这些任务的顺序处理它们的结果。
通常,CompletionService 依赖于一个单独的 Executor 来实际执行任务,在这种情况下,CompletionService 只管理一个内部完成队列。ExecutorCompletionService 类提供了此方法的一个实现。此类将那些完成时提交的任务放置在可使用take()访问的队列上。
Callable接口类似于Runnable,两者作用都是定义任务。不同的是,被线程执行后,Callable可以返回结果或抛出异常。而Runnable不可以。Callable的返回值可以通过Future来获取。
许多服务器都面临着处理大量客户端远程请求的压力,如果每收到一个请求,就创建一个线程来处理,表面看是没有问题的,但实际上存在着很严重的缺陷。服务器应用程序中经常出现的情况是请求处理的任务很简单但客户端的数目却是庞大的,这种情况下如果还是每收到一个请求就创建一个线程来处理它,服务器在创建和销毁线程所花费的时间和资源可能比处理客户端请求处理的任务花费的时间和资源更多。为了缓解服务器压力,需要解决频繁创建和销毁线程的问题。线程池可以实现这个需求。
线程池可以看做是许多线程的集合。在没有任务时线程处于空闲状态,当请求到来,线程池给这个请求分配一个空闲的线程,任务完成后回到线程池中等待下次任务。这样就实现了线程的重用。线程池会通过相应的调度策略和拒绝策略,对添加到线程池中的线程进行管理。
工作模型中一共有三种队列:正在执行的任务队列,等待被执行的阻塞队列,等待被commit进阻塞队列中的任务队列。
Java中常用的线程池有三个,最出名的当然是ThreadPoolExecutor,除此之外还有ScheduledThreadPoolExecutor、ForkJoinPool。
ThreadPoolExecutor一共有四个构造方法,其他三个构造方法都是通过上述的构造方法来实现的。毫无疑问手动配置线程池的关键就是学好构造方法中的几个参数如何设置。这几个参数对应着ThreadPoolExecutor中的几个成员属性。
corePoolSize与maximumPoolSize分别是核心池大小与最大池大小。在源码中的声明为
private volatile int corePoolSize;private volatile int maximumPoolSize;
当新任务在方法 execute(java.lang.Runnable) 中提交时,如果运行的线程少于 corePoolSize,则创建新线程来处理请求,即使其他辅助线程是空闲的。如果运行的线程多于 corePoolSize 而少于 maximumPoolSize,则仅当队列满时才创建新线程。如果设置的 corePoolSize 和 maximumPoolSize 相同,则创建了固定大小的线程池。如果将 maximumPoolSize 设置为基本的无界值(如 Integer.MAX_VALUE),则允许池适应任意数量的并发任务。在大多数情况下,核心和最大池大小仅基于构造来设置,不过也可以使用 setCorePoolSize(int) 和 setMaximumPoolSize(int) 进行动态更改。
workQueue是线程池工作模型中的阻塞队列,用于传输和保持提交的任务。在源码中的声明为private final BlockingQueue workQueue;。
keepAliveTime是池中线程空闲时的活动时间。如果池中当前有多于 corePoolSize 的线程,则这些多出的线程在空闲时间超过 keepAliveTime 时将会终止(参见 getKeepAliveTime(java.util.concurrent.TimeUnit))。这提供了当池处于非活动状态时减少资源消耗的方法。如果池后来变得更为活动,则可以创建新的线程。也可以使用方法 setKeepAliveTime(long, java.util.concurrent.TimeUnit) 动态地更改此参数。使用 Long.MAX_VALUE TimeUnit.NANOSECONDS 的值在关闭前有效地从以前的终止状态禁用空闲线程。默认情况下,保持活动策略只在有多于 corePoolSizeThreads 的线程时应用。但是只要 keepAliveTime 值非 0, allowCoreThreadTimeOut(boolean) 方法也可将此超时策略应用于核心线程。
threadFactory是一个线程集合。线程池可以使用ThreadFactory创建新线程。如果没有另外说明,则在同一个 ThreadGroup 中一律使用 Executors.defaultThreadFactory() 创建线程,并且这些线程具有相同的 NORM_PRIORITY 优先级和非守护进程状态。通过提供不同的 ThreadFactory,可以改变线程的名称、线程组、优先级、守护进程状态,等等。如果从 newThread 返回 null 时 ThreadFactory 未能创建线程,则执行程序将继续运行,但不能执行任何任务。
handler是线程池拒绝策略,RejectedExecutionHandler类型的对象。当 Executor 已经关闭,并且 Executor 将有限边界用于最大线程和工作队列容量,且已经饱和时,在方法 execute(java.lang.Runnable) 中提交的新任务将被拒绝。在以上两种情况下, execute 方法都将调用其 RejectedExecutionHandler 的 RejectedExecutionHandler.rejectedExecution(java.lang.Runnable, java.util.concurrent.ThreadPoolExecutor) 方法。下面提供了四种预定义的处理程序策略:
排队有三种通用策略:
源码已经告诉了我们线程池有几个状态。
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int CAPACITY = (1 << COUNT_BITS) - 1;
// runState is stored in the high-order bits
private static final int RUNNING = -1 << COUNT_BITS;
private static final int SHUTDOWN = 0 << COUNT_BITS;
private static final int STOP = 1 << COUNT_BITS;
private static final int TIDYING = 2 << COUNT_BITS;
private static final int TERMINATED = 3 << COUNT_BITS;
可以看出,一共有RUNNING、SHUTDOWN、STOP、TIDYING、TERMINATED五种状态。ctl对象一共32位,高3位保存线程池状态信息,后29位保存线程池容量信息。线程池的初始化状态是RUNNING,在源码中体现为private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
。
状态 | 高三位 | 工作队列workers中的任务 | 阻塞队列workQueue中的任务 | 未添加的任务 |
---|---|---|---|---|
RUNNING | 111 | 继续处理 | 继续处理 | 添加 |
SHUTDOWN | 000 | 继续处理 | 继续处理 | 不添加 |
STOP | 001 | 尝试中断 | 不处理 | 不添加 |
TIDYING | 010 | 处理完了 | 如果由SHUTDOWN - TIDYING ,那就是处理完了;如果由STOP - TIDYING ,那就是不处理 | 不添加 |
TERMINATED | 011 | 同TIDYING | 同TIDYING | 同TIDYING |
execute()分三种情况处理任务
case1:如果线程池中运行的线程数量
case3:如果以上两种case不成立,即没能将任务成功放入阻塞队列中,且addWoker新建线程失败,则该任务由当前 RejectedExecutionHandler 处理。
submit()方法是通过调用execute(Runnable)实现的。
Fork/Join框架是Java7提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。
我们再通过Fork和Join这两个单词来理解下Fork/Join框架,Fork就是把一个大任务切分为若干子任务并行的执行,Join就是合并这些子任务的执行结果,最后得到这个大任务的结果。比如计算1+2+。。+10000,可以分割成10个子任务,每个子任务分别对1000个数进行求和,最终汇总这10个子任务的结果。Fork/Join的运行流程图如下:
工作窃取(work-stealing)算法是指某个线程从其他队列里窃取任务来执行。工作窃取的运行流程图如下:
那么为什么需要使用工作窃取算法呢?假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如A线程负责处理A队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。
工作窃取算法的优点是充分利用线程进行并行计算,并减少了线程间的竞争,其缺点是在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且消耗了更多的系统资源,比如创建多个线程和多个双端队列。
我们已经很清楚Fork/Join框架的需求了,那么我们可以思考一下,如果让我们来设计一个Fork/Join框架,该如何设计?这个思考有助于你理解Fork/Join框架的设计。
第一步分割任务。首先我们需要有一个fork类来把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小。
第二步执行任务并合并结果。分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据。
Fork/Join使用两个类来完成以上两件事情:
ForkJoinTask在执行的时候可能会抛出异常,但是我们没办法在主线程里直接捕获异常,所以ForkJoinTask提供了isCompletedAbnormally()方法来检查任务是否已经抛出异常或已经被取消了,并且可以通过ForkJoinTask的getException方法获取异常。使用如下代码:
if(task.isCompletedAbnormally())
{
System.out.println(task.getException());
}
getException方法返回Throwable对象,如果任务被取消了则返回CancellationException。如果任务没有完成或者没有抛出异常则返回null。
ForkJoinPool由ForkJoinTask数组和ForkJoinWorkerThread数组组成,ForkJoinTask数组负责存放程序提交给ForkJoinPool的任务,而ForkJoinWorkerThread数组负责执行这些任务。
我们如果要用java默认的线程池来做调度器,一种选择就是Timer和TimerTask的结合。一个Timer为一个单独的线程,虽然一个Timer可以调度多个TimerTask,但是对于一个Timer来讲是串行的。多线程调度器ScheduledThreadPoolExecutor,也就是定时任务,基于多线程调度完成,当然你可以为了完成多线程使用多个Timer,只是这些Timer的管理需要你来完成,不是一个框架体系,而ScheduleThreadPoolExecutor提供了这个功能。
CompletionService接口是将生产新的异步任务与使用已完成任务的结果分离开来的服务。生产者利用submit()提交要执行的任务。使用者利用take()获取并移除已完成的任务的返回值,并按照完成这些任务的顺序处理它们的结果。
通常,CompletionService 依赖于一个单独的 Executor 来实际执行任务,在这种情况下,CompletionService 只管理一个内部完成队列。ExecutorCompletionService 类提供了此方法的一个实现。此类将那些完成时提交的任务放置在可使用take()访问的队列上。
CountDownLatch是一个通用同步器,用于同步一个或多个任务。在完成一组正在其他线程中执行的任务之前,它允许一个或多个线程一直等待。
CyclicBarrier允许一组线程互相等待,直到到达某个公共屏障点。如果你希望一组并行的任务在下个步骤之前相互等待,直到所有的任务都完成了下个步骤前的所有操作,才继续向前执行,那么CyclicBarrier很合适。
一般的锁在任意时刻只允许一个线程访问一项资源,而计数信号量允许n个任务同时访问一项资源。我们可以将信号量看做一个许可集,可以向线程分发使用资源的许可证。获得资源前,线程调用acquire()从许可集中获取许可。该线程结束后,通过release()将许可还给许可集。
配置线程池是比较复杂的工作,为了方便用户使用,Executors中为创建Executor、ExecutorService、ScheduledExecutorService、ThreadFactory和Callable对象提供了便捷的静态工厂方法。比如
Exchanger用于在线程之间传输数据。