# 在任务与执行策略之间的隐性耦合
Executror框架可以将任务的提交与任务的执行解耦开。但是虽然Executor框架为制定和修改执行策略提供了很大的灵活性,但并非所有的任务都能适用所有的执行策略。有些类型的任务需要明确地制定执行策略,其中包括:
-
依赖性任务
:大多数行为正确的任务都是独立的:它们不依赖于其他任务的执行时序、执行结果或其他效果。当在线程池中执行独立任务时,可以任意修改线程池大小和配置,这些修改只会对执行性能产生影响。如果提交给线程池的任务需要依赖于其他任务,那么隐含的对执行策略带来了约束,此时必须小心地维持这些执行策略以避免产生活跃性问题。 -
使用线程封闭机制的任务
:与线程池相比,单线程的Executor能够对并发性做出更强的承诺。它们能确保任务不会并发的执行。对象可以封闭在任务线程中,使得在该线程执行的任务在访问该对象时不需要同步。这种情况将在任务与执行策略之间形成隐性的耦合:即任务要求其执行所在的Executor是单线程的。如果将Executor从单线程环境改为线程池环境,那么将会失去线程安全。 -
对响应时间敏感
:如果将一个运行时间较长的任务提交到单线程的Executor中,或者将多个运行时间较长的任务提交到一个只包含少量线程的线程池中,那么将会降低由该Executor管理的服务性。 -
使用threadLocal的任务
:ThreadLocal使每个线程都拥有某个变量的一个私有版本。只要条件允许,Executor可以自由的重用这些线程。如果从任务中抛出一个未受检查的异常,那么将用一个新的工作者线程来替代抛出异常的线程。只有线程本地值的生命周期受限于任务的生命周期时,在线程池中的线程使用ThreadLocal才有意义,而在线程池中的线程中不应该使用ThreadLocal在任务之间传递值。
只有当任务都是同类型的并且互相独立时,线程池的性能才能达到最佳。如果运行时间较长和运行时间较短的任务混合在一起,除非线程池很大,否则很容易造成拥塞。
线程饥饿死锁
在线程池中,如果任务依赖于其他任务,那么可能产生死锁。
在单线程的Executor中,如果一个任务将另一个任务提交到同一个Executor,并且等待这个被提交任务的结果,那么通常会引发死锁。
如果所有正在执行任务的线程都由于等待其他仍处于工作队列的任务而阻塞,那么会发生同样的问题。这种现象被称为线程饥饿死锁(Thread Starvation Deadlock)
public class ThreadDeadLock{
ExecutorService exec = Executors.newSingleThreadExecutor();
public class RenderPageTask implements Callable {
public String call throws Exception {
Future header,footer;
header = exec.submit(new LoadFileTask("header.html"));
footer = exec.submit(new LoadFileTask("footer.html"));
String page = renderBody();
// 这里将发生死锁:由于当前任务在等待子任务的结果
return header.get() + page + footer.get();
}
}
}
每当提交了一个有依赖性的Executor任务时,要清晰的知道可能会出现线程“饥饿”死锁,因此需要在代码或配置Executor的配置文件中记录线程池的大小限制或配置限制。
运行时间较长的任务
如果任务阻塞时间过长,那么即便不出现死锁,任务的的响应性也很差。执行时间较长可能会造成线程池阻塞,增加执行时间较短任务的服务时间。如果线程数量远小于在稳定状态下执行时间较长任务的数量,那么到最后可能所有的线程都会运行这些执行时间较长的任务,从而影响整体的响应性。
通过限定任务等待资源的时间,不要无限制的等待,来缓解执行时间任务较长任务的影响。平台类库的大多数阻塞方法都提供了限时版本和无限时版本,例如Thread.join,BlockingQueue.put,CountDownLatch.await以及Selector.select等。如果等待超时,那么可以把任务标为失败,然后终止任务或者将任务放回队列以供随后执行。这样无论任务最终是否能执行成功,至少任务能顺利继续执行下去。不过如果线程池中总是充满被阻塞的任务,那么可能是线程池的规模过小。
设置线程池的大小
要想正确的设置线程池的大小,必须分析计算环境、资源预算和任务的特性。在部署的系统中有多少个CPU?多大的内存?任务是计算密集型、I/O密集型还是二者皆可?它们是否需要像JDBC连接这样的稀缺资源?并且如果它们之间的行为相差很大,那么应该考虑使用多个线程池,从而使每个线程池可以根据各自的工作负载来调整。
- 对于
计算密集型
的任务,在拥有N个Cpu的系统上,当线程池的大小为N+1时,通常能有最优的利用率:即使当计算密集型的线程偶尔由于页缺失故障或者其他原因暂停时,这个“额外”的线程也能保证cpu的时钟周期不会被浪费。 - 对于
包含IO操作或者其他阻塞操作
的任务,由于线程并不会一直执行,因此线程池的规模应该更大。如果要正确的设置线程池的大小,你需要估算任务的等待时间和计算时间的比值。
CPU周期并不是唯一影响线程池大小的资源,还包括内存、文件句柄、套接字句柄和数据库连接等。
配置ThreadPoolExcecutor
ThreadPoolExecutor为一些Executor提供了基本的实现,这些Executor是由Executors中的newCachedThreadPool
、newFixedThreadPool
等工厂方法返回的。ThreadPoolExecutor是一个灵活的,稳定的线程池,且支持各种定制。
如果默认的构造函数不能满足需求,那么可以通过ThreadPoolExecutor的构造函数,并且根据自己的需求来定制。ThreadPoolExecutor定义了很多构造函数。
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue workQueue,
RejectedExecutionHandler handler) {
this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue,
Executors.defaultThreadFactory(), handler);
}
线程的创建和销毁
线程池的基本大小(corePoolSize)
、最大大小(maximumPoolSize)
、存活时间
等因素共同负责线程的创建与销毁。
-
基本大小就是线程池的目标大小,即
没有执行任务时
线程池的大小。创建ThreadPoolExecutor的初期,线程并不会立即启动,而是等到有任务提交时才启动,除非调用prestartAllCoreThread)
- 最大大小表示可同时活动的线程数量的上限,如果某个线程的空闲时间超出了存活时间,那么则会被标记为可回收的,当线程池大小超过了基本大小时,那么这个线程将被终止。
通过调节线程池的基本大小和存活时间,可以帮助线程池回收空闲线程占有的资源(回收线程时会产生额外的延迟,因为当需求增加时,必须创建新的线程来满足需求)。
- newFixedThreadPool工厂方法将线程池的基本大小和最大大小设置为参数中指定的值,然后创建的线程不会超时。
- newCachedThreadPool工厂方法将线程池最大的大小设置为
Integer.MAX_VALUE
,而基本大小设置为0,超时时间设置为1分钟,这样创建出来的线程可以被无限扩展,当需求降低的时候自动收缩。
管理队列任务
在有限的线程池中限制可并发执行的任务数量(单线程的Executor是一种特例:它们能确保不会有任务并发执行,因为它们通过线程封闭来实现线程安全性。)
如果无限制的创建线程,那么将导致系统的不稳定性,并且通过固定大小的线程池(而不是收到一个请求就创建一个线程)来解决这样的问题。然而这个方案并不完整。在高负载的情况下,应用程序仍可能耗尽资源。如果新请求的到达速率超过了线程池的处理速率,那么新来的请求将累积起来。在线程池中,这些请求会在一个由Executor管理的Runnable队列中等待,而不会像线程那样去竞争CPU资源。通过一个Runnable和一个链表节点来表示一个等待中的任务,当然比用线程来表示开销低很多。但是如果客户提交给服务器请求的速率超过了服务器的处理速度,那么资源仍可能被耗尽。
即使请求到达的速率很稳定,也有可能出现请求突增的情况。尽管队列有足浴缓解任务的突增问题,但是如果任务持续高速的到来,那么最终还是会抑制请求的到达率以避免耗尽内存,甚至在耗尽内存之前,响应性能也随着任务队列的增长而越来越糟。
ThreadPoolExecutor允许提供一个BlockingQueue
来保存等待执行的任务。基本的任务排列方法有3种:
- 无界队列
- 有界队列
- 同步移交(Synchronous Handoff)
队列的选择与其他配置参数有关,例如线程池的大小等。
newFixedThreadPool和newSingleThreadExecutor在默认情况下将使用一个无界的LinkedBlockingQueue。如果所有线程都处于忙碌,那么任务将在队列中等待,如果任务快速的到达,超过了cpu处理任务的速度,那么队列将无限制的增加。
更稳妥的策略是使用有界队列,例如ArrayBlockingQueue、有界的LinkedBlockingQueue、PriorityBlockingQueue等。有界队列可以避免资源耗尽。但是带来了一个新问题:当队列填满以后该怎么办?(饱和策略可以解决这个问题)。在使用有界的工作队列时,队列的大小与线程池的大小必须一起调节:
- 如果线程池小而队列较大,那么有助于减少内存的使用量,降低CPU的使用率,同时可以减少上下文切换,但是代价就是可能会限制吞吐量。
对于非常大的或者无界的线程池,可以通过使用SynchronousQueue来避免任务排队,以及直接将任务从生产者移交给工作者线程。SynchronousQueue并不是一个真正的队列,而是一种在线程间进行移交的机制。要将一个元素放入SynchronousQueue中,必须有另一个线程正在等待接收这个元素。如果没有线程正在等待,并且线程池的当前大小小于最大值,那么ThreadPoolExecutor将会创建一个新的线程。否则根据饱和策略,这个任务将被拒绝。
使用直接移交将更加高效,因为任务会直接交给执行它的线程,而不是被首先放入队列里,然后由工作线程从队列中提取任务。只有当线程池是无界的或者是可以拒绝的时候,SynchronousQueue才有实际价值。在newCachedThreadPool中就使用了SynchronousQueue。
当使用像LinkedBlockingQueue
或ArrayBlockingQueue
这样的FIFO队列,任务的执行顺序和它们的到达顺序相同,如果想进一步控制任务的执行顺序,可以使用PriorityBlockingQueue
,内容根据自然顺序或者Comparable定义。
对于Executor,newCachedThreadPool工厂方法是一种很好的默认选择,它能提供比固定大小更好的排队性能(由于使用了SynchronousQueue而不是LinkedBlockingQueue),当需要限制当前任务的数量以满足资源管理器需求时,可以选择固定大小的线程池,避免过载问题。
饱和策略
当有界队列被填满后,饱和策略开始发挥作用。
ThreadPoolExecutor的饱和策略可以通过调用setRejectedExecutionHandle
来修改。如果某个任务被提交到已经关闭的Executor时,也会触发饱和策略。
JDK提供了几种不同的RejectedExecutionHandle
实现,每种实现都包含不同的策略:
-
AbortPolicy
:中止策略,是默认的饱和策略。该策略将会抛出未检查的RejectedExecutionException
,调用者可以捕获这个异常,然后根据需求来编写自己的处理代码。 -
DiscardPolicy
:抛弃策略,会悄悄的抛弃该任务。 -
DiscardOldestPolicy
:抛弃最旧的策略,会抛弃下一个将被执行的任务,然后尝试提交当前任务。(如果是优先队列,则会抛弃优先级最高的任务,因此不要将DiscardOldestPolicy和优先队列一起使用) -
CallerRunsPolicy
:调用者运行策略,实现了一种调节机制,既不会抛弃任务,也不会抛出异常,而是将某些任务回退给调用者,从而降低新任务的流量。它不会在线程池的某个线程中执行新提交的任务,而是在一个调用了execute的线程中执行该任务。当线程池中的所有线程都被占用,并且工作队列被填满的时候,下一个任务会在调用execute时在主线执行。由于执行需要一定时间,因此主线至少在一段时间内不能提交任何任务,从而使得工作者线程有时间来处理完正在执行的任务。在这期间,主线程不会调用accept,因此请求将会被保存到TCP层的队列中而不是在应用程序的队列中,如果持续过载,TCP层最终发现它的请求队列被填满,因此同样会开始抛弃请求。从线程池 -> 工作队列 -> 应用程序 -> TCP层,最终到达客户端,这种策略能够实现一种平缓的性能降低。
/**
* 创建一个固定大小的线程池,同时使用“调用者运行”的饱和策略
*/
ThreadPoolExecutor executor = new ThreadPoolExecutor(N_THREADS, N_THREADS, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue(CAPACITY));
executor.setRejectedExecutionHandle(new ThreadPoolExecutor.CallerRunsPolicy);
当工作队列被填满后,没有预定义的饱和策略来阻塞execute。可以通过使用Semaphore信号量来限制任务的到达率。
线程工厂
每当线程池需要创建一个线程时,都是通过线程工厂方法来完成的。默认的线程工厂方法将创建一个新的、非守护的线程。ThreadFactory
接口只定义了一个方法Thread new Thread(Runnable r)
,每当线程池需要创建一个新线程时都会调用这个方法。如果在应用程序中需要利用安全策略来控制对某些特殊代码库的访问权限,那么可以通过Executors中的privilegedThreadFactory
工厂来定制自己的线程工厂。通过这样的方式创建出来的线程,将于privilegedThreadFactory拥有同样的访问权限。如果不使用privilegedThreadFactory
,线程池创建的线程将从在需要更新线程时调用execute或submit的客户端程序中继承访问权限,从而导致一些令人困惑的安全问题。
在调用构造函数后再定制ThreadPoolExecutor
在调用完成ThreadPoolExecutor的构造函数之后,仍然可以设置大多数传递给它的构造函数的参数。如果Executor是通过Executors中的某个(newSingleThreadExecutor除外)工厂方法创建的,那么可以将结果的类型转化为ThreadPoolExecutor。
ExecutorService exec = Executors.newCachedThreadPool();
if(exec instanceof ThreadPoolExecutor){
((ThreadPoolExecutor) exec).setCorePool(10);
}else {
throw new AssertionError("Oops,bad assumpion");
}
在Executors中包含一个unconfigurableExecutorService
工厂方法,该方法可以对ExecutorService进行包装,如果你将ExecutorService暴露给不信任的代码,又不期望其被修改,就可以通过unconfigurableExecutorService来包装它。
拓展ThreadPoolExecutor
ThreadPoolExecutor是可拓展的,它提供了几个可以在子类化中改写的方法:
- beforeExecute
- afterExecute
- terminated
这几个方法有利于拓展ThreadPoolExecutor的行为。在执行任务的线程池中将调用beforeExecute和afterExecute方法,以便与添加日志,计时。无论是从run中正常返回,还是抛出一个异常而返回,afterExcute都会被调用,如果beforeExecute抛出一个RuntimeException,那么任务将不被执行,afterExecute也不被调用。
在线程池关闭操作时执行terminated,可以用来释放Executor在其生命周期里分配的各种资源,还可以发送通知,记录日志等。
递归算法的并行化
如果循环中的迭代操作都是独立的,并且不需要等待所有的迭代操作都完成再继续执行,那么就可以使用Executor将串行方法转化为并行循环。
void processSequentially(List elements){
for(Element e : elements){
process(e);
}
}
void processInparallet(Executor exec, List elements){
for(final Element e : elements){
exec.excute(new Runnable(){
public void run(){
process(e);
};
});
}
}
调用processInparallet比processSequentially能更好的返回,因为一当列表中的任务提交完成,就会立即返回,而不会等待这些任务执行完成。
在每个迭代中都不需要来自后续递归迭代的结果
public void sequentialRecursive(List> nodes, Collection results){
for(Node n : nodes){
results.add(n.compute());
sequentialRecursive(n.getChildren(), results);
}
}
public void parallelRecursive(final Executor exec, List> nodes, final Collection results){
for(final Node n : nodes){
exec.execute(new Runnbale(){
public void run(){
results.add(n.compute());
}
});
parallelRecursive(exec, n.getChildren(), results);
}
}
当parallelRecursive返回的时候,树中的各个节点都已经访问过了(遍历过程仍是串行,compute()调用才是并行),并且每个节点的计算任务也已经放入了Executor的工作队列。
小结
对于并发执行的任务,Executor框架是一种强大且灵活的框架。它提供了大量可调节的选项,例如创建线程和关闭线程的策略,处理队列任务的策略,处理过多任务的策略,并且提供了几个钩子方法来拓展它的行为。当然,其中有些参数不能很好的工作,某些类型的任务需要特定的执行策略,而一些参数组合可能会产生想象之外的结果。