–> go to 总目录
在HotSpot
VM
的线程模型中,Java
线程(java
.lang
.Thread
)被一对一映射为本操作系统线程。Java
线程启动时会创建一个本地操作系统线程;当该Java
线程终止时,这个操作系统线程也会被回收。操作系统会调度所有线程并将它们分配给可用的CPU
。
在上层,Java
多线程程序通常把应用分解为若干个任务,然后使用用户级的调度器(Executor
框架)将这些任务映射为固定数量的线程;在底层,操作系统内核将这些线程映射到硬件处理器上。这种两级调度模型的示意图如图10-1所示。
从图中可以看出,应用程序通过Executor
框架控制上层的调度;而下层的调度由操作系统内核控制,下层的调度不受应用程序的控制。
Executor
框架主要由3大部分组成如下。
Executor
是一个接口,它是Executor
框架的基础,它将任务的提交与任务的执行分离开来ThreadPoolExecutor
是线程池的核心实现类,用来执行被提交的任务。ScheduledThreadPoolExecutor
是一个实现类,可以在给定的延迟后运行命令,或者定期执ScheduledThreadPoolExecutor
比Timer
更灵活,功能更强大。Future
接口和实现Future
接口的FutureTask
类,代表异步计算的结果。Runnable
接口和Callable
接口的实现类,都可以被ThreadPoolExecutor
或ScheduledThreadPoolExecutor
执行Runnable
或者Callable
接口的任务对象。工具类Executors
可以把一个Runnable
对象封装为一个Callable
对象(Executors
.callable
(Runnable``task
)或Executors
.callable
(Runnable
task
,Object
resule
))。Runnable
对象直接交给ExecutorService
执行(ExecutorService
.execute
(Runnable``command
));或者也可以把Runnable
对象或Callable
对象提交给ExecutorService
执(ExecutorService
.submit
(Runnable
task
)或ExecutorService
.submit
(Callable
<T
>task
))。ExecutorService
.submit
(…),ExecutorService
将返回一个实现Future
接口的对象(到目前为止的JDK
中,返回的是FutureTask
对象)。由于FutureTask
实现了Runnable
,程序员也可以创建FutureTask
,然后直接交给ExecutorService
执行。FutureTask
.get
()方法来等待任务执行完成。主线程也可以执行FutureTask
.cancel
(boolean
mayInterruptIfRunning
)来取消此任务的执行。Executor
框架最核心的类是ThreadPoolExecutor
,它是线程池的实现类,主要由下列4个组件构成。
corePool
:核心线程池的大小。maximumPool
:最大线程池的大小。BlockingQueue
:用来暂时保存任务的工作队列。RejectedExecutionHandler
:拒绝处理、当ThreadPoolExecutor
已经关闭或ThreadPoolExecutor
已经饱和时(达到了最大线程池大小且工作队列已满),execute()
方法将要调用的Handler
。ThreadPoolExecutor通常使用工厂类Executors
来创建。Executors
可以创建3种类型的
ThreadPoolExecutor
:SingleThreadExecutor
、FixedThreadPool
和CachedThreadPool
。
FixedThreadPool
适用于为了满足资源管理的需求,而需要限制当前线程数量的应用场景,它适用于负载比较重的服务器。
下面是Executors
提供的,创建使用固定线程数的FixedThreadPool
的API
。
public static ExecutorService newFixedThreadPool(int nThreads)
public static ExecutorService newFixedThreadPool(int nThreads,ThreadFactorythreadFactory)
FixedThreadPool
被称为可重用固定线程数的线程池。下面是FixedThreadPool
的源代码实现。
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue());
}
FixedThreadPool
的corePoolSize
和maximumPoolSize
都被设置为创建FixedThreadPool
时指定的参数nThreads
。
当线程池中的线程数大于corePoolSize
时,keepAliveTime
为多余的空闲线程等待新任务的最长时间,超过这个时间后多余的线程将被终止。这里把keepAliveTime
设置为0L
,意味着多余的空闲线程会被立即终止。
FixedThreadPool
的execute()
方法的运行示意图如图10-4所示。
corePoolSize
,则创建新线程来执行任务。corePoolSize
),将任务加入LinkedBlockingQueue
。LinkedBlockingQueue
获取任务来执行。FixedThreadPool
使用无界队列LinkedBlockingQueue
作为线程池的工作队列(队列的容量为Integer
.MAX
_VALUE
)。使用无界队列作为工作队列会对线程池带来如下影响。
1)当线程池中的线程数达到corePoolSize
后,新任务将在无界队列中等待,因此线程池中
的线程数不会超过corePoolSize
。
2)由于1,使用无界队列时maximumPoolSize
将是一个无效参数。
3)由于1和2,使用无界队列时keepAliveTime
将是一个无效参数。
4)由于使用无界队列,运行中的FixedThreadPool
(未执行方法shutdown()
或shutdownNow()
)不会拒绝任务(不会调用RejectedExecutionHandler
.rejectedExecution
方法)。
SingleThreadExecutor
适用于需要保证顺序地执行各个任务;并且在任意时间点,不会有多个线程是活动的应用场景。
下面是Executors
提供的,创建使用单个线程的SingleThreadExecutor
的API
。
public static ExecutorService newSingleThreadExecutor()
public static ExecutorService newSingleThreadExecutor(ThreadFactory threadFactory)
SingleThreadExecutor
是使用单个worker
线程的Executor
。下面是SingleThreadExecutor
的源代码实现。
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService(new ThreadPoolExecutor(1, 1,0L, TimeUnit.MILLISECONDS,new LinkedBlockingQueue()));
}
SingleThreadExecutor
的corePoolSize
和maximumPoolSize
被设置为1。其他参数与
FixedThreadPool
相同。SingleThreadExecutor
使用无界队列LinkedBlockingQueue
作为线程池的工作队列(队列的容量为Integer.MAX_VALUE
)。SingleThreadExecutor
使用无界队列作为工作队列对线程池带来的影响与FixedThreadPool
相同,这里就不赘述了。
SingleThreadExecutor
的运行示意图如图10-5所示。
1)如果当前运行的线程数少于corePoolSize
(即线程池中无运行的线程),则创建一个新线程来执行任务。
2)在线程池完成预热之后(当前线程池中有一个运行的线程),将任务加入LinkedBlockingQueue
。
3)线程执行完1中的任务后,会在一个无限循环中反复从LinkedBlockingQueue
获取任务来执行。
CachedThreadPool
是大小无界的线程池,适用于执行很多的短期异步任务的小程序,或者是负载较轻的服务器。
下面是Executors
提供的,创建一个会根据需要创建新线程的CachedThreadPool
的API
。
public static ExecutorService newCachedThreadPool()
public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory)
CachedThreadPool
是一个会根据需要创建新线程的线程池。下面是创建CachedThreadPool的源代码。
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue());
}
CachedThreadPool
的corePoolSize
被设置为0,即corePool
为空;maximumPoolSize
被设置为Integer.MAX_VALUE
,即maximumPool
是无界的。这里把keepAliveTime
设置为60L,意味着CachedThreadPool
中的空闲线程等待新任务的最长时间为60秒,空闲线程超过60秒后将会被
终止。
FixedThreadPool
和SingleThreadExecutor
使用无界队列LinkedBlockingQueue
作为线程池的工作队列。CachedThreadPool
使用没有容量的SynchronousQueue
作为线程池的工作队列,但CachedThreadPool
的maximumPool
是无界的。这意味着,如果主线程提交任务的速度高于maximumPool
中线程处理任务的速度时,CachedThreadPool
会不断创建新线程。极端情况下,CachedThreadPool
会因为创建过多线程而耗尽CPU
和内存资源。
CachedThreadPool
的execute()
方法的执行示意图如图10-6所示。
SynchronousQueue
.offer
(Runnable
task
)。如果当前maximumPool
中有空闲线程正在执行SynchronousQueue
.poll
(keepAliveTime
,TimeUnit
.NANOSECONDS
),那么主线程执行offer
操作与空闲线程执行的poll
操作配对成功,主线程把任务交给空闲线程执行,execute()
方法执行完成;否则执行下面的步骤2)。maximumPool
为空,或者maximumPool
中当前没有空闲线程时,将没有线程执行SynchronousQueue
.poll
(keepAliveTime
,TimeUnit
.NANOSECONDS
)。这种情况下,步骤1)将失败。此时CachedThreadPool
会创建一个新线程执行任务,execute()
方法执行完成。SynchronousQueue
.poll
(keepAliveTime
,TimeUnit
.NANOSECONDS
)。这个poll
操作会让空闲线程最多在SynchronousQueue
中等待60秒钟。如果60秒钟内主线程提交了一个新任务(主线程执行步骤1)),那么这个空闲线程将执行主线程提交的新任务;否则,这个空闲线程将终止。由于空闲60秒的空闲线程会被终止,因此长时间保持空闲的CachedThreadPool
不会使用任何资源。前面提到过,SynchronousQueue
是一个没有容量的阻塞队列。每个插入操作必须等待另一CachedThreadPool
使用SynchronousQueue
,把主线程提交的任务传递给空闲线程执行。CachedThreadPool
中任务传递的示意图如图10-7所示。ScheduledThreadPoolExecutor
继承自ThreadPoolExecutor
。它主要用来在给定的延迟之后运行任务,或者定期执行任务。ScheduledThreadPoolExecutor
的功能与Timer
类似,ScheduledThreadPoolExecutor
功能更强大、更灵活。Timer
对应的是单个后台线程,ScheduledThreadPoolExecutor
可以在构造函数中指定多个对应的后台线程数
ScheduledThreadPoolExecutor
通常使用工厂类Executors
来创建。Executors
可以创建2种类型的ScheduledThreadPoolExecutor
,如下。
ScheduledThreadPoolExecutor
。包含若干个线程的ScheduledThreadPoolExecutor
。SingleThreadScheduledExecutor
。只包含一个线程的ScheduledThreadPoolExecutor
。
ScheduledThreadPoolExecutor
适用于需要多个后台线程执行周期任务,同时为了满足资源
管理的需求而需要限制后台线程的数量的应用场景。下面是Executors
提供的,创建单个线程
的SingleThreadScheduledExecutor
的API
。
下面是工厂类Executors
提供的,创建固定个数线程的ScheduledThreadPoolExecutor
的API
。
public static ExecutorService newFixedThreadPool(int nThreads)
public static ExecutorService newFixedThreadPool(int nThreads,ThreadFactorythreadFacto)
ScheduledThreadPoolExecutor
的执行示意图
DelayQueue
是一个无界队列,所以ThreadPoolExecutor
的maximumPoolSize
在ScheduledThreadPoolExecutor
中没有什么意义(设置maximumPoolSize
的大小没有什么效果)。ScheduledThreadPoolExecutor
的执行主要分为两大部分。
1)当调用ScheduledThreadPoolExecutor
的scheduleAtFixedRate()
方法或者scheduleWithFixedDelay()
方法时,会向ScheduledThreadPoolExecutor
的DelayQueue
添加一个实现了RunnableScheduledFutur
接口的ScheduledFutureTask
。
2)线程池中的线程从DelayQueue
中获取ScheduledFutureTask
,然后执行任务。
ScheduledThreadPoolExecutor为了实现周期性的执行任务,对ThreadPoolExecutor做了如下
的修改。
- 使用DelayQueue作为任务队列。
- 获取任务的方式不同(后文会说明)。
- 执行周期任务后,增加了额外的处理(后文会说明)
前面我们提到过,ScheduledThreadPoolExecutor
会把待调度的任(ScheduledFutureTask
)
放到一个DelayQueue
中。
ScheduledFutureTask
主要包含3个成员变量,如下。
long
型成员变量time
,表示这个任务将要被执行的具体时间。long
型成员变量sequenceNumber
,表示这个任务被添加ScheduledThreadPoolExecutor
中的序号。long
型成员变量period
,表示任务执行的间隔周期。DelayQueue
封装了一个PriorityQueue
,这个PriorityQueue
会对队列中的ScheduledFutureTask
进行排序。排序时,time
小的排在前面(时间早的任务将被先执行)。如果两个ScheduledFutureTask
的time
相同,就比较sequenceNumber
,sequenceNumber
小的排在前面(也就是说,如果两个任务的执行时间相同,那么先提交的任务将被先执行)。首先,让我们看看ScheduledThreadPoolExecutor
中的线程执行周期任务的过程。图10-9是ScheduledThreadPoolExecutor
中的线程1执行某个周期任务的4个步骤。
下面是对这4个步骤的说明。
1)线程1从DelayQueue
中获取已到期ScheduledFutureTask
(DelayQueue
.take()
)。到期任务是指ScheduledFutureTask
的time
大于等于当前时间。
2)线程1执行这个ScheduledFutureTask
。
3)线程1修改ScheduledFutureTask
的time
变量为下次将要被执行的时间。
4)线程1把这个修改time
之后的ScheduledFutureTask
放回DelayQueue
(DelayQueue
.add()
)。
接下来,让我们看看上面的步骤1)获取任务的过程。下面是DelayQueue
.take()
方法的源代码实现。
public E take() throws InterruptedException {
final ReentrantLock lock = this.lock;
lock.lockInterruptibly(); // 1
try {
for (;;) {
E first = q.peek();
if (first == null) {
available.await(); // 2.1
} else {
long delay = first.getDelay(TimeUnit.NANOSECONDS);
if (delay > 0) {
long tl = available.awaitNanos(delay); // 2.2
} else {
E x = q.poll(); // 2.3.1
assert x != null;
if (q.size() != 0)
available.signalAll(); // 2.3.2
return x;
}
}
}
} finally {
lock.unlock(); // 3
}
}
图10-10是DelayQueue.take()的执行示意图。
如图所示,获取任务分为3大步骤。
1)获取Lock
。
2)获取周期任务。
PriorityQueue
为空,当前线程到Condition
中等待;否则执行下面的2.2。PriorityQueue
的头元素的time
时间比当前时间大,到Condition
中等待到time
时间;否PriorityQueue
的头元素(2.3.1);如果PriorityQueue
不为空,则唤醒在Condition
中等待的所有线程(2.3.2)。3)释放Lock
。
ScheduledThreadPoolExecutor
在一个循环中执行步骤2,直到线程从PriorityQueue
获取到一个元素之后(执行2.3.1之后),才会退出无限循环(结束步骤2)。
最后,让我们看看ScheduledThreadPoolExecutor
中的线程执行任务的步骤4,把ScheduledFutureTask
放入DelayQueue
中的过程。下面是DelayQueue
.add()
的源代码实现。
public boolean offer(E e) {
final ReentrantLock lock = this.lock;
lock.lock(); // 1
try {
E first = q.peek();
q.offer(e); // 2.1
if (first == null || e.compareTo(first) < 0)
available.signalAll(); // 2.2
return true;
} finally {
lock.unlock(); // 3
}
}
图10-11是DelayQueue.add()的执行示意图。
如图所示,添加任务分为3大步骤。
1)获取Lock
。
2)添加任务。
PriorityQueue
添加任务。PriorityQueue
的头元素,唤醒在Conditio
n中等待的所有线
SingleThreadScheduledExecutor
适用于需要单个后台线程执行周期任务,同时需要保证顺
序地执行各个任务的应用场景。
SingleThreadExecutor
。下面是Executors
提供的,创建使用单个线程的SingleThreadExecutor
的API
。
public static ScheduledExecutorService newSingleThreadScheduledExecutor()
public static ScheduledExecutorService newSingleThreadScheduledExecutor
(ThreadFactory threadFactory)
Future
接口和实现Future
接口的FutureTask
类用来表示异步计算的结果。当我们把Runnable
接口或Callable
接口的实现类提交(submit
)给ThreadPoolExecutor
或ScheduledThreadPoolExecutor
时,ThreadPoolExecutor
或ScheduledThreadPoolExecutor
会向我们返回一个FutureTask
对象。下面是对应的API
。
Future submit(Callable task)
Future submit(Runnable task, T result)
Future<> submit(Runnable task)
有一点需要读者注意,到目前最新的JDK
8为止,Java
通过上述API
返回的是一个FutureTask
对象。但从API
可以看到,Java
仅仅保证返回的是一个实现了Future
接口的对象。在将来的JDK
实现中,返回的可能不一定是FutureTask
。
FutureTask
除了实现Future
接口外,还实现了Runnable
接口。因此,FutureTask
可以交给Executor
执行,也可以由调用线程直接执行(FutureTask
.run()
)。根据FutureTask
.run()
方法被执行的时机,FutureTask
可以处于下面3种状态。
1)未启动。FutureTask
.run()
方法还没有被执行之前,FutureTask
处于未启动状态。当创建一个FutureTask
,且没有执行FutureTask
.run()
方法之前,这个FutureTask
处于未启动状态。
2)已启动。FutureTask
.run()
方法被执行的过程中,FutureTask
处于已启动状态。
3)已完成。FutureTask
.run()
方法执行完后正常结束,或被取消(FutureTask
.cancel
(…)),或执行FutureTask
.run()
方法时抛出异常而异常结束,FutureTask
处于已完成状态。图10-12是FutureTask
的状态迁移的示意图。
当FutureTask
处于未启动或已启动状态时,执行FutureTask
.get()
方法将导致调用线程阻塞;
当FutureTask
处于已完成状态时,执行FutureTask
.get()
方法将导致调用线程立即返回结果或抛出异常。
当FutureTask
处于未启动状态时,执行FutureTask
.cancel()
方法将导致此任务永远不会被执行;当FutureTask
处于已启动状态时,执行FutureTask
.cancel
(true
)方法将以中断执行此任务线程的方式来试图停止任务;当FutureTask
处于已启动状态时,执FutureTask
.cancel
(false
)方法将不会对正在执行此任务的线程产生影响(让正在执行的任务运行完成);当FutureTask
处于已完成状态时,执行FutureTask
.cancel
(…)方法将返回false
。
图10-13是get
方法和cancel
方法的执行示意图。
可以把FutureTask
交给Executor
执行;也可以通过ExecutorService
.submit
(…)方法返回一个FutureTask
,然后执行FutureTask
.get()
方法或FutureTask
.cancel
(…)方法。除此以外,还可以单独使用FutureTask
。
当一个线程需要等待另一个线程把某个任务执行完后它才能继续执行,此时可以使用FutureTask
。假设有多个线程执行若干任务,每个任务最多只能被执行一次。当多个线程试图同时执行同一个任务时,只允许一个线程执行任务,其他线程需要等待这个任务执行完后才能继续执行。下面是对应的示例代码。
private final ConcurrentMap
这个可以耐心看下,大概就是map中放置运行的任务。循环时获取执行任务的结果或生成新任务并放入到map中去执行
上述代码的执行示意图如图10-14所示。
当两个线程试图同时执行同一个任务时,如果Thread 1执行1.3后Thread 2执行2.1,那么接下来Thread 2将在2.2等待,直到Thread 1执行完1.4后Thread 2才能从2.2(FutureTask.get())返回。
FutureTask
的实现基于AbstractQueuedSynchronizer
(以下简称为AQS
)。java
.util
.concurrent
中的很多可阻塞类(比如ReentrantLock
)都是基于AQS
来实现的。AQS
是一个同步框架,它提供通用机制来原子性管理同步状态、阻塞和唤醒线程,以及维护被阻塞线程的队列。JDK
6中AQS
被广泛使用,基于AQS
实现的同步器包括:ReentrantLock
、Semaphore
、ReentrantReadWriteLock
、CountDownLatch
和FutureTask
。
每一个基于AQS
实现的同步器都会包含两种类型的操作,如下。
acquire
操作。这个操作阻塞调用线程,除非/直到AQS
的状态允许这个线程继续FutureTask
的acquire
操作为get()
/get
(long
timeout
,TimeUnit
unit
)方法调用。release
操作。这个操作改变AQS
的状态,改变后的状态可允许一个或多个阻塞线程被解除阻塞。FutureTask
的release
操作包括run()
方法和cancel
(…)方法。基于“复合优先于继承”的原则,FutureTask
声明了一个内部私有的继承于AQS
的子类
、Sync
,对FutureTask
所有公有方法的调用都会委托给这个内部子类。
AQS
被作为“模板方法模式”的基础类提供给FutureTask
的内部子类Sync
,这个内部子类只需要实现状态检查和状态更新的方法即可,这些方法将控制FutureTask
的获取和释放操作。具体来说Sync
,实现了AQS
的tryAcquireShared
(int
)方法和tryReleaseShared
(int
)方法,Sync
通过这两个方法来检查和更新同步状态。
FutureTask的设计示意图如图10-15所示。
如图所示,Sync
是FutureTask
的内部私有类,它继承自AQS
。创建FutureTask
时会创建内部
私有的成员对象Sync
,FutureTask
所有的的公有方法都直接委托给了内部私有的Sync
。
FutureTask
.get()
方法会调用AQS
.acquireSharedInterruptibly
(int
arg
)方法,这个方法的执行
过程如下。
1)调用AQS
.acquireSharedInterruptibly
(int
arg
)方法,这个方法首先会回调在子类Sync
中实
现的tryAcquireShared()
方法来判断acquire
操作是否可以成功。acquire
操作可以成功的条件为:
state
为执行完成状态RAN
或已取消状态CANCELLED
,且runner
不为null
。
2)如果成功则get()
方法立即返回。如果失败则到线程等待队列中去等待其他线程执行,release
操作。
3)当其他线程执行release
操作(比如FutureTask
.run()
或FutureTask
.cancel
(…))唤醒当前线
程后,当前线程再次执行tryAcquireShared()
将返回正值1,当前线程将离开线程等待队列并唤醒它的后继线程(这里会产生级联唤醒的效果,后面会介绍)。
4)最后返回计算的结果或抛出异常。
FutureTask.run() 的执行过程如下。
1)执行在构造函数中指定的任务(Callable
.call()
)。
2)以原子方式来更新同步状态(调用AQS
.compareAndSetState
(int
expect
,int
update
),设置
state
为执行完成状态RAN
)。如果这个原子操作成功,就设置代表计算结果的变量result
的值为
Callable
.call()
的返回值,然后调用AQS
.releaseShared
(int
arg
)。
3)AQS
.releaseShared
(int
arg
)首先会回调在子类Sync
中实现的tryReleaseShared
(arg
)来执
行release
操作(设置运行任务的线程runner
为null
,然会返回true
);AQS
.releaseShared
(int
arg
),然后唤醒线程等待队列中的第一个线程。
4)调用FutureTask
.done()
。
当执行FutureTask
.get()
方法时,如果FutureTask
不是处于执行完成状态RAN
或已取消状态CANCELLED
,当前执行线程将到AQS
的线程等待队列中等待(见下图的线程A
、B
、C
和D
)。当某个线程执行FutureTask
.run()
方法或FutureTask
.cancel
(…)方法时,会唤醒线程等待队列的第一个线程(见图10-16所示的线程E
唤醒线程A
)。
假设开始时FutureTask
处于未启动状态或已启动状态,等待队列中已经有3个线程(A
、B
和
C
)在等待。此时,线程D
执行get()
方法将导致线程D
也到等待队列中去等待。
当线程E
执行run()
方法时,会唤醒队列中的第一个线程A
。线程A
被唤醒后,首先把自己从
队列中删除,然后唤醒它的后继线程B
,最后线程A
从get()
方法返回。线程B
、C
和D
重复A
线程的处理流程。最终,在队列中等待的所有线程都被级联唤醒并从get()
方法返回。
Runnable
接口和Callable
接口的实现类,都可以被ThreadPoolExecutor
或ScheduledThreadPoolExecutor
执行。它们之间的区别是Runnable
不会返回结果,而Callable
可以返回结果。
除了可以自己创建实现Callable
接口的对象外,还可以使用工厂类Executors
来把一个Runnable
包装成一个Callable
。
下面是Executors
提供的,把一个Runnable
包装成一个Callable
的API
。
public static Callable callable(Runnable task) // 假设返回对象Callable1
下面是Executors
提供的,把一个Runnable
和一个待返回的结果包装成一个Callable的API
。
public static Callable callable(Runnable task, T result) // 假设返回对象Callable2
前面讲过,当我们把一个Callable
对象(比如上面的Callable1
或Callable2
)提交给ThreadPoolExecutor
或ScheduledThreadPoolExecutor
执行时,submit
(…)会向我们返回一个FutureTask
对象。我们可以执行FutureTask
.get()
方法来等待任务执行完成。当任务成功完成后FutureTask.get()
将返回该任务的结果。例如,如果提交的是对象Callable1
,FutureTask.get()
方法将返回null
;如果提交的是对象Callable2
,FutureTask.get()
方法将返回result
对象。
1)线程池判断核心线程池里的线程是否都在执行任务。如果不是,则创建一个新的工作
线程来执行任务。如果核心线程池里的线程都在执行任务,则进入下个流程。
2)线程池判断工作队列是否已经满。如果工作队列没有满,则将新提交的任务存储在这
个工作队列里。如果工作队列满了,则进入下个流程。
3)线程池判断线程池的线程是否都处于工作状态。如果没有,则创建一个新的工作线程
来执行任务。如果已经满了,则交给饱和策略来处理这个任务。
线程池只执行execute分四种情况
1)如果当前运行的线程少于corePoolSize
,则创建新线程来执行任务(注意,执行这一步骤
需要获取全局锁)。
2)如果运行的线程等于或多于corePoolSize
,则将任务加入BlockingQueue
。
3)如果无法将任务加入BlockingQueue
(队列已满),则创建新的线程来处理任务(注意,执
行这一步骤需要获取全局锁)。
4)如果创建新线程将使当前运行的线程超出maximumPoolSize
,任务将被拒绝,并调用
RejectedExecutionHandler.rejectedExecution()
方法。
ThreadPoolExecutor
采取上述步骤的总体设计思路,是为了在执行execute()
方法时,尽可能
地避免获取全局锁(那将会是一个严重的可伸缩瓶颈)。在ThreadPoolExecutor
完成预热之后(当前运行的线程数大于等于corePoolSize
),几乎所有的execute()方法调用都是执行步骤2,而步骤2不需要获取全局锁。
我们可以通过ThreadPoolExecutor来创建一个线程池。
new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime,
milliseconds,runnableTaskQueue, handler);
创建一个线程池时需要输入几个参数,如下。
1)corePoolSize
(线程池的基本大小):当提交一个任务到线程池时,线程池会创建一个线程来执行任务,即使其他空闲的基本线程能够执行新任务也会创建线程,等到需要执行的任务数大于线程池基本大小时就不再创建。如果调用了线程池的prestartAllCoreThreads()
方法,线程池会提前创建并启动所有基本线程。
2)runnableTaskQueue
(任务队列):用于保存等待执行的任务的阻塞队列。可以选择以下几个阻塞队列。
ArrayBlockingQueue
:是一个基于数组结构的有界阻塞队列,此队列按FIFO
(先进先出)原LinkedBlockingQueue
:一个基于链表结构的阻塞队列,此队列按FIFO
排序元素,吞吐量通常要高于ArrayBlockingQueue
。静态工厂方法Executors
.newFixedThreadPool()
使用了这个队列。SynchronousQueue
:一个不存储元素的阻塞队列。每个插入操作必须等到另一个线程调用移除操作,否则插入操作一直处于阻塞状态,吞吐量通常要高于Linked
-BlockingQueue
,静态工厂方法Executors
.newCachedThreadPool
使用了这个队列。PriorityBlockingQueue
:一个具有优先级的无限阻塞队列。maximumPoolSize
(线程池最大数量):线程池允许创建的最大线程数。如果队列满了,并且已创建的线程数小于最大线程数,则线程池会再创建新的线程执行任务。值得注意的是,如果使用了无界的任务队列这个参数就没什么效果。ThreadFactory
:用于设置创建线程的工厂,可以通过线程工厂给每个创建出来的线程设置更有意义的名字。使用开源框架guava
提供的ThreadFactoryBuilder
可以快速给线程池里的线程设置有意义的名字,代码如下。new ThreadFactoryBuilder().setNameFormat("XX-task-%d").build();
5)RejectedExecutionHandler
(饱和策略):当队列和线程池都满了,说明线程池处于饱和状态,那么必须采取一种策略处理提交的新任务。这个策略默认情况下是AbortPolicy
,表示无法处理新任务时抛出异常。在JDK
1.5中Java
线程池框架提供了以下4种策略。
AbortPolicy
:直接抛出异常。CallerRunsPolicy
:只用调用者所在线程来运行任务。这个策略重试添加当前的任务,他会自动重复调用 execute() 方法,直到成功。DiscardOldestPolicy
:丢弃队列里最近的一个任务,并执行当前任务。DiscardPolicy
:不处理,丢弃掉。当然,也可以根据应用场景需要来实现RejectedExecutionHandler
接口自定义策略。如记录keepAliveTime
(线程活动保持时间):线程池的工作线程空闲后,保持存活的时间。所以,如果任务很多,并且每个任务执行的时间比较短,可以调大时间,提高线程的利用率。TimeUnit
(线程活动保持时间的单位):可选的单位有天(DAYS
)、小时(HOURS
)、分钟(MINUTES
)、毫秒(MILLISECONDS
)、微秒(MICROSECONDS
,千分之一毫秒)和纳秒(NANOSECONDS
,千分之一微秒)。可以使用两个方法向线程池提交任务,分别为execute()和submit()方法。
execute()方法用于提交不需要返回值的任务,所以无法判断任务是否被线程池执行成功。
通过以下代码可知execute()方法输入的任务是一个Runnable类的实
threadsPool.execute(new Runnable() {
@Override
public void run() {
// TODO Auto-generated method stub
}
});
submit()方法用于提交需要返回值的任务。线程池会返回一个future类型的对象,通过这个future对象可以判断任务是否执行成功,并且可以通过future的get()方法来获取返回值,get()方法会阻塞当前线程直到任务完成,而使用get(long timeout,TimeUnit unit)方法则会阻塞当前线程一段时间后立即返回,这时候有可能任务没有执行完。
Future future = executor.submit(harReturnValuetask);
try {
Object s = future.get();
} catch (InterruptedException e) {
// 处理中断异常
} catch (ExecutionException e) {
// 处理无法执行任务异常
} finally {
// 关闭线程池
executor.shutdown();
}
可以通过调用线程池的shutdown
或shutdownNow
方法来关闭线程池。它们的原理是遍历线程池中的工作线程,然后逐个调用线程的interrupt
方法来中断线程,所以无法响应中断的任务可能永远无法终止。但是它们存在一定的区别,shutdownNow
首先将线程池的状态设置成STOP
,然后尝试停止所有的正在执行或暂停任务的线程,并返回等待执行任务的列表,而shutdown
只是将线程池的状态设置成SHUTDOWN
状态,然后中断所有没有正在执行任务的线程。
只要调用了这两个关闭方法中的任意一个,isShutdown
方法就会返回true
。当所有的任务都已关闭后,才表示线程池关闭成功,这时调用isTerminaed
方法会返回true
。至于应该调用哪一种方法来关闭线程池,应该由提交到线程池的任务特性决定,通常调用shutdown
方法来关闭线程池,如果任务不一定要执行完,则可以调用shutdownNow
方法。
要想合理地配置线程池,就必须首先分析任务特性,可以从以下几个角度来分析。
CPU
密集型任务、IO
密集型任务和混合型任务。性质不同的任务可以用不同规模的线程池分开处理。
CPU密集型
任务应配置尽可能小的线程,如配置Ncpu+1
个线程的线程池。
IO密集型
任务线程并不是一直在执行任务,则应配置尽可能多的线程,如2*Ncpu
。
混合型的任务
,如果可以拆分,将其拆分成一个CPU密集型
任务和一个IO密集型
任务,只要这两个任务执行的时间相差不是太大,那么分解后执行的吞吐量将高于串行执行的吞吐量。如果这两个任务执行时间相差太大,则没必要进行分解。
可以通过Runtime
.getRuntime()
.availableProcessors()
方法获得当前设备的CPU
数。
优先级不同的任务可以使用优先级队列PriorityBlockingQueue
来处理。它可以让优先级高的任务先执行。
注意 如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。
执行时间不同的任务可以交给不同规模的线程池来处理,或者可以使用优先级队列,让执行时间短的任务先执行。
依赖数据库连接池的任务,因为线程提交SQL
后需要等待数据库返回结果,等待的时间越长,则CPU
空闲时间就越长,那么线程数应该设置得越大
,这样才能更好地利用CPU
。建议使用有界队列
。有界队列能增加系统的稳定性和预警能力,可以根据需要设大一点儿,比如几千。有一次,我们系统里后台任务线程池的队列和线程池全满了,不断抛出抛弃任务的异常,通过排查发现是数据库出现了问题,导致执行SQL
变得非常缓慢,因为后台任务线程池里的任务全是需要向数据库查询和插入数据的,所以导致线程池里的工作线程全部阻塞,任务积压在线程池里。如果当时我们设置成无界队列,那么线程池的队列就会越来越多,有可能会撑满内存,导致整个系统不可用,而不只是后台任务出现问题。当然,我们的系统所有的任务是用单独的服务器部署的,我们使用不同规模的线程池完成不同类型的任务,但是出现这样问题时也会影响到其他任务。
如果在系统中大量使用线程池,则有必要对线程池进行监控,方便在出现问题时,可以根据线程池的使用状况快速定位问题。可以通过线程池提供的参数进行监控,在监控线程池的时候可以使用以下属性。
taskCount
:线程池需要执行的任务数量。completedTaskCount
:线程池在运行过程中已完成的任务数量,小于或等于taskCount
。largestPoolSize
:线程池里曾经创建过的最大线程数量。通过这个数据可以知道线程池是否曾经满过。如该数值等于线程池的最大大小,则表示线程池曾经满过。getPoolSize
:线程池的线程数量。如果线程池不销毁的话,线程池里的线程不会自动销毁,所以这个大小只增不减。getActiveCount
:获取活动的线程数。通过扩展线程池进行监控。可以通过继承线程池来自定义线程池,重写线程池的beforeExecute
、afterExecute
和terminated
方法,也可以在任务执行前、执行后和线程池关闭前执行一些代码来进行监控。例如,监控任务的平均执行时间、最大执行时间和最小执行时间等。protected void beforeExecute(Thread t, Runnable r) { }