基本概念
-
任务
: 就是你自己实现的任务逻辑,一般为Runnable
实现类或Callable
实现类,不过在线程池中已经被封装成一个FutureTask
. 在我们向线程池中提交一个任务的时候,会先判断目前线程池中的workerCount
是否小于核心线程数
,如果小于则将这个任务封装成一个Worker
,然后启动一个新线程;如果不小于则将这个任务添加到工作队列
-
工作队列
:工作队列
是BlockQueue
的实现类,它的作用就是用来缓存任务
的,因为它本身是线程安全的,所以在向工作队列
的时候不需要格外处理线程安全问题 -
Worker
: 可以认为每个Worker
对应一个线程,在我们创建Worker
的时候,会传入一个任务
,这个任务就是这个Worker
首次要执行的逻辑,执行完之后它就会去工作队列
拿任务执行. 所有的Worker
都保存在一个HashSet
数据结构中,所以在向HashSet
添加Worker
的时候需要去处理线程安全问题,线程池中是通过ReentrantLock
来保证线程安全
工作流程
其实在说这个之前我们可以先考虑一下线程池出现的目的: 因为创建线程需要比较大的开销,并且线程数太多的情况下上下文切换比较频繁,所以我们希望有一种机制来改善它,这就是线程池,改善的核心就是控制线程的数量,通过暴露接口,可以满足用户创建不同场景下的线程池
- 来任务了,先创建几个线程
核心线程数
- 任务太多了,处理不过来,总不能一直创建线程吧,这时候就将任务缓存到
工作队列
- 任务实在是太多,
工作队列
都满了,那就再创建几个线程吧最大线程数
- 任务真的真的太多了,还是处理不过来,拒绝吧,提供了几种
拒绝策略
- 其他: 一段时间后,任务太少了,那些一直不工作的线程怎么处理?
空闲时间
使用示例
ExecutorService executorService = new ThreadPoolExecutor(
1,
1,
3,
TimeUnit.SECONDS,
new ArrayBlockingQueue<>(2),
(r) -> new Thread(r),
(r, executor) -> System.out.println("拒绝"));
for (int i = 0; i < 5; i++) {
executorService.submit(() -> {
System.out.println(Thread.currentThread().getName());
sleep(TimeUnit.MILLISECONDS, 50);
});
}
----------------------------------------------执行结果----------------------------------------------
拒绝
拒绝
Thread-0
Thread-0
Thread-0
ThreadPoolExecutor
线程池的核心实现类,基于ThreadPoolExecutor
可以实现满足不同场景的线程池
-
acl
: 类型为AtomicInteger
,该变量包括两部分内容: 低29位用于表示workerCount
,即线程池中的线程数,高3位用于表示线程池的状态,即RUNNING
SHUTDOWN
STOP
TIDYING
TERMINATED
- 状态之间的转换
RUNNING -> SHUTDOWN
On invocation of shutdown(), perhaps implicitly in finalize()
(RUNNING or SHUTDOWN) -> STOP
On invocation of shutdownNow()
SHUTDOWN -> TIDYING
When both queue and pool are empty
STOP -> TIDYING
When pool is empty
TIDYING -> TERMINATED
When the terminated() hook method has completed
构造函数
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.acc = System.getSecurityManager() == null ?null : AccessController.getContext();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
-
corePoolSize
: 核心线程数,提交一个任务时,如果线程池中的线程数没有达到核心线程数,则会创建一个新的线程 -
maximumPoolSize
: 最大线程池,工作队列满了的情况下,如果线程池中的线程数没有达到最大线程数,则会创建一个新线程,否则使用拒绝策略 -
keepAliveTime
: 空闲线程存活时间,工作对立中没有任务时,线程最大等待时间,其实就是工作队列的带时间阻塞 -
workQueue
: 工作队列,存放任务的 -
threadFactory
: 创建线程工厂类 -
handler
: 线程池满了情况下,提交任务时对应的拒绝策略,可以自己实现,默认提供了几种
提交任务
// AbstractExecutorService#submit
public Future> submit(Runnable task) {
if (task == null) throw new NullPointerException();
// 创建一个FutureTask对象
RunnableFuture ftask = newTaskFor(task, null);
// 执行 ThreadPoolExecutor#execute
execute(ftask);
return ftask;
}
- 基于
Runnable
创建一个FutureTask
对象,这样可以获取返回值了,因为Runnable
没有返回值,所以这里直接传null
- 调用
ThreadPoolExecutor#execute
方法
ThreadPoolExecutor#execute
public void execute(Runnable command) {
if (command == null)
throw new NullPointerException();
/*
* Proceed in 3 steps:
*
* 1. If fewer than corePoolSize threads are running, try to
* start a new thread with the given command as its first
* task. The call to addWorker atomically checks runState and
* workerCount, and so prevents false alarms that would add
* threads when it shouldn't, by returning false.
*
* 2. If a task can be successfully queued, then we still need
* to double-check whether we should have added a thread
* (because existing ones died since last checking) or that
* the pool shut down since entry into this method. So we
* recheck state and if necessary roll back the enqueuing if
* stopped, or start a new thread if there are none.
*
* 3. If we cannot queue task, then we try to add a new
* thread. If it fails, we know we are shut down or saturated
* and so reject the task.
*/
int c = ctl.get();
// 如果`workerCount < corePoolSize`,则尝试创建一个新线程,创建成功就直接返回,失败继续下面的流程
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
return;
c = ctl.get();
}
// 如果线程池正在运行并且将该任务添加到工作队列成功
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
// 再次检查线程池是否正在运行,如果不在运行了就将该任务移除并执行拒绝策略
if (! isRunning(recheck) && remove(command))
reject(command);
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
// 如果`workerCount >= corePoolSize && 工作队列放不下了`,再次尝试添加一个新线程,如果添加失败则执行拒绝策略
else if (!addWorker(command, false))
reject(command);
}
- 如果
workerCount < corePoolSize
,则尝试创建一个新线程,创建成功就直接返回,失败继续下面的流程 -
workerCount >= corePoolSize
,再次检查线程池是否正在运行,如果不在运行了就将该任务移除并执行拒绝策略 - 如果
workerCount >= corePoolSize && 工作队列放不下了
,再次尝试添加一个新线程,如果添加失败则执行拒绝策略
ThreadPoolExecutor#addWorker
该方法用于尝试向线程池中添加一个新的线程,如果线程池运行状态不正常,则会添加失败
1. `firstTask`: 任务的具体逻辑,这里是一个`FutureTask`对象
2. `core`: 如果为true,这和`corePoolSize`比较,否则和`maximumPoolSize`比较. 因为执行`addWorker`方法只有两种情况:一种是`workerCount= SHUTDOWN &&
! (rs == SHUTDOWN &&
firstTask == null &&
! workQueue.isEmpty()))
return false;
// 通过自旋操作更新`workerCount`的值,即:加1
for (;;) {
// 获取目前线程池中的线程数
int wc = workerCountOf(c);
// 因为执行`addWorker`方法只有两种情况:一种是`workerCount= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize))
return false;
// 通过CAS操作尝试对`workerCount`加1,如果成功就跳出最外层循环
if (compareAndIncrementWorkerCount(c))
break retry;
c = ctl.get(); // Re-read ctl
// 如果在自旋(内循环更新`workerCount`值)期间,线程池的状态发生变化,重新进入外循环
if (runStateOf(c) != rs)
continue retry;
// else CAS failed due to workerCount change; retry inner loop
}
}
boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
w = new Worker(firstTask);
final Thread t = w.thread;
if (t != null) {
// 这里的`ReentrantLock`主要作用是保证添加`Worker`到`workers`时是线程安全的,因为`workers`是`HashSet`结构,其本身不是线程安全的
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int rs = runStateOf(ctl.get());
// 如果线程池正在运行
if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) {
// 如果t.isAlive()这说明线程已经被启动了,这时候直接抛异常,一般不会出现
if (t.isAlive()) // precheck that t is startable
throw new fIllegalThreadStateException();
// 将该任务添加到`workers`中,`workers`是一个`HashSet`结构,不过这里通过`ReentrantLock`保证它是线程安全的
workers.add(w);
int s = workers.size();
// 更新`largestPoolSize`,该值用于表示线程池中曾经达到的最大线程数
if (s > largestPoolSize)
largestPoolSize = s;
workerAdded = true;
}
} finally {
mainLock.unlock();
}
if (workerAdded) {
// 最后启动线程
t.start();
workerStarted = true;
}
}
} finally {
// 根据上面的代码来判断,如果线程池运行状态不正常的时候,会添加`Worker`失败,然后执行`addWorkerFailed`方法
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
注释已经写的很详细了,总结一下:
- 先通过自旋更新
workerCount
的值 - 添加
Worker
到workers
中时需要通过ReentrantLock
保证线程安全,因为workers
是HashSet
结构,其本身不是线程安全的 - 线程池运行状态不正常时,会添加
Worker
失败,此时需要执行ThreadPoolExecutor#addWorkerFailed
方法
ThreadPoolExecutor#addWorkerFailed
执行到这里,说明线程池可能已经出现了问题,这时候需要回滚之气那的操作.即恢复workerCount
的值,然后将该Worker
从workers
中移除,并尝试停止线程池
private void addWorkerFailed(Worker w) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
if (w != null)
// 从`HashSet`中移除
workers.remove(w);
// 对`workerCount`减1
decrementWorkerCount();
// 尝试停止线程池
tryTerminate();
} finally {
mainLock.unlock();
}
}
- 从
HashSet
中移除刚刚添加的Worker
- 对
workerCount
减1 - 尝试停止线程池
执行任务
通过上面的代码可以发现,提交任务的时候,如果创建了一个新的Worker
实例,就相当于创建了一个新的线程,并且会启动该线程. 那线程启动之后主要做了什么?
Thread#start
=> Worker#run
=> ThreadPoolExecutor#runWorker
Worker
- 实现了
Runnable
接口,因此当线程启动之后,就会执行Worker#run
方法 - 继承自
AbstractQueuedSynchronizer
,说明它具有锁的功能,但它是不可重入锁 - 在构造函数中,已自己为参数,创建一个线程,并将该线程作为自己的一个属性
thread
Worker(Runnable firstTask) {
// 设置state=-1,则无法获取锁, 在runWorker中会先执行unlock方法,然后再执行lock方法获取锁
setState(-1); // inhibit interrupts until runWorker
// 最开始执行的那个任务,之后的任务去队列里面拿
this.firstTask = firstTask;
// 以自己为参数创建一个线程
this.thread = getThreadFactory().newThread(this);
}
在Worker#run
方法中,直接调用了ThreadPoolExecutor#runWorker
方法
ThreadPoolExecutor#runWorker
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
// 先取第一个任务执行,这是在构造函数中传入的
Runnable task = w.firstTask;
w.firstTask = null;
// 因为在Worker构造函数中默认设置了state为-1,需要先执行`Worker#unlock`将state设置为0
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
// 如果首个任务不为null并且工作队列里面还有任务
while (task != null || (task = getTask()) != null) {
w.lock();
// If pool is stopping, ensure thread is interrupted;
// if not, ensure thread is not interrupted. This
// requires a recheck in second case to deal with
// shutdownNow race while clearing interrupt
// 有点不太懂
if ((runStateAtLeast(ctl.get(), STOP) || (Thread.interrupted() && runStateAtLeast(ctl.get(), STOP))) && !wt.isInterrupted())
wt.interrupt();
try {
// 前置处理,默认为空
beforeExecute(wt, task);
Throwable thrown = null;
try {
// 执行任务
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
// 后置处理,默认为空
afterExecute(task, thrown);
}
} finally {
// 设置task为null, 用于取下一个任务
task = null;
// 完成任务数加1
w.completedTasks++;
w.unlock();
}
}
// 工作队列里面没任务了,并且在获取任务时在工作队列上阻塞的时候大于空闲时间,并且时正常结束的,即没有发生什么异常
completedAbruptly = false;
} finally {
// 将该Worker从HashSet中移除,执行一些销毁操作
processWorkerExit(w, completedAbruptly);
}
}
- 先执行
firstTask
,该任务在创建Worker
时传入 - 再从
工作队列
中取任务执行 - 执行完成之后,说明
runWorker
将要退出了,这时候同时需要将该Worker
从HashSet中移除
todo 最核心的,中断处理,即那个判断条件,也就是Worker
实现AQS的目的
空闲线程清理
在创建线程池的时候,有提到一个参数:空闲时间
,这个空闲时间
是什么意思呢?
Worker
执行完firstTask
之后,就会去工作队列
中拿任务继续执行,工作队列
是一个阻塞队列,当工作队列
中没有任务时,线程就会阻塞,直到有提交了新的任务. 这个空闲时间
其实就可以理解成该线程的阻塞时间,这部分逻辑在ThreadPoolExecutor#getTask
方法中
private Runnable getTask() {
boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
// Are workers subject to culling?
// allowCoreThreadTimeOut表示线程是否永久存货, 默认是永久存活, 结合下面的代码说明在这两种情况下,空闲时间生效: 1.allowCoreThreadTimeOut==true 2.工作线程数大于corePoolSize
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
if ((wc > maximumPoolSize || (timed && timedOut)) && (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
Runnable r = timed ? workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
-
空闲时间
其实就是线程在阻塞队列上阻塞的最大时间,即通过阻塞队列实现 - 在这两种情况下,空闲时间才会生效:
allowCoreThreadTimeOut==true
或者工作线程数大于corePoolSize
常见线程池
通过Executors
可以快速的创建一些不同类型的线程池
ExecutorService#newSingleThreadExecutor
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue()));
}
-
corePoolSize
为1,maximumPoolSize
为1,意味着线程池中最多只有一个工作线程 -
空闲时间
为0,表示没任务立即销毁该线程 -
工作队列
为LinkedBlockingQueue
,这其实是一个有界的阻塞队列,但是由于这里没有在创建LinkedBlockingQueue
的时设置容量,所以默认为Integer.MAX_VALUE
优缺点
- 对阻塞队列的长度没有限制,可能会造成OOM
ExecutorService#newCachedThreadPool
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue());
}
-
corePoolSize
为0,maximumPoolSize
为Integer.MAX_VALUE,意味着线程数可以为
Integer.MAX_VALUE -
空闲时间
为60s,也就是一分钟
3.工作队列
为SynchronousQueue
,这是一个比较特殊的阻塞队列,当一个生产者线程向队列中存数据时,生产者线程将被阻塞直到有另一个消费者线程从队列中取数据(即take),反之亦然
优缺点
- 适合执行时间比较短的任务,这种情况下,很多线程可以被复用,避免每次都创建大量线程的开销
- 但在任务执行时间比较长的情况,由于该线程池对线程数没有限制,可能会创建非常多的线程.
ExecutorService#newFixedThreadPool
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue());
}
-
corePoolSize
为入参,maximumPoolSize
为入参 -
空闲时间
为0,表示没任务立即销毁该线程 -
工作队列
为LinkedBlockingQueue
,这其实是一个有界的阻塞队列,但是由于这里没有在创建LinkedBlockingQueue
的时设置容量,所以默认为Integer.MAX_VALUE
这个其实和newSingleThreadExecutor
有点像,只不过newSingleThreadExecutor
中只有一个线程,而newFixedThreadPool
是固定的线程
优缺点
- 对阻塞队列的长度没有限制,可能会造成OOM
ExecutorService#ScheduledThreadPool
public ScheduledThreadPoolExecutor(int corePoolSize, ThreadFactory threadFactory) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,new DelayedWorkQueue(),threadFactory);
}
-
corePoolSize
为入参,maximumPoolSize
为Integer.MAX_VALUE -
空闲时间
为0,表示没任务立即销毁该线程 -
工作队列
为DelayedWorkQueue
,这是一个有界的阻塞队列
优缺点
- 对阻塞队列的长度没有限制,可能会造成OOM
总结
还是推荐根据具体场景,基于ThreadPoolExecutor
定制自己的线程池