线程池
欢迎来到狗哥多线程系列连载。本篇是线程相关的第六篇,前五篇分别是:
创建线程到底有几种方式?
线程有多少种状态?Runnable 一定在执行任务吗?
万字长文,Thread 类源码解析!
wait、notify/notifyAll 解析
线程之生产者消费者模式
什么是线程池?
线程池是一种池化技术,简单来说就是一个管理线程的池子。这个池子里面的线程数是固定的,当任务数量大于线程数量时,会对线程进行复用。一个线程执行完任务,就回到这等待下一个任务的招唤,也不要你销毁。类似的还有我们工作常接触的数据库连接池。java 中的线程池主要是 juc (java.util.concurrent)包来复制,主要是由 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 类来实现,后者在前者的基础上增加了定时执行的功能。
为什么使用线程池?
那为什么要使用线程池呢?手动创建不香吗?真的不香,手动创建的情景仅仅适合很少任务量的情况。比如:只有一个任务,这问题不大。
public class OneTask {
public static void main(String[] args) {
Thread thread0 = new Thread(new Task());
thread0.start();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
那如果我就是有 10000 个任务呢?要这样写吗?
public class OneTask {
public static void main(String[] args) {
for (int i = 0; i < 10000; i++) {
Thread thread0 = new Thread(new Task());
thread0.start();
}
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
运行结果:
Thread Name: Thread-9977
Thread Name: Thread-9975
Thread Name: Thread-9973
Thread Name: Thread-9951
Thread Name: Thread-9999
Excuse me? 创建 10000 个线程?疯了吧?java 是一门高级语言,很多底层的工作对我们来说都是黑盒,比如垃圾自动回收。每一个线程从创建到销毁都要占用资源,用完需要回收的。
10000 个线程造成的垃圾回收开销得有多大呀,如果还是需要耗费一定时间的任务呢?要是我的线程任务很简单就是打印个日志,使用线程的内存开销比任务执行本身的开销还要大,这时就会得不偿失。
简而言之,频繁创建线程带来两点很不友好的问题:
- 反复创建线程系统开销比较大,每个线程创建和销毁都需要时间。
- 过多的线程会占用过多的内存等资源,还会带来过多的上下文切换,同时还会导致系统不稳定。
但我的任务确实多,咋办?这个时候线程池就出现了,它的出现解决了以上两点问题。
首先,针对反复创建线程开销大的问题,线程池用固定数量的线程保持工作状态并复用。
其次,针对过多线程占用太多内存资源的问题,线程池根据需要创建线程,控制线程的总数量,避免占用过多内存资源。
java 的线程池
线程池嘛,就是个池子。这里面的线程是固定的且可控的,java 提供了 Executor 接口方便我们实现线程池,它的继承关系是这样的:
其中 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 是实现线程池的两个类,区别上文说过了。
另外,还有个 JDK1.7 才出现的线程池:ForkJoinPool,它适合执行可产生子任务的任务,第一步是拆分也就是 Fork,第二步是汇总也就是 Join。继承关系是这样的(后面再单独出一期专门研究这个线程池)。
线程池的执行流程
1、首先提交任务,检查核心线程池是否已满?满了丢进队列。未满则创建线程执行任务。
2、队列是否已满?满了检查整个线程池是否已满?未满则是添加到队列中排队等待。
3、整个线程池都没可用线程了,直接根据拒绝策略处理新任务。
线程池的参数
找到 ThreadPoolExecutor 的构造方法:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue < Runnable > workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {}
它一共有如下7 个参数:
ThreadPoolExecutor 构造传入这 7 个参数,就可以创建一个线程池了,下面逐一解释:
1、corePoolSize 是核心线程数,就是指定线程池有多少始终活跃的线程,这个是根据业务需求定的,线程池执行过程的第一步就是检查核心线程数是不是都已经满了。
2、maximumPoolSize 是整个线程池的最大线程数,超出核心线程的部分有空闲,是可以进行回收的。所以正常情况下,线程池中的线程数量会处在 corePoolSize 与 maximumPoolSize 的闭区间内。
二者区别
maximumPoolSize 包含 corePoolSize 和 maximumPoolSize减corePoolSize。他两就像长工和临时工的区别。打个比方外包公司接到大项目,需要 100 个程序员才能搞定,可公司内部就只有 10 个猿。咋办?招 90 个临时的呗,干完活就开掉。原有的 10 个就是长工对应 corePoolSize ,即使没这项目他在公司还有活干。而剩下就 90 个就是临时的,对应 maximumPoolSize - corePoolSize,做完项目就不需要了。残酷吧?
所以,maximumPoolSize = corePoolSize + 临时工
3、keepAliveTime + 时间单位用于定义核心线程以外的线程(临时工,如果有的话)的存活时间,也就是说,这是定义临时工能活多久的参数。
4、ThreadFactory 是线程工厂,用于创建线程。有默认的,也可自定义实现。
5、workQueue 是阻塞队列,也就是暂时存任务的地方。
6、Handler 是拒绝策略,后面专门有一篇文章来探讨。
了解了这 7 个参数,现在我们设定 corePoolSize = 5,maximumPoolSize = 10,阻塞队列长度 = 100。再来看一个动图,你对上面的流程图的理解会更深。
有哪 6 种线程池,如何使用?
除了自定义,良心的 java 给我们实现了 3 类,6 个线程池,分别是:
由 ThreadPoolExecutor 创建
- FixedThreadPool
- CachedThreadPool
- SingleThreadExecutor
由 ScheduledThreadPoolExecutor 创建
- ScheduledThreadPool
- SingleThreadScheduledExecutor
JDk 1.7 出现
- ForkJoinPool (原理较复杂,后面再讲)
FixedThreadPool(固定数目的线程池)
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue());
}
- 固定线程数的线程池,核心线程数与最大线程数一样。
- 即使任务数 > 核心线程数,也不会再创建线程,而是扔到队列等待。
- 队列也满了,那就走拒绝策略。
- 线程闲置,马上回收。
线程数量固定,比较适用于耗时较长的任务。避免频繁回收和分配线程。
执行过程:线程池有 t0 ~ t9 十个线程,他们不断执行任务,期间任务不会减少不会增加,因为核心线程数 = 最大线程数。
用法:用它生成 10 个线程,来执行 10000 个任务:
public class MyThreadPoolTest {
public static void main(String[] args) {
ExecutorService executorService = Executors.newFixedThreadPool(10);
for (int i = 0; i < 10000; i++) {
executorService.execute(new Thread(new Task()));
}
executorService.shutdown();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
执行结果:可以看到来来去去都是 1~10 这几个线程在跑任务,并没有编号为 11 的线程。
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-2
Thread Name: pool-1-thread-6
Thread Name: pool-1-thread-8
Thread Name: pool-1-thread-7
Thread Name: pool-1-thread-7
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-2
Thread Name: pool-1-thread-6
Thread Name: pool-1-thread-10
Thread Name: pool-1-thread-3
CachedThreadPool(可缓存线程的线程池)
上源码:
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue());
}
- 核心线程数 = 0,要是一直没任务线程数就 = 0。
- 最大线程数是无限增加的(最大可到 Integer.MAX_VALUE,为 2^31-1,基本不可能达到)。
- 线程数并非固定不变,默认闲置线程超过 60s 没工作,则销毁。
- 队列是 SynchronousQueue 容量是 0,不存储任务,只做中转。
适用于耗时较短的任务、任务处理速度 > 任务提交速度。就不会造成不断创建新线程。
用法:用它提交 10000 个任务,并执行。
public class MyThreadPoolTest {
public static void main(String[] args) {
ExecutorService executorService = Executors.newCachedThreadPool();
for (int i = 0; i < 10000; i++) {
executorService.execute(new Thread(new Task()));
}
executorService.shutdown();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
执行结果:只要有任务提交就新建线程执行
Thread Name: pool-1-thread-826
Thread Name: pool-1-thread-827
Thread Name: pool-1-thread-233
Thread Name: pool-1-thread-303
Thread Name: pool-1-thread-321
Thread Name: pool-1-thread-833
Thread Name: pool-1-thread-825
Thread Name: pool-1-thread-832
Thread Name: pool-1-thread-69
Thread Name: pool-1-thread-18
Thread Name: pool-1-thread-830
Thread Name: pool-1-thread-829
SingleThreadExecutor(单线程的线程池)
源码:
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue()));
}
- 最大线程数和核心线程都 = 1,有且只有一个线程。
这货有啥使用场景?还真有,比如:用于所有任务都需要按被提交的顺序依次执行的场景
用法:
public class MyThreadPoolTest {
public static void main(String[] args) {
ExecutorService executorService = Executors.newSingleThreadExecutor();
for (int i = 0; i < 10000; i++) {
executorService.execute(new Thread(new Task()));
}
executorService.shutdown();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
结果:
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
Thread Name: pool-1-thread-1
···
ScheduledThreadPool(定时或周期的线程池)
源码:
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {
return new ScheduledThreadPoolExecutor(corePoolSize);
}
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new DelayedWorkQueue());
}
适用场景:定时或周期性执行任务,它有三个重要的方法:
ScheduledExecutorService service = Executors.newScheduledThreadPool(10);
// 延迟指定时间后执行一次任务(这里是 10s 后执行完任务,结束)
service.schedule(new Task(), 10, TimeUnit.SECONDS);
// 以固定的频率执行任务(表示第一次延时后每次延时多长时间执行一次),第二个参数是第一次延迟的时间,第三个参数是周期
service.scheduleAtFixedRate(new Task(), 10, 10, TimeUnit.SECONDS);
// 类似于第二个,区别在于周期的定义。第二个方法的周期是以任务开始时间为起始时间计时,而这个是以任务结束的时间为起始时间
service.scheduleWithFixedDelay(new Task(), 10, 10, TimeUnit.SECONDS);
用法:
public class MyThreadPoolTest {
public static void main(String[] args) {
ScheduledExecutorService executorService = Executors.newScheduledThreadPool(10);
for (int i = 0; i < 10000; i++) {
executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS);
}
executorService.shutdown();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
SingleThreadScheduledExecutor(定时或周期的单线程线程池)
源码:
public static ScheduledExecutorService newSingleThreadScheduledExecutor() {
return new DelegatedScheduledExecutorService
(new ScheduledThreadPoolExecutor(1));
}
public ScheduledThreadPoolExecutor(int corePoolSize) {
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,
new DelayedWorkQueue());
}
SingleThreadScheduledExecutor 只有一个线程且支持定时、周期功能。很明显是 ScheduledThreadPool 和 SingleThreadExecutor 的结合体。适用于对执行顺序有要求,且需要定时或周期执行的任务
用法:
public class MyThreadPoolTest {
public static void main(String[] args) {
ScheduledExecutorService executorService = Executors.newSingleThreadScheduledExecutor();
for (int i = 0; i < 10000; i++) {
executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS);
}
executorService.shutdown();
}
static class Task implements Runnable {
public void run() {
System.out.println("Thread Name: " + Thread.currentThread().getName());
}
}
}
巨人的肩膀
- https://kaiwu.lagou.com/course/courseInfo.htm?courseId=59#/detail/pc?id=1762
总结
本文聊了聊线程池是什么?为什么?怎么用?以及分析了线程池的执行过程,各参数含义、Java 各线程池的使用以及使用场景。相信你看完会有所收获,当然,由于篇幅原因,阻塞队列、拒绝策略等参数后面再发文探讨。另外,如文章有错,请友善指正,感激不尽。
小福利
如果看到这里,喜欢这篇文章的话,请帮点个好看。微信搜索一个优秀的废人,关注后回复电子书送你 100+ 本编程电子书 ,不只 Java 哦,详情看下图。回复 1024送你一套完整的 java 视频教程。