这次分享的是线程池的一些东西,还是一起去看一下源码,看源码一时爽,一直看一直爽。
为什么要用到线程池呢?每次new Thread新建对象性能差;线程缺乏统一管理,可能无限制新建线程,相互之间竞争,及可能占用过多系统资源导致死机;缺乏更多功能,如定时执行、定期执行、线程中断。在这种情况下线程池应运而生,线程池的出现使我们可以重用存在的线程,减少对象创建、消亡的开销,性能佳;可有效控制最大并发线程数,提高系统资源的使用率,同时避免过多资源竞争,避免堵塞;提供定时执行、定期执行、单线程、并发数控制等功能。
废话不多说,先看一下它的继承结构:
我们今天的主角是ThreadPoolExecutor,老样子,先去看它的构造方法:
它一共有四种构造方法,前三种都是调用了第四个,说白了,就是他们的参数有差异,接下来去了解一下这些参数到底是干什么用的:
corePoolSize:这里是指核心线程数。当提交一个新任务时,线程池会创建一个新的线程去执行这个任务,直到当线程池中的核心线程数量与corePoolSize相等,后边提交的任务就会被扔到队列中等待执行。
maximumPoolSize:这里是指最大线程数。就是这个线程池最多能容纳线程的数量。最大线程数=核心线程数+非核心线程数。所谓的非核心线程数,是指在阻塞队列满了以后,如果继续提交任务,也会创建线程去执行,只不过这里的线程不再属于核心线程,也要注意当前线程总数量要小于maximumPoolSize,这种线程就叫做非核心线程。
keepAliveTime:这里指的是线程的存活时间。表示线程没有任务执行时最多保持多久时间会终止。默认情况下,只有当线程池中的线程数大于corePoolSize时,keepAliveTime才会起作用。如果一个线程空闲的时间达到keepAliveTime,则会终止,直到线程池中的线程数不超过corePoolSize。但是如果调用了allowCoreThreadTimeOut(boolean)方法,在线程池中的线程数不大于corePoolSize时,keepAliveTime参数也会起作用,直到线程池中的线程数为0;
unit:这里指的是线程存活时间的时间单位。包括天、时、分、秒、毫秒、微秒、纳秒。
workQueue:这里指的是阻塞队列。就是线程池中的核心线程数>=corePoolSize时,还继续提交任务,就会把任务放到阻塞队列中。这里阻塞队列的策略主要有三种。ArrayBlockingQueue(有界队列,就是一个长度固定的队列,由于长度固定,所以一旦超过了队列长度和maximumPoolSize,线程池就无法再接收任务)、LinkedBlockingQueue(无界队列,长度不固定,在核心线程数>=corePoolSize后,所有的任务都将无限制的加入队列中,内存飙升)、SynchronousQueue (同步移交队列,对于提交的任务,如果有空闲线程,则使用空闲线程来处理;否则新建一个线程来处理任务)。
threadFactory:这里指的是创建线程的工厂。
RejectedExecutionHandler:饱和策略。主要包括AbortPolicy(直接抛出异常,默认策略)、CallerRunsPolicy(用调用者所在的线程来执行任务)、DiscardOldestPolicy(丢弃阻塞队列中靠最前的任务,并执行当前任务)、DiscardPolicy(直接丢弃任务)。也可以自己去实现RejectedExecutionHandler接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务。
接下来去看一下它的一些常量:
AtomicInteger:在使用非阻塞算法实现并发控制,在一些高并发程序中非常适合,主要是在高并发的情况下是提供原子操作的。这里其实你不必要纠结,在后边你会常看到ctl.get()这个方法,他这里get到的就是这里构造方法传入的参数。你可以把他理解为是一个新的对象,它有俩个属性,一个是线程池的状态(用32位整形的高3位表示),一个是线程的数量(用32位整形的低29表示)。
COUNT_BITS:就是下边要移动的位数,结果就是29位。
CAPACITY:线程的最大容量。0000 0000 0000 0000 0000 0000 0000 0001左移29位- ->0010 0000 0000 0000 0000 0000 0000 0000 =,0001 1111 1111 1111 1111 1111 1111 1111 这个二级制数转换为十进制再减1就行了,结果就是536870911。
RUNNING:这里指的是线程池状态--运行中。主要是接受新任务,并处理队列任务。(表示状态的只有高3位,就以运行中作为例子看一下。-1代表的是1111 1111 1111 1111 1111 1111 1111 1111,左移29位后是1110 0000 0000 0000 0000 0000 0000 0000,表示RUNNING状态,即-536870912)
SHUTDOWN:线程池处在SHUTDOWN状态时,不接收新任务,但能处理已添加的任务。 调用线程池的shutdown()方法时,线程池状态由RUNNING变为SHUTDOWN。
STOP:线程池处在STOP状态时,不接收新任务,不处理已添加的任务,并且会中断正在处理的任务。 调用线程池的shutdownNow()方法时,线程池状态由RUNNING或者SHUTDOWN都会转为STOP。
TIDYING:当所有的任务已终止,ctl记录的任务数量(即方法workerCountOf(c))为0,线程池会变为TIDYING状态。当线程池变为TIDYING状态时,会执行terminated()。
TERMINATED:线程池彻底终止,就变成TERMINATED状态。 线程池处在TIDYING状态时,执行完terminated()之后,线程池就会由 TIDYING变为TERMINATED。
runStateOf(int c):这个方法是通过ctl获取线程池的状态。即通过高3位来判断。
workerCountOf(int c):这个方法是通过ctl获取正在运行的线程。即通过低29位来判断。
ctlOf(int rs, int wc):这个方法是初始化ctl的值。即AtomicInteger初始化时构造函数中传的参数就是这个东西。
runStateLessThan(int c, int s):c是线程池状态,那线程池的状态和另一个状态s比较大小,并返回结果。
runStateAtLeast(int c, int s):c是线程池状态,那线程池的状态和另一个状态s比较大小,并返回结果。和上边的一样,就是比较规则不一样。
isRunning(int c):c是线程池状态,判断当前线程是不是处于运行时。
接一下用一个图说明一下线程池状态直接的转换关系:
好了,我们开始看它核心的一些方法,首先是execute(Runnable command):
说明一下这里的参数Runnable command,就是要提交的任务。
上边这个是源码的解析,我们去画一个更直接明了的流程图再看一下:
下一个我们要看的就是如何去添加一个线程,就是在提交任务方法(execute)中的addWorker(Runnable firstTask, boolean core)方法:
说明一下这里的参数:Runnable firstTask指的是第一个任务, boolean core指的是是否是核心线程池。
老样子,画个流程图,看起来更直观一些,梳理一下:
搞了这半天,发现我们线程池里边的线程不是Thread对象,而是Worker对象,我们再去看一下:
看完这个你会发现,worker继承的是AQS(AbstractQueuedSynchronizer),我在前边ReentrantLock的实现原理中对AQS有比较详细的介绍,就是通过CAS操作去修改state的值(1是拿到锁了,0没拿到),去获取锁。需要我们注意的是我们在初始化worker的时候state的状态是-1,我们啥也干不了;还有就是worker实现的AQS不是可重入锁,他这里对state的操作不是加减法,就是直接修改。看到这里是不是有点清晰了,为什么线程池中放的不是Thread而是worker?主要是为了提供中断的这个功能。
接下里我们去看一下worker中比较重要的一个方法,就是runWorker(Worker w)了,进去看看:
画个流程图整理一下:
下边要看的是怎么从阻塞队列中获取任务,就是getTask()方法:
老样子,画个流程图:
退出worker线程:
下边再去看看 shutdown 和 shutdownNow:
在分析它们的源码之前,我们先去看一下他们之间有什么区别:
1、shutdown 方法执行之后它的状态变成了SHUTDOWN,shutdownNow执行之后状态改成了STOP;
2、shutdownNow 执行之后会中断所有线程,也就是所有任务,而shutdown 执行之后仅仅中断空闲线程,不会影响正在执行的任务;
3、shutdownNow 执行之后会返回那些未执行的任务;
我们通过对shutdown方法和shutdownNow区别的了解,看过了shutdown,shutdownNow也就比较简单了。
这里对ThreadPoolExecutor的介绍就到这里了。
最近开发任务比较多,写的时候断断续续,不说了,干活去了。。。。希望对大家有所帮助!