线程池相关

1.线程池参数设计

1.1意义

  • 线程池的线程数量设置过多会导致线程竞争激烈;
  • 如果线程数量设置过少的话,还会导致系统无法充分利用计算机资源;

1.2线程池原理

  • Java 线程的创建与销毁将会消耗一定的计算机资源,从而增加系统的性能开销。

在 HotSpot VM 的线程模型中,Java 线程被一对一映射为内核线程。Java 在使用线程执行程序时,需要创建一个内核线程;当该 Java 线程被终止时,这个内核线程也会被回收。

  • 大量创建线程同样会给系统带来性能问题,当线程数量太大,被创建的执行线程同时在争取 CPU 资源,又会导致大量的上下文切换,从而增加线程的执行时间,影响了整体执行效率。
    总之线程数量多了不行,少了也不行。

为了解决上述两类问题,Java 提供了线程池概念,对于频繁创建线程的业务场景,线程池可以创建固定的线程数量。线程池可以提高线程复用,又可以固定最大线程使用量,防止无限制地创建线程。

1.3 线程池思路

当程序提交一个任务需要一个线程时,会去线程池中查找是否有空闲的线程,若有,则直接使用线程池中的线程工作,若没有,会去判断当前已创建的线程数量是否超过最大线程数量,如未超过,则创建新线程,如已超过,则进行排队等待或者直接抛出异常。

1.4线程池框架 Executor

  • 包括 ScheduledThreadPoolExecutor 和 ThreadPoolExecutor 两个核心线程池。前者是用来定时执行任务,后者是用来执行被提交的任务。


    线程池相关_第1张图片
    image.png

阿里规范中建议不要使用Executors 创建线程池,建议使用ThreadPoolExecutor 来创建线程池:因为选择使用 Executors 提供的工厂类,将会忽略很多线程池的参数设置,工厂类一旦选择设置默认参数,就很容易导致无法调优参数设置,从而产生性能问题或者资源浪费。

ThreadPoolExecutor中的参数:

corePoolSize:线程池的核心线程数量
maximumPoolSize:线程池的最大线程数
keepAliveTime:当线程数大于核心线程数时,多余的空闲线程存活的最长时间
unit:时间单位
workQueue:任务队列,用来储存等待执行任务的队列
threadFactory:线程工厂,用来创建线程,一般默认即可
handler:拒绝策略,当提交的任务过多而不能及时处理时,我们可以定制策略来处理任务

线程池有两个线程数的设置,一个为核心线程数,一个为最大线程数。在创建完线程池之后,默认情况下,线程池中并没有任何线程,等到有任务来才创建线程去执行任务。

但有一种情况排除在外,就是调用 prestartAllCoreThreads() 或者 prestartCoreThread() 方法的话,可以提前创建等于核心线程数的线程数量,这种方式被称为预热,在抢购系统中就经常被用到。

当创建的线程数等于 corePoolSize 时,提交的任务会被加入到设置的阻塞队列中。当队列满了,会创建线程执行任务,直到线程池中的数量等于 maximumPoolSize。

当线程数量已经等于 maximumPoolSize 时, 新提交的任务无法加入到等待队列,也无法创建非核心线程直接执行,我们又没有为线程池设置拒绝策略,这时线程池就会抛出 RejectedExecutionException 异常,即线程池拒绝接受这个任务。

当线程池中创建的线程数量超过设置的 corePoolSize,在某些线程处理完任务后,如果等待 keepAliveTime 时间后仍然没有新的任务分配给它,那么这个线程将会被回收。线程池回收线程时,会对所谓的“核心线程”和“非核心线程”一视同仁,直到线程池中线程的数量等于设置的 corePoolSize 参数,回收过程才会停止。

即使是 corePoolSize 线程,在一些非核心业务的线程池中,如果长时间地占用线程数量,也可能会影响到核心业务的线程池,这个时候就需要把没有分配任务的线程回收掉。

我们可以通过 allowCoreThreadTimeOut 设置项要求线程池:将包括“核心线程”在内的,没有任务分配的所有线程,在等待 keepAliveTime 时间后全部回收掉。

线程池相关_第2张图片
image.png

1.5 计算线程数量

前提:环境具有多变性,设置一个绝对精准的线程数其实是不大可能的,但我们可以通过一些实际操作因素来计算出一个合理的线程数,避免由于线程池设置不合理而导致的性能问题。

一般多线程执行的任务类型可以分为 CPU 密集型I/O 密集型,根据不同的任务类型,我们计算线程数的方法也不一样。

1.5.1 CPU密集型

这种任务消耗的主要是 CPU 资源,可以将线程数设置为 N(CPU 核心数)+1,比 CPU 核心数多出来的一个线程是为了防止线程偶发的缺页中断,或者其它原因导致的任务暂停而带来的影响。
一旦任务暂停,CPU 就会处于空闲状态,而在这种情况下多出来的一个线程就可以充分利用 CPU 的空闲时间。

1.5.2I/O 密集型

这种任务应用起来,系统会用大部分的时间来处理 I/O 交互,而线程在处理 I/O 的时间段内不会占用 CPU 来处理,这时就可以将 CPU 交出给其它线程使用。因此在 I/O 密集型任务的应用中,我们可以多配置一些线程,具体的计算方法是 2N。

1.5.3 常规计算公式

image

WT:线程等待时间ST:线程时间运行时间

1.6 总结

要根据具体情况,计算出一个大概的数值,再通过实际的性能测试,计算出一个合理的线程数量。

2.线程池拒绝策略

拒绝策略发生的时机

当前提交任务数大于(maxPoolSize + queueCapacity)时就会触发线程池的拒绝策略了。


线程池相关_第3张图片
image.png

参考文档

  • https://mp.weixin.qq.com/s/iq0xgtWdVEuJH8PXn_u6qg

你可能感兴趣的:(线程池相关)