目录
七、共享模型之工具--线程池
1.线程池介绍
2.ThreadPoolExecutor(重点)
①线程池状态
②构造方法(必须掌握)
③JDK提供的线程工厂方法
newFixedThreadPool
newCachedThreadPool
newSingleThreadExecutor
使用第三方的线程工厂
④线程池提交任务
submit案例:
invokeAll案例:
invokeAny案例:
⑤关闭线程池
shutdown
shutdownNow
其他方法(了解)
3.模式之工作线程(了解)
前言和案例介绍
创建多少线程池合适
自定义线程池(重点掌握)
4.任务调度线程池
延时执行任务
定时执行任务
正确处理抛出的异常
5.Fork/Join(先了解概念)
使用Fork/Join
本章主要学习线程池的使用,以及自定义线程池,以及线程池的源码的一些分析;
线程是一种稀有的资源,每次创建线程都会消耗系统的资源,如果是高并发的情况下,一下子来了很多任务,如果为每一个任务都创建线程池,那就会消耗大量的内存,甚至会出现OOM的情况;而且因为机器的CPU数量有限,一旦线程的数量远远多于cpu的数量,那么就必然会出现线程由于得不到cpu时间片的使用权而进入阻塞,那么就必然会导致系统上下文的切换,频繁的切换系统的上下文就会影响系统的性能;
线程池里面也体现了享元模式的影子;
使用线程池的好处:
降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
提高响应速度。当任务到达时,任务可以不需要的等到线程创建就能立即执行。
提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控;
ThreadPoolExecutor 使用 int 的高 3 位来表示线程池状态,低 29 位表示线程数量
状态名 | 高3位 | 接收新任务 | 处理阻塞队列任务 | 说明 |
---|---|---|---|---|
RUNNING | 111 | Y | Y | |
SHUTDOWN | 000 | N | Y | 调用了shutDwonf方法,不会接收新任务,但会处理阻塞队列剩余任务,一种比较温和的停止线程运行的方式 |
STOP | 001 | N | N | 会中断正在执行的任务,并抛弃阻塞队列任务,暴力的终止线程 |
TIDYING | 010 | 任务全执行完毕,活动线程为 0 即将进入 终结 | ||
TERMINATED | 011 | 终结状态 |
从数字上比较,TERMINATED > TIDYING > STOP > SHUTDOWN > RUNNING (最高位的第一位是符号位)
这些信息存储在一个原子变量 ctl 中,目的是将线程池状态与线程个数合二为一,这样就可以用一次 cas 原子操作 进行赋值;
// c 为旧值, ctlOf 返回结果为新值
ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))));
// rs 为高 3 位代表线程池状态, wc 为低 29 位代表线程个数,ctl 是合并它们
private static int ctlOf(int rs, int wc) { return rs | wc; }
首先我们看一下 ThreadPoolExecutor 类参数最多、最全的有参构造方法。
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
corePoolSize 核心线程数目 (最多保留的线程数,会被保留在线程池,没有存活时间这种说法)
maximumPoolSize 最大线程数目 (maximumPoolSize - corePoolSize = 救急线程数)
keepAliveTime 生存时间 - 针对救急线程
unit 时间单位 - 针对救急线程
workQueue 阻塞队列
threadFactory 线程工厂 - 可以为线程创建时起个好名字
handler 拒绝策略
工作方式:
graph LR
subgraph //阻塞队列
size=2
t3(任务3)
t4(任务4)
end
subgraph //线程池c=2(核心线程数),m=3(最大线程数)
ct1//(核心线程1)
ct2//(核心线程2)
mt1//(救急线程1)(当阻塞线程的数量刚好等于阻塞队列的大小的时候,这个时候如果再来一个任务,那么JDK会优先创建救急线程,这个任务会交给救急线程来执行,当救急线程执行完毕后,那么当救急线程存活的时间大于设置的生存的时间,,那么救急线程就会被销毁)
ct1 --> t1(任务1)
ct2 --> t2(任务2)
end
t1(任务1)
工作步骤:
根据这个构造方法,JDK Executors 类中提供了众多工厂方法来创建各种用途的线程池。
线程池中刚开始没有线程,当一个任务提交给线程池后,线程池会创建一个新线程来执行任务。
当线程数达到 corePoolSize 并没有线程空闲,这时再加入任务,新加的任务会被加入workQueue 队列排 队,直到有空闲的线程。
如果队列选择了有界队列,那么任务超过了队列大小时,会创建 maximumPoolSize - corePoolSize 数目的线程来救急。 (救急线程存在的前提条件是在有界队列中)
如果线程到达 maximumPoolSize 仍然有新任务这时会执行拒绝策略。拒绝策略 jdk 提供了 4 种实现,其它 著名框架也提供了实现
AbortPolicy 让调用者抛出 RejectedExecutionException 异常,这是默认策略
CallerRunsPolicy 让调用者运行任务
DiscardPolicy 放弃本次任务
DiscardOldestPolicy 放弃队列中最早的任务,本任务取而代之
Dubbo 的实现,在抛出 RejectedExecutionException 异常之前会记录日志,并 dump 线程栈信息,方 便定位问题
Netty 的实现,是创建一个新线程来执行任务
ActiveMQ 的实现,带超时等待(60s)尝试放入队列
PinPoint 的实现,它使用了一个拒绝策略链,会逐一尝试策略链中每种拒绝策略
当高峰过去后,超过corePoolSize 的救急线程如果一段时间没有任务做,需要结束节省资源,这个时间由 keepAliveTime 和 unit 来控制。
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue());
}
案例演示:
// 创建大小为 2 的固定线程池, 自定义线程名称(需要实现一些工厂类)
ExecutorService executorService = Executors.newFixedThreadPool(2, new ThreadFactory() {
//创建原子类,用来计数用
private AtomicInteger atomicInteger = new AtomicInteger(1);
//自定义线程名字,在这个重写的方法中最后返回线程就行
@Override
public Thread newThread(Runnable r) {
//这个线程的两个参数 一个是runnable参数,一个是线程name
return new Thread(r, "my_thread_" + atomicInteger.getAndIncrement());
}
});
// 开 3 个线程, 线程池大小为 2 , 第三个线程执行时, 如果前两个线程任务没执行完, 会加入任务队列.
executorService.execute(() -> {
log.info("1");
});
executorService.execute(() -> {
log.info("2");
});
executorService.execute(() -> {
log.info("3");
});
//自己查看运行的结果
特点
核心线程数 == 最大线程数(没有救急线程被创建),因此也无需超时时间
阻塞队列是无界的,可以放任意数量的任务
评价 适用于任务量已知,相对耗时的任务
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue());
}
案例:
SynchronousQueue integers = new SynchronousQueue<>();
new Thread(() -> {
try {
log.debug("putting {} ", 1);
integers.put(1);
log.debug("{} putted...", 1);
log.debug("putting...{} ", 2);
integers.put(2);
log.debug("{} putted...", 2);
} catch (InterruptedException e) {
e.printStackTrace();
}
},"t1").start();
sleep(1);
new Thread(() -> {
try {
log.debug("taking {}", 1);
integers.take();
} catch (InterruptedException e) {
e.printStackTrace();
}
},"t2").start();
sleep(1);
new Thread(() -> {
try {
log.debug("taking {}", 2);
integers.take();
} catch (InterruptedException e) {
e.printStackTrace();
}
},"t3").start();
运行结果:
11:48:15.500 c.TestSynchronousQueue [t1] - putting 1
11:48:16.500 c.TestSynchronousQueue [t2] - taking 1
11:48:16.500 c.TestSynchronousQueue [t1] - 1 putted...
11:48:16.500 c.TestSynchronousQueue [t1] - putting...2
11:48:17.502 c.TestSynchronousQueue [t3] - taking 2
11:48:17.503 c.TestSynchronousQueue [t1] - 2 putted...
特点
核心线程数是 0, 最大线程数是 Integer.MAX_VALUE,救急线程的空闲生存时间是 60s,
意味着全部都是救急线程(60s 后可以回收)
救急线程可以无限创建
队列采用了 SynchronousQueue 实现特点是,它没有容量,没有线程来取是放不进去的(一手交钱、一手交货)
评价 整个线程池表现为线程数会根据任务量不断增长,没有上限,当任务执行完毕,空闲 1分钟后释放线 程。 适合任务数比较密集,但每个任务执行时间较短的情况
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue()));
}
使用场景:
希望多个任务排队执行。线程数固定为 1,任务数多于 1 时,会放入无界队列排队。任务执行完毕,这唯一的线程 也不会被释放。
区别:这个单线程池与自己创建一个线程来执行任务有什么区别呢?
自己创建一个单线程串行执行任务,如果任务执行失败而终止那么没有任何补救措施,而线程池还会新建一 个线程,保证池的正常工作
Executors.newSingleThreadExecutor() 线程个数始终为1,不能修改
FinalizableDelegatedExecutorService 应用的是装饰器模式,在调用构造方法时将ThreadPoolExecutor对象传给了内部的ExecutorService接口。只对外暴露了 ExecutorService 接口,因此不能调用 ThreadPoolExecutor 中特有的方法,也不能重新设置线程池的大小。
与Executors.newFixedThreadPool(1) 初始时为1的区别,使用Executors.newFixedThreadPool(1)这个以后还可以修改,但是单例线程池是不能修改的
对外暴露的是 ThreadPoolExecutor 对象,可以强转后调用 setCorePoolSize 等方法进行修改
注意:
注意,Executors 返回线程池对象的弊端如下:
FixedThreadPool 和 SingleThreadExecutor : 允许请求的队列长度为 Integer.MAX_VALUE,可能堆积大量的请求,从而导致 OOM。 CachedThreadPool 和 ScheduledThreadPool : 允许创建的线程数量为 Integer.MAX_VALUE ,可能会创建大量线程,从而导致 OOM。 说白了就是:使用有界队列,控制线程创建数量。 除了避免 OOM 的原因之外,不推荐使用 Executors提供的两种快捷的线程池的原因还有:
实际使用中需要根据自己机器的性能、业务场景来手动配置线程池的参数比如核心线程数、使用的任务队列、饱和策略等等。 我们应该显示地给我们的线程池命名,这样有助于我们定位问题。 原文链接:Java 并发编程下篇 -(线程池)_CodeAli的博客-CSDN博客
我们想帮自己的线程自定义线程name,这样可以让线程的name与业务挂钩,以后排除问题的时候就容易一些了;如果是自己定义线程工厂的话,很多线程安全的问题我们自己都考虑不到;
Google guava 工具类 提供的 ThreadFactoryBuilder(需要引入相关的jar包)
使用方式:
package threadpool;
import com.google.common.util.concurrent.ThreadFactoryBuilder;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
/**
* 这个类是用来 演示 guava架构包提供的线程命名方式 (为什么使用大公司写的,他们写的考虑的因素多,更加安全)
*/
public class GuavaUseTest {
public static void main(String[] args) {
ExecutorService executorService = new ThreadPoolExecutor(5, 10, 60L,
TimeUnit.SECONDS, new ArrayBlockingQueue<>(50),
//使用Google提供的线程工厂来进行自主命名 一般是前缀名
new ThreadFactoryBuilder().setNameFormat("这个是LJM的线程" +"pool" ).build(),
//这个拒绝策略可以自定义
((runnable,executor) -> {
System.out.println("这个任务我们没法处理了");
})
);
}
}
Apache commons-lang3 提供的 BasicThreadFactory
使用方法:(不用导入第三方架构包)
package threadpool;
import org.apache.commons.lang3.concurrent.BasicThreadFactory;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
/**
* 这个类是用来演示 Apache commons-lang3 提供的 BasicThreadFactory类 对线程池进行自主命名
*/
public class BasicThreadFactoryTest {
public static void main(String[] args) {
ExecutorService executorService = new ThreadPoolExecutor(5, 10, 60L,
TimeUnit.SECONDS, new ArrayBlockingQueue<>(50),
//使用Google提供的线程工厂来进行自主命名 一般是前缀名
new BasicThreadFactory.Builder().namingPattern("这个是LJM的线程-pool").build(),
//这个拒绝策略可以自定义
((runnable,executor) -> {
System.out.println("这个任务我们没法处理了");
})
);
}
}
线程的各种提交方式的概念:
// 执行任务
void execute(Runnable command);
// 提交任务 task,用返回值 Future 获得任务执行结果 会有返回值
Future submit(Callable task);
// 提交 tasks 中所有任务
List> invokeAll(Collection extends Callable> tasks)
throws InterruptedException;
// 提交 tasks 中所有任务,带超时时间,时间超时后,会放弃执行后面的任务
List> invokeAll(Collection extends Callable> tasks,
long timeout, TimeUnit unit)
throws InterruptedException;
// 提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消
T invokeAny(Collection extends Callable> tasks)
throws InterruptedException, ExecutionException;
// 提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消,带超时时间
T invokeAny(Collection extends Callable> tasks,
long timeout, TimeUnit unit)
throws InterruptedException, ExecutionException, TimeoutException;
提交任务 task,用返回值 Future 获得任务执行结果 会有返回值
private static void method1(ExecutorService pool) throws InterruptedException, ExecutionException {
Future future = pool.submit(() -> {
log.debug("running");
Thread.sleep(1000);
return "ok";
});
//获取线程的返回结果
log.debug("{}", future.get());
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
ExecutorService pool = Executors.newFixedThreadPool(1);
method1(pool);
}
允许结果:
18:36:58.033 c.TestSubmit [pool-1-thread-1] - running
18:36:59.034 c.TestSubmit [main] - ok
提交 tasks 中所有任务,如果带超时时间,那么时间超时后,会放弃执行后面的任务
private static void method2(ExecutorService pool) throws InterruptedException {
//返回的是一个泛型为Future的集合
List> futures = pool.invokeAll(Arrays.asList(
() -> {
log.debug("begin");
Thread.sleep(1000);
return "1";
},
() -> {
log.debug("begin");
Thread.sleep(500);
return "2";
},
() -> {
log.debug("begin");
Thread.sleep(2000);
return "3";
}
));
futures.forEach( f -> {
try {
log.debug("{}", f.get());
} catch (InterruptedException | ExecutionException e) {
e.printStackTrace();
}
});
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
ExecutorService pool = Executors.newFixedThreadPool(1);
method2(pool);
}
测试结果:
19:33:16.530 c.TestSubmit [pool-1-thread-1] - begin
19:33:17.530 c.TestSubmit [pool-1-thread-1] - begin
19:33:18.040 c.TestSubmit [pool-1-thread-1] - begin
19:33:20.051 c.TestSubmit [main] - 1
19:33:20.051 c.TestSubmit [main] - 2
19:33:20.051 c.TestSubmit [main] - 3
提交 tasks 中所有任务,哪个任务先成功执行完毕,返回此任务执行结果,其它任务取消
private static void method3(ExecutorService pool) throws InterruptedException, ExecutionException {
String result = pool.invokeAny(Arrays.asList(
() -> {
log.debug("begin 1");
Thread.sleep(1000);
log.debug("end 1");
return "1";
},
() -> {
log.debug("begin 2");
Thread.sleep(500);
log.debug("end 2");
return "2";
},
() -> {
log.debug("begin 3");
Thread.sleep(2000);
log.debug("end 3");
return "3";
}
));
log.debug("{}", result);
}
public static void main(String[] args) throws ExecutionException, InterruptedException {
ExecutorService pool = Executors.newFixedThreadPool(3);
//ExecutorService pool = Executors.newFixedThreadPool(1);
method3(pool);
}
测试结果:
19:44:46.314 c.TestSubmit [pool-1-thread-1] - begin 1
19:44:46.314 c.TestSubmit [pool-1-thread-3] - begin 3
19:44:46.314 c.TestSubmit [pool-1-thread-2] - begin 2
19:44:46.817 c.TestSubmit [pool-1-thread-2] - end 2
19:44:46.817 c.TestSubmit [main] - 2
19:47:16.063 c.TestSubmit [pool-1-thread-1] - begin 1
19:47:17.063 c.TestSubmit [pool-1-thread-1] - end 1
19:47:17.063 c.TestSubmit [pool-1-thread-1] - begin 2
19:47:17.063 c.TestSubmit [main] - 1
/*
线程池状态变为 SHUTDOWN
- 不会接收新任务
- 但已提交任务会执行完
- 此方法不会阻塞调用线程的执行,比如如果主线程此时调用了这个shutDown方法,此时并不会阻塞主线程,如果主线程
*/
void shutdown();
//实现的源码
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 修改线程池状态
advanceRunState(SHUTDOWN);
// 仅会打断空闲线程
interruptIdleWorkers();
onShutdown(); // 扩展点 ScheduledThreadPoolExecutor
} finally {
mainLock.unlock();
}
// 尝试终结(没有运行的线程可以立刻终结,如果还有运行的线程也不会等)
tryTerminate();
}
/*
线程池状态变为 STOP
- 不会接收新任务
- 会将队列中的任务返回
- 并用 interrupt 的方式中断正在执行的任务
*/
List shutdownNow();
public List shutdownNow() {
List tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 修改线程池状态
advanceRunState(STOP);
// 打断所有线程
interruptWorkers();
// 获取队列中剩余任务
tasks = drainQueue();
} finally {
mainLock.unlock();
}
// 尝试终结
tryTerminate();
return tasks;
}
// 不在 RUNNING 状态的线程池,此方法就返回 true
boolean isShutdown();
// 线程池状态是否是 TERMINATED
boolean isTerminated();
// 调用 shutdown 后,由于调用线程并不会等待所有任务运行结束,因此如果它想在线程池 TERMINATED 后做些事情,可以利用此方法等待
// 一般task是Callable类型的时候不用此方法,因为futureTask.get方法自带等待功能。
boolean awaitTermination(long timeout, TimeUnit unit) throws InterruptedException;
测试shutdown、shutdownNow、awaitTermination
@Slf4j(topic = "c.TestShutDown")
public class TestShutDown {
public static void main(String[] args) throws ExecutionException, InterruptedException {
ExecutorService pool = Executors.newFixedThreadPool(2);
Future result1 = pool.submit(() -> {
log.debug("task 1 running...");
Thread.sleep(1000);
log.debug("task 1 finish...");
return 1;
});
Future result2 = pool.submit(() -> {
log.debug("task 2 running...");
Thread.sleep(1000);
log.debug("task 2 finish...");
return 2;
});
Future result3 = pool.submit(() -> {
log.debug("task 3 running...");
Thread.sleep(1000);
log.debug("task 3 finish...");
return 3;
});
log.debug("shutdown");
pool.shutdown();
// pool.awaitTermination(3, TimeUnit.SECONDS);
// List runnables = pool.shutdownNow();
// log.debug("other.... {}" , runnables);
}
}
#shutdown依旧会执行剩下的任务
20:09:13.285 c.TestShutDown [main] - shutdown
20:09:13.285 c.TestShutDown [pool-1-thread-1] - task 1 running...
20:09:13.285 c.TestShutDown [pool-1-thread-2] - task 2 running...
20:09:14.293 c.TestShutDown [pool-1-thread-2] - task 2 finish...
20:09:14.293 c.TestShutDown [pool-1-thread-1] - task 1 finish...
20:09:14.293 c.TestShutDown [pool-1-thread-2] - task 3 running...
20:09:15.303 c.TestShutDown [pool-1-thread-2] - task 3 finish...
#shutdownNow立刻停止所有任务
20:11:11.750 c.TestShutDown [main] - shutdown
20:11:11.750 c.TestShutDown [pool-1-thread-1] - task 1 running...
20:11:11.750 c.TestShutDown [pool-1-thread-2] - task 2 running...
20:11:11.750 c.TestShutDown [main] - other.... [java.util.concurrent.FutureTask@66d33a]
定义
让有限的工作线程(Worker Thread)来轮流异步处理无限多的任务。也可以将其归类为分工模式,它的典型实现就是线程池,也体现了经典设计模式中的享元模式。
例如,海底捞的服务员(线程),轮流处理每位客人的点餐(任务),如果为每位客人都配一名专属的服务员,那 么成本就太高了(对比另一种多线程设计模式:Thread-Per-Message)
注意,不同任务类型应该使用不同的线程池,这样能够避免饥饿,并能提升效率;
例如,如果一个餐馆的工人既要招呼客人(任务类型A),又要到后厨做菜(任务类型B)显然效率不咋地,分成 服务员(线程池A)与厨师(线程池B)更为合理,当然你可能想到更细致的分工;
饥饿
使用固定大小线程池会有饥饿现象 ;线程池中的线程不足会导致饥饿现象;
两个工人是同一个线程池中的两个线程
他们要做的事情是:为客人点餐和到后厨做菜,这是两个阶段的工作
客人点餐:必须先点完餐,等菜做好,上菜,在此期间处理点餐的工人必须等待
后厨做菜:没啥说的,做就是了
比如工人A 处理了点餐任务,接下来它要等着 工人B 把菜做好,然后上菜,他俩也配合的蛮好
但现在同时来了两个客人,这个时候工人A 和工人B 都去处理点餐了,这时没人做饭了,饥饿
案例:
public class TestDeadLock {
static final List MENU = Arrays.asList("地三鲜", "宫保鸡丁", "辣子鸡丁", "烤鸡翅");
static Random RANDOM = new Random();
static String cooking() {
return MENU.get(RANDOM.nextInt(MENU.size()));
}
public static void main(String[] args) {
ExecutorService executorService = Executors.newFixedThreadPool(2);
executorService.execute(() -> {
log.debug("处理点餐...");
Future f = executorService.submit(() -> {
log.debug("做菜");
return cooking();
});
try {
log.debug("上菜: {}", f.get());
} catch (InterruptedException | ExecutionException e) {
e.printStackTrace();
}
});
executorService.execute(() -> {
log.debug("处理点餐...");
Future f = executorService.submit(() -> {
log.debug("做菜");
return cooking();
});
try {
log.debug("上菜: {}", f.get());
} catch (InterruptedException | ExecutionException e) {
e.printStackTrace();
}
});
}
}
运行的结果可能是:
17:08:41.339 c.TestDeadLock [pool-1-thread-2] - 处理点餐...
17:08:41.339 c.TestDeadLock [pool-1-thread-1] - 处理点餐...
因为线程池的数量有限,可能就会导致像死锁一样的情况(这里并不是真的死锁,这样讲是为了帮助理解),都卡在哪里等待;
过小会导致程序不能充分地利用系统资源、容易导致饥饿
过大会导致更多的线程上下文切换,占用更多内存
CPU 密集型运算
通常采用 cpu 核数 + 1
能够实现最优的 CPU 利用率,+1 是保证当线程由于页缺失故障(操作系统)或其它原因 导致暂停时,额外的这个线程就能顶上去,保证 CPU 时钟周期不被浪费
I/O 密集型运算
CPU 不总是处于繁忙状态,例如,当你执行业务计算时,这时候会使用 CPU 资源,但当你执行 I/O 操作时、远程 RPC 调用时,包括进行数据库操作时,这时候 CPU 就闲下来了,你可以利用多线程提高它的利用率。
经验公式如下
线程数 = 核数 * 期望 CPU 利用率 * 总时间(CPU计算时间+等待时间) / CPU 计算时间
例如 4 核 CPU 计算时间是 50% ,其它等待时间是 50%,期望 cpu 被 100% 利用,套用公式
4 * 100% * 100% / 50% = 8
例如 4 核 CPU 计算时间是 10% ,其它等待时间是 90%,期望 cpu 被 100% 利用,套用公式
4 * 100% * 100% / 10% = 40
这里是针对jdk1.8版本,使用jdk自带的线程时会出现OOM问题(就是内存被堆爆了),中小型公司一般很难遇到这种情况,但是在阿里巴巴开发文档上有明确的标识,线程不允许使用Executors去创建,而是通过ThreadPooleExecutor的方式(就是根据自己的业务需求自定义创建线程池),这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险;
如果自己不会定义的话,可以参考源码呀,可以把源码自己复制粘贴在自己写的类,然后再改一下基本的数据参数即可,但是数据别乱改,得参考自己的设备,别负荷运行了;
如果遇到不会的,先看源码是怎么写的,看能不能复制过来使用?看看人家是怎么实现的?如果我们不能直接使用那我们可不可以看他是如何实现的,我们也去实现这个接口,让我们和它有一样的功能;
package threadpool;
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
/**
* 尝试自定义线程池
*/
public class CustomThreadPool {
public static void main(String[] args) throws InterruptedException {
/**
* corePoolSize:核心线程数
* maximumPoolSize:线程池里的最大线程数
* long keepAliveTime:救急线程的活跃时间
* TimeUnit unit:时间单位
* BlockingQueue workQueue:任务队列,用于存放提交但是尚未被执行的任务
* ThreadFactory threadFactory:用于创建线程,在这里可以自定义线程name
* RejectedExecutionHandler handler:使用默认的AbortPolicy()
*/
// ExecutorService executorService = new ThreadPoolExecutor(5, 10, 60L, TimeUnit.SECONDS,
// new ArrayBlockingQueue<>(50), new MyThreadFactory(),
// 使用默认的拒绝访问方法
// new ThreadPoolExecutor.AbortPolicy()
// );
ExecutorService executorService = new ThreadPoolExecutor(5, 10, 60L,
TimeUnit.SECONDS, new ArrayBlockingQueue<>(50), new MyThreadFactory(),
//这个拒绝策略可以自定义
((runnable,executor) -> {
System.out.println("这个任务我们没法处理了");
})
);
//测试自己创建线程池可不可以使用 结果发现执行的线程池不会被销毁
//提交的线程任务参数也只能是 实现runnable接口的对象或者是实现Callable接口对象
executorService.submit(()->{
System.out.println("----");
});
//让线程池停止
executorService.shutdown();
//参数最大线程数
for (int i = 0; i < 100; i++) {
Thread.sleep(1000);
executorService.submit(()->{
System.out.println("520");
});
}
}
}
package threadpool;
import java.util.concurrent.ThreadFactory;
/**
* 这个类是给自定义的线程池用的线程工厂,怎么写的?是参照源码仿照的
*/
public class MyThreadFactory implements ThreadFactory {
@Override
public Thread newThread(Runnable r) {
return new Thread(r,"thread-name");
}
}
在『任务调度线程池』功能加入之前(JDK1.3),可以使用 java.util.Timer 来实现定时功能,Timer 的优点在于简单易用,但由于所有任务都是由同一个线程来调度,因此所有任务都是串行执行的,同一时间只能有一个任务在执行,前一个 任务的延迟或异常都将会影响到之后的任务。
不过这个Timer 已经过时了,不建议再使用了;
延时执行任务推荐使用 ScheduledExecutorService 类,
ScheduledExecutorService executor = Executors.newScheduledThreadPool(2);
// 添加两个任务,希望它们都在 1s 后执行
//这个schedule方法有三个参数,第一个参数是runnable或者是callable,第二个参数是延时多长时间去执行,第三个参数是时间单位
executor.schedule(() -> {
System.out.println("任务1,执行时间:" + new Date());
try { Thread.sleep(2000);
} catch (InterruptedException e)
{
e.printStackTrace();
}
}, 1000, TimeUnit.MILLISECONDS);
executor.schedule(() -> {
System.out.println("任务2,执行时间:" + new Date());
}, 1000, TimeUnit.MILLISECONDS);
//而且这个schedule是不会受到异常的影响的,即便第一个线程抛异常了。第二个线程依旧是可以正常运行的
使用scheduleAtFixedRate ;
ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
log.debug("start...");
//第一参数表示任务,第二个参数表示出现的延迟时间,第三个参数表示周期执行的时间间隔,第四个参数是时间间隔的单位
pool.scheduleAtFixedRate(() -> {
log.debug("running...");
}, 1, 1, TimeUnit.SECONDS);
21:45:43.167 c.TestTimer [main] - start...
21:45:44.215 c.TestTimer [pool-1-thread-1] - running...
21:45:45.215 c.TestTimer [pool-1-thread-1] - running...
21:45:46.215 c.TestTimer [pool-1-thread-1] - running...
21:45:47.215 c.TestTimer [pool-1-thread-1] - running...
如果每个任务的执行时间超过了间隔的时间,那么会发生什么呢? --- 时间间隔被挤长了,其他效果是没什么影响的;
代码测试:
ScheduledExecutorService pool = Executors.newScheduledThreadPool(1);
log.debug("start...");
pool.scheduleAtFixedRate(() -> {
log.debug("running...");
sleep(2);
}, 1, 1, TimeUnit.SECONDS);
输出分析:一开始,延时 1s,接下来,由于任务执行时间 > 间隔时间,间隔被『撑』到了 2s
21:44:30.311 c.TestTimer [main] - start...
21:44:31.360 c.TestTimer [pool-1-thread-1] - running...
21:44:33.361 c.TestTimer [pool-1-thread-1] - running...
21:44:35.362 c.TestTimer [pool-1-thread-1] - running...
21:44:37.362 c.TestTimer [pool-1-thread-1] - running...
小结:整个线程池表现为:线程数固定,任务数多于线程数时,会放入无界队列排队。任务执行完毕,这些线程也不会被释放。用来执行延迟或反复执行的任务
不论是哪个线程池,在线程执行的任务发生异常后既不会抛出,也不会捕获,这时就需要我们做一定的处理。
方法1:主动捉异常
ExecutorService pool = Executors.newFixedThreadPool(1);
pool.submit(() -> {
try {
log.debug("task1");
int i = 1 / 0;
} catch (Exception e) {
//一定不要生吞异常!!!
log.error("error:", e);
}
});
方法2:使用 Future
说明:
【lambda表达式内要有返回值,编译器才能将其识别为Callable】,否则将识别为Runnable,也就不能用FutureTask
方法中如果出异常,futuretask.get
会返回这个异常,否者正常返回。
ExecutorService pool = Executors.newFixedThreadPool(1);
Future f = pool.submit(() -> {
log.debug("task1");
int i = 1 / 0;
return true;
});
log.debug("result:{}", f.get());
这样的话报异常的话就可以被捕获输出到控制台,这样有利于定位异常的位置;
Fork/Join 是 JDK 1.7 加入的新的线程池实现,它体现的是一种分治思想,适用于能够进行任务拆分的 cpu 密集型运算;
所谓的任务拆分,是将一个大任务拆分为算法上相同的小任务,直至不能拆分可以直接求解。跟递归相关的一些计 算,如归并排序、斐波那契数列、都可以用分治思想进行求解
Fork/Join 在分治的基础上加入了多线程,可以把每个任务的分解和合并交给不同的线程来完成,进一步提升了运 算效率
Fork/Join 默认会创建与 cpu 核心数大小相同的线程池;
应用之求和
提交给 Fork/Join 线程池的任务需要继承 RecursiveTask(有返回值)或 RecursiveAction(没有返回值),例如下 面定义了一个对 1~n 之间的整数求和的任务
@Slf4j(topic = "c.AddTask")
class AddTask1 extends RecursiveTask {
int n;
public AddTask1(int n) {
this.n = n;
}
@Override
public String toString() {
return "{" + n + '}';
}
@Override
protected Integer compute() {
// 如果 n 已经为 1,可以求得结果了 创建终止拆分的条件
if (n == 1) {
log.debug("join() {}", n);
return n;
}
// 将任务进行拆分(fork)
AddTask1 t1 = new AddTask1(n - 1);
t1.fork(); //让线程池的线程去执行此任务
log.debug("fork() {} + {}", n, t1);
// 合并(join)结果
int result = n + t1.join();
log.debug("join() {} + {} = {}", n, t1, result);
return result;
}
}
然后提交给 ForkJoinPool 来执行
public static void main(String[] args) {
ForkJoinPool pool = new ForkJoinPool(4);
System.out.println(pool.invoke(new AddTask1(5)));
}
[ForkJoinPool-1-worker-0] - fork() 2 + {1}
[ForkJoinPool-1-worker-1] - fork() 5 + {4}
[ForkJoinPool-1-worker-0] - join() 1
[ForkJoinPool-1-worker-0] - join() 2 + {1} = 3
[ForkJoinPool-1-worker-2] - fork() 4 + {3}
[ForkJoinPool-1-worker-3] - fork() 3 + {2}
[ForkJoinPool-1-worker-3] - join() 3 + {2} = 6
[ForkJoinPool-1-worker-2] - join() 4 + {3} = 10
[ForkJoinPool-1-worker-1] - join() 5 + {4} = 15
15
但是我们发现这个这个任务的依赖性太强了,所以还可以继续优化......这也告诉我们如果没有合理的设计这个任务拆分,那是会影响的程序的性能的;但是好消息是在jdk8后,这个任务的拆分是交给了框架的内部来完成,其实就是stream流的api使用;