在JDK的并发包里提供了几个非常有用的并发工具类。CountDownLatch、CyclicBarrier和Semaphore工具类提供了一种并发流程控制的手段,Exchanger工具类提供了在线程间交换数据的一种方法。本章会配合一些应用场景来介绍如何使用这些工具类。
CountDownLatch允许一个或多个线程等待其他线程完成操作。
可以把CountDownLatch使用比作一个导游带队的场景,只有所有队员都到齐了,导游才能宣布去下一个景点。
假如有这样一个需求:我们需要解析一个Excel里多个sheet的数据,此时可以考虑使用多线程,每个线程解析一个sheet里的数据,等到所有的sheet都解析完成之后,程序需要提示解析完成。
在JDK1.5之后的并发包中提供的CountDownLatch也可以实现join的功能,并且比join的功能更多,如下所示:
public static void main(String[] args) throws InterruptedException {
CountDownLatch countDownLatch = new CountDownLatch(2);
new Thread(new Runnable() {
@Override
public void run() {
System.out.println(1);
countDownLatch.countDown();
System.out.println(2);
countDownLatch.countDown();
}
}).start();
countDownLatch.await();
System.out.println(3);
}
CountDownLatch的构造函数接收一个int类型的参数作为计算器,如果你想等待N个点完成,这里就传入N。
当我们调用CountDownLatch的countDown方法时,N就减1,CountDownLatch的await方法会阻塞当前线程,指定N变成零。由于countDown方法可以用在任何地方,所有这里说的N个点,可以是N个线程,也可以是1个线程的N个执行步骤。用在多个线程时,只需要把这个CountDownLatch的引用传递到线程里即可。
如果某个解析sheet的线程处理的比较慢,我们不可能让主线程一直等待,所以可以使用另外一个带指定时间的await方法一一await(long time, TimeUnit unit),这个方法等待特定时间后,就会不再阻挡当前线程。join也有类似的方法。
CyclicBarrier的字面意思是可循环使用(Cyclic)的屏障(Barrier)。它要做的事情是,让一组线程到达一个屏障(也可以叫同步点)时被阻塞,直到最后一个线程到达屏障时,屏障才会开门,所有被屏障拦截的线程才会继续运行。
可以想象一下,多个人等红灯的场景,红灯就是Barrier,假如10个人要过红绿灯,每个人到红绿灯前面时都要等待红灯变绿,恰巧当10个人都到齐是红灯变绿了,所有人就可以继续走了。
CyclicBarrier默认的构造方法是CyclicBarrier(int parties),其参数表示屏障拦截的线程数量,每个线程调用await方法告诉CyclicBarrier我已经到达了屏障,然后当前线程被阻塞。示例代码如下:
public static void main(String[] args) {
CyclicBarrier cyclicBarrier = new CyclicBarrier(2);
new Thread(() -> {
try {
cyclicBarrier.await();
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(1);
}).start();
try {
cyclicBarrier.await();
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(2);
}
因为主线程和子线程的调度是有CPU决定的,两个线程都有可能先执行,所以会产生两种输出,第一种可能是1,2;第二种是2,1。
如果把new CyclicBarrier(2)改成CyclicBarrier(3),则主线程和子线程会永远等待,因为没有第三个线程执行await方法,即没有第三个线程到达屏障,所以之前到达屏障的两个线程都不会继续执行。
CyclicBarrier还提供了一个高级的构造函数CyclicBarrier(int parties, Runnable barrierAction),用于在所有线程都到达屏障时,优先执行barrierAction,CyclicBarrier使用BarrierAction只是说明所有线程已经到达屏障了,然后CyclicBarrier执行barrierAction任务,最后线程在各自继续执行。这个构造方法方便处理更复杂的业务场景。
代码示例:
public static void main(String[] args) {
CyclicBarrier c = new CyclicBarrier(2, new A());
new Thread(() -> {
try {
c.await();
} catch (Exception e) {
e.printStackTrace();
}
try {
TimeUnit.SECONDS.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(2);
}).start();
try {
c.await();
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(1);
}
static class A implements Runnable {
@Override
public void run() {
System.out.println(3);
}
}
执行结果:
3
1
2
CyclicBarrier可以用于多线程计算数据,最后合并计算结果的场景。例如,用一个Excel保存了用户所有银行流水,每个Sheet保存一个账号近一年的每笔银行流水,现在需要统计用户的日均银行流水,先用多线程处理每个sheet里的银行流水,都执行完之后,得到每个sheet的日均银行流水,最后,再用barrierAction汇总这些线程的计算结果,计算出整个Excel的日均银行流水,代码如下:
public static void main(String[] args) {
BankWaterService bankWaterService = new BankWaterService();
bankWaterService.count();
}
static class BankWaterService implements Runnable {
private final CyclicBarrier c = new CyclicBarrier(4, this);
private final ExecutorService executor = Executors.newFixedThreadPool(4);
private final ConcurrentHashMap<String, Integer> sheetBankWaterCount = new ConcurrentHashMap<>();
private void count() {
for (int i = 0; i < 4; i++) {
executor.execute(new Runnable() {
@Override
public void run() {
sheetBankWaterCount.put(Thread.currentThread().getName(), 1);
try {
c.await();
System.out.println(Thread.currentThread().getName());
} catch (Exception e) {
}
}
});
}
}
@Override
public void run() {
int result = 0;
for (Map.Entry<String, Integer> sheet : sheetBankWaterCount.entrySet()) {
result += sheet.getValue();
}
System.out.println(result);
executor.shutdownNow();
}
}
输出结果:
4
pool-1-thread-1
pool-1-thread-3
pool-1-thread-4
pool-1-thread-2
Semaphore(信号量)是用来控制同时访问特定资源的线程数量,它通过协调各个线程,以保证合理的使用公共资源。
仅仅从字面上很难理解Semaphore所表达的含义,可以把它比作停车场控制流量的指示灯。比如停车场的容量是1000,只允许同时有一千辆车在这个停车场,其他的都必须在入口等待,所以前一千辆车会看到绿灯,可进入停车场,当停车场停满后指示灯变红,其他车不能进入停车场。但是如果前一千辆车有10辆已经离开了停车场,那么后面的10辆车就允许进入停车场。这个例子里说的车就是线程,进入停车场表示线程在执行,离开停车场表示线程执行完成,看见红灯表示线程被阻塞,不能执行。
Semaphore可以做流量控制,特别是公用资源有限的应用场景,比如数据库连接。
假如有一个需求,要读取几万个文件的数据,因为都是IO密集型任务,我们可以启动几十个线程并发的读取,但是如果读到内存后,还需要存储到数据库中,而数据库连接数只有10个,这是我们必须控制只有10个线程同时获取数据库连接保持数据,否则会报错无法获取数据库连接。这个时候,就可以使用Semaphore来做流量控制。
private static final int THREAD_COUNT = 30;
private static final ExecutorService executorService = Executors.newFixedThreadPool(THREAD_COUNT);
private static final Semaphore s = new Semaphore(10);
public static void main(String[] args) {
for (int i = 0; i < THREAD_COUNT; i++) {
executorService.execute(() -> {
try {
s.acquire();
System.out.println("save data");
s.release();
} catch (InterruptedException e) {
e.printStackTrace();
}
});
}
executorService.shutdown();
}
上面代码中,虽然有30个线程在执行,但是只允许10个线程并发执行。Semaphore的构造方法Semaphore(int permits)接收一个整型的数组,表示可用的许可证数量。Semaphore(10)表示允许10个线程获取许可证,也就是最大并发数是10。Semaphore的用法也很简单,首先线程使用Semaphore的acquire()方法获取一个许可证,使用完之后调用release()方法归还许可证。还可以使用tryAcquire()方法尝试获取许可证。
还有其他一下方法,这里暂不介绍了。
Exchanger(交换者)是一个用于线程间协作的工具类。Exchanger用于进行线程间的数据交换。它提供一个同步点,在这个同步点,两个线程可以交换彼此的数据。这两个线程通过exhange()方法交换数据,如果第一个线程先执行exhange()方法,它会一直等待第二个线程也执行exchange方法,当两个线程都达到同步点时,这两个线程就可以交换数据,将本线程生产出来的数据传递给对方。
Exchange可以用于校对工作,比如我们需要将纸质银行流水通过人工的方式录入成电子银行流水,为了避免错误,采用AB岗两人进行录入,录入到Excel之后,系统需要加载这两个Excel,并对两个Excel数据进行校对,看看是否录入一致,代码如下:
private static final Exchanger<String> exgr = new Exchanger<>();
private static final ExecutorService threadPool = Executors.newFixedThreadPool(2);
public static void main(String[] args) {
threadPool.execute(() -> {
String a = "银行流水A";
String exchange = null;
try {
exchange = exgr.exchange(a);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(exchange);
});
threadPool.execute(() -> {
String b = "银行流水B";
try {
String exchange = exgr.exchange(b);
System.out.println("A 录入的是:" + exchange + " B录入的是:" + b);
} catch (InterruptedException e) {
e.printStackTrace();
}
});
}
输出结果是:
A 录入的是:银行流水A B录入的是:银行流水B
银行流水B
如果两个线程一个没有执行exchange()方法,则会一直等待,如果单向特殊情况发生,避免一直等待,可以使用exchange(V x, long timeout, TimeUnit unit)设置最大等待时间。
本章配合一些应用场景介绍JDK提供的几个并发工具类,工作中可以在对应的业务场景中使用这些工具类。