最近监控发现对账系统最近越来越慢,领导急了,开始询问我能优化一下性能吗。我深入看了对账系统的业务后,发现还是挺简单的:
代码如下:
while(存在未对账订单){
// 1.查询未对账订单
pos = getPOrders();
// 2.查询派送单
dos = getDOrders();
// 3.执行对账操作
diff = check(pos, dos);
// 4.差异写入差异库
save(diff);
}
考虑并行
优化系统性能,要找到系统瓶颈。
目前的系统,由于订单量和派送单量巨大,所以查询未对账订单getPOrders()和查询派送单getDOrders()较慢,如何优化呢?
目前对账系统是单线程处理,图形化后是下图这个样子。串行化系统,优化性能首先想到的是能否利用多线程并行处理。
所以,很容易看出该对账系统的瓶颈:查询未对账订单getPOrders()和查询派送单getDOrders()是否可并行呢?
当然。因为这俩操作并无先后顺序依赖。这俩最耗时的操作并行后,执行过程如下
对比单线程的执行,优化效果很明显。
如何用代码实现呢?
创建俩线程t1、t2,并行执行getPOrders()、getDOrders()。
主线程需等待t1、t2执行完,才执行check()、save(),所以要调用
t1.join()、t2.join()实现等待,当t1、t2退出时,调用t1.join()、t2.join()的主线程就会从阻塞态被唤醒,开始执行check()、save()。
while(存在未对账订单){
// 查询未对账订单
Thread T1 = new Thread(()->{
pos = getPOrders();
});
T1.start();
// 查询派送单
Thread T2 = new Thread(()->{
dos = getDOrders();
});
T2.start();
// 等待T1、T2结束
T1.join();
T2.join();
// 执行对账操作
diff = check(pos, dos);
// 差异写入差异库
save(diff);
}
这样优化就够了吗?
你发现,while循环每次都会创建新的线程,而创建线程是个性能开销很大的操作。最好能复用线程,所以想到使用线程池了吧!
线程池优化代码:
但有个问题,主线程如何知道getPOrders()、getDOrders()何时执行完呢?
前面主线程通过调用t1、t2的join()等待t1、t2的退出,但在线程池方案中,线程根本就不会退出,所以join()方法也就失效了。
// 创建2个线程的线程池
Executor executor = Executors.newFixedThreadPool(2);
while(存在未对账订单){
// 查询未对账订单
executor.execute(()-> {
pos = getPOrders();
});
// 查询派送单
executor.execute(()-> {
dos = getDOrders();
});
/* 等待 */
// 执行对账操作
diff = check(pos, dos);
// 差异写入差异库
save(diff);
}
如何解决呢?最直接的就是弄个计数器,初始值置2,当执行完
pos = getPOrders();
后,计数器-1。
执行完
dos = getDOrders();
后,也计数器-1。
在主线程,等待计数器0,这时说明这俩操作都执行完了。
而等待计数器0,就是一个条件变量,用管程实现就很简单。
还好JUC已经帮我们写好了这套逻辑:CountDownLatch。
使用代码如下:
Executor executor = Executors.newFixedThreadPool(2);
while(存在未对账订单){
// 计数器值,初始为2
CountDownLatch latch = new CountDownLatch(2);
executor.execute(()-> {
pos = getPOrders();
// 计数器-1
latch.countDown();
});
executor.execute(()-> {
dos = getDOrders();
// 计数器-1
latch.countDown();
});
// 等待两个查询操作结束(计数器 == 0)
latch.await();
diff = check(pos, dos);
save(diff);
}
还能再优化吗?毕竟程序员的追求是永无止境的。
我们已经将两个查询并行了,但这俩查询和check()、save()之间还是串行。
显然,这俩查询操作和对账操作也可以并行,即在执行对账操作时,可以同时去执行下一轮的查询:
这到底是怎么做到的呢?
两次查询操作能够和对账操作并行,对账操作还依赖查询操作的结果,有点生产者-消费者的味道了,俩查询是生产者,对账是消费者。
生产者-消费者模型,那就得有个队列,保存生产者生产的数据,而消费者从队列中消费数据。
针对对账项目,可以设计两个队列,并且两个队列的元素之间还有对应关系:
这俩队列的元素之间一一对应。
为啥设计为两个队列呢?
对账操作每次从订单队列、派单队列各取出一个元素,然后对这俩元素执行对账,数据一定不会乱掉。
如何用双队列实现完全并行呢?
最简单的设计:
看上去想法很简单,但其实还需要t1、t2工作步调一致,不能一个跑太快,一个跑太慢,只有这样才能做到各自生产完一条数据时,通知t3。
所以难点是:t1、t2只有都生产完一条数据时,才能一起向下执行,即t1、t2要互相等待,步调一致。
当t1、t2都生产完一条数据时,还要通知t3执行对账。
这又该如何用代码实现呢?
你依然可以利用一个计数器解决刚才说的难点,计数器初始为2,t1、t2生产完一条数据都将计数器-1。
若计数器:
JUC已经提供这种场景的工具类:CyclicBarrier。
线程T1负责查询订单,当查出一条时,调用 barrier.await() 来将计数器减1,同时等待计数器变成0;线程T2负责查询派送单,当查出一条时,也调用 barrier.await() 来将计数器减1,同时等待计数器变成0;当T1和T2都调用 barrier.await() 的时候,计数器会减到0,此时T1和T2就可以执行下一条语句了,同时会调用barrier的回调函数来执行对账操作。
非常值得一提的是,CyclicBarrier的计数器有自动重置的功能,当减到0的时候,会自动重置你设置的初始值。这个功能用起来实在是太方便了。
// 订单队列
Vector<P> pos;
// 派送单队列
Vector<D> dos;
Executor executor = Executors.newFixedThreadPool(1);
// 当计数器减至0,调用回调方法
final CyclicBarrier barrier = new CyclicBarrier(2, ()->{
executor.execute(()->check());
});
void check(){
P p = pos.remove(0);
D d = dos.remove(0);
diff = check(p, d);
save(diff);
}
void checkAll(){
// 循环查询订单库
Thread T1 = new Thread(()->{
while(存在未对账订单){
// 查询订单库
pos.add(getPOrders());
// 等待
barrier.await();
}
});
T1.start();
// 循环查询运单库
Thread T2 = new Thread(()->{
while(存在未对账订单){
// 查询运单库
dos.add(getDOrders());
// 等待
barrier.await();
}
});
T2.start();
}
注意这里设置线程池为单个线程,可以保证对账的操作按顺序执行。如果设置为多个,有可能会两个线程 A、B 同时查询,A 的订单先返回,B 的派送单先返回,造成队列中的数据不匹配。所以1个线程实现生产数据串行执行,保证数据安全。