Java多线程中FutureTask详解与正式环境问题定位

通过FutureTask的源码我们可以看到FuturenTask类实现了RunnableFuture接口,继承了Runnable和Future接口。
public class FutureTask implements RunnableFuture
public interface RunnableFuture extends Runnable, Future
FutureTask可以交给Executor执行,也可以由调用线程直接执行(FutureTask.run())。根据FutureTask.run()方法被执行的时机,FutureTask主要有以下几种状态:
1、未启动。FutureTask.run()方法还没有被执行之前,FutureTask处于未启动状态。当创建一个FutureTask,且没有执行FutureTask.run()方法之前,这个FutureTask处于未启动状态。
2、已启动。FutureTask.run()方法被执行的过程中,FutureTask处于已启动状态。
3、已完成。FutureTask.run()方法执行完后正常结束,或被取消(FutureTask.cancel(…)),或执行FutureTask.run()方法时抛出异常而异常结束,FutureTask处于已完成状态。
下面我们来看看这几种状态的变换过程示意图:

当FutureTask处于未启动或已启动状态时,执行FutureTask.get()方法将导致调用线程阻塞;当FutureTask处于已完成状态时,执行FutureTask.get()方法将导致调用线程立即返回结果或抛出异常。
当FutureTask处于未启动状态时,执行FutureTask.cancel()方法将导致此任务永远不会被执行;当FutureTask处于已启动状态时,执行FutureTask.cancel(true)方法将以中断执行此任务线程的方式来试图停止任务;当FutureTask处于已启动状态时,执行FutureTask.cancel(false)方法将不会对正在执行此任务的线程产生影响(让正在执行的任务运行完成);当FutureTask处于已完成状态时,执行FutureTask.cancel(…)方法将返回false。
下面我们看下get和cancel执行过程

FutureTask使用

FutureTask可以通过Executor执行,也可以通过ExecutorService.submit返回一个FutureTask,然后执行FutureTask里面的各种方法。
当一个线程需要等待另一个线程把某个任务执行完后它才能继续执行,此时可以使用FutureTask。假设有多个线程执行若干任务,每个任务最多只能被执行一次。当多个线程试图同时执行同一个任务时,只允许一个线程执行任务,其他线程需要等待这个任务执行完后才能继续执行

public class FutureTaskTest {
    private final ConcurrentMap<Object,Future<String>> taskCache =
            new ConcurrentHashMap<Object,Future<String>>();

    public String executionTask(final String taskName) 
            throws ExecutionException,InterruptedException{
        for(;;){
            Future<String> future = taskCache.get(taskName);
            if(future == null){
                Callable<String> task = new Callable<String>(){
                    @Override
                    public String call() throws Exception {
                        return taskName;
                    }

                };
                FutureTask<String> futureTask = new FutureTask<String>(task);
                // 如果存在taskName则不往map里放,返回值是放入的futureTask
                future = taskCache.putIfAbsent(taskName, futureTask);
                if(future == null){
                    future = futureTask;
                    futureTask.run();
                }
                try {
                    return futureTask.get();
                } catch (Exception e) {
                    taskCache.remove(taskName, future);
                    e.printStackTrace();
                }
            }
        }
    }
}

把上面的代码转换成流程图如下所示:

当两个线程试图同时执行同一个任务时,如果Thread 1执行putIfAbsent后Thread 2执行get获取任务,那么接下来Thread 2将在future.get()等待,直到Thread 1执行完futureTask.run()后Thread 2才能从(FutureTask.get())返回。

FutureTask实现原理

FutureTask的实现基于AbstractQueuedSynchronizer(AQS)。java.util.concurrent中的很多可阻塞类(比如ReentrantLock)都是基于AQS来实现的。AQS是一个同步框架,它提供通用机制来原子性管理同步状态、阻塞和唤醒线程,以及维护被阻塞线程的队列。JDK 6中AQS被广泛使用,基于AQS实现的同步器包括:ReentrantLock、Semaphore、ReentrantReadWriteLock、CountDownLatch和FutureTask。
每一个基于AQS实现的同步器都会包含两种类型的操作,第一个是至少一个acquire操作。这个操作阻塞调用线程,除非直到AQS的状态允许这个线程继续执行。FutureTask的acquire操作为get()/get(long timeout,TimeUnit unit)方法调用。
另一个是至少一个release操作。这个操作改变AQS的状态,改变后的状态可允许一个或多个阻塞线程被解除阻塞。FutureTask的release操作包括run()方法和cancel(…)方法。基于“复合优先于继承”的原则,FutureTask声明了一个内部私有的继承于AQS的子类Sync,对FutureTask所有公有方法的调用都会委托给这个内部子类。AQS被作为“模板方法模式”的基础类提供给FutureTask的内部子类Sync,这个内部子类只需要实现状态检查和状态更新的方法即可,这些方法将控制FutureTask的获取和释放操作。具体来说,Sync实现了AQS的tryAcquireShared(int)方法和tryReleaseShared(int)方法,Sync通过这两个方法来检查和更新同步状态。
Sync是FutureTask的内部私有类,它继承自AQS。创建FutureTask时会创建内部私有的成员对象Sync,FutureTask所有的的公有方法都直接委托给了内部私有的Sync。FutureTask.get()方法会调用AQS.acquireSharedInterruptibly(int arg)方法,这个方法的执行过程如下。
1、调用AQS.acquireSharedInterruptibly(int arg)方法,这个方法首先会回调在子类Sync中实现的tryAcquireShared()方法来判断acquire操作是否可以成功。acquire操作可以成功的条件为:state为执行完成状态RAN或已取消状态CANCELLED,且runner不为null。
2、如果成功则get()方法立即返回。如果失败则到线程等待队列中去等待其他线程执行release操作。
3、当其他线程执行release操作(比如FutureTask.run()或FutureTask.cancel(…))唤醒当前线程后,当前线程再次执行tryAcquireShared()将返回正值1,当前线程将离开线程等待队列并唤醒它的后继线程(这里会产生级联唤醒的效果,后面会介绍)。
4、最后返回计算的结果或抛出异常。
下面我们看看FutureTask.run()的执行过程
1、执行在构造函数中指定的任务(Callable.call())。
2、以原子方式来更新同步状态(调用AQS.compareAndSetState(int expect,int update),设置state为执行完成状态RAN)。如果这个原子操作成功,就设置代表计算结果的变量result的值为Callable.call()的返回值,然后调用AQS.releaseShared(int arg)。
3、AQS.releaseShared(int arg)首先会回调在子类Sync中实现的tryReleaseShared(arg)来执行release操作(设置运行任务的线程runner为null,然会返回true);AQS.releaseShared(int arg),然后唤醒线程等待队列中的第一个线程。
4、调用FutureTask.done()。
当执行FutureTask.get()方法时,如果FutureTask不是处于执行完成状态RAN或已取消状态CANCELLED,当前执行线程将到AQS的线程等待队列中等待(见下图的线程A、B、C和D)。当某个线程执行FutureTask.run()方法或FutureTask.cancel(…)方法时,会唤醒线程等待队列的第一
个线程(见下图所示的线程E唤醒线程A)。

假设开始时FutureTask处于未启动状态或已启动状态,等待队列中已经有3个线程(A、B和C)在等待。此时,线程D执行get()方法将导致线程D也到等待队列中去等待。当线程E执行run()方法时,会唤醒队列中的第一个线程A。线程A被唤醒后,首先把自己从队列中删除,然后唤醒它的后继线程B,最后线程A从get()方法返回。线程B、C和D重复A线程的处理流程。最终,在队列中等待的所有线程都被级联唤醒并从get()方法返回。

多线程正式环境问题定位

多线程的问题往往不好定位,主要大脑模拟各种可能出现问题的场景,然后通过分析日志、系统状态和dump线程,下面我们介绍几种方式方便我们定位问题。

在Linux命令行下使用TOP命令查看每个进程的情况


我们的程序是Java应用,所以只需要关注COMMAND是Java的性能数据,COMMAND表示启动当前进程的命令,在Java进程这一行里有时候可以看到CPU利用率是>100%,不用担心,这个是当前机器所有核加在一起的CPU利用率

使用top的交互命令数字1查看每个CPU的性能数据


命令行显示了CPU3,说明这是一个4核的虚拟机,平均每个CPU利用率在3%以下。如果这里显示CPU利用率100%,则很有可能程序里写了一个死循环
参数说明
us:用户空间占用CPU百分比
1.0% sy:内核空间占用CPU百分比
0.0% ni:用户进程空间改变过优先级的进程占用CPU百分比
98.7% id:空闲CPU百分比
0.0% wa:等待输入/输出CPU时间百分比

使用top的交互命令H查看每个线程的性能信息


这里我们需要特别主要三种情况:
1、某个线程CPU利用率一直100%,则说明是这个线程有可能有死循环,我们可以记下这个PID。
2、某个线程一直在TOP 10的位置,这说明这个线程可能有性能问题。
3、CPU利用率高的几个线程在不停变化,说明并不是由某一个线程导致CPU偏高。
如果是第一种情况,也有可能是GC造成,可以用jstat命令看一下GC情况,看看是不是因为持久代或年老代满了,产生Full GC,导致CPU利用率持续飙高
还可以把线程dump下来,看看究竟是哪个线程、执行什么代码造成的CPU利用率高。执行以下命令,把线程dump到文件dump.test.log里。执行如下命令。

sudo -u admin /opt/usr/java/bin/jstack 31177 > /home/fuyuwei/dump.test.log
"http-0.0.0.0-7001-97" daemon prio=10 tid=0x000000004f6a8000 nid=0x555e in Object.
wait() [0x0000000052423000]
java.lang.Thread.State: WAITING (on object monitor)
at java.lang.Object.wait(Native Method)
- waiting on (a org.apache.tomcat.util.net.AprEndpoint$Worker)
at java.lang.Object.wait(Object.java:485)
at org.apache.tomcat.util.net.AprEndpoint$Worker.await(AprEndpoint.java:1464)
- locked (a org.apache.tomcat.util.net.AprEndpoint$Worker)
at org.apache.tomcat.util.net.AprEndpoint$Worker.run(AprEndpoint.java:1489)
at java.lang.Thread.run(Thread.java:662)

dump出来的线程ID(nid)是十六进制的,而我们用TOP命令看到的线程ID是十进制的,所以要用printf命令转换一下进制。然后用十六进制的ID去dump里找到对应的线程
例如我们用top定位到PID=1234,然后转成十六进制

printf "%x\n" 1234
4d2

这里我们就简单介绍这几种方式吧。

你可能感兴趣的:(java,多线程,FutureTask,问题定位,线上)