一起精读源代码系列(2) Android Handler源码分析

做Android研发的同学不管是面试还是平时的工作中一定会遇到各种Handler相关的问题,这一篇我们就通过源代码一起探讨一下Android的Handler机制。本文的分析基于Android8.0源码。
1、一个小问题,有代码如下。一个函数延迟2秒执行,另一个函数延迟3秒执行,其中第一个函数执行了3秒,请问第二个函数会在什么时候执行。

        Handler handler = new Handler() {
            @Override
            public void handleMessage(Message msg) {
                super.handleMessage(msg);
                switch (msg.what) {
                    case 1:
                        methodOne();
                        break;
                    case 2:
                        methodTwo();
                        break;
                    default:
                        break;
                }
            }
        };
        handler.sendEmptyMessageDelayed(1, 2000);
        handler.sendEmptyMessageDelayed(2, 3000);

    private void methodTwo() {
        System.out.println("methodTwo");
    }

    private void methodOne() {
        System.out.println("methodOne");
        try {
            Thread.sleep(3000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.out.println("methodOneFinish");
    }

带着这个问题,开始本文分析。
先看构造函数

    public Handler() {
        this(null, false);
    }
    public Handler(Looper looper) {
        this(looper, null, false);
    }
    public Handler(Looper looper, Callback callback) {
        this(looper, callback, false);
    }
    public Handler(boolean async) {
        this(null, async);
    }
    public Handler(Callback callback, boolean async) {
        if (FIND_POTENTIAL_LEAKS) {
            final Class klass = getClass();
            if ((klass.isAnonymousClass() || klass.isMemberClass() || klass.isLocalClass()) &&
                    (klass.getModifiers() & Modifier.STATIC) == 0) {
                Log.w(TAG, "The following Handler class should be static or leaks might occur: " +
                    klass.getCanonicalName());
            }
        }

        mLooper = Looper.myLooper();
        if (mLooper == null) {
            throw new RuntimeException(
                "Can't create handler inside thread that has not called Looper.prepare()");
        }
        mQueue = mLooper.mQueue;
        mCallback = callback;
        mAsynchronous = async;
    }

    public Handler(Looper looper, Callback callback, boolean async) {
        mLooper = looper;
        mQueue = looper.mQueue;
        mCallback = callback;
        mAsynchronous = async;
    }

默认构造函数callback为null,async为false,async如果为true,则处理程序将调用Message#setAsynchronous,looper就是Looper.myLooper()的返回值,是从ThreadLocal中get到的一个值,也就是如下代码

    public static @Nullable Looper myLooper() {
        return sThreadLocal.get();
    }

跟踪到ThreadLocal的get函数

    public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }

第一行,获取当前线程;第二行,通过当前线程获取ThreadLocalMap实例。我们跟踪进去看一下

    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }

进入Thread类,发现t.threadLocals指的是ThreadLocal.ThreadLocalMap,初始值为null。
所以会调用setInitialValue函数

    private T setInitialValue() {
        T value = initialValue();
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
        return value;
    }

value返回为null,map初始值也为null,所以会进createMap

    void createMap(Thread t, T firstValue) {
        t.threadLocals = new ThreadLocalMap(this, firstValue);
    }

这里的泛型T是ThreadLocal包裹的泛型对象,在Looper类中,ThreadLocal包裹的泛型对象就是Looper。那这段代码的意思就是实例化了一个ThreadLocalMap,key为ThreadLocal类,value为Looper对象。ThreadLocalMap类在此不做详细说明,就理解为一个类似于键值对存储的数据结构就行。根据上面的代码分析,这里的value为null,所以最后return的也是null。
显而易见,如果myLooper返回值是这样的话Handler就无法工作了。所以我们要提到另外一个重要的函数,Looper.prepare

    private static void prepare(boolean quitAllowed) {
        if (sThreadLocal.get() != null) {
            throw new RuntimeException("Only one Looper may be created per thread");
        }
        sThreadLocal.set(new Looper(quitAllowed));
    }

这里sThreadLocal.get() 不能有值,因此,每个线程只能调用一次Looper.prepare函数。下面一行是ThreadLocal的set的过程

    public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
    }

这时候value就是new的一个Looper对象了,这样就做到了以ThreadLocal为key,Looper为value的键值对存进了ThreadLocalMap,ThreadLocalMap与当前线程进行了绑定。这样就做到了从当前线程中获取Looper。
所以在使用Handler之前,必须执行Looper.prepare,之所以我们平时在主线程中new Handler不需要执行,是因为在ActivityThread中已经帮我们执行了。参看ActivityThread第6525行。

        Looper.prepareMainLooper();
    public static void prepareMainLooper() {
        prepare(false);
        synchronized (Looper.class) {
            if (sMainLooper != null) {
                throw new IllegalStateException("The main Looper has already been prepared.");
            }
            sMainLooper = myLooper();
        }
    }

到此为止,构造函数中Looper的分析过程已完成,下面我们需要看另一个重要类的分析,也就是 mQueue = mLooper.mQueue这行代码的分析。mQuene是Handler类中的一个成员变量,类名为MessageQueue,根据英文翻译,可以理解为消息队列,但内部的数据结构并不是队列,内部存储的都是Message,从代码层面来讲其实是单链表的结构。mQuene来源于mLooper的成员变量,初始化的过程在

    private Looper(boolean quitAllowed) {
        mQueue = new MessageQueue(quitAllowed);
        mThread = Thread.currentThread();
    }

Message类有几个重要的属性,在这里先大概列出来

    public int what;
    public int arg1;
    public int arg2;
    public Object obj;
    long when;
    Bundle data;
    Handler target;
    Message next;

前面打好了基础,接下来,我们就可以开始看整个Handler的运行机制了。以文章开头的问题为例,我们来看下代码的执行过程。首先是new Handler,这个上文已经分析过了,然后里面有一个handleMessage的覆盖,我们看下这里是怎么回调过来的。
首先来到ActivityThread的第6541行

        Looper.loop();

这个loop函数有50多行,我们从头分析。前几行是这样的

        final Looper me = myLooper();
        if (me == null) {
            throw new RuntimeException("No Looper; Looper.prepare() wasn't called on this thread.");
        }
        final MessageQueue queue = me.mQueue;

通过throw的异常可以看出,在线程中执行loop之前必须先prepare。
然后拿到了MessageQuene实例。
再下面几行,启动了一个无限for循环

        for (;;) {
            Message msg = queue.next(); // might block
            if (msg == null) {
                // No message indicates that the message queue is quitting.
                return;
            }

目的就是不断的从quene中取message,message为null的时候退出循环。那我们需要看下next函数的具体实现。

    Message next() {
        // Return here if the message loop has already quit and been disposed.
        // This can happen if the application tries to restart a looper after quit
        // which is not supported.
        final long ptr = mPtr;
        if (ptr == 0) {
            return null;
        }

        int pendingIdleHandlerCount = -1; // -1 only during first iteration
        int nextPollTimeoutMillis = 0;
        for (;;) {
            if (nextPollTimeoutMillis != 0) {
                Binder.flushPendingCommands();
            }

            nativePollOnce(ptr, nextPollTimeoutMillis);

            synchronized (this) {
                // Try to retrieve the next message.  Return if found.
                final long now = SystemClock.uptimeMillis();
                Message prevMsg = null;
                Message msg = mMessages;
                if (msg != null && msg.target == null) {

可以看到,它也有一个无限for循环。然后有一个nativePollOnce函数的调用,这是一个native的函数,也就是c++的实现。主要功能是等待,直到有下一条消息为止。至于为什么死循环不会导致应用卡死(也就是ANR),这个我们稍后再讨论,先继续往下看。可以看到synchronized关键字修饰了this,可以看到取消息的过程是线程安全的。定义了两个参数prevMsg表示之前那条消息,msg表示下一条消息。

                    // Stalled by a barrier.  Find the next asynchronous message in the queue.
                    do {
                        prevMsg = msg;
                        msg = msg.next;
                    } while (msg != null && !msg.isAsynchronous());
                }
                if (msg != null) {
                    if (now < msg.when) {
                        // Next message is not ready.  Set a timeout to wake up when it is ready.
                        nextPollTimeoutMillis = (int) Math.min(msg.when - now, Integer.MAX_VALUE);
                    } else {

下面一个do while循环,从链表中尾部取出消息。当now小于msg.when,也就是当消息的执行之间大于现在的时间(这个when是开发者设定的消息执行时间点,后面也会解释),下一条message还没准备好,所以需要计算出还需要多久去唤醒这条消息,也就是nextPollTimeoutMillis 这个参数。如果当前时间大于next消息的执行时间,则执行如下代码

                        // Got a message.
                        mBlocked = false;
                        if (prevMsg != null) {
                            prevMsg.next = msg.next;
                        } else {
                            mMessages = msg.next;
                        }
                        msg.next = null;
                        if (DEBUG) Log.v(TAG, "Returning message: " + msg);
                        msg.markInUse();
                        return msg;
                    }
                } else {
                    // No more messages.
                    nextPollTimeoutMillis = -1;
                }

这就是获取消息的过程。首先mBlocked设置为false,阻塞的tag先关闭。如果当前一条消息不为null,则把链表的最后一条消息赋值给到prevMsg的next消息,否则把链表的最后一条消息赋值给mMessages这个成员变量。最后把链表的最后一条消息删除并且把当前取到的msg置为正在使用,把msg给return给调用者。再往后的源码就是IdelHandler的相关使用了,我们后面再具体分析。分析到这,就有几个结论了,我分别列举出来
1、MessageQuene是单链表。
2、每次取出的是链表尾部的消息,当这条消息未到执行时间,会计算出唤醒时间进入nativePollOnce等待唤醒,否则直接取出msg返回并从链表中删除这条msg。
3、当链表中没有msg的时候,nextPollTimeoutMillis为-1,持续nativePollOnce等待唤醒。

分析完了取消息的过程,继续回到之前的loop函数。

            try {
                msg.target.dispatchMessage(msg);
            } finally {
                if (traceTag != 0) {
                    Trace.traceEnd(traceTag);
                }
            }

msg.target指的是handler对象,也就是说looper从MessageQuene取到消息之后会进入到handler的dispatchMessage流程。

    /**
     * Handle system messages here.
     */
    public void dispatchMessage(Message msg) {
        if (msg.callback != null) {
            handleCallback(msg);
        } else {
            if (mCallback != null) {
                if (mCallback.handleMessage(msg)) {
                    return;
                }
            }
            handleMessage(msg);
        }
    }

我们假定不设置callBack,则最终进入到了handleMessage,这就是new Handler里面handleMessage函数的执行过程。
接下去是sendMessage的过程分析。通过跟踪sendMessage相关的源代码,可以发现不管是sendMessage还是sendEmptyMessage都最终会进入到如下函数

    public final boolean sendMessageDelayed(Message msg, long delayMillis)
    {
        if (delayMillis < 0) {
            delayMillis = 0;
        }
        return sendMessageAtTime(msg, SystemClock.uptimeMillis() + delayMillis);
    }

    public boolean sendMessageAtTime(Message msg, long uptimeMillis) {
        MessageQueue queue = mQueue;
        if (queue == null) {
            RuntimeException e = new RuntimeException(
                    this + " sendMessageAtTime() called with no mQueue");
            Log.w("Looper", e.getMessage(), e);
            return false;
        }
        return enqueueMessage(queue, msg, uptimeMillis);
    }

其中SystemClock.uptimeMillis() 是表示系统开机到当前的时间总数,单位是毫秒,但是,当系统进入深度睡眠(CPU休眠、屏幕休眠、设备等待外部输入)时间就会停止,但是不会受到时钟缩放、空闲或者其他节能机制的影响。官方解释如下

    /**
     * Returns milliseconds since boot, not counting time spent in deep sleep.
     *
     * @return milliseconds of non-sleep uptime since boot.
     */
    @CriticalNative
    native public static long uptimeMillis();

下面的enqueueMessage函数就是MessageQuene中Message的添加过程。
先截取一些代码看一下

        synchronized (this) {
            if (mQuitting) {
                IllegalStateException e = new IllegalStateException(
                        msg.target + " sending message to a Handler on a dead thread");
                Log.w(TAG, e.getMessage(), e);
                msg.recycle();
                return false;
            }

            msg.markInUse();
            msg.when = when;
            Message p = mMessages;
            boolean needWake;
            if (p == null || when == 0 || when < p.when) {
                // New head, wake up the event queue if blocked.
                msg.next = p;
                mMessages = msg;
                needWake = mBlocked;
            } else {

又看到了synchronized关键字,所以enqueueMessage也是线程安全的。通过精读上方代码,我们可以得出如下结论
1、p==null表示第一次sendMessage,则链表中只有这个消息。
2、when==0表示handler执行了sendMessageAtFrontOfQueue这个函数,官方文档标注的是说把消息放在消息队列的最前方,在单链表中指的是放到链表的尾部。
3、when 当p!=null&&when>0&&when>p.when的时候的执行流程如下

                // Inserted within the middle of the queue.  Usually we don't have to wake
                // up the event queue unless there is a barrier at the head of the queue
                // and the message is the earliest asynchronous message in the queue.
                needWake = mBlocked && p.target == null && msg.isAsynchronous();
                Message prev;
                for (;;) {
                    prev = p;
                    p = p.next;
                    if (p == null || when < p.when) {
                        break;
                    }
                    if (needWake && p.isAsynchronous()) {
                        needWake = false;
                    }
                }
                msg.next = p; // invariant: p == prev.next
                prev.next = msg;

启动一个死循环,直到p==null或者when 1、结论前提:p!=null&&when>0&&when>p.when
2、MessageQuene中每次进入新消息,都需要根据msg.when进行排序,msg.when越小,越接近链表尾部。
至此为止,源码层面的Handler机制全部分析完毕。
接下来,我们解答文出现的几个问题:
1、为什么要有looper死循环。
因为Java的Main函数执行完就退出了。对于Android这样的GUI程序,肯定不能执行完就退出,所以引入了死循环,让线程一直执行下去。
1、Looper.loop是一个死循环,为什么不会卡死Android UI,为什么不会导致ANR。
Android 所有的 UI 刷新和生命周期的回调都是由 Handler消息机制完成的,就是说 UI 刷新和生命周期的回调都是依赖 Looper 里面的死循环完成的。其中,在UI的渲染过程中,会调用到如下代码

    void scheduleTraversals() {
        if (!mTraversalScheduled) {
            mTraversalScheduled = true;
            mTraversalBarrier = mHandler.getLooper().getQueue().postSyncBarrier();
            mChoreographer.postCallback(
                    Choreographer.CALLBACK_TRAVERSAL, mTraversalRunnable, null);
            if (!mUnbufferedInputDispatch) {
                scheduleConsumeBatchedInput();
            }
            notifyRendererOfFramePending();
            pokeDrawLockIfNeeded();
        }
    }

其中有这么一行mHandler.getLooper().getQueue().postSyncBarrier();这就是说渲染view的过程也用到了handler机制,并且渲染message的优先级高于普通message。在Android各大组件的生命周期中,利用了ActivityThread类中的H类来处理,也是Handler机制。
2、nativePollOnce是什么。
参考linux epoll
3、文章开头的问题答案是什么。
第二个函数会等待第一个函数执行完了再执行。根据以上分析,dispatchMessage发生在loop for循环中,消息是一条条取出的,msg.when小的排在链表尾部,会优先被取出然后dispatch。handleMessage执行完了之后,才会取下一条消息执行。

下一篇预告:ConcurrentHashMap源码分析

你可能感兴趣的:(一起精读源代码系列(2) Android Handler源码分析)