Android性能监测:Looper机制监测卡顿和丢帧(二)

Android性能监测:Looper机制监测卡顿和丢帧(二)


附录1使用Android的Choreographer监测App发生的UI卡顿丢帧问题。Choreographer本身依赖于Android主线程的Looper消息机制。
发生在Android主线程的每16ms重绘操作依赖于Main Looper中消息的发送和获取。如果App一切运行正常,无卡顿无丢帧现象发生,那么开发者的代码在主线程Looper消息队列中发送和接收消息的时间会很短,理想情况是16ms,这是也是Android系统规定的时间。但是,如果一些发生在主线程的代码写的太重,执行任务花费时间太久,就会在主线程延迟Main Looper的消息在16ms尺度范围内的读和写。

先看下Android官方实现的Looper中loop()函数代码官方实现:

    /**
     * Run the message queue in this thread. Be sure to call
     * {@link #quit()} to end the loop.
     */
    public static void loop() {
        final Looper me = myLooper();
        if (me == null) {
            throw new RuntimeException("No Looper; Looper.prepare() wasn't called on this thread.");
        }
        final MessageQueue queue = me.mQueue;

        // Make sure the identity of this thread is that of the local process,
        // and keep track of what that identity token actually is.
        Binder.clearCallingIdentity();
        final long ident = Binder.clearCallingIdentity();

        for (;;) {
            Message msg = queue.next(); // might block
            if (msg == null) {
                // No message indicates that the message queue is quitting.
                return;
            }

            // This must be in a local variable, in case a UI event sets the logger
            final Printer logging = me.mLogging;
            if (logging != null) {
                logging.println(">>>>> Dispatching to " + msg.target + " " +
                        msg.callback + ": " + msg.what);
            }

            final long slowDispatchThresholdMs = me.mSlowDispatchThresholdMs;

            final long traceTag = me.mTraceTag;
            if (traceTag != 0 && Trace.isTagEnabled(traceTag)) {
                Trace.traceBegin(traceTag, msg.target.getTraceName(msg));
            }
            final long start = (slowDispatchThresholdMs == 0) ? 0 : SystemClock.uptimeMillis();
            final long end;
            try {
                msg.target.dispatchMessage(msg);
                end = (slowDispatchThresholdMs == 0) ? 0 : SystemClock.uptimeMillis();
            } finally {
                if (traceTag != 0) {
                    Trace.traceEnd(traceTag);
                }
            }
            if (slowDispatchThresholdMs > 0) {
                final long time = end - start;
                if (time > slowDispatchThresholdMs) {
                    Slog.w(TAG, "Dispatch took " + time + "ms on "
                            + Thread.currentThread().getName() + ", h=" +
                            msg.target + " cb=" + msg.callback + " msg=" + msg.what);
                }
            }

            if (logging != null) {
                logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);
            }

            // Make sure that during the course of dispatching the
            // identity of the thread wasn't corrupted.
            final long newIdent = Binder.clearCallingIdentity();
            if (ident != newIdent) {
                Log.wtf(TAG, "Thread identity changed from 0x"
                        + Long.toHexString(ident) + " to 0x"
                        + Long.toHexString(newIdent) + " while dispatching to "
                        + msg.target.getClass().getName() + " "
                        + msg.callback + " what=" + msg.what);
            }

            msg.recycleUnchecked();
        }
    }


在loop()函数中,Android完成了Looper消息队列的分发,在分发消息开始,会打印一串log日志:

                logging.println(">>>>> Dispatching to " + msg.target + " " +
                        msg.callback + ": " + msg.what);

同时在消息处理结束后也会打印一串消息日志:

logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);

正常的情况下,分发消息开始到消息结束,理想的情况下应该在16ms以内。但是分发处理的消息到上层,由开发者代码接管并处理,如果耗时太久,就很可能超出16ms,也即发生了丢帧,超时太多,由于Android系统依赖主线程Looper重绘UI的消息迟迟得不到处理,那么就导致绘图动作停滞,用户视觉上就会感受到卡顿。
利用这一特性和情景,可以使用主线程的Looper监测系统发生的卡顿和丢帧。具体是这样的:首先给App的主线程Looper注册一个自己的消息日志输出打印器,正常情况下,该日志打印器将输出全部的Android Looper上的日志,但是在这里,技巧性的过滤两个特殊日志:

>>>>> Dispatching to

表示Looper开始分发主线程上的消息。

 

<<<<< Finished to

表示Looper分发主线程上的消失结束。

 

从>>>>> Dispatching to 到 <<<<< Finished to 之间这段操作,就是留给开发者所写的代码发生在上层主线程操作的动作,通常所说的卡顿也就发生这一段。
正确情况下,从消息分发(>>>>> Dispatching to)开始,到消息处理结束(<<<<< Finished to),这段操作理想情况应在16ms以内完成,如果超过这一时间,也即意味着卡顿和丢帧。
现在设计一种技巧性的编程方案:在(>>>>> Dispatching to)开始时候,延时一定时间(THREAD_HOLD)执行一个线程,延时时间为THREAD_HOLD,该线程只完成打印当前Android堆栈的信息。THREAD_HOLD即为开发者意图捕捉到的超时时间。如果没什么意外,该线程在THREAD_HOLD后,就打印出当前Android的堆栈信息。巧就巧妙在利用这一点儿,因为延时THREAD_HOLD执行的线程和主线程Looper中的线程是并行执行的,当在>>>>> Dispatching to时刻把延时线程任务构建完抛出去等待THREAD_HOLD后执行,而当前的Looper线程中的消息分发也在执行,这两个是并发执行的不同线程。
设想如果Looper线程中的操作代码很快就执行完毕,不到16ms就到了<<<<< Finished to,那么毫无疑问当前的主线程无卡顿和丢帧发生。如果特意把THREAD_HOLD设置成大于16ms的延时时间,比如1000ms,如果线程运行顺畅不卡顿无丢帧,那么从>>>>> Dispatching to到达<<<<< Finished to后,把延时THREAD_HOLD执行的线程删除掉,那么线程就不会输出任何堆栈信息。若不行主线程发生阻塞,当从>>>>> Dispatching to到达<<<<< Finished to花费1000ms甚至更长时间后,而由于到达<<<<< Finished to的时候没来得及把堆栈打印线程删除掉,因此就输出了当前堆栈信息,此堆栈信息刚好即为发生卡顿和丢帧的代码堆栈,正好就是所需的卡顿和丢帧检测代码。

如代码:

package zhangphil.test;

import android.os.Bundle;
import android.os.Handler;
import android.os.HandlerThread;
import android.os.Looper;
import android.support.annotation.Nullable;
import android.support.v7.app.AppCompatActivity;
import android.util.Log;
import android.util.Printer;
import android.view.View;

public class ANRActivity extends AppCompatActivity {

    private final String TAG = "卡顿性能检测";
    private CheckTask mCheckTask = new CheckTask();

    @Override
    protected void onCreate(@Nullable Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);

        check();

        setContentView(R.layout.activity_anr);
        findViewById(R.id.button).setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View v) {
                uiLongTimeWork();
            }
        });
    }

    private void check() {
        Looper.getMainLooper().setMessageLogging(new Printer() {
            private final String START = ">>>>> Dispatching to";
            private final String END = "<<<<< Finished to";

            @Override
            public void println(String s) {
                if (s.startsWith(START)) {
                    mCheckTask.start();
                } else if (s.startsWith(END)) {
                    mCheckTask.end();
                }
            }
        });
    }

    private class CheckTask {
        private HandlerThread mHandlerThread = new HandlerThread("卡顿检测");
        private Handler mHandler;

        private final int THREAD_HOLD = 1000;

        public CheckTask() {
            mHandlerThread.start();
            mHandler = new Handler(mHandlerThread.getLooper());
        }

        private Runnable mRunnable = new Runnable() {
            @Override
            public void run() {
                log();
            }
        };

        public void start() {
            mHandler.postDelayed(mRunnable, THREAD_HOLD);
        }

        public void end() {
            mHandler.removeCallbacks(mRunnable);
        }
    }

    private void uiLongTimeWork() {
        try {
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }

    /**
     * 输出当前异常或及错误堆栈信息。
     */
    private void log() {
        StringBuilder sb = new StringBuilder();
        StackTraceElement[] stackTrace = Looper.getMainLooper().getThread().getStackTrace();
        for (StackTraceElement s : stackTrace) {
            sb.append(s + "\n");
        }

        Log.w(TAG, sb.toString());
    }
}

运行输出:

07-24 10:12:08.476 17064-17110/zhangphil.test W/卡顿性能检测: java.lang.Thread.sleep(Native Method)
    java.lang.Thread.sleep(Thread.java:386)
    java.lang.Thread.sleep(Thread.java:327)
    zhangphil.test.ANRActivity.uiLongTimeWork(ANRActivity.java:78)
    zhangphil.test.ANRActivity.access$000(ANRActivity.java:13)
    zhangphil.test.ANRActivity$1.onClick(ANRActivity.java:28)
    android.view.View.performClick(View.java:6291)
    android.view.View$PerformClick.run(View.java:24931)
    android.os.Handler.handleCallback(Handler.java:808)
    android.os.Handler.dispatchMessage(Handler.java:101)
    android.os.Looper.loop(Looper.java:166)
    android.app.ActivityThread.main(ActivityThread.java:7425)
    java.lang.reflect.Method.invoke(Native Method)
    com.android.internal.os.Zygote$MethodAndArgsCaller.run(Zygote.java:245)
    com.android.internal.os.ZygoteInit.main(ZygoteInit.java:921)

可以看到当点击按钮故意制造一个卡顿后,卡顿被检测到,并且输出和定位到了卡顿的具体代码位置。
    总结起来,利用主线程的Looper检测卡顿和丢帧,从成对的消息分发(>>>>> Dispatching to),到消息处理结束(<<<<< Finished to),正常的理想时间应该在16ms以内,若当前代码耗时太多,这一段时间就会超过16ms。假设现在要检测耗时超过1秒(1000ms)的耗时操作,那就在>>>>> Dispatching to时刻,抛出一个延时执行的线程,该线程打印当前堆栈的信息,延时的时间特意设置成阈值1000。此种情况下,正常顺畅执行无卡顿无丢帧的代码从>>>>> Dispatching to到<<<<< Finished to之间不会超过设置的阈值1000ms,因此当Looper中的代码到达<<<<< Finished to就把之前抛出来延时执行的线程删除掉,也就不会输出任何堆栈信息。但是只有当耗时代码从>>>>> Dispatching to到<<<<< Finished to超过了1000ms,由于Looper中由于耗时操作很晚(超过我们设定的阈值)才到达<<<<< Finished to,没赶上删掉堆栈打印线程,于是堆栈线程得以有机会打印当前堆栈信息,这就是卡顿和丢帧的发生场景检测机制。
事实上可以灵活设置延时阈值THREAD_HOLD,从而检测到任何大于或等于该时间的耗时操作。


附录:
1,《Android性能:通过Choreographer检测UI丢帧和卡顿》链接:https://blog.csdn.net/zhangphil/article/details/81129246 

你可能感兴趣的:(Android)