如何分析ANR

参考文章:http://blog.csdn.net/dadoneo/article/details/8270107
书籍:Andriod高阶进阶

一、什么是Anr:

application not responding 程序无响应。程序在规定的时间内没有响应。
超时时间的计数一般是从按键分发给app开始。超时的原因一般有两种:**

1.当前的事件没有机会得到处理(即UI线程正在处理前一个事件,没有及时的完成或者looper被某种原因阻塞住了)
2.当前的事件正在处理,但没有及时完成

二、Anr的主要原因

ANR一般有三种类型:

1:KeyDispatchTimeout(5 seconds) --主要类型
按键或触摸事件在特定时间内无法得到响应

2:BroadcastTimeout(10 seconds)
BroadcastReceiver在的onRecieve运行在主线程中,短时间内无法处理完成导致

3:ServiceTimeout(20 seconds) --小概率类型
Service的各个声明周期在特定时间内无法处理完成

Anr场景分析

1.使用命令导出anr日志

adb pull /data/anr/traces.txt  ~/Desktop/

**2.分析关键信息
以每行的重点内容没准,每行自带时间戳

Process:anr发生的时间和进程,和生成traces文件的时间
CPUusage ... ago :cpu在anr发生前的使用情况
CPUusage ...later: cpu在anr后的使用情况
ABI:         手机的cpu架构
HEAP:     堆的内存信息
ANR in: 包名,和类名
Reason:原因
TOTAL:总的CPU使用率
prio:线程的优先级
tid:线程锁id  主线程的id为1  主要看这个线程的
Sleeping:线程的状态
sCount:线程被挂起的次数
dsCount:线程是否被调试
04-01 13:12:11.572** I/InputDispatcher( 220): Application is not responding**:Window{2b263310com.[Android](http://lib.csdn.net/base/android).email/com.android.email.activity.SplitScreenActivitypaused=false}.  5009.8ms since event, 5009.5ms since waitstarted
04-0113:12:11.572 I/WindowManager( 220): Input event dispatching timedout sending tocom.android.email/com.android.email.activity.SplitScreenActivity
04-01 **13:12:14.123 I/Process(  220): Sending signal. PID: 21404 SIG: 3---****发生**ANR**的时间和生成**trace.txt**的时间**
04-01 13:12:14.123 I/dalvikvm(21404):threadid=4: reacting to signal 3 
……
04-0113:12:15.872 E/ActivityManager(  220): ANR in com.android.email(com.android.email/.activity.SplitScreenActivity)
04-0113:12:15.872 E/ActivityManager(  220): Reason:keyDispatchingTimedOut
04-0113:12:15.872 E/ActivityManager(  220): Load: 8.68 / 8.37 / 8.53
04-0113:12:15.872 E/ActivityManager(  220): **CPUusage from 4361ms to 699ms ago** ----CPU在ANR发生前的使用情况

04-0113:12:15.872 E/ActivityManager(  220):   5.5%21404/com.android.email: 1.3% user + 4.1% kernel / faults: 10 minor
04-0113:12:15.872 E/ActivityManager(  220):   4.3%220/system_server: 2.7% user + 1.5% kernel / faults: 11 minor 2 major
04-0113:12:15.872 E/ActivityManager(  220):   0.9%52/spi_qsd.0: 0% user + 0.9% kernel
04-0113:12:15.872 E/ActivityManager(  220):   0.5%65/irq/170-cyttsp-: 0% user + 0.5% kernel
04-0113:12:15.872 E/ActivityManager(  220):   0.5%296/com.android.systemui: 0.5% user + 0% kernel
04-0113:12:15.872 E/ActivityManager(  220): **100%TOTAL: 4.8% user + 7.6% kernel + 87% iowait**
04-0113:12:15.872 E/ActivityManager(  220): **CPUusage from 3697ms to 4223ms later**:-- ANR后CPU的使用量
04-0113:12:15.872 E/ActivityManager(  220):   25%21404/com.android.email: 25% user + 0% kernel / faults: 191 minor
04-0113:12:15.872 E/ActivityManager(  220):    16% 21603/__eas(par.hakan: 16% user + 0% kernel
04-0113:12:15.872 E/ActivityManager(  220):    7.2% 21406/GC: 7.2% user + 0% kernel
04-0113:12:15.872 E/ActivityManager(  220):    1.8% 21409/Compiler: 1.8% user + 0% kernel
04-0113:12:15.872 E/ActivityManager(  220):   5.5%220/system_server: 0% user + 5.5% kernel / faults: 1 minor
04-0113:12:15.872 E/ActivityManager(  220):    5.5% 263/InputDispatcher: 0% user + 5.5% kernel
04-0113:12:15.872 E/ActivityManager(  220): **32%TOTAL: 28% user + 3.7% kernel**

典型的分析情况

1.如果TOTAL的和接近100,有可能是因为当前使用的app占用的cpu太高,导致系统将你的杀死。
2.如果TOTAL很小,则说明线程被阻塞了,主线程在等待下条消息的进入,任务在等待时anr。
3.如果ioWait很高,则说明是io操作导致的

分析
因为主线程被阻塞导致的关键信息。
at android.os.MessageQueue.nativePollOnce(Native Method)
at android.os.MessageQueue.next(MessageQueue.java:119)
at android.os.Looper.loop(Looper.java:110)

DALVIK THREADS:(mutexes: tll=0tsl=0 tscl=0 ghl=0 hwl=0 
hwll=0)"main" prio=5 tid=1NATIVE  | group="main" sCount=1 
dsCount=0obj=0x2aad2248 self=0xcf70  | sysTid=21404 nice=0 
sched=0/0cgrp=[fopen-error:2] 
handle=1876218976  
**at android.os.MessageQueue.nativePollOnce(Native Method)  
at android.os.MessageQueue.next(MessageQueue.java:119)  
at android.os.Looper.loop(Looper.java:110**) 
at android.app.ActivityThread.main(ActivityThread.java:3688)
 at java.lang.reflect.Method.invokeNative(Native Method)  
at java.lang.reflect.Method.invoke(Method.java:507)  
at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:866) 
at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:624) 
at dalvik.system.NativeStart.main(Native Method)

io读写导致的anr

关键点:ioWait很高,ContentResolver in AsyncTask onPostExecute
1.首先看到total中ioWait很高,说明是io操作导致的。

如何分析ANR_第1张图片
CEE1266B-9D96-40F2-8D20-8255B5B15355.png

2.具体原因
可以看到关键词sqlite,ContentResolver
如何分析ANR_第2张图片
474549C1-9397-40D2-9412-A0C713CA6220.png

在主线程进行了网络访问

关键词OSNetworkSystem.receiveStreamnet

如何分析ANR_第3张图片
828A13CA-3C5C-40FB-AFBD-CA132D27A92D.png

内存不足导致

可以看到TOTAL的使用率有98,所以内存不足。


如何分析ANR_第4张图片
F8E5A2DD-13F9-403C-8F6A-C72509E73CC7.png

关键词:VMWAITVMRuntime.trackExternalAllocation

广播阻塞导致anr

android.intent.action.SCREEN_OFF广播为order,即如果其中注册了此广播的任何应用在处理此广播时未返回,则会导致后续broadcast的失败,出现ANR,导致系统无法唤醒。而导致广播未被及时处理的原因,除了可能是由于对应的Receiver处理函数中一些操作长时间未完成外,也可能是由于整个应用进程被block了,从而没有机会去调用Receiver函数。
1.针对onRecieve中的耗时操作,可以将业务单独加入到一个线程中执行

如何分析ANR_第5张图片
Paste_Image.png

快速定位anr

1.如果是ANR问题 , 则搜索“ANR”关键词 。 快速定位到关键事件信息 。
2.如果是ForceClosed(程序强制关闭) 和其它异常退出信息,则搜索"Fatal" 关键词, 快速定位到关键事件信息 。

ANR的避免和检测

使用StrictModel
它是android sdk提供的一个用来检测代码中是否存在违规操作的工具类
1.线程检测策略
ThreadPolicy
1.detectCustomSlowCalls:检测耗时操作
2.detectDiskWrites:检测磁盘写入
3.detectDiskRead:检测磁盘读取
4.detectNetWork:检测网络
5.detectAll:启用所有策略
VmPolicy
虚拟机检测策略
1.detectActivityLeaks:是否存在activity泄露
2.detectLeakedClosableObjects:是否存在没有关闭的closable对象
3.detectLeakedSqlLiteObjects:是否存在sqlite对象泄露
4.detectClassInstanceLimit:是否存在实力个数超限制
5.detectALL:启用所有策略

使用方式

在application的oncreate方法前
StrictMode.setThreadPolicy(new StrictModel.ThreadPolicy.Builder().detectAll().penaltyLog().build());
//penlatyLog表示是否打印日志。

你可能感兴趣的:(如何分析ANR)