崩溃日志收集框架方案选型调研

最近应项目需求,准备做崩溃日志收集框架,前期简单调研一番。

一、日志收集方案

类型 名称 描述 说明
java crash收集方法 Thread.setDefaultUncaughtExceptionHandler jvm提供的未捕获异常处理接口。 通过uncaughtException触发java crash日志收集。
native crash收集工具 Coffeecatch 实现简洁,改动容易, 存在兼容性问题(没有实践过,不清楚具体是什么兼容性问题)。 它的用法类似于try catch结构,将可能会发生crash的代码 放到try{}块中,发生crash后,在catch 块中提取crash信息。
利用logcat日志 Android提供的logcat日志。 需要在crash时启动新进程过滤logcat日志,不可靠。
BreakPad google提供的native crash日志收集工具集。 权威、跨平台、代码体量大。
三方开源库 Xcrash 爱奇艺开源的日志收集库. Android app可捕获java crash、native crash、anr。不需要 root 权限或任何系统权限。
三方服务(有可视化统计后台) Bugly 腾讯出品。 提供Android/ios两端,crash、anr等问题捕获与监控。
Fabric 国外一款log收集与分析工具。 java、native都能捕获,功能比较全,第一个Android项目用的就是它。
Umeng 友盟数据统计。 只能捕获Java层崩溃,而Native层则获取不到。

当然还有其他我没了解到的方案。

二、调研方案

1)自定义框架:Thread.setDefaultUncaughtExceptionHandler + breakPad:
Thread.setDefaultUncaughtExceptionHandler收集java crash,breakPad收集native crash。

breakPad使用体会主要有两点:

  • 生成的dump文件需要转换:
    崩溃捕获结果是一个二进制的minidump文件,需要通过minidump_stackwalk脚本转换为stacktrace才能提供分析,而处理dump文件时如果遇到对应系统库缺失、或者库版本错误的情况,就会无法拿到正确的backtrace。

  • 生成的dump文件较大,维护和上报困难:
    文件大小能轻松破M,大的可能在10M左右。

$:/sdcard/crashDump # ls -al
-rw-rw----  1 root sdcard_rw 733664 2020-06-16 11:02 0280a2f6-b056-4eca-23fde6bd-86f16e2f.dmp
-rw-rw----  1 root sdcard_rw 715752 2020-06-16 11:05 1d75cc29-23a5-44b6-47fe0eb7-8b48eec2.dmp

当然,native crash部分也有基于coffeecatch进行改进做的,这里没有调研过。

2)使用xcrash:

功能比较全面,还能捕获anr日志。爱奇艺19年中旬推出的开源日志收集框架,目前爱奇艺不同平台的多个项目都引入了xcrash,应该会持续维护,当然既然是开源,也可以自己弄过来结合项目情况自定义,自己来维护也行,总之比较靠谱。大厂的话一般也会有自己的统计后台,配合xcrash收集数据上报。

使用体会主要有三点:

  • 捕获到的崩溃信息丰富完善。

  • 崩溃发生时直接提取相应信息生成tombstone文件,能直接提供分析,不像breakpad的dump文件还需要转。

  • tombstone文件大小可控。一般在几十到上百K的水平。

$:/data/data/com.stan.xcrashdemo/files/tombstones # ls -al
-rw------- 1 u0_a251 u0_a251 19480 2020-06-16 17:56 tombstone_00001592301394345000_1.0__com.stan.xcrashdemo.java.xcrash
-rw------- 1 u0_a251 u0_a251 44351 2020-06-16 18:50 tombstone_00001592304623106296_1.0__com.stan.xcrashdemo.anr.xcrash

3)bugly:

bugly也有全面的日志收集能力,外加提供统计后台支持,属于一条龙服务。

这里简单对比下bugly和xcrash日志收集数据对比:

收集项 Xcrash Bugly
基本信息(应用版本,设备,系统等)
崩溃进程名
崩溃线程名
崩溃时间
LogCat日志
崩溃Native栈
崩溃Java栈
崩溃时网络情况
崩溃时内存情况
前后台情况
是否root
自定义信息支持(did,uuid,等)
ANR支持
Native崩溃支持
Java崩溃支持
页面路径跟踪 无(可加到自定义信息)
启动后使用时长
符号表
自定义错误
统计后台支持

你可能感兴趣的:(崩溃日志收集框架方案选型调研)