移动端应用性能多维监控——三翼鸟崩溃监控系统

APP出现了线上崩溃等问题,严重影响用户体验,一款成熟的崩溃监控产品是什么样的?如何快速接入 iOS & Android 双端应用,全方位采集多类型崩溃问题?期待数据可视化呈现,通过各种关键维度快速洞悉掌控崩溃数据?首次上报、最近上报、复现上报——问题的前世今生你都想知道?看这一篇就够啦!

1.项目背景

应用上线后的性能表现直接关系到用户的使用体验,影响用户的留存和忠诚度。根据友盟的调查数据,“如果应用发生崩溃,冻结或报错等现象,尤其是程序减速或崩溃卡死几秒钟这样的现象,53%的用户会将APP卸载”。

分析市面上第三方崩溃系统,发现存在数据权限受限、数据维度缺失、数据不准确、预警不完善、服务对接难、费用高昂等多种问题,严重影响系统的使用体验、问题分析的便利性和处理效率。

移动端应用性能多维监控——三翼鸟崩溃监控系统_第1张图片

鉴于相关第三方产品所存在的问题,三翼鸟数字化技术团队从2022年1月开始进行自主研发。

2.项目目标

  1. 赋能海尔智家各智慧小微产业移动端应用快捷地获取应用崩溃监控能力;

  1. 为接入应用提供实时、准确、清晰的崩溃数据,助力应用高效处理线上问题。

3.项目特色

  1. 全类型采集:全面采集底层到应用层多种类型崩溃问题,包括Java、native、Mach异常、NSException等;

  1. 智能解析&聚类:智能定位特征值,海量问题精准聚类;

  1. 可视化呈现:多维解析崩溃数据,全盘可视化,分析环节多步合一;

  1. 深度分析:日志检索、用户追查,还原问题轨迹,快速聚焦问题核心;

  1. 多策略预警:预警指标灵活组合,全景监控,实时告警;

  1. 服务及时,0费用:一站式接入平台服务毫秒级响应,0接入费用。

4.特色功能

4.1 数据概览

  • 今日数据实时呈现:数据实时刷新;支持查看实时数据、环比昨日同时段数据变化情况,及时发现异常问题;

  • 历史数据多维看板:崩溃趋势、新增问题趋势、部门分布等多种关键指标的可视化看板;历史数据保存时间达180天。

4.2崩溃分析——数据可视化呈现

历史趋势变化、多维分布:堆叠面积图展示总体变化趋势; 条形图展示关键维度分布情况以及TOP占比;可查看选定版本、时间范围的新增问题。

4.3 问题详情

  • 问题详情分析:支持查看问题首次上报、近期上报的时间和版本情况;支持查看问题历史上报趋势和关键维度分布,省去需要分析多个报告的过程;

  • 崩溃报告详情和关键堆栈:系统会对崩溃报告中的关键内容进行提取,直观展示报告关键信息;直观展示崩溃堆栈,快速定位问题根源;支持导出完整崩溃报告。

4.4 智能预警

自定义智能预警:自由选择预警应用版本; 提供阈值、对比昨日及连续多日上涨等规则,多种策略自由组合。

5.价值体现

5.1 线上崩溃问题在流程优化和效率提升方面有了明显的改观

  • 问题发现环节:从最初的被动等待用户反馈变为主动监控、及时修复;

  • 问题修复效果评估阶段:从修复后只能靠人工大量复现变为通过海量用户真实数据评估修复效果;

  • 多部门协同,将崩溃问题清晰地划分了责任团队,驱动各团队目标一致。

5.2 已支持5款应用接入

作为平台性产品,已赋能5款团队内部应用及产业应用接入监控崩溃问题。

5.3 帮助接入应用有效管控APP崩溃率

  • 智家(4月0.0997%,10月0.0560%)

  • 三翼鸟(6月0.0376%,10月0.0281%)

  • 三翼鸟工作台(6月4.7632%,10月0.0239%,崩溃率降低99.50%)

——低于App行业整体崩溃率10余倍

5.4 支持三翼鸟数字化、智家大脑及多个产业团队使用平台处理问题

  • 支持15+团队处理应用崩溃问题;

  • 目前已有累计200多位同事使用多维监控系统处理崩溃问题。

5.5 线上问题累计上报次数21万+

  • 累计监控线上问题上报次数210000+;

  • 累计监控线上问题数量10000+(聚合后数量);

  • 累计预警触发次数5000+。

5.6 平台完成3篇专利输出

  • 《日志的聚类方法和装置、存储介质及电子装置》

  • 《应用程序崩溃日志的处理方法、存储介质及电子装置》

  • 《iOS 崩溃聚类信息》

5.7 摆脱对三方系统依赖,提升数据稳定性

  • 崩溃系统替换阿里mPaaS系统,作为面向集团提供崩溃率数据的唯一出口;

  • 摆脱对mPaaS的依赖,提升了数据的稳定性和开发处理问题的效率。

6.技术亮点

6.1 双端崩溃全类型采集

  • 基于主流开源采集方案自研优化,安卓和iOS崩溃类型采集较mpaas更全面;

  • iOS数据采集量约阿里mPaaS的2倍,Android采集量与mPaaS相当。

6.2 智能提取特征值聚类

  • 针对不同问题类型设定差异化聚类规则,智能提取特征值进行聚类;

  • 配合去内存地址聚类、flutter聚类等规则,相比mPaaS聚类更加准确、全面。

6.3 与z·one打通,无需手动上传符号表

iOS问题需上传符号表解析。通过与构建平台打通,实现【应用打包→版本同步→符号表同步→自动解析】的自动化流程,免去手动上传符号表的繁琐操作。

6.4 崩溃时同步上传用户日志,提升问题处理效率

对于疑难问题,单纯依赖崩溃报告难以快速定位。多维系统在发生崩溃时可同步上报用户日志,为崩溃分析提供更多现场数据,疑难问题处理效率大幅提升。

6.5 数据隔离,研发过程数据不影响线上数据

三方系统通常无法区分线上数据与开发自测、提测等过程的数据。多维系统通过版本类型标注功能和分版本数据看板实现数据隔离,避免干扰数据影响线上数据统计结果。

7.本文作者及团队介绍

「 三翼鸟数字化技术平台-技术架构平台 」通过持续迭代演进移动端一站式接入平台为三翼鸟APP、智家APP等多个APP提供基础运行框架、系统通用能力API、日志、网络访问、页面路由、动态化框架、UI组件库等移动端开发通用基础设施;通过ZONE平台为三翼鸟子领域提供项目管理和技术实践支撑能力,完成从代码托管、CI/CD系统、业务发布、线上实时监控等Devops与工程效能基础设施搭建。

你可能感兴趣的:(研发,效能提升,重构,软件工程,ios,android)