稳定性保障实践-自动化

一、稳定性实践

故障预防

1、CodeReview & 自测(提供工具、冒烟case等)

2、代码检测 & 单测

3、页面压测 & 兼容 & monkey等测试

4、灰度发布 & 开关控制

5、重要活动故障演练

6、降级处理

故障发现

1、监控告警:js异常(0.3‰、0.1‰),页面错误,crash(设备数>=10),页面加载成功、取消率、bundle下载成功率、版本覆盖率、OOM、ANR、白屏等

2、日常巡检,如白屏
3、告警群&接入oncall,及时周知

故障定位 1、埋点日志上报
2、用户行为分析
故障恢复 1、开关关闭
2、热修
故障改进

1、故障复盘

2、问题改进

二、稳定性压测

        基于UI实现,检测双端页面在长时间运行下,是否存在crash、oom、js error的工具

稳定性保障实践-自动化_第1张图片

        运行的时候先获取设备集,获取配置(执行手机,测试用例,超时时间,重试策略等)、然后按照策略(全量/单个/多个分配)执行case,通过接口调用 & 日志检测监控异常,最后回调atm接口,上传接口,并将失败接口通知接口人

你可能感兴趣的:(react,native,压力测试)