故障定级

故障分为P1-4级

P1

系统无法访问

有10%以上的查询无结果,或者无法查询

booking失效比率超过5%

P2

5%以上的查询无结果

1%以上的booking失效

重要wrapper获取率为0,且没有发现

P3

2%以上的查询无结果

0..5%的booking失效

其他影响服务质量的故障

P4

其他故障,不影响线上业务

可用率计算

A = 1-(T(P1) + T(P2) * 0.5 + T(P3) * 0.25)/T

T为计算时段的总时间

P1-2的故障需要Ops会同相关产品开发部门进行故障review

P1-3的故障,如不是监控系统发现,需要review监控系统

所有故障的故障报告,和故障review应该在故障发生后24小时内完成

你可能感兴趣的:(故障定级)