可用度计算总结

可用度计算方案:

术语:

MTTR、MTTF、MTBF是体现系统可靠性的重要指标,但是三者容易混淆,下文使用图解方式解释三者之间的区别,希望能起到解惑的效用。

MTTF (Mean Time To Failure,平均无故障时间),指系统无故障运行的平均时间,取所有从系统开始正常运行到发生故障之间的时间段的平均值。 MTTF =∑T1/ N

MTTR (Mean Time To Repair,平均修复时间),指系统从发生故障到维修结束之间的时间段的平均值。MTTR =∑(T2+T3)/ N

MTBF (Mean Time Between Failure,平均失效间隔),指系统两次故障发生时间之间的时间段的平均值。 MTBF =∑(T2+T3+T1)/ N

很明显:MTBF= MTTF+ MTTR
在这里插入图片描述

计算方案:

在告警系统中:

单机可用度 = MTTF / MTBF

MTTF(∑T1/ N) :
平均无灾难级别告警的时间

MTTR(∑(T2+T3)/ N)
灾难级别告警从产生到修复的平均时间

MTBF(∑(T2+T3+T1)/ N):

灾难级别告警从上次修复到下次产生并修复的平均时间

具体计算逻辑:

(1)当至少有一个未解决的灾难级别告警时:系统可用度为0%
(2)当有0个未解决的灾难级别告警时:
a. 若已解决的灾难级别告警数为0,则系统可用度为100%
b. 若已解决的灾难级别告警数大于0,则系统可用度采用下面公式计算

(∑T1/ N)/ (∑(T2+T3+T1)/ N)

= (∑T1)/ ∑(T2+T3+T1)

=∑(第二条灾难告警的开始时间 - 第一条灾难告警的修复时间)/ 最后一条灾难告警修复的时间 - 第一条灾难告警修复的时间

你可能感兴趣的:(可用度计算总结)