可用度计算总结
可用度计算方案: 术语: MTTR、MTTF、MTBF是体现系统可靠性的重要指标,但是三者容易混淆,下文使用图解方式解释三者之间的区别,希望能起到解惑的效用。 MTTF (Mean Time To Failure,平均无故障时间),指系统无故障运行的平均时间,取所有从系统开始正常运行到发生故障之间的时间段的平均值。 MTTF =∑T1/ N MTTR (Mean Time To Repair,平均修复时间),指系统从发生故障到维修结束之间的时间段的平均值。MTTR =∑(T2+T3)/ N MTBF (Mean Time Between Failure,平均失效间隔),指系统两次故障发生时间之间的时间段的平均值。 MTBF =∑(T2+T3+T1)/ N 很明显:MTBF= MTTF+ MTTR 计算方案: 在告警系统中: 单机可用度 = MTTF / MTBF MTTF(∑T1/ N) : 平均无灾难级别告警的时间 MTTR(∑(T2+T3)/ N) 灾难级别告警从产生到修复的平均时间 MTBF(∑(T2+T3+T1)/ N): 灾难级别告警从上次修复到下次产生并修复的平均时间 具体计算逻辑: (1)当至少有一个未解决的灾难级别告警时:系统可用度为0% (2)当有0个未解决的灾难级别告警时: a. 若已解决的灾难级别告警数为0,则系统可用度为100% b.