已知:磁盘的故障率是8%/年,故障恢复的周期是3天(包括磁盘坏掉的当天)。
求:GlusterFS集群的可靠性达到99.99%的磁盘上限。
计算方法如下:
磁盘每年的故障率为:8%;
磁盘每天的故障率p=8%/365;(设定一年为365天)
因为磁盘时固定配对,并且故障恢复的周期是3天,所以一组磁盘(3个备份)出现故障的情况有三种:
1. 三块磁盘同一天坏掉(设其概率为q1)
则q1=365 * p3
2. 两块磁盘同一天坏掉(设其概率为q2)
则q2= 361 * p2 * 4* p + 2* p2 * 3 *p +2 * p2 * 2 *p
注:把时间限定在365天内,如果在第3天~第363天中的一天两块磁盘同时坏掉,那么要想这组磁盘出现故障,则第三块磁盘必须在两块磁盘同时坏掉的那天的前两天或者后两天内坏掉;如果两块磁盘同时在第2天坏掉,则第3块磁盘必须在第1天、第3天或者第4天坏掉;如果两块磁盘同时在第364天坏掉,则第3块磁盘必须在第365天、第363天或者第362天坏掉;如果两块磁盘在第1天坏掉,则第3块磁盘必须在第2天或第3天坏掉;如果两块磁盘在第365天坏掉,则第3块磁盘必须在第364天或第363天坏掉。
3. 三块磁盘分别不在同一天坏掉(设其概率为q3)
则q3 =363 *p3
注:一块磁盘在第1天~第363天中的一天坏掉,之后两天,第2块和第3块磁盘一次坏掉。
所以一组磁盘一年的可靠性为:P3=1-q1 –q2 –q3 =0.999999977
这样计算出来的可靠性如下:(n为磁盘组数)
n=2000: 0.9999540010574235
n=3000: 0.9999310023796049
n=4000: 0.9999080042307498
可靠性达到99.99%的磁盘上限为:4000*3=12000(个)
假设每个服务器12块磁盘,则可达到1000个节点。