RAID相关技术知识6

 

硬盘阵列可靠度的计算

 
   引言�D�D问题的提出及其思考
  三年前( 1998),我台上了音频工作站,外存储器是七只希捷9.1G的SCSI硬盘组成的RAID5(6/7)磁盘阵列柜,实际可用容量为54.6G,就当时而言,是一个较好的方案。后来,在做升级方案时,有人认为再买一只磁盘阵列柜,仍采用RAID5。也有人认为单只硬盘的容量已有了较大提高,不用磁盘阵列柜也是可行的,甚至可以考虑采用IDE硬盘作备份。其实问题的焦点是能否找到可靠度的数学模型,不就迎刃而解了吗。正是在这种情况下,我们作了一些资料收集与整理,对硬盘阵列的可靠度作了探索性求解,写成此文,以作抛砖引玉。
   RAID的特点
   1、成本低,功耗小,传输速率高。在RAID中,可以让很多磁盘驱动器同时传输数据,而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个的磁盘驱动器若干倍的速率。
   2、可以提供容错功能,提高了可靠度,当然这是以冗余为代价的。这是RAID获得广泛应用的重要原因之一。
   3、RAID是获得大容量存储器的价廉物美、简单易行的好方法。这是RAID获得广泛应用的又一重要原因。
   4、当RAID由硬盘阵列柜实现时,硬盘阵列柜的价格比起硬盘来往往是较贵的。
 
 
   RAID的可靠性模型
  这里所说的模型是指可靠度的模型,它和电路上的串并联不可混为一谈。例如若有两只电容并联,但任何一只失效,都会使系统失效,那么在可靠性计算中则被判为串联。各种 RAID可靠性模型示意图见左图。
   磁盘阵列可靠度的计算
  根据平均故障间隔时间 (MTBF),可以推断出单只磁盘的规定时间的无故障可靠度概率。按希捷网站提供的数据,SCSI硬盘的MTBF为100万小时,IDE硬盘的MTBF为40万小时。部分品牌的硬盘未给出MTBF,应该说,希捷的资料具有一定的代表性。按RAID可靠度的数学模型,计算出常见RAID的可靠度,并整理成表,以便对比。从该表不难看出,IDE的RAID1也有极高的可靠度。由于SCSI硬盘比IDE硬盘价格要贵得多,性能也高出不少,为了获得比较合理结论,可选择以下方式比较:规定时间内、相同价格下比可靠度;或规定时间内、相同可靠度下比价格;当然还有其他的比较方式。不难得出以下结论:SCSI硬盘一次性投资较大,相对一劳永逸,RAID的可选形式较多。IDE硬盘一次性投资小,要达到规定可靠度,必须分段投资,总价仍较低,相对麻烦,RAID的可选形式较少。由于计算机硬件发展极其迅速,上述结论最多只是特点而已,具体如何处理,还得视具体情况而定。
磁盘阵列可靠度表
时间
一年
两年
三年
 
SCSI硬盘可靠度   (MTBF=100万小时)
单只硬盘
0.991278257
0.982632582
0.974062314
Raid 0
0.982632583
0.965566792
0.948797391
Raid 0+1
0.999698372
0.998814354
0.997378292
Raid 1
0.999923931
0.999698372
0.999327236
Raid 5(2/3)
0.99977312
0.999105595
0.998016609
Raid 5(3/4)
0.999548877
0.998231871
0.99610166
Raid 5(4/5)
0.999252494
0.997087139
0.993614621
Raid 5(5/6)
0.998885246
0.995681075
0.990586456
Raid 5(6/7)
0.998448393
0.994023102
0.987046811
 
IDE 硬盘可靠度  (MTBF=40万小时)
单只硬盘
0.978338064
0.957145367
0.936411745
Raid 0
0.957145367
0.916127254
0.876866957
Raid 0+1
0.99816348
0.992965362
0.984838253
Raid 1
0.99953076
0.99816348
0.995956533
  结束语
  硬盘生产方给出的 MTBF是在特定的条件下作出的结论,一般来说,实际使用中环境各异,达不到那样好条件的较多。厂方测试用的硬盘一般无需经过长途运输,而客户用的硬盘都是有过运输经历的产品,甚至经过恶劣装运,使用技巧也是不容忽视的。因此实际可靠度会有所下降,但是各种形式的RAID之间的可靠度关系是客观存在的。
RAID产品的选择常涉及到磁盘阵列的可靠度计算的问题,在《硬盘阵列可靠度的计算》一文中对些做过介绍,但文中虽有定量的数据,却缺乏计算这些数据所需的公式。以下是原文作者的一些补充,对此有兴趣的朋友可以欢迎来信进一步交流。
  以单只硬盘的平均故障间隔( MTBF)为基础,考虑到硬盘是“机与电”有机结合的产品,(平均寿命)故障以“机的广义磨损”占主导地位,故推断它的平均无故障可靠度为指数分布,即单只硬盘可靠度:R=e-t/T。其中T为平均故障间隔,t为使用时间。依此为基础又可以算出RAID 0,1,5的平均无故障可靠度,分别用R0,R1和R5表示。设磁盘阵列由N(N属于自然数)个硬盘组成,那么:
  R 0=R N                (N>1)
  R 1=1-(1-R) N           (N>1)
  R 5=R N+NR (N-1)(1-R)      (N>2)
  通过定量计算可以看出:除 RAID 0以外,其余RAID形式的平均无故障可靠度都有大幅度的提高,一般高达一个数量级以上。通常说的磁盘阵列是指冗余阵列,而单纯的RAID 0不是冗余阵列,它往往是配合其他形式的RAID而完成特定的复合磁盘阵列功能,且具备冗余能力。冗余阵列的最大优势在于工作状态下完成故障盘的调换

你可能感兴趣的:(职场,休闲,RAID相关技术知识6)