Recitation 5

Recitation 5: A Case for Redundant Arrays of Inexpensive Disks(RAID)

Use your own word to describe different types of “RAID”.

  • RAID1: 使用镜像的方法。每一个数据盘,都会有一个镜像盘备份,利用效率为50%。
  • RAID2: 使用Hamming-code来进行数据校验。数据按位存储在磁盘组的各个磁盘上,需要根据数据的位数来确定每个磁盘组中磁盘的数量。比如,位宽为4的数据的磁盘组需要4个数据磁盘和3个校验磁盘,每读一个数据,需要读取7块磁盘。
  • RAID3: 每个磁盘组中使用1块磁盘用于校验。比如,通常将数据按位存放在磁盘组里的各个数据磁盘上,然后将这些位xor,存放在1块校验磁盘中,当有某块磁盘故障,可通过其它磁盘来进行数据重建。
  • RAID4: 与RAID3相似,每个组也需要1块校验磁盘,但是将同一个数据单元的数据写在同一块数据盘上。这样读写操作只需要涉及当前数据磁盘和校验磁盘,而不是像RAID3需要访问所有磁盘,RAID4的这种方法增加了IO的并行性。
  • RAID5: 不需要单独的校验磁盘。校验数据分布在磁盘组的各个磁盘上,这样写操作可以同时出现在不同的磁盘上(不再需要同时写校验磁盘),增加了并行性。

Why there are so many different types of RAID?

  • 数据存储的衡量主要包括性能、成本以及安全三个指标。不同等级,其对这三个指标的着重也不一样。因此,不同的RAID等级可适用于不同的应用场景,满足不同用户的需求。如下题所述。

Which scenarios are suitable for different types?

  • RAID1: 适用于对数据安全及其重视的应用,成本最高,比如金融、银行。
  • RAID2: 数据冗余开销太多,实际中很少应用。如果实在是需要,可能的情形是Disk Controller无法检测出磁盘错误,而需要Hamming-Code来进行错误检测。
  • RAID3: 非主流,应用少,不如用RAID4。适用于并发读写的情况比较少的,但单个数据可能比较大,对读写单个大数据的速度比较重视的情形。因为,它可以同时将单个数据的各个块进行读写,单个文件的读写速度快。
  • RAID4: 非主流,应用少,不如用RAID5。适用于想增加数据磁盘的使用寿命,而减少校验磁盘使用寿命的情形。
  • RAID5: 当前主流的RAID等级,兼顾了性能、数据安全以及存储成本,大多数数据中心使用该方案。

Modern RAID arrays use parity information and standby disks to provide a highly reliable storage medium even in the face of hardware failures. A highly reliable system, however, requires more than just a highly reliable storage medium. Consider a networked server handling network transactions (a web server or bank central computer, perhaps). Think about other components of this system whose failure could result in a loss of service. Identify one other component (software or hardware) of such a system that could be appropriately designed along the lines of one or another of the RAID levels, and describe the approach briefly or demonstrate in a picture, indicating how it relates to which RAID level

在网络传输的过程中,传输的数据有可能会出现bit flip,为了检测甚至纠正这个错误的位,必须增加数据冗余,对传输的数据进行Hamming编码,这个类似于RAID2。

你可能感兴趣的:(Recitation 5)