存储基础知识

RAID技术(硬盘阵列)

介绍

  1. RAID:(Redundant Arrays of Independent Disks),独立冗余磁盘阵列
    曾又叫(Redundant Arrays of Inexpensive Disks),廉价冗余磁盘阵列。
  2. 概述:将一个个单独的磁盘以不同的组合方式形成一个逻辑硬盘,从而提高了磁盘读取的性能和数据的安全性。
  3. 特点:高性能、高可靠。

RAID级别

RAID 0、1、2、3、4、5
RAID 6、7
RAID10(RAID1和RAID0的组合)
RAID01(RAID0和RAID1的组合)
RAID30(RAID3和RAID0的组合)
RAID50(RAID0和RID5的组合)

RAID0

定义:

把多个(最少2个)偶数块硬盘合成1个逻辑盘使用,数据读写时对各硬盘同时操作。

  1. 条带化(stripe)
  2. 将数据分成一定的大小顺序的写到阵列的磁盘里
  3. 可以并行的执行读写操作,可以充分利用总线带宽,传输速度快。
缺点:

不提供数据冗余保护,一旦诗句损坏将无法恢复。

应用于:对读取性能要求较高,但所存储的数据非重要数据的情况。

RAID1

定义:

同时对两个硬盘读写,强调数据安全性,资源存在浪费的可能。
也叫镜像(mirror)因为它将数据完全一致的分别写到工作磁盘和镜像磁盘里,磁盘空间的利用率只有50%。

缺点:

资源浪费,读取时没有影响,但写入时会有影响。

应用于:

提供了最佳的数据保护,工作磁盘发生故障,系统会自动从镜像磁盘读取数据。所以主要应用于对数据保护及为重视的应用。

RAID2

定义:

被称为纠错海明码磁盘阵列,阵列中序号为2N的磁盘(第1、2、4、6…)称为校验盘,其余的磁盘用于存放数据,磁盘数目越多,校验盘所占的比例

应用于:

在大数据存储额情况下性能很高,但实际应用很少。

RAID3

定义:
  1. 采用一个硬盘作为校验盘,其余磁盘作为数据盘
  2. 数据按位或字节的方式交叉的存取到各个数据盘中
  3. 不同磁盘上同一带区的数据做异或校验(把校验值写入校验盘中)
  4. 在完整的情况下读取时没有任何性能上的影响,但写入时不同
  5. 一个写操作包含:写入数据块、读取同一带区的数据块、计算校验值、写入校验值等操作(系统开销大为增加)
缺点:

与RAID0读写性能一致,但提供了数据容错能力,但写入时性能大为下降。
原因是,每一次写操作时,即使是改动某个数据盘上的一个数据块
也必须根据所有同一带区的数据重新计算校验值写入到校验盘中。
若校验盘在系统接受大量的写操作时,容易形成性能瓶颈。

应用于:

RAID3为,带奇偶校验的并行传送,若数据盘中出现损坏,不会影响用户读取数据,若读取上的数据块正好在损坏的磁盘上,则系统需要读取的所有同一带区的数据块,然后根据校验值重新构建数据系统性能受到影响。
适用于大量读操作,如Web系统以及信息查询等应用,或持续大块数据流,非线性编程的应用。

RAID4

定义:
  1. 与RAID3基本一致
  2. 区别在于条带化的方式不一样
  3. RAID4按照块的方式存放数据
  4. 在写操作时只涉及两块磁盘(数据盘和校验盘)
  5. 提高了系统的IO性能
缺点:

面对随机的分散的写操作
单一的校验盘往往称为性能瓶颈

RAID5

定义:

把多个(最少3个)硬盘合并成1个逻辑盘使用

  1. 与RAID3相似
  2. 区别在于数据校验的信息,被均匀的分散到的阵列的各个磁盘上,
  3. 优于RAID3,不存在并发写操作时的校验盘性能瓶颈
  4. 阵列的磁盘上既有数据,也有数据校验信息
  5. 数据块和对应的校验信息,会存储于不同的磁盘上(作为冗余和容错使用)
  6. 当一个数据盘损坏,系统可以根据同一个带区的其他数据块和对应的校验信息来重构损坏的数据。
优点:

RAID5可以理解为RAID0和RAID1的折中方案:

  1. 可以提供数据安全保障,但比RAID1低。但磁盘空间利用率比RAID1高
  2. RAID5与具有和RAID0相近似的数据读取速度,只多了一个奇偶校验信息
  3. 写入数据的速度比单个磁盘进行读写操作慢(多了奇偶)
  4. 存储成本相对较低

数据盘损坏时情况与RAID3一致。

RAID6

定义:
  1. 提供两级冗余(阵列中的两个驱动器失败时,阵列仍然能够继续工作)
  2. 支持数据的恢复又要支持校验的恢复
特点:

实现代价最高比其他级RAID更复杂和更昂贵
RAID6的校验数据:
写操作:有两个独立的校验计算支持两个磁盘失败。
方法:使用多种算法(XOR和某种其他的函数), 在不同的数据分条或者磁盘上,使用排列的数据

RAID10

定义:
  1. RAID1和RAID0的结合,先做镜像然后做条带化
  2. RAID10磁盘空间利用率和RAID1一样50%
优点:
  1. 提高了系统的读写性能
  2. 又提供了数据冗余保护
应用于:

既有大量的数据需要存储,又对数据安全性能有严格要求的领域。比如金融、证券

RAID01

定义:
  1. 是RAID0和RAID1的结合,对条带化的数据进行镜像
  2. 与RAID10不同------一个磁盘的丢失等同于整个镜像条带化的丢失所以一旦镜像盘失败,则存储系统成为一个RAID0系统(只有条带化)
应用于:

实际运用很少。

不同RAID级别对比

使用最广泛:

RAID0、RAID1、RAID10、RAID5

IO性能:

读操作:RAID10和RAID5相当
写操作:RAID10要好于RAID5

数据重构:

RAID5工作负荷和花费时间大于RAID10,同时RAID5出现数据丢失的可能性比RAID10高,负荷变大将影响重构期间的性能,时间长意味着再次出现数据损坏的可能性高。

数据安全保护:

RAID10只有出现该失效盘的对应镜像盘也失效,数据才会丢失
RAID5已有一块失效,只要再出现任意的一块磁盘失效,都将导致数据丢失。RAID5在磁盘空间利用率比RAID10高,

你可能感兴趣的:(计算机理论基础,raid)