一:什么是RAID
a: RAID:Redundant Arrays of Inexpensive(Independent) Disks
b: 1988年由加利福尼亚大学伯克利分校(University of California-Berkeley) “A Case for Redundant Arrays of Inexpensive Disks”
c: 多个磁盘合成一个“阵列”来提供更好的性能、冗余,或者两者都提供

二:RAID的作用
a:提高IO能力
磁盘并行读写
b:提高耐用性
磁盘冗余来实现
c:级别:多块磁盘组织在一起的工作方式有所不同
d:RAID实现的方式
外接式磁盘阵列:通过扩展卡提供适配能力
内接式RAID:主板集成RAID控制器,安装OS前在BIOS里配置
软件RAID:通过OS实现

三:RAID级别与特点
a:RAID-0
可用空间:Nmin(S1,S2,...)
最少磁盘数:2, 2+
优点:读、写性能提升,不存在校验,不会占太多cpu资源;
缺点:无冗错能力,不能用于对数据安全性要求高的环境
适用领域:视频生成和编辑、图形编辑,其它需要大的传输带宽的操作
b:RAID-1
最少磁盘数:2, 2+
可用空间:1
min(S1,S2,...)
优点:读性能提升、写性能略有下降,具有100%数据冗余,
缺点:开销大,空间利用率只有50%,在写性能方面提示不大;
适用领域:财务、金融等高可用、高安全的数据存储环境
c:RAID-4
最少磁盘数:3,3+
优点:有着性能和冗余的均衡考虑。
缺点:固定的冗余盘成为磁盘阵列I/O瓶颈。
数据交叉存储在2块硬盘中,再由第3块硬盘存储数据的校验码; 校验码是由2块硬盘中的chunk块按位进行异或运算后的值而得;
其中1块硬盘坏了不影响文件数据读写操作,数据还可以恢复,但就是有些慢;即使坏了1块硬盘仍然继续在线工作时,称为降级模式,此时数据没有保障,风险较大;所以要马上用新硬盘替换坏硬盘,暂定业务,用2块可用盘进行计算,按位校验恢复数据到新硬盘即可,当所有数据都恢复到新硬盘后,就能继续正常工作了;但是万一在恢复过程中也是有风险的;
RAID4还有一个固有缺点:用单块盘作为存放校验码,无论前面哪块盘访问数据,校验盘都得被访问;即集中存放校验码的校验盘访问压力过大,很容易造成性能瓶颈;所以,尽 早发现坏盘损坏,就能尽早更换;可以在接1块新硬盘当做空闲备用盘。
异或运算,存储校验码:
例如:1101,0110按位校验,校验码为:1011

d:RAID-5
       最少磁盘数:3,3+ 
       优点:读性能较高,中等的写性能,校验信息的分布方式存取,避免出现写操作的瓶颈; 
       缺点:控制器设计复杂,磁盘重建的过程比较复杂; 
       可用空间:(N-1)*min (s1,s2...)
      适用领域:文件服务器,email服务器,web服务器等环境,数据库应用

e:RAID-6
      读、写性能提升
      可用空间:(N-2)*min(S1,S2,...)
      有容错能力:允许最多2块磁盘损坏,大大提高了冗余性能
      最少磁盘数:4, 4+

f:RAID-10
      读、写性能提升
      可用空间:N*min(S1,S2,...)/2
      有容错能力:每组镜像最多只能坏一块
      最少磁盘数:4, 4+
                优点:读性能很高,写性能比较好,数据安全性好,允许同时有N个磁盘失效; 
      缺点:利用率只有50%,开销大; 
      适用领域:多用于要求高可用性和高安全性的数据库应用

g:RAID-01
       多块磁盘先实现RAID0,再组合成RAID1
                 不符合常用方法,每一组有一块坏的硬盘可能性大
h:RAID-50
       多块磁盘先实现RAID5,再组合成RAID0
                 磁盘数:最低6个; 
       优点:比RAID5有更好的读性能,比相同容量的RAID5重建时间更短,可以容许N个磁盘同时失效; 
       缺点:设计复杂,比较难实现;同一个RAID5组内的两个磁盘失效会导致整个阵列失效; 
       适用领域:大型数据库服务器、应用服务器、文件服务器等应用