开始时RAID(Redundant arrays of inexpensive disks)廉价冗余磁盘阵列
现在是RAID(Redundant arrays of independent disks )独立冗余磁盘阵列
RAID 的出现是因为利用廉价的容量小磁盘来构成大容量大的的磁盘
现在有RAID 0 、RAID 1、 RAID 2 ,3 ,4 , 5、RAID01 、RAID10级别只是个概念而已,仅代表磁盘的组织方式不同,没有上下(先后之分)
从性能上,存取冗余能力,空间利用率,至少需要多少块来分析不同的raid 基本
RAID 0也叫条带化技术设备
上面四个绿色就是硬盘,通过框就是组成一个逻辑的设备,通过raid 0 组织数据技术,数据是按顺序的固定大小的数据存储在不同的磁盘上,比如上面的第1黄 ,第2黄 ,第3黄如此类推的把数据存放在不同的磁盘上
a 读写性能上都提高了,因为条带化,本来一次的存储一个的变成了四个
b 没有冗余
c 空间利用率百分之百
d 至少需要两块硬盘
RAID 1:叫镜像技术
上面两块绿色的是硬盘,白色和***为数据,RAID 1 数据的组织方式是,两个盘各存一份数据,左右两边***和白色的数据是一样,数据编号也是一样
a 读性能提高了,但是写性能差了,因为从两边都可以读,但是存时要两边一起存数据
b 有冗余能力,因为提供了备份
c 空间利用率是1/2
d 至少需要两块盘
RAID 2 , 3,4,5,6比较相似所以一起讲
RAID 4 :通过校验码的方式提供冗余,也提供条带化
绿色为四个不同的硬盘,存数据是是把数据存放在前面三个盘中,第四个盘是用来存放校验码,如果有一个盘的数据丢失或损坏,可以通过校验码和另外两个盘的数据计算获取,如
第1,2,3个***为存放数据,第四个就是存放校验码的,当校验码被频繁地访问时,它的访问量被其他的盘大,那是这个阵列的瓶颈就是存放校验码的那个盘,这就是木桶效应,所以出现了RAID5
RAID5:与RAID4大体一样,但是把校验码放在不同的硬盘,并不是放在一个硬盘里 ,比如,1,2,3***为数据,第四个***为校验码,第一个白色为校验码,第2,3,4为数据
上面最多能坏一个盘,所以出现了RAID6
RAID6:提供两个盘作为校验码,所以最多能坏两个盘
a 读写性能提高了有用到条带化
b 提供冗余,通过校验码和其他盘数据获取损坏盘数据
c 利用率是 (n-1)/ n;RAID 6 的利用率是(n-2)/ n
d 至少需要三块盘;RAID 6 至少需要四块盘
RAID 01:先做条带化,再做镜像
先是左边三块盘做RAID0,右边三块盘做RAID0,然后两个RAID0再做一次RAID1,所以是有提供冗余的
a 读写性能都有提高
b 有提供冗余
c 空间利用率是1/2
d 至少需要四块盘
RAID 10:先做RAID1再做RAID0
每两块盘做RAID1,再是三个RAID1做RAID0
a 读写性能提高
b 有提供冗余
c 空间利用率是1/2
d 至少需要四块盘
那么有人问,他们有区别吗,其实是有的各自有各自的好处和坏处,两者的性能是一样的,不过现在的企业更喜欢RAID10
RADI 50:同理显示做RAID5 ,再做RAID0
JBOB:最主要的功能是把多块小盘合成一块大盘来使用
特性是,读写性能没提高,没冗余,空间利用率百分之一百,至少需要两块盘
一般用在,不在于速度的追求,不在乎数据安全,但在乎容量的大小(存储单个大文件)
如现在的Hadoop大数据处理的HDFS