【前言】
RAID 为廉价磁盘冗余阵列( Redundant Array of Inexpensive Disks ), RAID 技术将一个个单独的磁盘以不同的组合方式形成一个逻辑硬盘,从而提高了磁盘读取的性能和数据的安全性。不同的组合方式用 RAID 级别来标识,常见 RAID 的级别有 、 1 、 01 、 10 、 5 、 6 等等。具体实现的数据存储的原理请参考相关文章。本章主要概述 Linux 环境下 RAID 6 级别的存储原理。 Linux 环境下配置 RAID 的命令是 “mdadm” 。
【 RAID 6 概述】
RAID 6 是指带有两种分布存储的奇偶校验码(既 P 和 Q )的独立硬盘结构。与 RAID 5 相比, RAID 6 增加了第二个独立校验码( Q )信息块,两个独立的奇偶校验系统使用不同的算法,数据的可靠性非常高,即使两块硬盘同时失效也不会影响数据的使用,主要是用于要求数据绝对安全的场合。如下图:
上图中 Q 为 RAID 6 的第二个校验信息块,采用的是非常复杂的 “ 伽罗华域 ” 算法,稍后会讲到。
【 RAID 6 的 P 校验概述】
其实 RAID 6 的 P 校验和 RAID 5 的校验是一样的,都是采用的 “ 异或 ” 运算。异或运算符的原则就是相同为 ,不同为 1 的。在 RAID 5 的环境中只能掉一块硬盘,但是 RAID 6 在 RAID 5 的基础上添加了 Q 校验,因此 RAID 6 支持同时掉两块盘。异或运算如下:
P = A + B + C = A xor B xor C
A = P - B - C = P xor B xor C
注意:上述的加减法都是异或运算。
【 RAID 6 的 Q 校验概述】
说到 Q 校验就有点复杂了,它采用上面所提到的 “ 伽罗华域 ” 算法。 “ 伽罗华域 ” 实际上就是 “0-255” 的一个有限域 GF(2^8) ,在 GF(2^8) 内不管是是加、减、乘、除都不会超过这个范围。并且,加减法可逆,乘除法可逆,而且计算的值在 GF(2^8) 内是唯一的。注意:此处提到的加、减、乘、除法不是日常使用的加减乘除,而是 “ 伽罗华域 ” 内的运算。在 GF(2^8) 中,如果 2 的 n 次方大于某个值(本原多项式)就会对该值(本原多项式)取余,结果又会返回到 GF(2^8) 中。因此,保证了 2^0 到 2^255 的结果值在 GF(2^8) 内是唯一的。
在 GF(2^8) 中一共有 16 个本原多项式,分别如下:
1 x8+x7+x6+x5+x4+x2+1 1 1111 0101 = 0x1F5
2 x8+x7+x6+x5+x2+x+1 1 1110 0111 = 0x1E7
3 x8+x7+x6+x3+x2+x+1 1 1100 1111 = 0x1CF
4 x8+x7+x6+x+1 1 1100 0011 = 0x1C3
5 x8+x7+x5+x3+1 1 1010 1001 = 0x1A9
6 x8+x7+x3+x2+1 1 1000 1101 = 0x18D
7 x8+x7+x2+x+1 1 1000 0111 = 0x187
8 x8+x6+x5+x4+1 1 0111 0001 = 0x171
9 x8+x6+x5+x3+1 1 0110 1001 = 0x169
10 x8+x6+x5+x2+1 1 0110 0101 = 0x165
11 x8+x6+x5+x+1 1 0110 0011 = 0x163
12 x8+x6+x4+x3+x2+x+1 1 0101 1111 = 0x15F
13 x8+x6+x3+x2+1 1 0100 1101 = 0x14D
14 x8+x5+x3+x2+1 1 0010 1101 = 0x12D
15 x8+x5+x3+x+1 1 0010 1011 = 0x12B
16 x8+x4+x3+x2+1 1 0001 1101 = 0x11D
RAID 6 常用的本原多项式为 0X11D ,既上列中最后一个。 Linux 环境中的 RAID 6 也是如此。
好了回到 Q 校验上, Q 校验和 P 校验结合正好组成了一个二元一次方程, K1 、 K2 、 K3 为 GF(2^8) 中多项式的数值。
P = A + B + C
Q = A*K1 + B*K2 + C*K3
【伽罗华域的乘除法运算】
伽罗华域中的加减法也是异或运算,所以就不做详细解释了,重点解释一下乘除法。通过上面的 Q 校验知道 Q 校验的生成需要伽罗华域中的乘法运算,计算乘法运算是一件非常复杂的事情,最好的解决办法就是将 GF(2^8) 中所有多项式的值生成表格,通过查表得知乘法运算的值。
1 、生成正表 GFILOG
通过下表的方法生成正表 GFILOG ,注意:此表的本原多项式为 0X11D 。
如下:是正表 GFILOG
2 、生成反表 GFLOG
有了正向变换表,要得到逆向表就很简单了,把正向中的表变换值做为索引,在把正向表中的索引作为值就 OK 了。如下表:
3 、计算乘除法运算(查表法)
乘法: A * K1 = GFILOG[(GFLOG[A]+GFLOG[K1]) mod 255];
除法: A / K1 = GFILOG[(GFLOG[A]-GFLOG[K1]+255) mod 255];
现在知道了伽罗华域的乘除法,那么我们计算 Q 校验就方便了许多。
【根据 Q 校验生成丢失的数据】
当 RAID 6 中坏掉两块磁盘,那该如何生成丢失的数据呢?用 RAID 6 的一个条带举例说明。
1 、如果某个条带中丢失的两块数据是 P 和 Q ,那么正好,数据没有丢失,正常提取即可。
2 、如果某个条带中丢失的两块数据是 P 和 A ,那么可以根据 Q 校验计算出 A 的数据。
P = A*K1 + B*K2 + C*K3
A*K1 = P + B*K2 + C*K3
A = ( P + B*K2 + C*K3 ) / K1 // 注: K1 可以同过查表获取
3 、如果某个条带中丢失的两块数据是 Q 和 A ,那么可以根据校验 P 计算出 A 的数据。
P = A + B + C
A = P + B + C
4 、如果某个条带中丢失的两块数据是 A 和 B ,那么可以根据校验 P 和 Q 计算出 A 和 B 的数据。
P = A + B + C
Q = A*K1 + B*K2 + C*K3
A = P + B + C
Q = (P + B + C)*K1 + B*K2 +C*K3
Q = P*K1 + B*K1 + C*K1 + B*K2 + C*K3
Q = P*K1 + C*K1 + C*K3 + B*K1 + B*K2
Q + P*K1 + C*K1 + C*K3 = (K1+K2) * B
B = ( Q + P*K1 + C*K1 + C*K3) / (K1+K2)
计算出 B 的值以后,再根据 P 校验和计算出 A 的值就容易很多了。
A = P + B + C
【 Linux 环境下的 RAID 6 】
根据前的内容已经知道 RAID 6 的大致原理了。因为伽罗华域的本原多项式有 16 种,因此 RAID 6 的种类有很多,再加上 K 值的不固定。因此计算某个 RAID 6 的 Q 校验值会变的很复杂。不过 Linux 环境下的 RAID 6 的 K 值经过测试,其值根据够成 RAID 6 阵列的磁盘数,从本原多项式 0X11D 的开始取( RAID 6 总磁盘数 -2 )个多项式的值作为 K 的值。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/31380569/viewspace-2654098/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/31380569/viewspace-2654098/