海明校验码

海明校验码

海明校验关键的一个前提是,数据位中只能有一位出错.这也是海明码产生的依据所在.

海明码的提出者Richard Hamming确实很高明.以至于看过之后,你还摸不着脑袋.其实,只要根据数据中只有一位出错的前提,相信各位读者也能提出所谓的海明码.

海明码到底是怎样提出的呢?我们不妨自己先偿试一下.无非就是要指出数据位中唯一出错的那一位嘛.自己动手吧.

判断是否出错

异或运算可以查错.将各数位的异或结果与各数位进行异或,0,则正确,否则错误.如对 (1011) 2. 各数位异或结果r = ­1011=1.你可能会说r再异或上原来的数不就是原来的数自己异或上自己吗?结果一定为0,有什么意义呢?要清楚,你将r跟原来的数一起传出去的时候,可能就出错了,到时候与r异或的就可能不是原数了。而且根据前提,只有一位出错,1的个数就不太为偶数,r与原数异或就为1.

标识哪一位出错

从最笨的方法开始.为每一位配上一个校验位.校验位的值等于对应原数.如要为1011配上校验位.得到1011 1011.验证的时候,校验位与原数异或,若为1.则表明该位或其校验位出错了.很显然,这种方法,不能唯一确定那一位出错了.

再改进一下.我们把数据中的每一位依次独立起来,这样只要出错,那么与它相干的校验结果一定与众不同.配上校验码的算法是:每一位的校验位是除该位外其它各位的异或的结果.(1011) 2为例.其对就校验码为r1r2r3r4 = 0100r1 = 011 = 0,r2 = 111,依次计算,这样比如某一位出错,比如第一位,那与第一位相干的r2,r3,r4在做校验时,一定为1,只有r1没有相干,所以为0.表明第一位出错了.若是校验位出错了,r1出错.那么只有r1的校验结果为1,其它三位校验位都为0.因此,可以辨别是哪一位出错了.这种方法,看起来不错,但在数据位太少,1位或2位时,就无法指示哪一位出错了.而且需要配上跟原数长度一样的校验位,岂不是浪费空间.

最经济的校验位(Richard Hamming真高明)

上面的的例子中,我们使用0111判断第一位出错了,1011,是第二位,1101第三位,1110第四位.1000,表示第一位校验出错,0100,第二位校验位,……

这样的话校验结果的4位数只表示了8位状态.4二进制数,是可以表示16位状态的,这就是冗余所在.

Richard Hamming的高明在于充分利用了配上的校验位.对于4位数,配上3位校验位就足够了.3位二制过有8种状态,正确的情况(为0时)占用一种,刚好剩下7,指示7位数中的某一位出错.假设,校验结果为S1,S2,S3.怎样校验,使S1S2S3可以表示哪一位出错了呢?算法是:当某一位的二进制数值,在对应的Sii=1,2,3)中为1,那么Si的校验表达式中就有它.

 

D1

D2

D3

D4

D5

D6

D7

S1

 

 

 

1

1

1

1

S2

 

1

1

 

 

1

1

S3

1

 

1

 

1

 

1

结果是:

S1 = D4D5D6D7

S2 = D2D3D6D7

S3 = D1D3D5D7

那么这7位中,哪些是校验位,哪些是原始数据呢?由前面介绍我们知道,增加的校验位只和原来的数据作异或.因此,挑出那么,只校验过程中,只出现过一次的数.那么就是D1,2D,D4.

显然,D1是原始数据D3,D5,D7的校验位.

D1 = D3D5D7

同样的有:

D2 = D3D6D7

D4 = D5D6D7

对于数据(1011) 2的四位数,除了第1,2,4位不能安放之外,其它们可以随便放(因为校验位随安放次序而改变),只要保证出错位只有一位,那么S1S2S3就可以保证指出哪位出错.一般是,将数据顺序安放在D3,D5,D6,D7位置上,再进一步示校验位.得到最后编码:

D1

D2

D3

D4

D5

D6

D7

0

1

1

0

0

1

1

显然,校验位的位数k与原始数据位数n的关系为:

2^k-1 >= n+k

再举一个例子:5位数(110102的海明码.

1)            确定校验位的位数为4.因为4满足2^4-1>=5+4,4是满足该条件的最小整数.

2)            确定校验结果Si的算法.

 

D1

D2

D3

D4

D5

D6

D7

D8

D9

S1

 

 

 

 

 

 

 

1

1

S2

 

 

 

1

1

1

1

 

 

S3

 

1

1

 

 

1

1

 

 

S4

1

 

1

 

1

 

1

 

1

根据表可以写出:

S1 = D8D9

S2 = D4D5D6D7

S3 = D2D3D6D7

S4 = D1D3D5D7D9

3)            确定校验位次序

Si表达式中只出现一次的,也就是在Si-Di表格中只有一个“1”的列,为校验位.分别为:

D8=D9

D4=D5D6D7

D2=D3D6D7

D1=D3D5D7D9

4)            填充好编码

D1

D2

D3

D4

D5

D6

D7

D8

D9

1

0

1

0

1

0

1

0

0

5)            验证

以第7位出错为例.即数据更改为:

D1

D2

D3

D4

D5

D6

D7

D8

D9

1

0

1

0

1

0

0

0

0

计算校验结果:

S1 = D8D9 = 0

S2 = D4D5D6D7 = 1

S3 = D2D3D6D7 = 1

S4 = D1D3D5D7D9 = 1

S1S2S3S4 = 01112= 710,指示的正是第7位出错了!

你可能感兴趣的:(Misc,算法)