简单理解海明校验码

二进制数据经过传送、存取等环节,会发生误码(1变成0或0变成1),这就有如何发现及纠正误码的问题。所有解决此类问题的方法就是在原始数据(数码位)基础上增加几位校验位。我们常使用的检验码有三种. 分别是奇偶校验码、海明校验码和循环冗余校验码(CRC)。

海明校验码是由RichardHamming于1950年提出、目前还被广泛采用的一种很有效的校验方法。它的实现原理,是在k个数据位之外加上r个校验位,从而形成一个k+r位的新的码字,使新的码字的码距比较均匀地拉大。把数据的每一个二进制位分配在几个不同的偶校验位的组合中,当某一位出错后,就会引起相关的几个校验位的值发生变化,这不但可以发现出错,还能指出是哪一位出错,为进一步自动纠错提供了依据。但是因为这种海明校验的方法只能检测和纠正一位出错的情况。所以如果有多个错误,就不能查出了。

什么是码距?
两个码组对应位上数字的不同位的个数称为码组的距离,简称码距,又称海明(Hamming)距离。例如00110和00100码距为1,12345和13344码距为2,Caus和Daun码距为2。

海明校验码公式(假设为k个数据位设置r个校验位)

2^r-1 ≥ k + r 

公式怎么得出来的呢?
假设有r个校验位,一个位子有0或1两种情况,r个位子就有2r种排列情况,能表示2r种状态。其中一个状态用来表示正确(没有错误发生)的这种情况。其余的2r-1种状态来表示错误发生在哪一位。总共有k+r位,所以2r-1一定要>=总位子k+r。
按照该不等可以得出k与r的对应关系

k值 r值
1 2
2~4 3
5~11 4
12~26 5
27~57 6
58~120 7
... ...

注意:海明校验码是放在2的幂次位上的,即“1,2,4,8,16,32······”

实战求1011的海明码
第一步:求r的值(即校验位数)
直接根据公式代入得:
2^r-1 ≥ 4 + r
2^r-r ≥ 5
得到r最小为3
所以海明码的位数是4+3=7位
第二步:校验位和信息位对号入座
注意: 信息位的位置分配是从高位到低位依次存放
注意: 海明校验码是放在2的幂次位上的

位数|1|2|3|4|5|6|7
:-:|:-:|:-:|:-:|:-:|:-:|:-:
信息位|||1||1|0|1
校验位|r1|r2||r3|||
第三步:确定校验位的值
校验原则:被校验的海明位的下标等于所有参与校验该为的校验位的下标之和

海明码 海明码下标 校验位组 信息位
1 1 r1
2 2 r2
3 3=2+1 r1,r2 1
4 4 r3
5 5=4+1 r3,r1 1
6 6=4+2 r3,r2 0
7 7=4+3 r3,r2,r1 1

然后将校验码校验的信息位的位置记录下来:

  • r1: 3, 5, 7
  • r2: 3, 6, 7
  • r3: 5, 6, 7

然后做对应信息位的异或运算(异或的运算法则为:0⊕0=0,1⊕0=1,0⊕1=1,1⊕1=0(同为0,异为1))

  • r1: 1 xor 1 xor 1 = 1
  • r2: 1 xor 0 xor 1 = 0
  • r3: 1 xor 0 xor 1 = 0

代入表格得到

位数 1 2 3 4 5 6 7
信息位 1 1 0 1
校验位 1 0 0

注意:按照从低位到高位的排列顺序得到海明码:1010101

你可能感兴趣的:(简单理解海明校验码)