数据校验码--汉明码(Hamming code)

汉明码是Richard Hamming于1950年提出的。是目前广泛采用的一种有效的校验码,其中,主存的ECC(Error Correcting Code)采用的就是类似的校验码。

基本原理

将有效的信息按某种规律分成若干组,每组安排一个校验位,做奇偶测试,就能提供多位检错信息,以指出最大可能是哪位出错,从而将其纠正。实质上,汉明校验码是一种多重校验。

----摘自百度百科
这个分组的思想有点不是很理解。

在有效信息位种中加入几个校验位形成汉明码,使码距比较均匀的增大,并把汉明码的每一个二进制位分配到几个奇偶校验组中。

以下使用P代表校验位,H代表汉明码,D代表原始信息位,N位信息位的位数,K位校验位的位数。
则N与K的关系为2^(K-1) >=N+K+1,如下表:

N K
1~3 4
4~10 5
11~25 6
26~56 7
57~119 8

分组原则

  • 信息位和校验位之和为m,每个校验位Pi在汉明码中被分到位号为2^(i-1)的位置上,其余各位为信息位
  • 汉明码每一位Hi有多个校验位校验,其关系是被校验的每一位位号等于校验它的各校验位的位号之和,即汉明码的实质是参与校验的各校验位权之和。 这句话理解起来有点别扭,看下面例子。
  • 在增大码距时,应使所有编码的码距尽量均匀地增大,以保证对所有代码的检测能力平衡的提高

例子

编码

假设原始数据信息位的位数为8,那么他需要的K值位5,即需要有5个校验位,组成的汉明码的位数为13.再根据校验位的分配原则,组成的汉明码如下:

|位|13| 12| 11 |10| 9| 8| 7 |6| 5| 4| 3| 2| 1|
|-|-|-|-|-|-|-|-|-|-|-|-|-|
|汉明码|P5| D8| D7| D6 | D5| P4| D4| D3| D2| P3| D1| P2| P1|

P5本来应该是放在第16位的,但是由于生成的汉明码位数为13所以它就被挪到的第13位了。
那么怎么确定校验呢?最初也困扰我许久。
先看一个表格:
其中H的下标代表在汉明码中的位置,也是P4P3P2P1组成的-十进制数

P5 P4 P3 P2 P1 H
0 0 0 1 H1 P1
0 0 1 0 H2 P2
0 0 1 1 H3 D1
0 1 0 0 H4 P3
0 1 0 1 H5 D2
0 1 1 0 H6 D3
0 1 1 1 H7 D4
1 0 0 0 H8 P4
1 0 0 1 H9 D5
1 0 1 0 H10 D6
1 0 1 1 H11 D7
1 1 0 0 H12 D8
1 1 0 1 H13 P5

校验位Pi的偶校验结果就是:
P1 = D1 ^ D2 ^ D4 ^ D5 ^ D7
P2 = D1 ^ D3 ^ D4 ^ D6 ^ D7
P3 = D2 ^ D3 ^ D4 ^ D8
P4 = D5 ^ D6 ^ D7 ^D8
如果是奇校验的话上面的结果取反就是了。
那么还有P5呢?上面的结果中,D4,D7出现了3次,而D1,D2,D3,D5,D6,D8仅出现了2次,为了使其各个信息位在校验中均匀的出现校验,从而定义P5 = D1 ^ D2 ^ D3 ^ D5 ^ D6 ^D8,这样,每一位信息位都均匀的出现在3个Pi值得形成关系中,当任意一位信息位变化的时候都会引起3个P值得变化,即合法汉明码的码距为4 (前面都懂,这个码距为4有点想不明白)
这就是编码了。

现在再来看看这句话

汉明码每一位Hi有多个校验位校验,其关系是被校验的每一位位号等于校验它的各校验位的位号之和,即汉明码的实质是参与校验的各校验位权之和。

P1,P2,P3,P4,P5的位数分别为1,2,4,8,13
D1的汉明码位数为3,3 = 2 + 1所以D1会被P1,P2两个校验位所校验。

汉明码的信息位 汉明码的位数 被校验位 说明
D1 3 = 1 + 2 P1,P2 D1信息位会被校验位P1,P2所校验。
D2 5 = 1 + 4 P1,P3
D3 6 = 2 + 4 P2,P3
D4 7 = 1 + 2 +4 P1,P2,P3
D5 9 = 1+ 8 P1,P4
D6 10 = 2 + 8 P2,P4
D7 11 = 1 + 2 +8 P1,P2,P4
D8 12 = 4 + 8 P3,P4

根据偶校验结果以及上应该就清楚了。

校验

将收到的汉明码进行偶校验(当然也可以进行奇校验,前提是前面编码的时候使用的是奇校验)

S1 = P1 ^ D1 ^ D2 ^ D4 ^ D5 ^ D7
S2 = P2 ^ D1 ^ D3 ^ D4 ^ D6 ^ D7
S3 = P3 ^ D2 ^ D3 ^ D4 ^ D8
S4 = P4 ^ D5 ^ D6 ^ D7 ^D8
S5 = P5 ^ D1 ^ D2 ^ D3 ^ D5 ^ D6 ^D8

汉明码出错情况:
记录 S = S5 S4 S3 S2 S1

  1. S为00000时代表无错
  2. 有一位不为0,表明某一校验位出错或者三位汉明码(信息位和校验位)同时出错
  3. 两位不为0,表明两位汉明码同时出错,此时只能发现错误无法确定错误的位置
  4. 3位不为0,表明一位信息位出错或者3位校验位同时出错
  5. 4/5位不为0,表明出错情况严重,系统可能出现故障,应检查系统硬件的正确性

以上结果分析基于偶校验。

|汉明码||P5| D8| D7| D6 | D5| P4| D4| D3| D2| P3| D1| P2| P1|
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|出错位号||H13| H12| H11 |H10|H9| H8| H7 |H6| H5| H4| H3| H2|H1|
||S5|1|1|0|1|1|0|0|1|1|0|1|0|0|
||S4|0|1|1|1|1|1|0|0|0|0|0|0|0|
||S3|0|1|0|0|0|0|1|1|1|1|0|0|0|
||S2|0|0|1|1|0|0|1|1|0|0|1|1|0|
||S1|0|0|1|0|1|0|1|0|1|0|1|0|1|

你可能感兴趣的:(数据校验码--汉明码(Hamming code))