探讨一下异或(xor)为什么能还原的问题

xor运算法则

  • xor在对两个bit运算的时候,两个bit值相同的时候,结果是0,不同的时候结果是1
  • 操作的对象是2个操作数对应的bit位

xor的用途

xor最常用的是将某个数清零(对自身做异或)
movw num, %ax
xorw %ax, num1 #num1为16位的 0x12


如果将一个数a和另一个数b做xor 得到结果c, 再 c xor b 就可以得到a
int a = 10;
int b = 11;
a == (a xor b xor b) //true
如何证明这个结论呢?
  • 观察xor的运算, 我们可以得出一个结论, 其实xor相当于不进位的加法

举个例子:
num1: .byte 0b0
num2: .byte 0b1

情况1
xorb 0, num1 #结果 num1 = 0b0  相当于 0 + 0 = 0
xorb 1,num1 #结果 num1 = 0b1  相当于 1 + 0 = 1

情况2
xorb 0, num2 #结果 num2 = 0b1 相当于 0 + 1 = 1
xorb 1,num2 #结果 num2 = 0b0 相当于 1 + 1 = 0b10, 进位被直接舍弃, 最后num2 = 0b0

所以上述 a xor b xor b == a, 可以先理解成 a + b + b == a 这个等式

假如 a 和 b 就是单纯的 一个bit位

  • 那么在这两次的连加中, 不管有没有进位,最后连加的结果的最低位一定等于a (这其中b是可以 == a的)

  • 这是二进制加法的特性,但是要注意的是连加的次数一定要是2的倍数,而且连加的被加数b一定要不变 (这其中b是可以 == a的)

  • 有了这个特性我们回过头去看xor

上面说了xor相当于不进位的加法,所以 a+b+b 最后计算的结果所有的进位全被舍弃,自然而然保留的结果一定 == a

现在将a和b括展到多个bit位,那么原理是一样的, a xor b xor b, 还是相当于 a + b + b, xor会将每个对应的 bit位 都做 连续的加法,由于是不进位的,所以每次对应的bit位的连加是互不影响的,所以最后整个结果 所有的二进制bit位都相没有变, 所以最后的结果一定是a

  • xor上述这样的运算特性,可以做一些简单的加密

RAID(独立硬盘冗余阵列)

这种技术用许多块硬盘组成一个RAID集, RAID技术主要优势在于数据冗余,也就是说即便其中一块硬盘坏了,整个系统也可以设法把丢失的数据重新构建出来,从而正常运作下去,其中重建数据这一步可以通过xor来完成

5块硬盘,其中4块用来保存数据,另一块用来作校验, 作校验的这块硬盘的数据是其它4块通过xor得到的

意思就是 校验盘的每个二进制位 == 其它4块盘对应的bit位xor计算出来,这样如果4块盘中一任何一块损坏了, 就可以拿余下的3块先做xor得出的结果再和校验盘xor后就能还原出被损坏的盘的数据

eg:
a = 0b1
b = 0b0
c = 0b1
d = 0b1
校验盘 f = 1 xor 0 xor 1 xor 1 = 1

现在 c盘坏掉了, 那么 a xor b xor d xor f ===> 1 xor 0 xor 1 xor 1 = 1这其中的原理和上面是不同的, 现在我们来分析下 为什么能还还原出来

  • 首先 f = a + b + c + d(做不进位的加法)

  • 然后现在c坏掉了 c = a + b + d + f
    我们可以将 a + b + d 看成一个整体 x
    整个式子化简成 f = x xor c

  • 根据上面的分析可以理解成加法(不进位),那么式子可以看作是f = x + c所以 c = x - f

为什么写成这样, 因为我们在逻辑上将等式转换了, 现在来分析这样一个减法等式c = x - f

我们认知的逻辑世界里这样的转换是没有问题的,那么这种转换在计算机看来是否正解呢?

答案是没有问题的
从2个方面可以说明问题:
第一:计算机是人类造出来的,当然遵循人类的思维,只不过内部表现的不一样

第二:计算机会将这个等式转换成加法等式,即 c = x + (-f),这其实和我们人类的转换是一样的

最后 得出的等式c = x + (-f)

如果这个时候 我明确的告诉你f = -f,那么就意味着c = x + f===>c = x xor f,就意味着这个算法是成立的了

我们来复习一下补码 计算补码的方法这里就不说了
上面所有和操作都是有一个前提就是 xor 是不进位的加法,而且是对bit位操作, 所以f == -f 根据补码算出来的 他们的最低bit位一定一样

假设 8位 
0的补码0  
-1的补码 = 0b11111111
他们的正负数最低位都是相同的

所以 f == -f在这种情况下可以看作是成立的
所以 上面的 RAID的算法是成立的

这同时也说明了 xor的另一个结论 a = x xor b 那么 b = x xor a 一定成立,xor可以当作不进位的加法,也可以当作减法,这个过程就是上术对RAID的分析

如果括展到多个bit位的时候,也是一样的, 因为xor的操作就是针对bit位的, 每一个bit位的过程都是这样的互不影响的

你可能感兴趣的:(探讨一下异或(xor)为什么能还原的问题)