char, unsigned char, int,unsigned int之间的相互转换

最近写代码的时候发现一个问题,我有一个数据是放在两个寄存器中的,一个表示高8位,一个表示低八位,我的这个数据是有符号的,那我在算出数据的时候就需要把两个寄存器的值进行合并了,这样就需要把数据从char 转换到short类型了。

现在假定我有两个char型数据ch1,ch2。需要把结果写入一个short型的数据data。假定ch1为低8位数据,ch2为高8位数据

最开始我是这样写的:

data = (((short)ch2 << 8) & 0xff00) | (short(ch1) & 0x00ff);

这样写数据总是不对,于是就查阅了一些资料,也加了一些log查看数据,最终发现了问题,今天就借这个机会总结一下数据转换的问题。

整数在计算机中是以二进制补码的方式表示的,以int型为例:

int有4个字节,最高位为符号位 0表示正,1表示负

举个例子+3在计算机里存储为0000 0000  0000 0000  0000 0000  0000 0011b;

负数为即将该负数的绝对值按位取反,然后加1,那么-3在计算机中的存储就为1111 1111  1111 1111  1111 1111 1111 1101b;

数据转换大致可分为两种

1:低字节向高字节转换

2:高字节像低字节转换

首先我们先分析第一种,低字节向高字节转换,这种转换方式会采取高位补位的方式

例如将char型的3(0000 0011b)转换成int型,那就是转换为(0000 0000  0000 0000  0000 0000  0000 0011b)

例如将char型的3(0000 0011b)转换成unsigned int型,那就是转换为(0000 0000  0000 0000  0000 0000  0000 0011b)

例如将char型的-3(1111 1101b)转换成int型,那就是转换为(1111 1111  1111 1111  1111 1111 1111 1101b)

例如将char型的-3(1111 1101b)转换成unsigned int型,那就是转换为(1111 1111  1111 1111  1111 1111 1111 1101b)

通过上面的例子我们可以看出,低字节向高字节转换,采取的补位方式会因为数据正负而有不同,其实就是补数据位,正数补0,负数补1。基于这种方式,我们在将char型的-3转换成unsigned int型的数据时就会出现错误。

第二种情况就是高字节向低字节转换,这种转换会采取直接截取的方式

这种情况比较容易理解这里就不多说。

现在回到最开始的问题

data = (((short)ch2 << 8) & 0xff00) | (short(ch1) & 0x00ff);

这个运算会有什么问题,首先我们知道ch1,ch2都是有符号的,如果两者都为负值,那我对ch1的处理就是有问题的,因为我在转换的时候会将ch1的符号位也当成了数据位来计算,就会出现差错。

所以我们在转换的时候如果遇到负数,要特别小心下符号位和数据位的区别

你可能感兴趣的:(C语言)