int、short、char 类型超出范围赋值,说说原码,反码,补码。

 

(以下使用g++编译器,win32平台)。

假设short类型的大小是2字节,int类型的大小是4个字节。short能表示-32768~32767之间的整数。

以下代码:

short s=100000;

能通过编译,s中的值是多少呢?

实际上,上面的代码等价于short s=(short)100000,

也就是说,编译器对100000强制转化为short类型,一般是截取最后16位的值(假设编译器将100000当int类型看待)。

现在要手算,s的值到底是多少呢?

第一步,100000%65536=34464,34464就是100000最后16位的值。

34464大于32767。如果用无符号的short类型存储34464,那是足够的(unsigned short的范围是0~65536)。

但是,同样的16位的值,用有符号的short类型保存,就超出范围了,它表示的就是另外一个值,是一个负数。

第二步,这个负数是多少呢?先看看有关原码、反码、补码的内容。

这里需要举一个例子。负数在计算机中使用补码表示的。

拿一个字节的char类型来说,-1,原码是1000,0001,

反码是1111,1110(第一位是符号位,不取反,其他7为都取反),反码加1就是补码了。因此,-1的补码是1111,1111。

这8位二进制,刚好等于unsigned char  a=2^8-1(2^8表示2的8次方)的8位二进制(1,0000,0000-0000,0001=1111,1111)。

这会不会是个巧合呢?再来看-2,原码是1000,0010,反码是1111,1101,补码是1111,1110。

这8位二进制,刚好等于unsigned char b=2^8-2的二进制表示(1,0000,0000-0000,0010=1111,1110)。

再看-127,原码是1111,1111,反码是1000,0000,补码就是1000,0001。

也就是说,-127在计算机中用1000,0001这八位二进制保存。

这等价于unsigned char c=2^8-127的二进制表示,(1,0000,0000-0111,1111=1000,0001)。

特殊的,-128的原码是什么?它没有原码,因为7位二进制只能表示到127, 对128没法表示。

实际上,在计算机中,-128是用1000,0000表示的。这是补码表示形式,不是负零。

为什么呢?因为,1000,0000=2^8-128=1,0000,0000-1000,0000=1000,0000。这符合上面的规律。

那么,计算机为什么采用补码来表示负数呢?是因为补码可以方便计算,把减法变成加法。

比如,1-2=1+(-2)=0000,0001+1111,1110=1111111=-1。结果也是补码的形式,很方便。

再比如,-1-2=(-1)+(-2)=1111,1111+1111,1110=1111,1101。

细心的读者会发现,1111,1111+1111,1110产生了溢出。补码的好处在于,可以不考虑溢出,结果照样正确。

为什么呢?-1-2=(2^8-1)+(2^8-2)=2^8-3+2^8,而2^8-3恰恰是-3的内存表示,另外的那个2^8就是进位了。

从这里可以看出,把这个进位扔掉,结果刚好正确。

第三步,回到原来的问题,34464所表示的16为二进制,保存在一个short类型中,结果是多少?

假设这个结果是-a,注意a是一个正数。

那么,2^16-a=34464(仔细回顾第二步的内容)。

所以,-a=34464-2^16=-31072。

 

 

 

你可能感兴趣的:(C++)