文章参考微信公众号[嵌入式软件学习圈]
无符号整形类型“回绕”
涉及无符号操作数的计算永远不会产生溢出,因为编译器会自动产生回绕。
也就是说,如果数值超过无符号整型数据的限定长度时就会发生回绕,即如果无符号整型变量的值超过了无符号整型的上限,就会又从0开始增大;如果无符号整型变量的值低于无符号整型的下限,那么就会到达无符号整型的上限,然后从上限开始减小。这就像一个人绕着跑道跑步一样,绕了一圈,又返回到出发点,因此称为回绕。
为了加深大家对无符号整数运算产生回绕的理解,我们继续来看一个简单例子。
#include
int
main(void)
{
unsigned a = 4294967295;
unsigned b = 2;
unsigned c = 4;
printf("%u\n", a+b );
printf("%u\n",b-c );
return 0;
}
在代码清单中,我们定义了3个无符号整型变量a、b与c。其中将变量a的值初始化为4294967295 (即在32位机器上存储为0ffffffff);
当程序执行语句“a+b”时,其结果超出了无符号整型的限定值(UINT_MAX:0fffffff)于是便产生向下回绕,因此输出的结果为1 ( 即0ffffffff + 000000002 = 000000001 );
当程序执行语句“b-c”时,其结果为负数,于是便产生向,上回绕,因此返回的结果为4294967294 (即0x0000002 - 0x00000004 = 0fffffffe)。具体运行结果如图所示:
$: ./test
1
4294967294
$:
从代码清单中可以看出,无符号整数运算产生的回绕会给程序带来严重的后果,尤其是作为数组索引、指针运算、对象的长度或大小、循环计数器与内存分配函数的实参等的时候是绝对不允许产生回绕的。
因此,针对无符号整数的运算,应该采用适当的方法来防止产生回绕。例如,下述代码演示了如何简单地处理代码中所产生的回绕。
#include
#include
int
main(void)
{
unsigned a = 4294967295;
unsigned b = 2;
unsigned c = 4;
if(a+b > UINT_MAX){
return -1;
}else
printf("%u\n",a+b );
if(b-c < 0){
return -2;
}else
printf("%u\n",b-c );
return0;
}
在上面的代码中,通过一些条件对无符号操作数进行测试,从而避免了无符号操作数运算产生回绕。在实际的编程环境中,无符号整数的回绕很可能会导致缓冲区溢出,甚至导致攻击者可执行任意代码。
有符号整形类型“溢出”
整数溢出是一种常见、难预测且严重的软件漏洞,由它引发的程序Bug可能比格式化字符串与缓冲区溢出等缺陷更难于发现。C99 标准中规定,当两个操作数都是有符号整数时,就有可能发生整数溢出,它将会导致“不能确定的行为”。
也就是说整数溢出是一种未定义的行为,这也就意味着编译器在处理有符号整数的溢出时具有很多的选择,遵循标准的编译器可以做它们想做的任何事,比如完全忽略该溢出或终止进程。大多数编译器都会忽略这种溢出,这可能会导致不确定的值或错误的值保存在整数变量中。
整数溢出有时候是很难发现的,一般情况下在整数溢出发生之前,你都无法知道它是否会发生溢出,即使你的代码经过仔细审查,有时候溢出也是不可避免的。因此,程序很难区分先前计算出的结果是否正确,而且如果计算结果将作为一个缓冲区的大小、数组的下标、循环计数器与内存分配函数的实参等时将会非常危险。当然,因为无法直接改写内存单元,所以大多数整数溢出是没有办法利用的。
当然,面对这些简单的有符号整数运算溢出,简单地通过对操作数进行预测的方法就能够避免发生有符号整数运算溢出。其实,不只算术运算可能造成溢出,任何企图改变该有符号整型变量值的操作都可能造成溢出。
一个溢出的例子:
在上述程序中,需要将cl与c2的内容复制到buf中,并分别由lenl与len2来指定复制的字节数。这里需要特别注意的语句是if((lenl + len2)> 100),我们利用该语句进行了相对严格的大小检查:如果len1 + len2的值大于buf数组的大小(100),则不进行复制。
运行代码清单,当我们执行命令 "Hello,world!" 6 "nihao" 2时,程序运行正常,并成功地将字符串复制到buf中。
可当我们执行命令"Hello,world!" 2147483647 "nihao" 2
时,程序却意外地绕过大小检查语句“if(len1 + len2)> 100)”来执行相关的操作。是什么原因导致这种情况发生的呢?
其实很简单,就是由于整数溢出而导致的。从执行的命令"Hello,world!"2147483647"nihao"2可以得出,lenI 的值为2147483647 (即十六进制为0xfffff) ,len2 值为2 (即十六进制为0x00000002)。当执行语句“len1 + len2 (即0rx7ffff0000000 )"时会发生溢出,所得结果为-2147483647 (即十六进制为0x80000001 )。因为-2147483647远远小于100,从而使程序绕过大小检查语句“if(lenl + len2)> 100)”来执行余下的操作。
总结:
- 为了程序的完备性,必须要考虑变量值超出其能表达范围的特殊情况。
- 在C标准头文件limits.h中定义了众多宏常量来表示各种类型的最值,在编写程序时可以利用他们来进行数据有效性检查:
#define SCHAR_MAX 0x7f /* max value for a signed char */
#define SCHAR_MIN (-0x7f-1) /* min value for a signed char */
#define UCHAR_MAX 0xffU /* max value for an unsigned char */
#ifdef __CHAR_UNSIGNED__
# define CHAR_MIN 0 /* min value for a char */
# define CHAR_MAX 0xff /* max value for a char */
#else
# define CHAR_MAX 0x7f
# define CHAR_MIN (-0x7f-1)
#endif
#define USHRT_MAX 0xffffU /* max value for an unsigned short */
#define SHRT_MAX 0x7fff /* max value for a short */
#define SHRT_MIN (-0x7fff-1) /* min value for a short */
#define UINT_MAX 0xffffffffU /* max value for an unsigned int */
#define INT_MAX 0x7fffffff /* max value for an int */
#define INT_MIN (-0x7fffffff-1) /* min value for an int */
#ifdef __LP64__
# define ULONG_MAX 0xffffffffffffffffUL /* max value for unsigned long */
# define LONG_MAX 0x7fffffffffffffffL /* max value for a signed long */
# define LONG_MIN (-0x7fffffffffffffffL-1) /* min value for a signed long */
#else
# define ULONG_MAX 0xffffffffUL /* max value for an unsigned long */
# define LONG_MAX 0x7fffffffL /* max value for a long */
# define LONG_MIN (-0x7fffffffL-1)/* min value for a long */
#endif
# define ULLONG_MAX 0xffffffffffffffffULL /* max value for unsigned long long */
# define LLONG_MAX 0x7fffffffffffffffLL /* max value for a signed long long */
# define LLONG_MIN (-0x7fffffffffffffffLL-1) /* min value for a signed long long */
往期文章列表:
===========我是华丽的分割线===========
更多知识:
点击关注专题:嵌入式Linux&ARM
或浏览器打开:https://www.jianshu.com/c/42d33cadb1c1
或扫描二维码: