缓冲区溢出是指当计算机向缓冲区内填充数据位数时超过了缓冲区本身的容量,溢出的数据覆盖在合法数据上。理想的情况是:程序会检查数据长度,而且并不允许输入超过缓冲区长度的字符。但是绝大多数程序都会假设数据长度总是与所分配的储存空间相匹配,这就为缓冲区溢出埋下隐患。操作系统所使用的缓冲区,又被称为“堆栈”,在各个操作进程之间,指令会被临时储存在“堆栈”当中,“堆栈”也会出现缓冲区溢出。缓冲区溢出攻击是利用缓冲区溢出漏洞所进行的攻击行动。利用缓冲区溢出攻击,可以导致程序运行失败、系统关机、重新启动等后果。
缓冲区溢出中,最为危险的是堆栈溢出,因为入侵者可以利用堆栈溢出,在函数返回时改变返回程序的地址,让其跳转到任意地址,带来的危害一种是程序崩溃导致拒绝服务分段错误(Segmentation fault),另外一种就是跳转并且执行一段恶意代码,比如得到shell,然后为所欲为。
C语言没有提供字符串类型,字符串以字符数组的形式出现,C标准库提供了一些操作字符串的函数,主要有:strcmp 字符串比较函数,strcpy 字符串拷贝函数, strlen 字符串测长函数, strcat字符串连接函数,sprintf格式化字符串拷贝函数等等。因为字符串就是以‘\0’结束的一段内存,这些函数实质上也就是操作内存的函数。
-
头文件:
-
#include
-
函数原型:
-
char *gets(char *buff);
-
函数说明:
-
从
stdin流中读取字符串,直至接受到换行符或EOF时停止,并将读取的结果存放在buffer指针所指向的字符数组中。但换行符会被丢弃,然后在末尾添加
'\0'字符,并由此来结束字符串。
【缓冲区溢出错误】读入stdin流中的字符串超过buff长度造成溢出。
-
错误代码:
-
void main()
-
{
-
char buf[
1024];
-
gets(buf);
-
}
-
//当输入内容超过1024大小
-
头文件:
-
#include
-
函数原型:
-
char *fgets(char *s, int size, FILE *stream);
-
函数说明:
-
从stream流中读取字符串,直至接受到换行符或EOF时停止(最多读取size
-1个字符),并将读取的结果存放在buffer指针所指向的字符数组中。换行符仍会被丢弃,然后在末尾添加
'\0'字符,并由此来结束字符串。
正确示例:
-
正确代码:
-
#define BUFSIZE 1024
-
-
void main()
-
{
-
char buf[BUFSIZE];
-
fgets(buf, BUFSIZE,
stdin);
-
}
-
//最多读入BUFSIZE-1个字符,并将回车替换为'\0'
-
头文件:
-
#include
-
函数原型:
-
char *strcpy(char *dest, const char *src);
-
函数说明:
-
把从src地址开始且含有
NULL结束符的字符串复制到以dest开始的地址空间。【src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。】
不可以重叠是因为有可能造成拷贝的时候死循环,这从strcpy函数的实现原理可以看出。
实现原理:
-
#include
-
#include
-
#include
-
char* strcpy(char *strDest, const char *strSrc) //const
-
{
-
assert((strDest!=
NULL) && (strSrc !=
NULL));
-
char *address = strDest;
-
while( (*strDest++ = *strSrc++) !=
'\0' )
-
;
-
return address ;
-
}
返回strDest的原始值使函数能够支持链式表达式,增加了函数的“附加值”。如:
int iLength=strlen(strcpy(strA,strB));
【缓冲区溢出错误】源字符串strSrc的字符数目大于目的字符串strDest的buff长度。
-
头文件:
-
#include
-
函数原型:
-
char *strncpy(char *dest, const char *src, size_t n);
-
函数说明:把从src地址开始且含有
NULL结束符的字符串复制到以dest开始的地址空间。最多复制n个字符。【src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。】
实现原理:
-
char *strncpy(char *dest, const char *src, size_t n)
-
{
-
1,填充构造一个n长度长的src2字符数组
-
//若{src=
"abc",n=
2},则src2=
'a'
'b'
-
//若{src=
"abc",n=
4},则src2=
'a'
'b'
'c'
'\0',与strcpy一致
-
//若{src=
"abc",n=
5},则src2=
'a'
'b'
'c'
'\0'
'\0'
-
//若{src=
"abc\0def",n=
5},则src2=
'a'
'b'
'c'
'\0'
'\0'
-
2,将n长度长的src2复制(memcpy)到dest。(dest是否溢出必须规范n=dst_size
-1才能保证)
-
}
-
// vc6.0 source
-
char * __
cdecl strncpy (
-
char * dest,
-
const char * source,
-
size_t count
-
)
-
{
-
char *start = dest;
-
-
while (count && (*dest++ = *source++))
/* copy string */
-
count--;
-
-
if (count)
/* pad out with zeroes */
-
while (--count)
-
*dest++ =
'\0';
-
-
return(start);
-
}
因为strncpy 其行为是很诡异的(不符合我们的通常习惯)。标准规定 n 并不是 sizeof(s1),而是要复制的 char 的个数(错:如果src 长度大于等于 n, 那么 strncpy 会拷贝 n – 1 各字符到 dest, 然后补 0?)。一个最常见的问题,就是strncpy 并不帮你保证‘/0’结束。所以strncpy更像是特殊的memcpy。
正确使用方法【建议】:
-
strncpy(dst, src, dst_size
-1);
-
dst[dst_size
-1] =
'\0';
/* Always do this to be safe! */
重写一个安全版本【复制字符串】:
-
#define STRNCPY(pszDst, pszSrc, iLen) \
-
do \
-
{ \
-
strncpy((pszDst), (pszSrc), (iLen)
-1);\
-
(pszDst)[(iLen)
-1] =
0; \
-
} \
-
while(
0)
-
#endif
或重写一个函数:
-
/* safe strncpy */
-
char *sstrncpy(char *dest, const char *src, size_t n) //最多复制n-1个字符,并在最后添加'\0'
-
{
-
if (n ==
0)
-
return dest;
-
-
dest[
0] =
0;
-
-
return
strncat(dest, src, n -
1);
-
}
-
使用
strncat 是因为很难实现一个性能能够达到库函数的字符串拷贝函数。
如果是为了复制一个字符串,那么更好的做法是使用 strdup 函数
char * strdup (const char *s);
strdup 函数会调用 malloc 分配足够长度的内存并返回。
【特别注意】在你不使用的时候 free 它。
char * strndup (const char *s, size_t n);
最多复制n个字符到堆内存分配的空间,并再在结尾增加一个'\0'。需要free。
【特别注意】在你不使用的时候 free 它。
如果只是函数内部调用,也可以使用 strdupa 函数。
char * strdupa (const char *s);
strdupa 函数调用 alloca函数而非 malloc 函数分配内存,alloca 分配的内存是
桟内存而非堆内存。所以当函数返回后,内存就自动释放了,不需要 free。
如果只是函数内部调用,也可以使用 strdupa 函数。
char * strndupa (const char *s,<span style="font-family: Arial, Helvetica, sans-serif; font-size: 12px;">size_t nspan><span style="font-size: 12px; font-family: Arial, Helvetica, sans-serif;">);span>
最多复制n个字符到栈内存分配的空间,并再在结尾增加一个'\0'。不用释放。
-
头文件:
-
#include
-
函数原型:
-
char *strcat(char *dest, const char *src);
-
函数说明:
-
把src所指字符串添加到dest结尾处(覆盖dest结尾处的
'\0')并添加
'\0'。【src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。】
实现原理:
-
//将源字符串加const,表明其为输入参数
-
char *strcat(char *strDest,const char *strSrc)
-
{
-
//后文return address,故不能放在assert断言之后声明address
-
char *address = strDest;
-
assert((strDest!=
NULL)&&(strSrc!=
NULL));
-
-
while(*strDest)
-
{
-
strDest++;
-
}
-
-
while( (*strDest++ = *strSrc++) !=
'\0' )
-
;
-
-
return address;
//为了实现链式操作,将目的地址返回
-
}
-
}
-
头文件:
-
#include
-
函数原型:
-
char *strncat(char *dest, const char *src, size_t n);
-
函数说明:
-
把src所指字符串的前n个字符或
'\0'之前的字符添加到dest结尾处(覆盖dest结尾处的
'\0')并添加
'\0'。【src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串。】
正确使用方法:
strncat(dest, source, dest_size-strlen(dest)-1);
-
头文件:
-
#include
-
函数原型:
-
size_t strnlen(
const
char *s);
-
函数说明:
-
计算字符串s的(
unsigned
int型)长度,不包括
'\0'在内
-
头文件:
-
#include
-
函数原型:
-
size_t strnlen(
const
char *s,
size_t maxlen);
-
函数说明:
-
计算字符串str的(
unsigned
int型)长度,不保护结束符
NULL,该长度最大为maxlen。
使用示例:
-
传(字符串,字符串长度)
-
-
声明
1:
-
char p [BUFF_LEN];
-
void f(char * buff,int p_len);
//说明后面的是实际p字符串的长度
-
调用
1:
-
f(buff, strnlen(p,
sizeof(p)))
-
-
声明
2:
-
char p [BUFF_LEN];
-
void f(char * buff,int buff_size);
//说明后面的是栈上数组的长度
-
调用
2:
-
f(buff,
sizeof(p)))
-
头文件:
-
#include
-
函数原型:
-
int sprintf(char *buffer, const char *format, ...);
-
参数列表:
-
buffer:
char型指针,指向将要写入的字符串的缓冲区。
-
format:格式化字符串。
-
[argument]...:可选参数,可以是任何类型的数据。
-
返回值:字符串长度(
strlen)
-
功能:
-
把格式化的数据写入某个字符串缓冲区。
函数 sprintf()和 vsprintf()是用来格式化文本和将其存入缓冲区的通用函数。
它们可以用直接的方式模仿 strcpy() 行为。换句话说,使用 sprintf() 和 vsprintf() 与使用 strcpy() 一样,都很容易对程序造成缓冲区溢出。
-
头文件:
-
#include
-
函数原型:
-
int snprintf(char *buffer, size_t size, const char *format, ...);
-
参数列表:
-
buffer:
char型指针,指向将要写入的字符串的缓冲区。
-
size:最多从源串中拷贝n-
1个字符到目标串中,然后再在后面加一个
'\0'。
-
format:格式化字符串。
-
[argument]...:可选参数,可以是任何类型的数据。
-
返回值:若成功则返回“欲”写入的字符串长度,若出错则返回负值。
特别注意返回值,与sprintf不同,如果输出因为size的限制而被截断,返回值将是“如果有足够空间存储,所应能输出的字符数(不包括字符串结尾的'/0')”,这个值和size相等或者比size大!也就是说,如果可以写入的字符串是 "0123456789ABCDEF" 共16位,但是size限制了是10,这样 snprintf() 的返回值将会是16 而不是 10 !并且,如果返回值等于或者大于size,则表明输出字符串被截断了(truncated)。
-
char buff[
10]={
0};
-
char str[] =
"123456789012345678";
-
snprintf(buff,
sizeof(buff), str);
//如果后面的字符串str中有%s等转义字符,则会继续往后读取。
-
char buff[
10]={
0};
-
char str[] =
"123456789012345678";
-
snprintf(buff,
sizeof(buff),
"%s", str);
//严格规范,结果是"123456789"
-
头文件:
-
#include
-
函数原型:
-
int strcmp(const char *s1, const char *s2);
-
函数说明:
-
两个字符串自左向右逐个字符相比(按ASCII值大小相比较),直到出现不同的字符或遇
'\0'为止。
【缓冲区溢出错误】
-
头文件:
-
#include
-
函数原型:
-
int strncmp(const char *s1, const char *s2,size_t n);
-
函数说明:
-
此函数功能即比较字符串str1和str2的前maxlen个字符。
-
void main(int argc, char **argv)
-
{
-
char buf[
256];
-
sscanf(argv[
0],
"%s", &buf);
-
}
如果输入的字大于 buf 的大小,则有溢出的情况。幸运的是,有一种简便的方法可以解决这个问题。考虑以下代码,它没有安全性方面的薄弱环节:
-
void main(int argc, char **argv)
-
{
-
char buf[
256];
-
sscanf(argv[
0],
"%255s", &buf);
-
}
-
// vc6.0 source
-
void * __
cdecl memcpy (
-
void * dst,
-
const void * src,
-
size_t count
-
)
-
{
-
void * ret = dst;
-
/*
-
* copy from lower addresses to higher addresses
-
*/
-
while (count--) {
-
*(
char *)dst = *(
char *)src;
-
dst = (
char *)dst +
1;
-
src = (
char *)src +
1;
-
}
-
return(ret);
-
}
-
// get length of string, max_len is the maximum length
-
// we assume that: a string with size [n] can have [n - 1] charactors at most
-
size_t
strlen(
const
char * str,
size_t str_size){
-
assert(str !=
NULL);
-
assert(str_size >
0);
-
-
size_t i =
0;
-
for (; i < str_size; ++ i){
-
if (str[i] ==
'\0'){
-
return i;
-
}
-
}
-
-
return
-1;
-
}
-
// string copy, dst_size/src_size are the size of array dest/src
-
size_t
strcpy(
char * dest,
size_t dst_size,
const
char * src,
size_t src_size){
-
assert(dest !=
NULL && src !=
NULL);
-
-
int src_len =
strlen(src, src_size);
-
if (src_len <
0){
-
return
-1;
-
}
-
-
if ((
size_t)src_len > dst_size){
-
return
-1;
-
}
-
-
int i =
0;
-
for (; i < src_len; i ++){
-
dest[i] = src[i];
-
}
-
-
dest[src_len] =
0x0;
-
-
return
0;
-
}
函数 | 严重性 | 解决方案 |
gets | 最危险 | 使用 fgets(buf, size, stdin)。这几乎总是一个大问题! |
strcpy | 很危险 | 改为使用 strncpy。 |
strcat | 很危险 | 改为使用 strncat。 |
sprintf | 很危险 | 改为使用 snprintf,或者使用精度说明符。 |
scanf | 很危险 | 使用精度说明符,或自己进行解析。 |
sscanf | 很危险 | 使用精度说明符,或自己进行解析。 |
fscanf | 很危险 | 使用精度说明符,或自己进行解析。 |
vfscanf | 很危险 | 使用精度说明符,或自己进行解析。 |
vsprintf | 很危险 | 改为使用 vsnprintf,或者使用精度说明符。 |
vscanf | 很危险 | 使用精度说明符,或自己进行解析。 |
vsscanf | 很危险 | 使用精度说明符,或自己进行解析。 |
streadd | 很危险 | 确保分配的目的地参数大小是源参数大小的四倍。 |
strecpy | 很危险 | 确保分配的目的地参数大小是源参数大小的四倍。 |
strtrns | 危险 | 手工检查来查看目的地大小是否至少与源字符串相等。 |
realpath | 很危险(或稍小,取决于实现) | 分配缓冲区大小为 MAXPATHLEN。同样,手工检查参数以确保输入参数不超过 MAXPATHLEN。 |
syslog | 很危险(或稍小,取决于实现) | 在将字符串输入传递给该函数之前,将所有字符串输入截成合理的大小。 |
getopt | 很危险(或稍小,取决于实现) | 在将字符串输入传递给该函数之前,将所有字符串输入截成合理的大小。 |
getopt_long | 很危险(或稍小,取决于实现) | 在将字符串输入传递给该函数之前,将所有字符串输入截成合理的大小。 |
getpass | 很危险(或稍小,取决于实现) | 在将字符串输入传递给该函数之前,将所有字符串输入截成合理的大小。 |
getchar | 中等危险 | 如果在循环中使用该函数,确保检查缓冲区边界。 |
fgetc | 中等危险 | 如果在循环中使用该函数,确保检查缓冲区边界。 |
getc | 中等危险 | 如果在循环中使用该函数,确保检查缓冲区边界。 |
read | 中等危险 | 如果在循环中使用该函数,确保检查缓冲区边界。 |
bcopy | 低危险 | 确保缓冲区大小与它所说的一样大。 |
fgets | 低危险 | 确保缓冲区大小与它所说的一样大。 |
memcpy | 低危险 | 确保缓冲区大小与它所说的一样大。 |
snprintf | 低危险 | 确保缓冲区大小与它所说的一样大。 |
strccpy | 低危险 | 确保缓冲区大小与它所说的一样大。 |
strcadd | 低危险 | 确保缓冲区大小与它所说的一样大。 |
strncpy | 低危险 | 确保缓冲区大小与它所说的一样大。 |
vsnprintf | 低危险 | 确保缓冲区大小与它所说的一样大。 |
Arrlen:intc1=
sizeof(a1)/sizeof(char);