linux内核遨游之旅—引子

strncpy的实现说起

第一次阅读内核源码是在网上浏览博客的时候,有个博主说strncpy的执行效率很低,而且并不是绝对安全,也存在缓冲区溢出的风险。

先贴出来其实现,再逐行分析。

#ifndef __HAVE_ARCH_STRNCPY
/**
 * strncpy - Copy a length-limited, %NUL-terminated string
 * @dest: Where to copy the string to
 * @src: Where to copy the string from
 * @count: The maximum number of bytes to copy
 *
 * The result is not %NUL-terminated if the source exceeds
 * @count bytes.
 *
 * In the case where the length of @src is less than  that  of
 * count, the remainder of @dest will be padded with %NUL.
 *
 */
char *strncpy(char *dest, const char *src, size_t count)
{
    char *tmp = dest;   (1)

    while (count) {     (2)
        if ((*tmp = *src) != 0)     (3)
            src++;      (4)
        tmp++;          (5)
        count--;            (6)
    }   
    return dest;            (7)
}
EXPORT_SYMBOL(strncpy);
#endif

首先,我们整体看一下函数的执行流程

  1. 行1,将tmp指向dest
  2. 行2,初次进入while循环时,count为dest大小
  3. 行3,将src的内容赋值给tmp
  4. 行4,如果src没有移动到字符串末尾的\0,则把src往后移动一个字节
  5. 行5,tmp向后移动一个字节
  6. 行6,count减1

简单来说,该函数把src的内容往dest拷贝,最多拷贝count个字节

但是这里有几个关键问题

  1. 如果src的长度 >= count 会发生什么?
  2. 如果src的长度 < count,该函数性能如何?

问题1:

如果src_len >= count,根据行2行3可知,dest会被填充count字节,也就是说src的前count字节会被copy到dest,所以dest末尾并不是\0

问题2:

如果src_len < count,考虑边界情况,假设当前src指向字符串末尾(也就是\0的前一个字符),则行3把src的值赋值到tmp,行4src往后移动一个字节,指向\0,行5、行6,把tmp向后移动一个字节,count减1,while循环进入下一次,行3把src的值(也就是\0)赋值给tmp,注意观察行3,此时if语句值为false,src不向后移动(所以src依然指向\0),行5、行6,tmp向后移动,count减1。再次进入下一次循环,行3,把src的当前值(\0)赋值给tmp,if语句值为false,src不向后移动,tmp向后移动,count减1。所以,此情况下,该函数会使用\0填充dest剩下的全部字节。

看看如下常用的使用方式:

char buff[1024];
const char* src = "hello world";
strncpy(buff, src, sizeof(buff));

把src内容拷贝到buff后,会将剩余的空间全部填充0,效率非常低。

char buff[5];
const char* src = "hello world";
strncpy(buff, src, sizeof(buff));

buff的长度比src长度要小,buff末尾并不是\0,需要添加如下语句才能避免缓冲区溢出问题。

buff[sizeof(buff) - 1] = 0

你可能感兴趣的:(linux内核遨游之旅—引子)