在学习socket编程的途中, 通过客户端给服务端发送字符串,然后服务端通过read或者recv来读取数据,然后返回读取的字节数. 我在想read返回的读取字节数有没有包含'\0'
或者'\n'
呢,于是通过一些简单的小例子,来看看实际情况到底如何.
我们来看一下read函数的原型:
ssize_t read(int fd, void *buf, size_t count);
然后看看函数的描述:
read() attempts to read up to count bytes from file descriptor fd into the buffer starting at buf.
然后是函数的返回描述:
On success, the number of bytes read is returned (zero indicates end of file), and the file position is advanced by this number. It is not an error if this number is smaller than the number of bytes requested; this may happen for example because fewer bytes are actually available right now (maybe because we were close to end-of-file, or because we are reading from a pipe, or from a terminal), or because read() was interrupted by a signal. See also NOTES.
On error, -1 is returned, and errno is set appropriately. In this case, it is left unspecified whether the file position (if any) changes.
大概的意思就是read函数从文件描述符fd中读取字节到count大小的buf中,如果成功读取的话,返回读到的字节数大小,否则返回-1.
接下来我们通过一下小函数来实验一下.
看下面的函数:
#include
#include
#include
#include
#define BUFSIZE 1024
int main(int argc, char *argv[]){
char buf[BUFSIZE] = {0};
int len = read(STDIN_FILENO, buf, BUFSIZE);
printf("Read buf: %s", buf);
printf("The length of buf read: %d\n", len);
printf("The strlen of buf: %ld\n", strlen(buf));
return 0;
}
现在我们编译运行这个程序,然后输入:
hello
我们知道hello的字节数为5,然后在终端里我们要敲回车进行确认,也就是换行符'\n'
,然后我们看看输出:
Read buf: hello
The length of buf read: 6
The strlen of buf: 6
注意在代码中
printf("Read buf: %s", buf);
这一句我是没有加换行符的,但是输出的时候却有了换行的作用,说明buf
把换行符'\n'
给读取进来了,下面的长度也说明了问题,
读取到的长度为6,然而hello只有5个字节,说明把换行符读了进来,结束符没有读取进来
strlen
测量的buf长度也是6,因为strlen不测量结束符'\0'
,因此也说明read读取到的字节数不包含结束符,而是包含换行符.
ps. 最后会有简略的strlen
和 sizeof
函数的比较.
因为终端只能带有换行符,我们试一下从文件中读取不带换行符的试试.创建一个文件名为read_test
,里面的内容为:
hello
注意是不带换行的!
然后代码改为如下:
#include
#include
#include
#include
#define BUFSIZE 1024
int main(int argc, char *argv[]){
char buf[BUFSIZE] = {0};
int r_fd = open(argv[1], O_RDONLY);
int len = read(r_fd, buf, BUFSIZE);
printf("Read buf: %s", buf);
printf("The length of buf read: %d\n", len);
printf("The strlen of buf: %ld\n", strlen(buf));
return 0;
}
编译运行, 输入的命令为:
./read_the_end_of_file read_test
最后输出为:
Read buf: helloThe length of buf read: 5
The strlen of buf: 5
很显而易见,buf只读取了hello
,没有了换行符,所以导致第一行和下一行连在一起了.
read函数返回的字节大小和strlen返回的字符串长度都是5,验证了这一点.
通过上面两个简单的测试,最后总结如下:
'\0'
的大小. read函数读取不包含'\0'
, strlen
读取的也不包含'\0'
先说结论:
strlen 是函数,sizeof 是运算符
strlen 测量的是字符的实际长度,以’\0’ 结束。而sizeof 测量的是字符的分配大小.
也就是说: strlen是通过找'\0'
来确定字符的实际长度的.这一点非常关键.
下面来看看简单的例子:
#include
#include
int main(){
char str[20] = "hello";
printf("strlen of str: %ld\n", strlen(str));
printf("sizeof str: %ld\n", sizeof(str));
return 0;
}
输出为:
strlen of str: 5
sizeof str: 20
有一点要说明,在char str[20] = "hello";
这条语句中, 字符数组会自动在hello
后面加上'\0'
这个结束符,所以strlen才能找到'\0'
,得到str的实际字符长度为5.
那如果字符数组不一次赋值的话,就有区别了,看下面程序:
#include
#include
int main(){
char str1[] = "hello";
char str2[] = {'h','e','l','l','o', '\0'};
char str3[] = {'h', 'e','l','l', 'o'};
printf("str1:%s\n", str1);
printf("str2:%s\n", str2);
printf("str3:%s\n", str3);
printf("strlen of str1 = %ld\n", strlen(str1));
printf("strlen of str1 = %ld\n", strlen(str2));
printf("strlen of str1 = %ld\n", strlen(str3));
return 0;
}
编译运行:
str1:hello
str2:hello
str3:hellohello
strlen of str1 = 5
strlen of str1 = 5
strlen of str1 = 10
我们知道字符串是以 ‘\0’ 为结束标志的,所以char str1[ ] = “hello” 等效于char str2[ ] = {‘h’ , ‘e’ , ‘l’ , ‘l’ , ‘o’ , ‘\0’} 。strlen函数求的是字符串的实际长度,它求得方法是从开始到遇到第一个’\0’,如果你只定义没有给它赋初值,这个结果是不定的,它会从首地址一直找下去,直到遇到’\0’停止。而如果不在字符数组初始化的时候加上\0,那么strlen 得到的值就不是正确的数值,打印出来的结果也不是想要的结果。因此我们要避免这种情况,在初始化的时候要记得加上 \0,或者一次性赋初值。
另外: