Linux 文件I/O — 文件描述符详解

注:学习资源来自邢文鹏老师

文件描述符

一个进程默认打开3个文件描述符

STDIN_FILENO 0
STDOUT_FILENO 1
STDERR_FILENO 2

新打开文件返回文件描述符表中未使用的最小文件描述符

open函数可以打开或创建一个文件。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

返回值:成功返回新分配的文件描述符,出错返回-1并设置errno

在Man Page中open函数有两种形式,一种带两个参数,一种带三个参数,其实在C代码中open函数是这样声明的:

int open(const char *pathname, int flags, ...);

第三个参数mode指定文件权限,可以用八进制数表示,比如0644表示-rw-r-r–,也可以用S_IRUSRS_IWUSR等宏定义按位或起来表示,详见open(2)的Man Page
要注意的是,文件权限由open的mode参数和当前进程的umask掩码共同决定。

最后的可变参数可以是0个或1个,由flags参数中的标志位决定,见下面的详细说明。

pathname参数是要打开或创建的文件名,和fopen一样,pathname既可以是相对路径也可以是绝对路径。

flags参数有一系列常数值可供选择,可以同时选择多个常数用按位或运算符连接起来,所以这些常数的宏定义都以O_开头,表示or

必选项:以下三个常数中必须指定一个,且仅允许指定
O_RDONLY 只读打开
O_WRONLY 只写打开
O_RDWR 可读可写打开

选项可以同时指定0个或多个,和必选项按位或起来作为flags参数。可选项有很多,这里只介绍一部分,其它选项可参考open(2)的Man Page

  • O_APPEND 表示追加。如果文件已有内容,这次打开文件所写的数据附加到文件的末尾而不覆盖原来的内容。

  • O_CREAT 若此文件不存在则创建它。使用此选项时需要提供第三个参数mode,表示该文件的访问权限。

  • O_EXCL 如果同时指定了O_CREAT,并且文件已存在,则出错返回。

  • O_TRUNC 如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断(Truncate)
    为0字节。

  • O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O(Nonblock I/O),非阻塞I/O在下一节详细讲解。

open函数与fopen函数的区别

以可写的方式fopen一个文件时,如果文件不存在会自动创建,而open一个文件时必须明确指定O_CREAT才会创建文件,否则文件不存在就出错返回。

以w或w+方式fopen一个文件时,如果文件已存在就截断为0字节,而open一个文件时必须明确指定O_TRUNC才会截断文件,否则直接在原来的数据上改写。

umask命令

补充说明一下Shell的umask命令。Shell进程的umask掩码可以用umask命令查看:

$ umask
0002

用touch命令创建一个文件时,创建权限是0666,而touch进程继承了Shell进程的umask掩码,所以最终的文件权限是0666&022=0644

$ touch file123
$ ls -l file123
-rw-rw-r-- 1 xingwenpeng xingwenpeng 0 911 23:48 file123

同样道理,用gcc编译生成一个可执行文件时,创建权限是0777,而最终的文件权限是0777 & 022 = 0755

xingwenpeng@ubuntu:~$ umask
0002
xingwenpeng@ubuntu:~$ gcc main.c
xingwenpeng@ubuntu:~$ ls -l a.out
-rwxrwxr-x 1 xingwenpeng xingwenpeng 7158 911 23:51 a.out

我们看到的都是被umask掩码修改之后的权限,那么如何证明touch或gcc创建文件的权限本来应该是0666和0777呢?
我们可以把Shell进程的umask改成0,再重复上述实验:

$ rm file123 a.out
$ umask 0
$ touch file123
$ ls -l file123
-rw-rw-rw- 1 xingwenpeng xingwenpeng 0 911 23:52 file123
$ gcc main.c
$ ls -l a.out
-rwxrwxr-x 1 xingwenpeng xingwenpeng 7158 911 23:52 a.out

close函数关闭一个已打开的文件:

#include <unistd.h>
int close(int fd);

返回值:成功返回0,出错返回-1并设置errno

参数fd是要关闭的文件描述符。
需要说明的是,当一个进程终止时,内核对该进程所有尚未关闭的文件描述符调用close关闭,所以即使用户程序不调用close,在终止时内核也会自动关闭它打开的所有文件。
但是对于一个长年累月运行的程序(比如网络服务器),打开的文件描述符一定要记得关闭,否则随着打开的文件越来越多,会占用大量文件描述符和系统资源

由open返回的文件描述符一定是该进程尚未使用的最小描述符。由于程序启动时自动打开文件描述符0、1、2,因此第一次调用open打开文件通常会返回描述符3,再调用open就会返回4。

可以利用这一点在标准输入、标准输出或标准错误输出上打开一个新文件,实现重定向的功能。
例如,首先调用close关闭文件描述符1,然后调用open打开一个常规文件,则一定会返回文件描述符1,这时候标准输出就不再是终端,而是一个常规文件了,再调用printf就不会打印到屏幕上,而是写到这个文件中了。

你可能感兴趣的:(linux,文件描述符)