Linux 常用文件IO函数以及IO阻塞

常用文件IO函数

open函数

#include 
#include 
#include int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);

功能:
    打开文件,如果文件不存在则可以选择创建。
参数:
    pathname:文件的路径及文件名
    flags:打开文件的行为标志,必选项 O_RDONLY, O_WRONLY, O_RDWR
    mode:这个参数,只有在文件不存在时有效,指新建文件时指定文件的权限
返回值:
    成功:成功返回打开的文件描述符
    失败:-1

flags详细说明

必选项:

宏定义 取值含义
O_RDONLY 以只读的方式打开
O_WRONLY 以只写的方式打开
O_RDWR 以可读、可写的方式打开

可选项,和必选项按位或起来

宏定义 取值含义
O_CREAT 文件不存在则创建文件,使用此选项时需使用mode说明文件的权限
O_EXCL 如果同时指定了O_CREAT,且文件已经存在,则出错
O_TRUNC 如果文件存在,则清空文件内容
O_APPEND 写文件时,数据添加到文件末尾
O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O

mode补充说明

  1. 文件最终权限:mode & ~umask

  2. shell进程的umask掩码可以用umask命令查看

  • umask:查看掩码(补码)
  • umask mode:设置掩码,mode为八进制数
  • umask -S:查看各组用户的默认操作权限
宏定义 取值(八进制) 含义
S_IRWXU 00700 文件所有者的读、写、可执行权限
S_IRUSR 00400 文件所有者的读权限
S_IWUSR 00200 文件所有者的写权限
S_IXUSR 00100 文件所有者的可执行权限
S_IRWXG 00070 文件所有者同组用户的读、写、可执行权限
S_IRGRP 00040 文件所有者同组用户的读权限
S_IWGRP 00020 文件所有者同组用户的写权限
S_IXGRP 00010 文件所有者同组用户的可执行权限
S_IRWXO 00007 其他组用户的读、写、可执行权限
S_IROTH 00004 其他组用户的读权限
S_IWOTH 00002 其他组用户的写权限
S_IXOTH 00001 其他组用户的可执行权限

close函数

#include int close(int fd);
功能:
    关闭已打开的文件
参数:
    fd : 文件描述符,open()的返回值
返回值:
    成功:0
    失败: -1, 并设置errno

需要说明的是,当一个进程终止时,内核对该进程所有尚未关闭的文件描述符调用close关闭,所以即使用户程序不调用close,在终止时内核也会自动关闭它打开的所有文件。

但是对于一个长年累月运行的程序(比如网络服务器),打开的文件描述符一定要记得关闭,否则随着打开的文件越来越多,会占用大量文件描述符和系统资源。

write函数

#include 
ssize_t write(int fd, const void *buf, size_t count);
功能:
    把指定数目的数据写到文件(fd)
参数:
    fd :  文件描述符
    buf : 数据首地址
    count : 写入数据的长度(字节)
返回值:
    成功:实际写入数据的字节个数
    失败: - 1

read函数

#include 
​
ssize_t read(int fd, void *buf, size_t count);
功能:
    把指定数目的数据读到内存(缓冲区)
参数:
    fd : 文件描述符
    buf : 内存首地址
    count : 读取的字节个数
返回值:
    成功:实际读取到的字节个数
    失败: - 1

lseek函数

#include 
#include 
​
off_t lseek(int fd, off_t offset, int whence);
功能:
    改变文件的偏移量
参数:
    fd:文件描述符
    offset:根据whence来移动的位移数(偏移量),可以是正数,也可以负数,如果正数,则相对于whence往右移动,如果是负数,则相对于whence往左移动。如果向前移动的字节数超过了文件开头则出错返回,如果向后移动的字节数超过了文件末尾,再次写入时将增大文件尺寸。
​
    whence:其取值如下:
        SEEK_SET:从文件开头移动offset个字节
        SEEK_CUR:从当前位置移动offset个字节
        SEEK_END:从文件末尾移动offset个字节
返回值:
    若lseek成功执行, 则返回新的偏移量
    如果失败, 返回-1

所有打开的文件都有一个当前文件偏移量(current file offset),以下简称为 cfo。cfo 通常是一个非负整数,用于表明文件开始处到文件当前位置的字节数。

读写操作通常开始于 cfo,并且使 cfo 增大,增量为读写的字节数。文件被打开时,cfo 会被初始化为 0,除非使用了 O_APPEND 。

阻塞

阻塞(Blocking)和非阻塞(Non-Blocking)是计算机在进行IO操作时的两种不同模式。

  1. 阻塞IO

当调用一个IO操作时(例如读取文件、请求网络),当前线程会被挂起,直到IO操作完成才会返回结果并继续执行。也就是说在等待IO结果的这段时间里,当前线程会被阻塞无法执行其他代码,只能等着IO返回。

  1. 非阻塞IO

当调用一个IO操作时,当前线程不会被阻塞而是继续执行下面的指令。需要开发者在后续的循环中不停地检查IO操作是否完成,从而获取IO的返回结果。当前线程可以同时并发处理其他任务而不用等待IO。

总结:

  • 阻塞IO简单易用,但IO等待时线程无法干其他事。
  • 非阻塞IO可以并发操作,但需要不停检查IO是否完成。

对多线程和异步编程支持都很重要。

阻塞和非阻塞的概念

读常规文件是不会阻塞的,不管读多少字节,read一定会在有限的时间内返回。

从终端设备或网络读则不一定,如果从终端输入的数据没有换行符,调用read读终端设备就会阻塞,如果网络上没有接收到数据包,调用read从网络读就会阻塞,至于会阻塞多长时间也是不确定的,如果一直没有数据到达就一直阻塞在那里。

同样,写常规文件是不会阻塞的,而向终端设备或网络写则不一定。

【注意】阻塞与非阻塞是对于文件而言的,而不是指read、write等的属性。

以非阻塞方式打开文件程序示例:

#include  //read
#include 
#include 
#include 
#include 
#include  //EAGAINint main()
{
    // /dev/tty --> 当前终端设备
    // 以不阻塞方式(O_NONBLOCK)打开终端设备
    int fd = open("/dev/tty", O_RDONLY | O_NONBLOCK);char buf[10];
    int n;
    n = read(fd, buf, sizeof(buf));
    if (n < 0)
    {
        // 如果为非阻塞,但是没有数据可读,此时全局变量 errno 被设置为 EAGAIN
        if (errno != EAGAIN)
        {
            perror("read /dev/tty");
            return -1;
        }
        printf("没有数据\n");
    }return 0;
}

以非阻塞(non-blocking)的形式打开文件指的是:
加粗样式
在打开文件的系统调用(如open()函数)时,设置O_NONBLOCK标志位。这将导致这个已打开的文件描述符在后续的读写操作中变为非阻塞模式。

非阻塞模式下的主要特征是:

  1. 若读操作时内核数据缓冲区中没有数据,则立即返回错误(EAGAIN或EWOULDBLOCK),而不是阻塞等待数据到达。

  2. 若写操作时内核数据缓冲区剩余空间不足以存放用户数据,也会立即失败并出错返回,而不是等待缓冲区有空间时再写入。

  3. 对于设备文件,设置为非阻塞后,I/O操作也具备同样的非阻塞特性。

这样的好处是可以通过非阻塞I/O实现一些需要并发和异步处理的程序,不会因某个I/O操作的长时间阻塞而不能响应其它事件。比如异步日志记录、读取设备数据等场景。

但代价也明显,需要程序自行处理读取不到数据和写入失败的情况,编程难度加大。

所以以非阻塞的形式打开文件主要适用于对及时性要求较高的异步 I/O 场景。

你可能感兴趣的:(linux高并发服务器,linux,服务器,算法)