《Linux操作系统 - 高级编程》第一部分 标准IO及文件IO(第3章 文件IO)

3.1文件I/O概述

Linux操作系统是基于文件概念的。文件是以字符序列构成的信息载体。根据这一点,可以把I/O设备当做文件来处理,因此,在磁盘上的普通文件进行交互所用的统一系统调用可以直接用于I/O设备。这样大大简化了系统对于不同设备的处理,提高了效率。Linux中的文件主要分为6种:普通文件、目录文件、符号链接文件、管道文件、套接字文件和设备文件。

那么,内核如何区分和引用特定的文件呢?这里用到了一个重要的概念——文件描述符。对于Linux而言,所有的设备和文件的操作都是通过文件描述符来进行的。文件描述符是一个非负的整数,它是一个索引值,并指向在内核中每个进程打开文件的记录表。当打开一个现存文件或创建一个新文件时,内核就向进程返回一个文件描述符;读写文件时,需要把文件描述符作为参数传递给相应的函数。

通常,一个进程启动时,都会打开3个流:标准输入、标准输出和标准错误。这3个流分别对应文件描述符0、1 和 2(对应的宏分别是STDIN_FILENO、STDOUT_FILENO和STDERR_FILENO)。

基于文件描述符的I/O操作虽然不能直接移植到类Linux以外的系统上去(如Windows),但它往往是实现某些I/O操作的唯一途径,如Linux中底层文件操作函数、多路I/O、TCP/IP套接字编程接口等。同时,他们也很好地兼容POSIX标准,因此,可以很方便地移植到任何POSIX平台上。基于文件描述符的I/O操作是Linux中最常用的操作之一。

文件I/O相关函数:open() 、read() 、write() 、lseek() 和close() 。这些函数的特点是不带缓冲,直接对文件(包括设备)进行读写操作。这些函数不是ANSI C的组成部分,而是POSIX相关标准来定义。

3.2文件IO操作

3.2.1文件打开与和关闭

open()函数用于创建或打开文件,在打开或创建文件时可以指定文件打开方式及文件的访问权限。

表1 open()函数
所需头文件 #include
#include
#include
函数原型 int open(const char *pathname, int flags);
int open(const char *pathname, int flags, mode_t mode);
函数参数 pathname: 被打开的文件名(可包括路径名)
flags(文件打开方式,这里介绍几个常用的)
O_RDONLY 只读
O_WRONLY 只写
O_RDWR 可读可写
O_CREAT 如果文件不存在,就创建一个新文件,并用第三个参数为其设置权限;
O_TRUNC 若文件已经存在,那么会删除文件中的全部原有数据,并且设置文件大小为0;
O_APPEND 以添加方式打开文件,在写文件时,文件读写文职自动指向文件的末尾,即将写入的数据添加到文件的末尾;
mode :新建文件的存取权限
函数返回值 成功:返回文件描述符
失败:-1

close()函数用于关闭一个被打开的文件。当一个进程终止时,所有打开的文件都有内核自动关闭。很多程序都利用这一特性而不显示地关闭一个文件。

表2 close()函数
所需头文件 #include
函数原型 int close(int fd);
函数参数 fd:文件描述符
函数返回值 成功:0
失败:-1

3.2.2文件读写

read()函数从文件中读取数据存放到缓冲区中,并返回实际读取的字节数。若返回0,则表示没有数据可读,即已达到文件尾。读操作从文件的当前读写位置开始读取数据,当前读写位置自动往后移动。

表3read()函数
所需头文件 #include
函数原型 ssize_t read(int fd, void *buf, size_t count);
函数参数 fd :文件描述符;
buf :指定存储器读取数据的缓冲区;
count :指定读出的字节数;
函数返回值 成功:读到的字节数;
0:已到达文件尾;
1:出错;

在读到普通文件时,若读到要求的字节数之前已到达问价你的尾部,则返回的字节数会小于指定读出的字节数;

write()函数将数据写入文件中,并返回实际写入的字节数。写操作从文件的当前读写位置开始写入。对磁盘文件进行写操作时,若磁盘已满,write()函数返回失败;

表4 write()函数
所需头文件 #include
函数原型 ssize_t write(int fd, const void *buf, size_t count);
函数参数 fd :文件描述符;
buf :指定存储器写入数据的缓冲区;
count :指定读出的字节数;
函数返回值 成功:写入的字节数;
-1:出错;

下面写个简单小程序,实现copy程序,完成文件的复制,代码如下:
【参见附件/copy.c】

#include   
#include   
#include   
#include   
#include   
#define maxsize 256  
int main(int argc, char *argv[])  
{  
    int fd1,fd2;  
    int byte;  
    char buffer[maxsize];  
    if(argc != 3)  
    {  
printf("command error!\n");  
return -1;  
    }    
    if((fd1 = open(argv[1],O_RDONLY)) == -1)  
    {  
       		perror("open fails");  
return -1;  
    }  
  //如果文件不存在,则创建,若存在,则覆盖;  
    if((fd2 = open(argv[2],O_WRONLY | O_CREAT | O_TRUNC ,0664)) == -1)
    {  
perror("open fails");  
return -1;  
    }  
    while(1)  
    {  
if((byte = read(fd1,buffer,maxsize)) > 0)  
write(fd2,buffer,byte);  
       		if(byte == 0)  
            		break; //如果读不到数据,则返回  
    }  
    close(fd1);  
    close(fd2);  
    return 0;  
}  

执行结果如下:
《Linux操作系统 - 高级编程》第一部分 标准IO及文件IO(第3章 文件IO)_第1张图片
我们可以看到,原来file2.c并不存在,执行完程序后,file2.c存在,且大小和file1.c相同。

3.2.3文件定位

lseek()函数对文件当前读写位置进行定位。它只能对可定位(可随机访问)文件操作。管道、套接字和大部分字符设备文件不支持此类操作;

表5 lseek()函数
所需头文件 #include
#include
函数原型 off_t lseek(int fd, off_t offset, int whence);
函数参数 fd :文件描述符
offset :相对于基准点whence 的偏移量。以字节为单位,正数表示向前移动,负数表示向后移动
whence :当前位置的基点
SEEK_SET:文件的起始位置
SEEK_CUR:文件当前读写位置
SEEK_END:文件的结束位置
函数返回值 成功:文件当前读写位置
-1:出错

我们可以通过lseek函数实现一个小功能:查看文件的大小,代码如下:
【参见附件/lseek.c】

#include   
#include   
#include   
#include   
#include   
int main(int argc, const char *argv[])  
{  
    int fd;  
    int length;  
    if(argc != 2)  
    {  
        printf("command error!\n");  
        return -1;  
    }  
    if((fd = open(argv[1],O_RDONLY)) == -1)  
    {  
        perror("open fails");  
        return -1;  
    }  
    length = lseek(fd,0,SEEK_END);  
    printf("The length of %s is %d bytes!\n",argv[1],length); 
    return 0;  
} 

执行结果如下:
《Linux操作系统 - 高级编程》第一部分 标准IO及文件IO(第3章 文件IO)_第2张图片
我们可以看到,得到了lseek.c正确大小!

本章参考附件

点击进入

你可能感兴趣的:(《Linux操作系统 - 高级编程》第一部分 标准IO及文件IO(第3章 文件IO))