Linux文件操作与IO

底层文件访问


open系统调用

#include  #include  
#include   int open(const char *path, int oflags);
int open(const char *path, int oflags, mode_t mode);

在遵循POSIX规范的系统上,使用open系统调用并不需要包含头文件sys/types.h和sys/stat.h,但在某些UNIX系统上,他们可能必不可少。

open系统调用建立了一条从到文件或设备的访问路径,该调用将得到与该文件相关联的文件描述符(file discriptor)
任何一个进程可以同时打开的文件数目有限,通常由limits.h头文件中的常量OPEN_MAX定义,该值与系统有关,且这个限制本身还受到系统全局性限制影响,所以一个程序未必总是可以打开这么多文件。在Linux系统中,这个限制可以随着系统运行而调整,所以OPEN_MAX并不是一个常量。它通常一开始就被设置未256

参数 解释
path 准备打开的文件或者设备的名字
oflags 打开文件所采取的动作
mode 文件访问模式

oflag参数包括下列值的组合(用“按位与”操作)

解释
O_APPEND 把写入数据追加到文件末尾
O_TRUNC 把文件长度设置为0,丢弃已有内容
O_CREAT 如需要就按参数mode给出的访问模式创建文件
O_EXCL 与O_CREAT一起使用,确保调用者创建出文件。open调用是一个原子操作,它只执行一个函数调用。使用这个可选模式可以防止两个程序同时创建一同一个文件。如果文件已经存在,open调用失败

当你使用带有O_CREAT标志的open调用时,你必须使用带3个有参数的open调用。第3个参数mode是几个标志位按位或后得到的,这些标志在头文件sys/stat.h中定义

权限 拥有者
S_IRUSR r user
S_IWUSR w user
S_IXUSR x user
S_IRGRP r group
S_IWGRP w group
S_IXGRP x group
S_IROTH r other
S_IWOTH w other
S_IXOTH x other

用户掩码(由umask命令设定)会影响被创建文件的访问权限open调用中参数mode的值与当前用户掩码的反值做与操作


write系统调用

#include  
size_t write(int fd, const void *buf, size_t nbytes);

write系统调用把缓冲区buf中的前n个bytes写入与文件描述符fd相关的文件中。

参数 解释
fd 数据目的地的文件描述符
buf 数据来源地的指针
nbytes 写入数据字节数

返回实际写入的字节数,返回值可能小于nbytes。如果返回0,表示未写入数据;如果返回-1,表示write调用出错,错误代码保存在全局变量errno中。


read系统调用

 #include  
 size_t read(int fd, void *buf, size_t nbytes);

read系统调用从与文件描述符fd相关联的文件中读入nbytes字节的数据,并把它们放到buf中。

参数 解释
fd 数据来源文件的文件描述符
buf 数据目的地指针
nbytes 读入数据字节数

返回实际读入的字节数,可能会小于nbytes。如果返回0,表示未读入任何数据,已到达文件尾;返回-1表示出现错误。


close系统调用

#include  
int close(int fd);

close调用终止文件描述符fd与其对应文件之间的关联。文件描述符被释放并能够重新使用。close调用成功时候返回0,出错时返回-1。
检查close调用的返回结果非常重要。有的文件系统,特别使网络文件系统,可能不会在关闭文件之前报告文件写操作中出现的错误,这是因为在执行写操作时,数据可能未被确认写入


lseek系统调用

#include  
#include  

off_t lseek(int fd, off_t offset, int whence);

lseek系统调用对文件描述符的读写指针位置进行设置> 参数whence定义该偏移量offset的用法,可取下列值
| 参数 | 解释 |
| ------------- |:-------------:|
|SEEK_SET|绝对位置|
|SEEK_CUR|相对于当前位置|
|SEEK_END|相对于文件尾|


fstat stat lstat系统调用

#include  
#include 
#include  
int fstat(int fd, struct stat *buf);
int stat(const char *path, struct stat *buf); 
int lstat(const char *paht, struct stat *buf);

fstat系列调用返回与打开的文件描述符相关联的文件的状态信息,该信息将被写入buf中
stat和lstat返回的使通过文件名查询到的状态信息。它们产生相同效果,但当文件是符号链接时,lstat返回的是该符号链接本身的信息,而stat返回的使该链接指向文件的信息。


标准IO库

在标准IO库中,与底层文件描述符对应的流(stream),它被实现为指向结构体FILE的指针(FILE )> 在启动程序时,有三个文件流被自动打开的。它们是stdin stdout stderr他们与底层文件描述符0 1 2相对应,分别代表标准输入 标准输出 标准错误输出IO函数可能存在缓冲区安全问题,应该避免使用这样的函数,或者十分谨慎地使用有安全问题的函数*

fopen函数

#include  
FILE *fopen(const char *filename, const char *mode);

fopen打开由参数filename指定的文件,并把它与一个文件流关联起来。> > 参数mode指定文件的打开方式,取下列字符串中的值。

参数 解释
"rb" or "rb" 只读
"w" or "wb" 写方式,并把文件长度截短为0 "a" or "ab" 写方式,新内容追加到文件尾
"r+" or "rb+" 读写
"w+" or "wb+" 读写,文件长度截短为0
"a+" or "ab+" 读写,新内容追加在文件尾

字母b表示文件是一个二进制(binary)文件fopen调用成功将会返回一个非空的FILE指针,失败时返回NULLunix和Linux把所有文件都看成二进制文件,参数mode必须是字符串,所以总是应该使用双引号,而不是单引号*
可用的文件流数量也是有限的。实际限制由头文件stdio.h中的FOPEN_MAX定义,它的值至少为8,在linux系统中通常是16。

fread函数

#include  
size_t fread(void *ptr, size_t size, size_t nitems, FILE *stream);

数据从文件流stream读到ptr指向的数据缓冲区中。fread和fwrite都是对数据记录进行操作,size参数指定每个数据记录的长度,计数器ntimes给出要传输的记录个数。
返回值是成功读到数据缓冲区里的记录个数(不是字节数)。当到达文件尾,它的返回值可能会小于ntimes,甚至可以是0。

fwrite函数

 #include 
 size_t fwrite(const void *ptr, size_t size, size_t nitems, FILE *stream);

fwrite与fread有相似的接口。它从指定的数据缓冲区取出数据记录,并把它们写到文件流stream中。
返回值是成功写入的记录个数

fclose函数

#include  
int fclose(FILE *stream);

fclose函数关闭指定的文件流stream,使所有尚未写出的数据写出。如果要确保数据已经全部写出,就应该调用fclose函数。当程序正常结束时,会自动对所有还打开的文件流调用fclose函数。

fflush函数

#include 
int fflush(FILE *stream);

将文件流里所有尚未写出的数据立刻写出。有时在调试程序时,可以用它来确认程序正在写数据而不是被挂起了。调用fclose函数隐含执行了一次flush操作


fseek函数

fseek函数与lseek函数系统调用对应的文件流函数。它在文件流里为下次读写操作指定位置。offset和whence参数的含义和取值与前面的lseek系统调用完全一样。但是fseek返回一个证书:0表示成功,-1表示失败并设置errno支出错误。


fgetc getc getchar函数

 #include  
 int fgetc(FILE *stream); 
 int getc(FILE *stream); int getchar();

fgetc函数从文件流stream取出下一个字节并把它作为一个字符返回。当它到达文件尾或者出现错误时,它返回EOF(end of file)。可以通过ferror或者feof来区分> getc的作用和fgetc相同,但是它有可能被实现为一个宏(macro),如果这样,stream参数就可能被计算不止一次,所以它不能有副作用。此外,不能保证能够使用getc的地址作为函数指针

getchar函数相当于getc(stdin),它从标准输入里读取下一个字符。


fputc putc putchar函数

 #include 
 int fputc(int c, FILE *stream);
 int putc(int c, FILE *stream); 
 int putchar(int c);

fputc函数把字符c写到文件流stream中。它返回写入的值,如果失败则返回EOF.> putc函数作用相当于fputc,但它可能被实现为一个宏。
putchar函数相当于putc(c, stdout),它把单个字符写到标准输出。注意,putchar和getchard都是把字符当做int类型而不是插入类型。这就允许文件尾(EOF)取值-1,这是一个超出字符数字编码范围的值。


fgets gets函数

#include  
char *fgets(char *s, int n, FILE *stream);  
char *gets(char *s);

fgets函数把读到的字符写到s指向的字符串里,知道出现下列情况:

  1. 遇到换行符
  2. 已经传输了n-1个字符
  3. 到达文件尾
    它会把遇到的换行符也传递到接收字符串,再加上一个表示结尾的空字符\0。
    当调用成功时,fgets返回一个指向字符串s的指针。如果文件流已经到达文件尾,fgets会设置这个文件流的EOF标志并返回一个空指针。如果出现读错误,fgets返回一个空指针并设置errno。

gets函数类似于fgets函数,但gets函数存在缓冲区溢出问题,不推荐使用


格式化输入和输出


printf fprintf sprintf snprintf函数

#include  
int printf(const char *format, ...); 
int sprintf(char *s, const char *format, ...);
int fprintf(FILE *stream, const char *format, ...);
int snprintf(char *s, size_t size, const char *format, ...);

snprintf修复了缓冲区问题,推荐使用

snprintf将可变个参数(...)按照format格式化成字符串,然后将其复制到str中(1) 如果格式化后的字符串长度 < size,则将此字符串全部复制到str中,并给其后添加一个字符串结束符('\0');
(2) 如果格式化后的字符串长度 >= size,则只将其中的(size-1)个字符复制到str中,并给其后添加一个字符串结束符('\0')返回值为欲写入的字符串长度。

常见格式控制符:

控制符 解释
%d, %i 十进制格式输出整数
%o, %x 八进制或十六进制格式输出一个整数
%c 输出一个字符
%s 输出字符串
%f 单精度浮点数
%e 科学计数法格式输出双精度浮点数
%g 以通用格式输出一个双精度浮点数

-------#### scanf fscanf sscanf函数
#include int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *s, const char *format, ...);

scanf系列函数实现有漏洞,使用不够灵活,不推荐使用


错误处理

本文中的许多函数和系统调用都可能失败。它们会在失败时候设置外部变量errno来指明失败原因
#include
extern int errno;

你必须在函数调用失败之后立刻对其进行检查,你总是应该在使用它之前将它复制到另一个变量,因为它的值可能被下一个函数调用覆盖,即使下一个函数并没有出错,也可能会覆盖这个变量

错误代码 解释
EPERM 操作不允许
ENOENT 文件或目录不存在
EINTR 系统调用被中断
EIO IO错误
EBUSY 设备或资源忙碌
EEXIST 文件存在
EINVAL 无效参数
EMFILE 打开文件过多
ENODEV 设备不存在
EISDIR 是一个目录
ENOTDIR 不是一个目录

以上错误代码均保存在头文件errno.h中


#include int ferror(FILE *stream);
int feof(FILE *stream); 
void clearerr(FILE *stream);

ferror函数测试文件流stream的错误标识,如果该标识被设置就返回一个非0值,否则返回0
feof函数测试一个文件流的文件尾标识,如果该标识被设置就返回非0值,否则返回0。
clearerror函数的作用是清除由stream指向的文件流的文件尾标识和错误标识。它无返回值,也未定义任何错误。


 #include  char *strerror(int errnum);

strerror函数把错误代码映射成一个字符串,该字符串对错误代码进行解释。
#include void perror(const char *s);

perror函数把errno变量中的当前错误映射成一个字符串,并把它输出到标准错误输出流(stderr)。该字符串的前面加上字符串s(如果不为空),再加上一个冒号和空格。


void *指针类型

void即“无类型”,void *则为“无类型指针”,可以指向任何数据类型。反之则不然,例如:
void *p;
int *a;
p = a; //合法
a = p; //不合法
a = (int *) p; //合法

如果函数的参数可以是任意类型指针,那么应声明其参数为void*。例如内存操作函数:

void * memcpy(void *dest,const void *src,size_t len);

从源src所指的内存地址的起始位置开始拷贝n个字节到目标dest所指的内存地址的起始位置中。返回指向dest

void * memset(void *buffer,int c,size_t num);

将buffer中前n个字节用c替换并返回buffer 。

你可能感兴趣的:(Linux文件操作与IO)