文件操作介绍

文件操作

本章内容

  1. 为什么使用文件
  2. 文件的介绍
  3. 文件的打开和关闭
  4. 文件的顺序读写
  5. 文件的随机读写
  6. 文本文件和二进制文件
  7. 文件读取结束的判定
  8. 文件缓冲区

为什么使用文件

我们前面学习结构体时,写了通讯录的程序,当通讯录运行起来的时候,可以给通讯录中增加、删除数
据,此时数据是存放在内存中,当程序退出的时候,通讯录中的数据自然就不存在了,等下次运行通讯
录程序的时候,数据又得重新录入,如果使用这样的通讯录就很难受。
我们在想既然是通讯录就应该把信息记录下来,只有我们自己选择删除数据的时候,数据才不复存在。
这就涉及到了数据持久化的问题,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据
库等方式。
使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。

文件的介绍

磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
2.1 程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2 数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

本章讨论的是数据文件。
在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。
2.3 文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀

例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名。

文件的打开和关闭

3.1 文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统
声明的,取名FILE.

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,
使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。

下面我们可以创建一个FILE*的指针变量:

FILE* pf;//文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变
量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联
的文件。

比如:
文件操作介绍_第1张图片

3.2 文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指
针和文件的关系。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。

//打开文件
FILE * fopen ( const char * filename, const char * mode );
//关闭文件
int fclose ( FILE * stream );

打开方式如下:

文件操作介绍_第2张图片

/* fopen fclose example */
#include 
int main ()
{
  FILE * pFile;
  //打开文件
  pFile = fopen ("myfile.txt","w");
  //文件操作
  if (pFile!=NULL)
 {
    fputs ("fopen example",pFile);
    //关闭文件
    fclose (pFile);
 }
  return 0;
}

文件的顺序读写

文件操作介绍_第3张图片
对比一组函数:

scanf/fscanf/sscanf
printf/fprintf/sprintf

这里演示讲解这句函数的使用和对比

相信大家都很了解scanf和printf函数,就不再多介绍,主要看一下剩下的函数。

fprintf函数是C语言中的一个标准库函数,用于将格式化的数据输出到文件中。
它的原型如下:

int fprintf(FILE *stream, const char *format, …);

其中,stream是一个指向要写入的文件的指针,可以是标准输出(stdout)、标准错误输出(stderr)或者打开的文件流;format是一个字符串,指定了输出的格式;…表示可变数量的参数,根据format字符串的格式进行输出。

fprintf函数的工作原理类似于printf函数,但输出的结果不是打印到控制台,而是写入到指定的文件中。我们可以使用不同的格式化字符串来指定输出的内容和格式,如整数、浮点数、字符、字符串等。

下面是一些常用的示例:

#include 

int main() {
    FILE *fp = fopen("output.txt", "w"); // 打开一个文件用于写入

    if (fp != NULL) {
        int num = 10;
        float pi = 3.14;
        char ch = 'A';
        char str[] = "Hello, world!";
        
        fprintf(fp, "Number: %d\n", num);
        fprintf(fp, "Pi: %f\n", pi);
        fprintf(fp, "Character: %c\n", ch);
        fprintf(fp, "String: %s\n", str);
        
        fclose(fp); // 关闭文件
    }

    return 0;
}

该示例中,fprintf函数将不同类型的数据格式化输出到文件"output.txt"中。结果如下:

Number: 10
Pi: 3.140000
Character: A
String: Hello, world!

需要注意的是,为了确保文件正常打开和写入,我们在使用fprintf函数之前需要先使用fopen函数打开文件,并在使用完后使用fclose函数关闭文件。

fscanf函数是C语言中的一个标准库函数,用于从文件中读取格式化的数据。
它的原型如下:

int fscanf(FILE *stream, const char *format, …);

其中,stream是一个指向要读取的文件的指针,可以是标准输入(stdin)或者打开的文件流;format是一个字符串,指定了输入的格式;…表示可变数量的指针参数,用于接收读取到的数据。

fscanf函数的工作原理类似于scanf函数,但输入的数据不是从控制台读取,而是从指定的文件中读取。可以使用不同的格式化字符串来指定要从文件中读取的内容和格式,如整数、浮点数、字符、字符串等。

下面是一个使用fscanf函数的简单示例:

#include 

int main() {
    FILE *fp = fopen("input.txt", "r");  // 打开一个文件用于读取
    
    if (fp != NULL) {
        int num;
        float pi;
        char ch;
        char buffer[20];
    
        fscanf(fp, "Number: %d Pi: %f Character: %c String: %s", &num, &pi, &ch, buffer);
    
        printf("Number: %d\n", num);
        printf("Pi: %f\n", pi);
        printf("Character: %c\n", ch);
        printf("String: %s\n", buffer);
    
        fclose(fp);  // 关闭文件
    }
    
    return 0;
}

在这个示例中,我们使用fopen函数打开一个文件用于读取。然后,我们使用fscanf函数和格式化字符串指定了要从文件中读取的内容和格式,并使用相应的变量地址接收读取到的数据。

最后,我们使用printf函数将读取到的数据输出到控制台。假设文件"input.txt"中的内容为:“Number: 10 Pi: 3.14 Character: A String: Hello, world!”,那么输出结果如下:

Number: 10
Pi: 3.140000
Character: A
String: Hello,

需要注意的是,在使用fscanf函数之前,需要确保文件已经成功打开,并在使用完后使用fclose函数关闭文件。

sprintf函数是C语言中的一个标准库函数,用于将格式化的数据输出到字符串中。它的原型如下:

int sprintf(char *str, const char *format, …);

其中,str是一个指向要写入的字符数组的指针,format是一个字符串,指定了输出的格式,…表示可变数量的参数,根据format字符串的格式进行输出。

sprintf函数的工作原理类似于printf函数,但输出的结果不是打印到控制台,而是写入到指定的字符数组中。我们可以使用不同的格式化字符串来指定输出的内容和格式,如整数、浮点数、字符、字符串等。

下面是一个使用sprintf函数的简单示例:

#include 

int main() {
    char buffer[100];
    int num = 10;
    float pi = 3.14;
    char ch = 'A';
    char str[] = "Hello, world!";

    sprintf(buffer, "Number: %d\nPi: %f\nCharacter: %c\nString: %s\n", num, pi, ch, str);

    printf("%s", buffer);  // 输出结果

    return 0;
}

在这个示例中,我们定义了一个字符数组buffer来接收sprintf函数的输出结果。然后,我们使用格式化字符串指定了输出的内容和格式,并使用sprintf函数将结果写入到buffer中。

最后,我们通过printf函数将buffer中的内容输出到控制台。输出结果如下:

Number: 10
Pi: 3.140000
Character: A
String: Hello, world!

sscanf函数是C语言中的一个标准库函数,用于从字符串中读取格式化的数据。
它的原型如下:

int sscanf(const char *str, const char *format, …);

其中,str是一个字符串,用于存储要读取的数据,format是一个字符串,指定了输入的格式,…表示可变数量的指针参数,用于接收读取到的数据。

sscanf函数的工作原理类似于scanf函数,但输入的数据不是从控制台读取,而是从指定的字符串中读取。可以使用不同的格式化字符串来指定要从字符串中读取的内容和格式,如整数、浮点数、字符、字符串等。

下面是一个使用sscanf函数的简单示例:

#include 

int main() {
    char str[] = "Number: 10 Pi: 3.14 Character: A String: Hello, world!";
    int num;
    float pi;
    char ch;
    char buffer[20];

    sscanf(str, "Number: %d Pi: %f Character: %c String: %s", &num, &pi, &ch, buffer);

    printf("Number: %d\n", num);
    printf("Pi: %f\n", pi);
    printf("Character: %c\n", ch);
    printf("String: %s\n", buffer);

    return 0;
}

在这个示例中,我们定义了一个字符串str,其中包含了不同类型的数据。然后,我们使用sscanf函数和格式化字符串指定了要从str中读取的内容和格式,并使用相应的变量地址接收读取到的数据。

最后,我们使用printf函数将读取到的数据输出到控制台。输出结果如下:

Number: 10
Pi: 3.140000
Character: A
String: Hello,

需要注意的是,当从字符串中读取数据时,应确保格式化字符串中的格式和顺序与字符串中的数据匹配,否则可能导致读取错误或未定义的行为。

文件的随机读写

fseek
根据文件指针的位置和偏移量来定位文件指针。
例子:

int fseek ( FILE * stream, long int offset, int origin );
/* fseek example */
#include 
int main ()
{
  FILE * pFile;
  pFile = fopen ( "example.txt" , "wb" );
  fputs ( "This is an apple." , pFile );
  fseek ( pFile , 9 , SEEK_SET );
  fputs ( " sam" , pFile );
  fclose ( pFile );
  return 0;
}

fseek函数是C语言中的一个标准库函数,用于在文件中定位文件指针的位置。
它的原型如下:

int fseek(FILE *stream, long int offset, int whence);

其中,stream是一个指向要进行定位的文件的指针,offset是要设置的偏移量,表示距离whence位置的偏移量,whence表示相对于何处进行定位的标志。

whence参数可以取以下三个值:

SEEK_SET:从文件开头开始计算偏移量。
SEEK_CUR:从当前位置开始计算偏移量。
SEEK_END:从文件末尾开始计算偏移量。

fseek函数用于将文件指针定位到指定位置,以便进行后续的读取或写入操作。通过指定偏移量和whence参数,可以实现不同的定位需求,例如从文件开头处跳过固定长度的数据,或者从当前位置向后移动指定偏移量。

下面是一个使用fseek函数的示例:

#include 

int main() {
    FILE *fp = fopen("example.txt", "r");

    if (fp != NULL) {
        fseek(fp, 5, SEEK_SET);  // 设置文件指针跳过前5个字节

        char ch;
        fscanf(fp, "%c", &ch);
        printf("Character: %c\n", ch);

        fclose(fp);
    }

    return 0;
}

在这个示例中,我们打开了一个名为"example.txt"的文件,并使用fseek函数将文件指针定位到距离文件开头5个字节处。然后,我们使用fscanf函数读取下一个字符,并将其输出到控制台。

假设文件中的内容为:“Hello, world!”,那么输出结果如下:

Character: ,

通过调用fseek函数进行文件定位,我们可以控制文件指针的位置,以便进行读取或写入操作。

ftell是C语言中的标准库函数,用于获取文件指针当前位置相对于文件起始位置的偏移字节数。它的原型如下:

long ftell(FILE *stream);

其中,stream是一个指向已打开文件的指针。

ftell函数返回一个long类型的值,表示当前位置相对于文件起始位置的偏移字节数。如果函数调用失败,它将返回-1。

下面是一个使用ftell函数的简单示例:

#include 

int main() {
    FILE *fp = fopen("example.txt", "r");

    if (fp != NULL) {
        // 获取文件指针位置
        long position = ftell(fp);
        printf("Current position: %ld\n", position);

        fclose(fp);
    }

    return 0;
}

在这个示例中,我们打开了一个名为"example.txt"的文件,并使用fopen函数创建了一个文件指针fp。然后,我们使用ftell函数获取当前文件指针的位置,并将其输出到控制台。

ftell函数通常与fseek函数联合使用,可以用来定位文件中的特定位置,并支持在文件中进行随机读写操作。

需要注意的是,ftell函数返回的偏移字节数类型是long,具体字节数的上限取决于编译环境中的long类型的大小。

rewind函数是C语言中的一个标准库函数,用于将文件指针重新定位到文件的起始位置。它的原型如下:

void rewind(FILE *stream);

其中,stream是一个指向要重新定位的文件的指针。

rewind函数将文件指针重新设置为文件的起始位置,以便重新读取文件或执行其他操作。

下面是一个使用rewind函数的简单示例:

#include 

int main() {
    FILE *fp = fopen("example.txt", "r");

    if (fp != NULL) {
        char ch;

        // 读取文件中的一个字符
        fscanf(fp, "%c", &ch);
        printf("Character: %c\n", ch);

        // 将文件指针重新定位到文件起始位置
        rewind(fp);

        // 再次读取文件中的一个字符
        fscanf(fp, "%c", &ch);
        printf("Character: %c\n", ch);

        fclose(fp);
    }

    return 0;
}

在这个示例中,我们打开了一个名为"example.txt"的文件,并使用fscanf函数读取文件中的一个字符,并将其输出到控制台。

然后,我们调用rewind函数将文件指针重新定位到文件的起始位置。

最后,我们再次使用fscanf函数读取文件中的一个字符,并将其输出到控制台。由于调用了rewind函数,所以我们重新读取到文件中的第一个字符。

文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而
二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

文件操作介绍_第4张图片

#include 
int main()
{
 int a = 10000;
 FILE* pf = fopen("test.txt", "wb");
 fwrite(&a, 4, 1, pf);//二进制的形式写到文件中
 fclose(pf);
 pf = NULL;
 return 0;
 }

文件操作介绍_第5张图片

文件读取结束的判定

被错误使用的feof

牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。

  1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
    例如:
    fgetc 判断是否为 EOF .
    fgets 判断返回值是否为 NULL .
  2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
    例如:
    fread判断返回值是否小于实际要读的个数。

文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。

文件操作介绍_第6张图片

#include 
#include 
//VS2013 WIN10环境测试
int main()
{
 FILE*pf = fopen("test.txt", "w");
 fputs("abcdef", pf);//先将代码放在输出缓冲区
 printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
 Sleep(10000);
 printf("刷新缓冲区\n");
 fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
 //注:fflush 在高版本的VS上不能使用了
 printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
 Sleep(10000);
 fclose(pf);
 //注:fclose在关闭文件的时候,也会刷新缓冲区
 pf = NULL;
 return 0;
}

从上面的代码运行结果可以得到:因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。

最后学完文件操作,小伙伴可以尝试一下将通讯录系统再次改造,把信息保存在桌面上的文本文档试一下吧!

文件操作介绍_第7张图片

你可能感兴趣的:(详解文件操作,c语言)