C语言探索之旅 | 第二部分第七课：文件读写

作者谢恩铭，公众号「程序员联盟」（微信号：coderhub）。
转载请注明出处。
原文： https://www.jianshu.com/p/4ad...
《C语言探索之旅》全系列

内容简介

前言
文件的打开和关闭
读写文件的不同方法
在文件中移动
文件的重命名和删除
第二部分第八课预告

1. 前言

上一课 C语言探索之旅 | 第二部分第六课：创建你自己的变量类型之后，我们来学习很常用的文件读写。

我们学过了这么多变量的知识，已经知道变量实在是很强大的，可以帮助我们实现很多事情。

变量固然强大，还是有缺陷的，最大的缺陷就是：不能永久保存。

因为 C语言的变量储存在内存中，在你的程序退出时就被清除了，下次程序启动时就不能找回那个值了。

“蓦然回首，那人不在灯火阑珊处...”
“今天的你我，
怎样重复昨天的故事？
这一张旧船票，
还能否登上你的破船？”

不能够啊，“涛声不能依旧”啊...

如果这样的话，我们如何在 C语言编写的游戏中保存游戏的最高分呢？怎么用 C语言写一个退出时依然保存文本的文本编辑器呢？

幸好，在 C语言中我们可以读写文件。这些文件会储存在我们电脑的硬盘上，就不会在程序退出或电脑关闭时被清除了。

为了实现文件读写，我们就要用到迄今为止我们所学过的知识：

指针，结构体，字符串，等等。

也算是复习吧。

2. 文件的打开和关闭

为了读写文件，我们需要用到定义在 stdio.h 这个标准库头文件中的一些函数，结构，等。

是的，就是我们所熟知的 stdio.h，我们的“老朋友” printf 和 scanf 函数也是定义在这个头文件里。

下面按顺序列出我们打开一个文件，进行读或写操作所必须遵循的一个流程：

调用“文件打开”函数 fopen（f 是 file（表示“文件”）的首字母；open 表示“打开”），返回一个指向该文件的指针。
检测文件打开是否成功，通过第 1 步中 fopen 的返回值（文件指针）来判断。如果指针为 NULL，则表示打开失败，我们需要停止操作，并且返回一个错误。
如果文件打开成功（指针不为 NULL），那么我们就可以接着用 stdio.h 中的函数来读写文件了。
一旦我们完成了读写操作，我们就要关闭文件，用 fclose（close 表示“关闭”）函数。

首先我们来学习如何使用 fopen 和 fclose 函数，之后我们再学习如何读写文件。

fopen：打开文件

函数 fopen 的原型是这样的：

FILE* fopen(const char* fileName, const char* openMode);

不难看出，这个函数接收两个参数：

fileName：文件名（name 表示“名字”）。是一个字符串类型，而且是 const，意味着不能改变其值。
openMode：打开方式（open 表示“打开”，mode 表示“方式”）。表明我们打开文件之后要干什么的一个指标。只读、只写、读写，等等。

这个函数的返回值，是 FILE *，也就是一个 FILE（file 表示“文件”）指针。

FILE 定义在 stdio.h 中。有兴趣的读者可以自己去找一下 FILE 的定义。

我们给出 FILE 的一般定义：

typedef struct {
    char *fpos; /* Current position of file pointer (absolute address) */
    void *base; /* Pointer to the base of the file */
    unsigned short handle; /* File handle */
    short flags; /* Flags (see FileFlags) */
    short unget; /* 1-byte buffer for ungetc (b15=1 if non-empty) */
    unsigned long alloc; /* Number of currently allocated bytes for the file */
    unsigned short buffincrement; /* Number of bytes allocated at once */
} FILE;

可以看到 FILE 是一个结构体（struct），里面有 7 个变量。当然我们不必深究 FILE 的定义，只要会使用 FILE 就好了，而且不同操作系统对于 FILE 的定义不尽相同。

细心的读者也许会问：“之前不是说结构体的名称最好是首字母大写么，为什么 FILE 这个结构体每一个字母都是大写呢？怎么和常量的命名方式一样呢？”

好问题。其实我们之前建议的命名方式（对于结构体，首字母大写，例如：StructName）只是一个“规范”（虽然大多数程序员都喜欢遵循），并不是一个强制要求。

这只能说明编写 stdio.h 的前辈并不一定遵循这个“规范”而已。当然，这对我们并没什么影响。

以下列出几种可供使用的 openMode ：

r ：只读。r 是 read（表示“读”）的首字母。这个模式下，我们只能读文件，而不能对文件写入。文件必须已经存在。
w ：只写。w 是 write（表示“写”）的首字母。这个模式下，只能写入，不能读出文件的内容。如果文件不存在，将会被创建。
a ：追加。a 是 append（表示“追加”）的首字母。这个模式下，从文件的末尾开始写入。如果文件不存在，将会被创建。
r+ ：读和写。这个模式下，可以读和写文件，但文件也必须已经存在。
w+ ：读和写。预先会删除文件内容。这个模式下，如果文件存在且内容不为空，则内容首先会被清空。如果文件不存在，将会被创建。
a+ ：读写追加。这个模式下，读写文件都是从文件末尾开始。如果文件不存在，将会被创建。

上面所列的模式，其实还可以组合上 b 这个模式。b 是 binary 的缩写，表示“二进制”。对于上面的每一个模式，如果你添加 b 后，会变成 rb，wb，ab，rb+，wb+，ab+ ），该文件就会以二进制模式打开。不过二进制的模式一般不是那么常用。

一般来说，r，w 和 r+ 用得比较多。w+ 模式要慎用，因为它会首先清空文件内容。当你需要往文件中添加内容时，a 模式会很有用。

下面的例子程序就以 r+（读写）的模式打开文件：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    return 0;
}

于是，file 成为了指向 test.txt 文件的一个指针。

你会问：“我们的 test.txt 文件位于哪里呢？”

text.txt 文件和可执行文件位于同一目录下。

“文件一定要是 .txt 结尾的吗？”

不是，完全由你决定文件的后缀名。你大可以创建一个文件叫做 xxx.level，用于记录游戏的关卡信息。

“文件一定要和可执行文件在同一个文件夹下么？”

也不是。理论上可以位于当前系统的任意文件夹里，只要在 fopen 函数的文件名参数里指定文件的路径就好了，例如：

file = fopen("folder/test.txt", "w");

这样，文件 test.txt 就是位于当前目录的文件夹 folder 里。这里的 folder/test.txt 称为“相对路径”。

我们也可以这样：

file = fopen("/home/user/folder/test.txt", "w");

这里的 /home/user/folder/test.txt 是“绝对路径”。

测试打开文件

在调用 fopen 函数尝试打开文件后，我们需要检测 fopen 的返回值，以判断打开是否成功。

检测方法也很简单：如果 fopen 的返回值为 NULL，那么打开失败；如果不为 NULL，那么表示打开成功。示例如下：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    if (file != NULL)
    {
        // 读写文件
    }
    else
    {
        // 显示一个错误提示信息
        printf("无法打开 test.txt 文件\n");
    }

    return 0;
}

记得每次使用 fopen 函数时都要对返回值作判断，因为如果文件不存在或者正被其他程序占用，那可能会使当前程序运行失败。

fclose：关闭文件

close 表示“关闭”。

如果我们成功地打开了一个文件，那么我们就可以对文件进行读写了（读写的操作我们下一节再详述）。

如果我们对文件的操作已经结束，那么我们应该关闭这个文件，这样做是为了释放占用的文件指针。

我们需要调用 fclose 函数来实现文件的关闭，这个函数可以释放内存，也就是从内存中删除你的文件（指针）。

函数原型：

int fclose(FILE* pointerOnFile);

这个函数只有一个参数：指向文件的指针。

函数的返回值（int）有两种情况：

0 ：当关闭操作成功时。
EOF（是 End Of File 的缩写，表示“文件结束”。一般等于 -1）：如果关闭失败。

示例如下：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "r+");

    if (file != NULL)
    {
        // 读写文件

        // ...

        fclose(file);  // 关闭我们之前打开的文件
    }

    return 0;
}

3. 读写文件的不同方法

现在，我们既然已经知道怎么打开和关闭文件了，接下来我们就学习如何对文件进行读出和写入吧。

我们首先学习如何写入文件（相比读出要简单一些），之后我们再看如何从文件读出。

对文件写入

用于写入文件的函数有好几个，我们可以根据情况选择最适合的函数来使用。

我们来学习三个用于文件写入的函数：

fputc：在文件中写入一个字符（一次只写一个）。是 file put character 的缩写。put 表示“放入”，character 表示“字符”。
fputs：在文件中写入一个字符串。是 file put string 的缩写。string 表示“字符串”。
fprintf：在文件中写入一个格式化过的字符串，用法与 printf 是几乎相同的，只是多了一个文件指针。

fputc

此函数用于在文件中一次写入一个字符。

函数原型：

int fputc(int character, FILE* pointerOnFile);

这个函数包含两个参数：

character：int 型变量，表示要写入的字符。我们也可以直接写 'A' 这样的形式，之前 ASCII 那节的知识点没有忘吧。
pointerOnFile：指向文件的指针。

函数返回 int 值。如果写入失败，则为 EOF；否则，会是另一个值。

示例：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        fputc('A', file);  // 写入字符 A
        fclose(file);
    }

    return 0;
}

上面的程序用于向 test.txt 文件写入字符 'A'。

fputs

这个函数和 fputc 类似，区别是 fputc 每次是写入一个字符，而 fputs 每次写入一个字符串。

函数原型：

int fputs(const char* string, FILE* pointerOnFile);

类似地，这个函数也接受两个参数：

string：要写入的字符串。
pointerOnFile：指向文件的指针。

如果出错，函数返回 EOF；否则，返回不同于 EOF 的值。

示例：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        fputs("你好，朋友。\n最近怎么样？", file);
        fclose(file);
    }

    return 0;
}

fprintf

这个函数很有用，因为它不仅可以向文件写入字符串，而且这个字符串是可以由我们来格式化的。用法其实和 printf 函数类似，就是多了一个文件指针。

函数原型：

int fprintf(FILE *stream, const char *format, ...)

示例：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int age = 0;

    file = fopen("test.txt", "w");

    if (file != NULL)
    {
        // 询问用户的年龄
        printf("您几岁了 ? ");
        scanf("%d", &age);

        // 写入文件
        fprintf(file, "使用者年龄是 %d 岁\n", age);
        fclose(file);
    }

    return 0;
}

从文件中读出

我们可以用与写入文件时类似名字的函数，只是略微修改了一些，也有三个：

fgetc：读出一个字符。是file get character 的缩写。get 表示“获取，取得”。
fgets：读出一个字符串。是 file get string 的缩写。
fscanf：与 scanf 的用法类似，只是多了一个文件指针。scanf 是从用户输入读取，而 fscanf 是从文件读取。

这次介绍这三个函数我们会简略一些，因为如果大家掌握好了前面那三个写入的函数，那这三个读出的函数是类似的。只是操作相反了。

fgetc

首先给出函数原型：

int fgetc(FILE* pointerOnFile);

函数返回值是读到的字符。如果不能读到字符，那会返回 EOF。

但是如何知道我们从文件的哪个位置读取呢？是第三个字符处，还是第十个字符处呢？

其实，在我们读取文件时，有一个“游标”（cursor），会跟随移动。

这当然是虚拟的游标，你不会在屏幕上看到它。你可以想象这个游标和你用记事本编辑文件时的闪动的光标类似。这个游标指示你当前在文件中的位置。

之后的小节，我们会学习如何移动这个游标，使其位于文件中特定的位置。可以是开头，也可以是第 7 个字符处。

fgetc 函数每读入一个字符，这个游标就移动一个字符长度。我们就可以用一个循环来读出文件所有的字符。例如：

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int currentCharacter = 0;

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        // 循环读取，每次一个字符
        do
        {
            currentCharacter = fgetc(file);  // 读取一个字符
            printf("%c", currentCharacter);  // 显示读取到的字符
        } while (currentCharacter != EOF);  // 我们继续，直到 fgetc 返回 EOF（表示“文件结束”）为止

        fclose(file);
    }

    return 0;
}

fgets

此函数每次读出一个字符串，这样可以不必每次读一个字符（有时候效率太低）。

这个函数每次最多读取一行，因为它遇到第一个 'n'（换行符）会结束读取。所以如果我们想要读取多行，需要用循环。

插入一点回车符和换行符的知识：
关于“回车”（carriage return）和“换行”（line feed）这两个概念的来历和区别。
在计算机还没有出现之前，有一种叫做电传打字机（Teletype Model 33）的玩意，每秒钟可以打 10 个字符。
但是它有一个问题，就是打完一行换行的时候，要用去 0.2 秒，正好可以打两个字符。要是在这 0.2 秒里面，又有新的字符传过来，那么这个字符将丢失。
于是，研制人员想了个办法解决这个问题，就是在每行后面加两个表示结束的字符。一个叫做“回车”，告诉打字机把打印头定位在左边界；另一个叫做“换行”，告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历，从它们的英语名字上也可以看出一二。
后来，计算机被发明了，这两个概念也就被搬到了计算机上。那时，存储器很贵，一些科学家认为在每行结尾加两个字符太浪费了，加一个就可以。于是，就出现了分歧。在 Unix/Linux 系统里，每行结尾只有“<换行>”，即 "n"；在 Windows 系统里面，每行结尾是“<换行><回车>”，即 "nr"；在 macOS 系统里，每行结尾是“<回车>”，即 "r"。
一个直接后果是，Unix/Linux/macOS 系统下的文件在Windows里打开的话，所有文字会变成一行；而 Windows 里的文件在 Unix/Linux/macOS 下打开的话，在每行的结尾可能会多出一个 ^M 符号。
Linux 中遇到换行符会进行“回车 + 换行”的操作，回车符反而只会作为控制字符显示，不发生回车的操作。
而 Windows 中要“回车符 + 换行符”才会实现“回车+换行"，缺少一个控制符或者顺序不对都不能正确的另起一行。

函数原型：

char* fgets(char* string, int characterNumberToRead, FILE* pointerOnFile);

示例：

#include 

#define MAX_SIZE 1000  // 数组的最大尺寸 1000

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    char string[MAX_SIZE] = "";  // 尺寸为 MAX_SIZE 的数组，初始为空

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        fgets(string, MAX_SIZE, file);  // 我们读取最多 MAX_SIZE 个字符的字符串，将其存储在 string 中
        printf("%s\n", string);  // 显示字符串

        fclose(file);
    }

    return 0;
}

这里，我们的 MAX_SIZE 足够大（1000），保证可以容纳下一行的字符数。所以遇到 'n' 我们就停止读取，因此以上代码的作用就是读取文件中的一行字符，并将其输出。

那我们如何能够读取整个文件的内容呢？很简单，加一个循环。

如下：

#include 

#define MAX_SIZE 1000  // 数组的最大尺寸 1000

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    char string[MAX_SIZE] = "";  // 尺寸为 MAX_SIZE 的数组，初始为空

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        while (fgets(string, MAX_SIZE, file) != NULL)  // 我们一行一行地读取文件内容，只要不遇到文件结尾
        printf("%s\n", string);  // 显示字符串

        fclose(file);
    }

    return 0;
}

fscanf

此函数的原理和 scanf 是一样的。负责从文件中读取规定样式的内容。

函数原型：

int fscanf(FILE *stream, const char *format, ...)

示例：

例如我们创建一个 test.txt 文件，在里面输入三个数：23, 45, 67。

输入的形式可以是类似下面这样：

每个数之间有空格

每个数之间换一行

#include 

int main(int argc, char *argv[])
{
    FILE* file = NULL;
    int score[3] = {0};  // 包含 3 个最佳得分的数组

    file = fopen("test.txt", "r");

    if (file != NULL)
    {
        fscanf(file, "%d %d %d", &score[0], &score[1], &score[2]);
        printf("最佳得分是 : %d, %d 和 %d\n", score[0], score[1], score[2]);

        fclose(file);
    }

    return 0;
}

运行输出：

最佳得分是：23, 45, 67

4. 在文件中移动

前面我们提到了虚拟的“游标”，现在我们仔细地来学习一下。

每当我们打开一个文件的时候，实际上都存在一个“游标”，标识你当前在文件中所处的位置。

你可以类比我们的文本编辑器，每次你在文本编辑器（例如记事本）里面输入文字的时候，不是有一个游标（光标）可以到处移动么？它指示了你在文件中的位置，也就是你下一次输入会从哪里开始。

总结来说，游标系统使得我们可以在文件中指定位置进行读写操作。

我们介绍三个与文件中游标移动有关的函数：

ftell：告知目前在文件中哪个位置。tell 表示“告诉”。
fseek：移动文件中的游标到指定位置。seek 表示“探寻”。
rewind：将游标重置到文件的开始位置（这和用 fseek 函数来使游标回到文件开始位置是一个效果）。rewind 表示“转回”。

ftell：指示目前在文件中的游标位置

这个函数使用起来非常简单，它返回一个 long 型的整数值，标明目前游标所在位置。函数原型是：

long ftell(FILE* pointerOnFile);

其中，pointerOnFile 这个指针就是文件指针，指向当前文件。

相信不必用例子就知道如何使用了吧。

fseek：使游标移动到指定位置

函数原型为：

int fseek(FILE* pointerOnFile, long move, int origin);

此函数能使游标在文件（pointerOnFile 指针所指）中从位置（origin 所指。origin 表示“初始”）开始移动一定距离（move 所指。move 表示“移动”）。

move 参数：可以是一个正整数，表明向前移动；0，表明不移动；或者负整数，表明回退。
origin 参数：它的取值可以是以下三个值（#define 所定义的常量）中的任意：
- SEEK_SET ：文件开始处。SET 表示“设置”。
- SEEK_CUR ：游标当前所在位置。CUR 是 current（表示“当前”）的缩写。
- SEEK_END ：文件末尾。END 表示“结尾”。

来看几个具体使用实例吧：

// 这行代码将游标放置到距离文件开始处 5 个位置的地方
fseek(file, 5, SEEK_SET);

// 这行代码将游标放置到距离当前位置往后 3 个位置的地方
fseek(file, -3, SEEK_CUR);

// 这行代码将游标放置到文件末尾
fseek(file, 0, SEEK_END);

rewind：使游标回到文件开始位置

这个函数的作用就相当于使用 fseek 来使游标回到 0 的位置

void rewind(FILE* pointerOnFile);

相信使用难不倒大家吧，看函数原型就一目了然了。和 fseek(file, 0, SEEK_SET); 是一个效果。

5. 文件的重命名和删除

我们来学习两个简单的函数，以结束这次的课程：

rename 函数：重命名一个文件（rename 表示“重命名”）。
remove 函数：删除一个文件（remove 表示“移除”）。

这两个函数的特殊之处就在于，不同于之前的一些文件操作函数，它们不需要文件指针作为参数，只需要把文件的名字传给这两个函数就够了。

rename：重命名文件

函数原型：

int rename(const char* oldName, const char* newName);

oldName 就是文件的“旧名字”，而 newName 是文件的“新名字”。

如果函数执行成功，则返回 0；否则，返回非零的 int 型值。

以下是一个使用的例子：

int main(int argc, char *argv[])
{
      rename("test.txt", "renamed_test.txt");

      return 0;
}

很简单吧。

remove：删除一个文件

函数原型：

int remove(const char* fileToRemove);

fileToRemove 就是要删除的文件名。

注意：remove 函数要慎用，因为它不会提示你是否确认删除文件。
文件是直接从硬盘被永久删除了，也不会先移动至垃圾箱。
想要再找回被删除的文件就只能借助一些特殊的软件了，但是恢复过程可能没那么容易，也不一定能够成功。

实例：

int main(int argc, char *argv[])
{
    remove("test.txt");

    return 0;
}

6. 第二部分第八课预告

今天的课就到这里，一起加油吧！

下一课：C语言探索之旅 | 第二部分第八课：动态分配

我是谢恩铭，公众号「程序员联盟」（微信号：coderhub）运营者，慕课网精英讲师 Oscar 老师，终生学习者。
热爱生活，喜欢游泳，略懂烹饪。
人生格言：「向着标杆直跑」

C语言探索之旅 | 第二部分第七课：文件读写

内容简介

1. 前言

2. 文件的打开和关闭

fopen：打开文件

测试打开文件

fclose：关闭文件

3. 读写文件的不同方法

对文件写入

fputc

fputs

fprintf

从文件中读出

fgetc

fgets

fscanf

4. 在文件中移动

ftell：指示目前在文件中的游标位置

fseek：使游标移动到指定位置

rewind：使游标回到文件开始位置

5. 文件的重命名和删除

rename：重命名文件

remove：删除一个文件

6. 第二部分第八课预告

你可能感兴趣的:(c,后端,编程语言,编程,程序员)