有时我们想把某些信息记录下来,不会随着程序关闭而销毁,需要时再进行调用。这就涉及到了数据持久化的问题,我们一般数据持久化的方法有:把数据存放在磁盘文件、存放到数据库等方式。
使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化。
磁盘上的文件是文件。
但是在程序设计中,(从文件功能的角度来分类)我们一般谈的文件有两种:程序文件、数据文件。
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序文件(windows环境后缀为.exe)。(编译时所产生的相关文件)
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。(存储一些数据)
在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件(即数据文件)。
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:
文件路径+文件名主干+文件后缀
例如: E:\code\test.txt
E:\code\为文件路径
test为文件名主干
.txt为文件后缀
为了方便起见,文件标识常被称为文件名。
缓冲文件系统中(见最后章节),操作文件关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE.
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。(详情见下面具体应用)
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC(C语言的标准) 规定使用fopen函数来打开文件,fclose来关闭文件。
打开文件:
FILE * fopen ( const char * filename, const char * mode );
const char * filename:所要打开的文件名;
const char * mode:对文件的访问方式(见下);
FILE *:返回值为指向该文件的指针变量;fopen详解
关闭文件
int fclose ( FILE * stream );
FILE * stream:指向文件的指针变量;
int:文件关闭成功则返回0;否则返回EOF fclose详解
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r” (只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件(将原有数据清除再写入,下同) | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 建立一个新的文件 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 建立一个新的文件 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建立一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
int main()
{
FILE* pf;//定义一个文件指针
pf = fopen("test.txt", "w");//将文件test.txt以写的形式打开
if (pf == NULL)//防止为空指针
{
perror("fopen");//出错时打印fopen:错误信息
}
fputs("Hello world!", pf);//将Hello wold!打印到文件
fclose(pf);//关闭文件
pf = NULL;//文件指针赋值为空指针
return 0;
}
程序运行好后,在此代码文件里会生成test.txt文件并写出Hello wold
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
int fgetc ( FILE * stream );fgetc详解
FILE * stream:文件指针
int:成功返回所读取的字符(ASCII码);失败或结束返回EOF
//文件存放着Hello world!
int main()
{
FILE* pf;
pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
}
char ch=fgetc(pf);//一次输入一个字符
printf("%c\n",ch);
fclose(pf);
pf = NULL;
return 0;
}
int fputc ( int character, FILE * stream );fputc详解
int character:所要输出到文件的字符(ASCII码)
FILE * stream:文件指针
int:输出成功返回要写入的字符,否则返回EOF
int main()
{
FILE* pf;
pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
}
fputc('A', pf);//将A输出到文件(将原内容清除)
fclose(pf);
pf = NULL;
return 0;
}
char * fgets ( char * str, int num, FILE * stream );fgets详解
char * str:所要从文件输入的字符存储的地址(ASCII码)
int num:字符个数(包括’\0’)
FILE * stream:文件指针
char * :输入成功返回str,否则返回NULL
//文件存放着Hello world!
int main()
{
FILE* pf;
pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
}
char arr[20];
fgets(arr,6, pf);//从文件输入6个字符(包括‘\0’)输入到arr[20]
printf(arr);//只输出Hello
fclose(pf);
pf = NULL;
return 0;
}
int fputs ( const char * str, FILE * stream );fputs详解
const char * str:所要输出到文件的字符串
FILE * stream:文件指针
int:输出成功返回非负值,否则返回EOF
int main()
{
FILE* pf;
pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
}
fputs("Hard work!", pf);//将Hard work!输出到文件
fclose(pf);
pf = NULL;
return 0;
}
int fprintf ( FILE * stream, const char * format, … );fprintf详解
FILE * stream:文件指针
const char * format, … :参见printf
int:输出成功返回字符总个数,否则返回负值
struct S
{
char name[20];
int age;
};
int main()
{
struct S s = { "zhangsan",25 };
FILE* pf;
pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
}
fprintf(pf, "%s %d", s.name, s.age);//将结构s的信息输出到文件
fclose(pf);
pf = NULL;
return 0;
}
int fscanf ( FILE * stream, const char * format, … );fscanf详解
FILE * stream:文件指针
const char * format, …;参考scanf函数
int:输出成功返回成功填充的参数列表的项数(如下返回2),否则返回EOF
首先将文件中内容改为:lisi 30
struct S
{
char name[20];
int age;
};
int main()
{
struct S s = { 0 };
FILE* pf;
pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
}
fscanf(pf, "%s %d", s.name, &(s.age));
printf("%s %d", s.name, s.age);
fclose(pf);
pf = NULL;
return 0;
}
size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );fwrite详解
const void * ptr:要写入的元素地址
size_t size:写入元素的大小,单位byte
size_t count :一次写入几个size的内容
FILE * stream:文件指针,指向所要写入的文件
size_t:返回成功写入个数
struct S
{
char name[20];
int age;
char sex;
};
int main()
{
struct S s = { "王五",99,'m'};
FILE* pf;
pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
}
fwrite(&s, sizeof(struct S), 1, pf);
fclose(pf);
pf = NULL;
return 0;
}
可见二进制输出"王五",99,‘m’,文件中显示的是乱码,这是因为txt文件无法显示二进制文件内容.
size_t fread ( void * ptr, size_t size, size_t count, FILE * stream );fread详解
void * ptr:要存储输入的内容地址(大小至少大于size*count)
size_t size:输入元素的大小,单位byte
size_t count :一次输入几个size的内容
FILE * stream:文件指针,指向输入的文件
size_t:返回成功输入个数
struct S
{
char name[20];
int age;
char sex;
};
int main()
{
struct S s = { 0};
FILE* pf;
pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
}
fread(&s, sizeof(struct S), 1, pf);
printf("%s %d %c\n", s.name, s.age, s.sex);
fclose(pf);
pf = NULL;
return 0;
}
对于printf和scanf,其使用时不需要打开和关闭外部设备,而fprintf和fscanf则需要,这是因为任何一个C程序,只要运行起来系统就会默认打开3个流:
FILE* stdin - 标准输入流(键盘)
FILE* stdout - 标准输出流(屏幕)
FILE* stderr - 标准错误流(屏幕)
//下面两者等效
printf(“...”);
fprintf(stdout, "...");
fscanf(stdin,...);
scanf (...);
int sscanf ( const char * s, const char * format, …);sscanf详解
const char * s:所要转化的字符串的地址;
const char * format, …:同scanf标准
int:成功返回转化的项目个数,否则返回EOF
int sprintf ( char * str, const char * format, … );sprintf详解
char * str:存储转化格式化内容后的地址;
const char * format, …:同printf标准
int:成功返回字符个数(不包括‘\0’),否则返回负值
struct S
{
char name[20];
int age;
char sex;
};
int main()
{
struct S s = { "王五",99,'m'};
char buf[20] = {0};
struct S tmp = { 0 };
//将一个格式化内容转化为一个字符串,放到buf里
sprintf(buf, "%s %d %c", s.name, s.age, s.sex);
printf("字符串:");
puts(buf);//输出字符串
printf("********************\n");
//将一个字符串转化成一个格式化内容,存储到tmp中
sscanf(buf, "%s %d %c", tmp.name, &(tmp.age), &(tmp.sex));
printf("格式化内容:%s %d %c\n", tmp.name, tmp.age, tmp.sex);
return 0;
}
根据文件指针的位置和偏移量来定位文件指针。
int fseek ( FILE * stream, long int offset, int origin );fseek详解
- FILE * stream:文件指针,指向所要读写的文件;
- long int offset:偏移量
- 二进制文件中,与起始位置相差的字节个数偏;
- 文本文件中,或为0,或为ftell返回的值
- int origin:起始位置(可变)
- SEEK_SET : Beginning of file
- SEEK_CUR : Current position of the file pointer
- SEEK_END : End of file *
- int:成功返回0;否则返回非零
int main()
{
FILE* pf;
pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
char str1[20] = { 0 };
char str2[10] = { 0 };
//fputs("Good good study,day day up!", pf);
fseek(pf, 10, SEEK_SET);//从起始位置开始,将光标定位到第10个字节的位置,即study的开始位置
fgets(str1, 6, pf);//从光标处开始,打印6个字符(包括‘\0’)到str1
printf("%s\n", str1);
fseek(pf, -3, SEEK_END);//从末尾位置开始,将光标定位到第-3个字节的位置,即up的开始位置
fgets(str2, 3, pf);//从光标处开始,打印3个字符(包括‘\0’)到str2
printf("%s\n", str2);
fclose(pf);
pf = NULL;
return 0;
}
返回文件指针相对于起始位置的偏移量。
long int ftell ( FILE * stream );ftell详解
FILE * stream:文件指针
long int:成功返回文件指针相对于起始位置的偏移量,否则返回-1L
int main()
{
FILE* pf;
pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
fseek(pf, 10, SEEK_SET);//从起始位置开始,将光标定位到第10个字节的位置
long int addr=ftell(pf);//返回目前光标相对于起始位置的偏移量
printf("%ld\n", addr);
fseek(pf, 0, SEEK_END);//从末尾位置开始,将光标定位到第0个字节的位置,即末尾
long int addr1 = ftell(pf);//返回目前光标相对于起始位置的偏移量
printf("%ld\n", addr1);
fclose(pf);
pf = NULL;
return 0;
}
让文件指针的位置回到文件的起始位置。rewind详解
void rewind ( FILE * stream );
FILE * stream:文件指针;
void:无返回类型。
int main()
{
FILE* pf;
pf = fopen("text.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
fseek(pf, 0, SEEK_END);//将光标移至末尾
printf("%ld\n", ftell(pf));//27
rewind(pf);//移至起始位置
printf("%ld\n", ftell(pf));//0
fclose(pf);
pf = NULL;
return 0;
}
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文 本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而
二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。
feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾结束。
- 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets ) 例如:
fgetc 判断是否为 EOF ;
fgets 判断返回值是否为 NULL .- 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。 例如:
fread判断返回值是否小于实际要读的个数。
牢记:在文件读取过程中,不能用feof函数的返回值直接来判断文件的是否结束(结束有出现错误结束和遇到末尾结束)。
int main(void)
{
int c;
FILE* fp = fopen("test.txt", "r");
if (!fp)
{
//fp为NULL时,执行
perror("File opening failed");
return 1;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))//ferror(fp)为真,即读取出错而结束
puts("I/O error when reading");
else if (feof(fp))//feof(fp)为真,即读取到末尾而结束
puts("End of file reached successfully");
fclose(fp);
fp = NULL;
return 0;
}
int main(void)
{
double a[5] = { 1.,2.,3.,4.,5. };
FILE* fp = fopen("test.bin", "wb"); // 必须用二进制模式
fwrite(a, sizeof (* a), 5, fp); // 写 double 的数组
fclose(fp);
double b[5];
fp = fopen("test.bin", "rb");
size_t ret_code = fread(b, sizeof * b, 5, fp); // 读 double 的数组
if (ret_code == 5)
{
puts("Array read successfully, contents: ");
for (int n = 0; n < 5; ++n)
printf("%f ", b[n]);//将每个元素输出
putchar('\n');
}
else //如果ret_code != 5
{
//判断结束原因
if (feof(fp))//至末尾结束
{
printf("Error reading test.bin: unexpected end of file\n");
}
else if (ferror(fp)) //读取出错
{
perror("Error reading test.bin");
}
}
fclose(fp);
fp = NULL;
return 0;
}
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文
件。如果不做,可能导致读写文件的问题。