本节主要讨论如何使用C语言随机读写二进制文件。
本文引用自作者编写的下述图书; 本文允许以个人学习、教学等目的引用、讲授或转载,但需要注明原作者"海洋饼干叔
叔";本文不允许以纸质及电子出版为目的进行抄摘或改编。
1.《Python编程基础及应用》,陈波,刘慧君,高等教育出版社。免费授课视频 Python编程基础及应用
2.《Python编程基础及应用实验教程》, 陈波,熊心志,张全和,刘慧君,赵恒军,高等教育出版社Python编程基础及应用实验教程
3. 《简明C及C++语言教程》,陈波,待出版书稿。免费授课视频
文件既可以顺序读写,也可以随机读写。所谓顺序读写,可以简单理解为从头读/写到尾,数据项是一个接着一个进行读取/写入的;而随机读写则允许我们随时改变文件的当前读写位置,如果在非文件尾的位置写入内容,则相应位置的原始数据会被覆盖。
二进制文件可以视为字节流,程序为每一个被打开的二进制文件维护了一个读写位置标记,该标记为一个整数,表示当前读写位置相对于文件起始处的偏移量,以字节为单位。随着文件读写操作的进行,该读写位置会自动后移,其偏移量等于读写操作的字节数。
表20-6 文件随机访问函数(C语言)
函数 | 说明 |
---|---|
rewind | void rewind(FILE* f);说明:将文件f的读写位置移回文件头(起始处)。 |
fseek | int fseek(FILE* f, long offset, int origin);说明:该函数通常应用于二进制文件,其将文件f的读写位置移动至偏离参考点(origin)指定偏移量(offset)的位置。参考点origin应为SEEK_SET、SEEK_CUR、SEEK_END之一,依次为文件头、当前读写位置和文件尾。函数应用于文本文件时,offset只能是0或者是前次ftell()的返回值,而origin只能是SEEK_SET。操作成功,函数返回0,否则返回非零值。 |
ftell | long ftell(FILE* f);说明:对于二进制文件,返回文件的当前读写位置,即当前读写位置相对于文件头的偏移字节数。对于文本文件,函数返回值可能没有实际意义,但仍然可以配合fseek()函数恢复文件的读写位置。如果函数执行出错,返回-1。 |
fgetpos | int fgetpos(FILE* f, fpos_t* pos);说明:获取文件f的当前读写位置,写入指针pos所指向的fpos_t对象中。指针pos指向的对象必须是已分配好的。通常情况下,fpos_t事实上是长整型或者长长整型。操作成功,函数返回0,否则返回非零值。 |
fsetpos | int fsetpos(FILE* f, const fpos_t* pos);说明:设置文件f的读写位置,指针pos所指向的fpos_t对象即为目标位置。操作成功,函数返回0,否则返回非零值。 |
表20-6列出了C语言中用于二进制文件随机访问的常用函数,以这些函数为工具,我们可以在文件中随意移动读写位置,方便地读写二进制文件。
C语言程序BinaryPriceList展示了一个灵活的二进制商品价格表存储结构,该结构以不重复的固定的商品编号为基础进行工作。
//Project - BinaryPriceList
#include
#include
#include
#include
typedef struct {
int iNo; //商品编号,不重复
char sName[20]; //名称
float fPrice; //价格
int iQuantity; //在库数量
} Commodity;
bool locateCommodity(FILE* f, int iNo){
rewind(f); //读写指针回到文件头
int t;
while (true){
if (fread(&t,sizeof(int),1,f)!=1)
return false;
if (t==iNo){
fseek(f,-sizeof(int),SEEK_CUR);
return true;
}
else
fseek(f,sizeof(int)+sizeof(float)+20,SEEK_CUR);
}
}
void saveCommodity(FILE* f, const Commodity* c){
if (!locateCommodity(f,c->iNo))
fseek(f,0,SEEK_END);
fwrite(&c->iNo,sizeof(int),1,f);
fwrite(c->sName,20,1,f);
fwrite(&c->fPrice,sizeof(float),1,f);
fwrite(&c->iQuantity,sizeof(int),1,f);
}
bool loadCommodity(FILE* f, int iNo, Commodity* c){
if (!locateCommodity(f,iNo))
return false;
fread(&c->iNo,sizeof(int),1,f);
fread(c->sName,20,1,f);
fread(&c->fPrice,sizeof(float),1,f);
fread(&c->iQuantity,sizeof(int),1,f);
return true;
}
int main() {
char sPath[512];
if (getcwd(sPath,512)!=NULL) //获取并打印当前工作路径
printf("cwd: %s\n",sPath);
FILE* f = NULL;
if (access("commodity.dat",F_OK)==0) //判断文件是否存在
f = fopen("commodity.dat","rb+"); //打开已有文件进行随机读写
else
f = fopen("commodity.dat","wb+"); //打开新文件进行随机读写
Commodity c1 = {1,"Apple",5.2764123f,2000};
saveCommodity(f,&c1);
printf("ftell(f): %ld\n",ftell(f)); //输出文件当前读写位置
Commodity c3 = {3,"Beef",65.741f,5000};
saveCommodity(f,&c3);
Commodity c5 = {5,"Cherry",117.4f,500};
saveCommodity(f,&c5);
strcpy(c3.sName,"Pork");
saveCommodity(f,&c3);
Commodity t;
printf("%-6s%-20s%10s%10s\n","No","Name","Price","Quantity");
printf("----------------------------------------------\n");
for (int i=1;i<=5;i++){
if (!loadCommodity(f,i,&t))
printf("%-6d%-20s%10.2f%10d\n",i,"NA",0.0,0);
else
printf("%-6d%-20s%10.2f%10d\n",t.iNo,t.sName,t.fPrice,t.iQuantity);
}
fclose(f);
return 0;
}
上述代码的执行结果为:
cwd: D:\C2Cpp\C20_FileIO\build-BinaryPriceList-Desktop_Qt_5_14_1_MinGW_64_bit-Debug
ftell(f): 32
No Name Price Quantity
----------------------------------------------
1 Apple 5.28 2000
2 NA 0.00 0
3 Pork 65.74 5000
4 NA 0.00 0
5 Cherry 117.40 500
上述程序执行完成后,我们得到一个二进制文件commodity.dat,其尺寸为96字节。为了便于描述上述程序的随机读写过程及工作原理,我们画出了commodity.dat的内部结构,请见图20-7。请读者注意,图20-7只是一个示意图,其并不能“精细”表达commodity.dat的内部结构。
第7 ~ 12行:一个Commodity表示一条商品价格信息。简单计算可知,一个Commodity对象的内存尺寸为4 + 20 + 4 + 4 = 32字节。如图20-7所示,程序执行完成后,commodity.dat内部储存了编号为1、3、5的三条价格信息,分别对应3个Commodity对象,每个32字节,3个共96字节,地址范围为0 ~ 95。这里所称的地址,表示相对于文件起始处的偏移字节数。
第14 ~ 27行:locateCommodity()函数用于在已打开的二进制文件f中查找编号为iNo的商品价格信息。如果查找成功,函数将f的读写位置移至对应的商品价格信息的起始处并返回true,否则返回false。
第15行:rewind(f)将文件f的读写位置移至文件头,即地址0处。
第17 ~ 26行:通过while“死”循环对文件进行顺序查找。
第18 ~ 19行:从文件f读取商品编号至整数t,如果fread()函数的返回值不是1,说明已抵达文件尾,查找失败,返回false。
第20 ~ 23行:如果第18行读到的商品编号t等于iNo,说明找到了指定记录,使用fseek()函数将读写位置后退4个字节至该商品价格信息的起始处,然后返回true。此处的SEEK_CUR表示参考位置为当前位置,负的sizeof(int)表示回退4个字节。
第25行:如果第18行读到的商品编号t不等于iNo,说明匹配不成功,使用fseek()函数将当前读写位置前移28个字节至下一条商品价格信息的起始处,然后继续循环。
表20-7列出了locateCommodity(f,3)的执行过程,请读者结合图20-7进行分析。
表20-7 locateCommodity(f,3)的执行过程
序号 | 说明 | 代码行 |
---|---|---|
1 | rewind(f)将读写位置移至文件头,即地址0处。 | 15 |
2 | 在文件的当前位置读出商品编号,其值为1,fread()执行完后,读写位置前移至地址4。 | 18 |
3 | 1不等于3,说明匹配不成功,执行第25行,读写位置前移28至地址32,也就是下一条记录的起始位置。 | 20~25 |
4 | 循环继续,在文件的当前位置读出商品编号,其值为3,读写位置因读动作前移至36。 | 18 |
5 | 3等于3,匹配成功,执行第21行,读写位置后移4个字节至地址32,地址32正好是编号为3的商品价格记录在文件中的起始位置。 | 20~23 |
6 | 返回true,向函数的调用者报告定位成功的消息。 | 22 |
第29 ~ 37行:saveCommodity()函数用于将c所指向的商品价格对象存入文件f,如果对应编号的商品价格记录已存在,则覆盖更新原有信息。
第30 ~ 31行:使用locateCommodity()函数在文件f中定位指定商品编号的记录。如果locateCommodity()返回false,表示未找到,则将读写位置移至文件尾,准备在文件尾追加新记录。此处的SEEK_END表示参考位置为文件尾,0表示相对于文件尾偏移0字节。
第33 ~ 36行:向文件中依次写入商品编号、名称、价格以及库存数量。当读写位置位于文件尾时,这4行代码的执行结果相当于往文件尾附加了一条新记录。当读写位置位于locateCommodity()函数定位的原有记录的起始处,这4行代码的执行结果相当于覆盖更新了原有记录。
第39 ~ 48行:loadCommodity()函数从文件中查找并读取指定编号的商品价格信息至c指向的结构体。如果指定的编号不存在,返回false,否则返回true。
第40 ~ 41行:使用locateCommodity()定位指定编号的记录,如果没找到,返回false表示读取失败。
第43 ~ 46行:如果指定编号的记录在文件中存在,locateCommodity()函数执行后,文件的读写位置正好位于该记录的起始处。依次读入编号、名称、价格和库存数量。
第47行:返回true表示读取成功。
第55 ~ 59行:以二进制读写模式打开文件commodity.dat备用。程序第一次运行时,commodity.dat文件可能不存在,以wb+模式打开,该模式确保当文件不存在时,自动新建一个文件。程序第N次运行时,commodity.dat文件已存在,以rb+模式打开,该模式确保文件的原有内容不会被截断。
函数access()用于判断文件fname是否具体指定的访问权限,其原型如下。当文件具有指定的权限时,返回0,否则返回-1。
int access(const char* fname, int mode);
参数mode可以为F_OK、X_OK、W_OK和R_OK等值,依次表示文件是否存在、是否可执行、是否可写、是否可读。
第61 ~ 62行:存入编号为1的商品价格信息。在程序第1次运行时,第62行在文件中新增记录;在第N次运行时,第62行在文件中覆盖更新记录。
第64行:打印输出文件的当前读写位置。由于刚刚在第62行写入1号商品信息完毕,该读写位置的理论值应为32,因为如前所述,一行记录空间占用正好是32字节。
第66 ~ 69行:存储3号及5号商品价格信息。
第70 ~ 71行:修改3号商品的名称,再次将其写入文件。第71行执行前3号商品记录肯定已存在于文件中,因此第71行事实上覆盖更新了原有记录。执行结果的第7行证实,3号商品的名称被正确修改为Pork。
第73 ~ 81行:逐一读取并打印编号1至5的商品价格信息。执行结果的第6行和第8行证实,由于2号商品和4号商品不存在,第77行的loadCommodity()返回了false,第78行将对应的商品名称打印为“NA”,意为不可用(not available)。
第83行:关闭文件f。
为了帮助更多的年轻朋友们学好编程,作者在B站上开了两门免费的网课,一门零基础讲Python,一门零基础C和C++一起学,拿走不谢!
简洁的C及C++
Python编程基础及应用
如果你觉得纸质书看起来更顺手,目前Python有两本,C和C++在出版过程中。
Python编程基础及应用
Python编程基础及应用实验教程