ofstream写大文件出错

我的程序在运行过程中会同时向磁盘写两个体积很大的二进制文件。文件A大致是240G,文件B大致是480G。两个文件都是用ofstream对象来维护的。写操作是通过ofstream的write成员函数实现的。

现在的问题是:每次写文件写到64%左右就会出错,write函数的返回值显示写操作没有成功。第一回是在文件A出错,第二回则是在文件B出错。

刚好这几天单位这边的电路在整改。程序两次出错,都正好是电工对配电箱进行操作、对中央空调和好几个房间的电路进行合闸开闸的时候。所以不知道有没有可能是电压不稳而导致磁盘写操作失败。但是我的房间并没有停电,也就是说电脑并没有停机,所以感觉很奇怪。

目前已经排除了单个文件大小限制的原因,因为我试过用ofstream的write成员函数向磁盘写700G的二进制文件,一点问题也没有。

不知有没有办法得知具体的错误原因?我觉得ofstream的几个标志——badbit、eofbit和failbit都给不出很有用的信息。目前正尝试用C标准库的errno和strerror获得出错原因。但是我看了一下errno的说明,要是errno是EIO(I/O error)的话,这信息也没有太大用处。

不知有没有人遇到过这种情况?

 

我已经找到错误的真正原因了。我把这次事件记录在了博客里:http://blog.csdn.net/zzxiang1985/article/details/7526551

谢谢大家给我提供思路。以下是从这篇博客文章的最后几段复制粘贴过来的:

  原来这bug既不是藏在我的程序上,也不是藏在微软的C标准库或C++标准库实现中,而是藏在了NTFS中:http://support.microsoft.com/default.aspx?scid=kb;EN-US;967351。如果程序同时向磁盘写两个大文件,那这两个文件就会被分割成大量的碎片;而在NTFS中,如果一个文件被分割成大量碎片,这个文件的大小就会受到限制。以下是微软帮助和支持给出的技术解释(见刚才给出的网址):


When a file is very fragmented, NTFS uses more space to save the description of the allocations that is associated with the fragments. The allocation information is stored in one or more file records. When the allocation information is stored in multiple file records, another structure, known as the ATTRIBUTE_LIST, stores information about those file records. The number of ATTRIBUTE_LIST_ENTRY structures that the file can have is limited.
 

  翻译(微软帮助和支持的机器翻译真没法看):

  当一个文件被分割成大量碎片时,NTFS就需要用更多的空间来存储这些碎片在硬盘中的分配信息。这些分配信息被存储为一个或多个文件记录。当这些分配信息被存储为多个文件记录时,NTFS就会用另一个数据结构——ATTRIBUTE_LIST来存储这些文件记录的相关信息,而一个文件能拥有的ATTRIBUTE_LIST_ENTRY结构体的数量是有限的。
 
 
  我下载了Contig工具来查看那两个才写了一半的文件。果然,文件中的碎片数量已经达到了几百万之多!
 
 
  于是按照微软帮助和支持的说明,我下载安装了补丁,还下载安装了商业软件Diskeeper的试用版。打了补丁后还得将800多GB的E盘格式化,我勒了个去……格式化后,我先把Diskeeper开了起来,然后运行用fwrite的小程序。哇塞,速度比原来快了一倍多,Diskeeper真是给力——我后来试了一下不开Diskeeper,速度跟原来是一样的。当然,重要的是——经过5个多小时,小程序成功运行完毕了!再用Contig查看一下两个文件,碎片数量才几万。
 
 
  既然fwrite成功了,那么ofstream应该也能行;而且既然微软已经发步了解决这个问题的补丁,那么不开Diskeeper应该也行。于是我又换回了用ofstream的版本。结果没想到不开Diskeeper的ofstream比开了Diskeeper的fwrite还快——3小时就成功运行完毕了。
 
 
  于是,终于解决了这个困扰我一个多星期的问题。这时已经是5月1日,也就是昨天了。
 

总结:
  
1. 写程序的时候,如果要对调用错误进行检查并输出错误信息,那么要利用库和系统自身设计的错误信息机制,如C标准库的errno和Windows系统的GetLastError()。这些信息会对查错提供很大的帮助。如果我一开始就用了errno和GetLastError(),那就能早几天解决这个问题了。
 
2. 如果要往磁盘写大量的数据,尽量将这些数据合并成一个文件写,而不是分开多个文件写。这样一来可以减少文件碎片,二来可以加快写文件的速度。

转载于:https://www.cnblogs.com/byfei/archive/2012/05/08/3112266.html

你可能感兴趣的:(ofstream写大文件出错)