目录
中文路径
编译器
统一字符集
修正方法
改全局的Locale
使用wstring
字符集改为宽字符集
升级编译器
一劳永逸
将fstream再包装
总结
在C++的标准库中,std::fstream是个挺好用的文件读写流,操作文件很方便,因为是C++标准库,所以没有其它的环境依赖。在使用fstream过程中,有个打开中文路径文件会失败的问题,自己的代码中一直没处理好,这几天终于有点闲心,把这里改透。涉及很多知识点,也是个遗留已久的问题,特此做个记录。
在最后用了个一劳永逸的解决此问题方法:将fstream、FILE再包装下。
使用fstream调试程序过程中,发现打开含中文路径的文件时,会打开失败。查了一些资料,说在VS2008、vs2005中,fstream的open函数中,会判断当前的全局编码环境,导致含中文的路径打开失败,也提到了很多修改方法,如让修改全局的Locale改为宽字符、使用宽字符集wstring。
我当时的修改方法是调用重载的open(wstring),即将string的路径,转为wstring,然后fstream就可以打开有中文路径文件了,缺点是在string转wstring时需要调用windows的函数,产生了一个外部依赖,且多了几行代码。
我所使用的开发环境是vs2008,有些文章说只在vs2005、vs2008的环境中才有这个问题,好在我的开发环境中有vs2015,所以在vs2015中也测试下。很容易执行这个测试,vs2015中执行新建win32控制台程序,在main函数中添加测试代码,定义fstream打开文件,重点是文件路径要有中文。
测试代码如下:
#include int main() { std::fstream st; st.open("D:/temp/fstream测试/测试1.log", std::fstream::app); //含中文的 printf("%s\r\n", (st.is_open() ? "sucess" : "failed")); system("pause"); return 0; } |
测试执行比对后,确认在vs2008中不能打开中文路径文件,而在2015中可以打开中文路径文件,显然这个问题和编译器是有关系的。我想linux环境中会怎么样,还需要测试下Gcc的现象、版本支持情况。在C++标准库中,不约定std::fstream的字符集支持与否的,这个问题肯定和编译器有关。
测试项目的属性界面中,字符集都是默认设置的“使用Unicode字符集”,对比也是有效的。
程序运行的操作系统环境有字符集、程序源码文件有字符集、程序运行后处理字符也有字符集,改字符集是个繁琐的事情,源码文件、软件环境、都需要改。
避免字符集的问题,最简单就是统一字符集,各个涉及字符集的地方都统一,我们写的程序就适应环境的字符集,此时问题就出现了,对于跨平台的开发,linux和windows差别太大了,会引入很多问题。
为了在vs2008中使用std::fstream,可供使用的方法也有很多,最后总结罗列下面几种改进方法。
改全局的Locale,在调用open前调用setLocale修改为多字符集,open之后再改回来。产品是个多线程的程序,在基础库中修改全局的环境,可能会导致访问异常、崩溃,这不是个好方法。
然而这个只需要一行代码即可,修改最简单。复杂软件系统中不要随意改全局编码,不要这么用。
setlocale(LC_ALL,"Chinese-simplified"); std::fstream stream; stream.open(“d:/数据/a.log”); |
在fstream的接口方法中,重载有多个open函数,包括传入string、wstring等,实际测试确认调用重载传入wstring的open函数时,可以打开中文路径。
定义一个string转wstring的函数,使用fstream的open函数时,先调用转换为wstring,然后调用open函数。这样引入了一个多字符转宽字符的函数,多几行调用,整体的稳定、可靠是没问题的。
关于string转wstring,不要用C标准库的mbstowcs,该方法不支持中文,调用mbstowcs转换的中文会编程乱码。
#include //将string转换成wstring inline wstring string2wstring(string str) { wstring result; //获取缓冲区大小,并申请空间,缓冲区大小按字符计算 int len = MultiByteToWideChar(CP_ACP, 0, str.c_str(), str.size(), NULL, 0); TCHAR* buffer = new TCHAR[len + 1]; //多字节编码转换成宽字节编码 MultiByteToWideChar(CP_ACP, 0, str.c_str(), str.size(), buffer, len); buffer[len] = '\0'; //添加字符串结尾 //删除缓冲区并返回值 result.append(buffer); delete[] buffer; return result; } |
根源上还是字符集的问题,所有的string都改为wstring。我的软件中,一部分代码在windows vs2008开发、另一部分用的QtCreator开发、目前运行在windows,导致源码文件的默认编码是gb2312,软件运行的默认Locale也是多字符集。
由于有跨平台的考虑,要减少环境的依赖、尽量只调用标准库、少改动代码,所以所有的编码应统一utf8,工程量太大,不太现实,后续再改进。
最简单的方法是升级编译器,不要用vs2008。升级编译器,不是小事,看使用者的习惯,代码会不会有影响。升级编译器、编译环境,还是有些繁琐的。导致产品代码,要对编译器有要求,约定了最低编译器版本。
几种方法中都有缺点,转wstring的方式引入了操作系统的依赖,在我的产品代码中想尽量少依赖,可以用升级编译器的方式,但有几个库是vs2008的,都升级有些繁琐。
想到个简单的、一劳永逸的方法,复用FILE指针、fopen函数可以支持中文路径、各种版本编译器中表现也一致。
在fstream的构造函数中,有输入FILE指针,在fstream构造函数传入FILE,所以可以先用fopen函数打开带中文路径的文件,然后构造fstream,之后就正常使用fstream即可。
基于再包装wrap的方法,建立WrapFstream类,封装这几个操作。
bool open(const std::string & fileName, const char * mode){ close(); file = fopen(fileName.c_str(), mode); if (file != NULL) { st = new std::fstream(file); return st->is_open(); } return false; } |
void close(){ if (st != NULL){ if (st->is_open()) st->close(); delete st; st = NULL; } if (file != NULL) fclose(file); file = NULL; st = NULL; } |
/** * 将fstream再包装 * 单元测试在CoreTest/test_TSore.cpp */ class WrapFstream { std::fstream * st; FILE * file; public: MFileStream(){ file = NULL; st = NULL; } ~MFileStream(){ close(); } bool open(const char * fileName, const char * mode){ return this->open(string(fileName), mode); } bool open(const std::string & fileName, const char * mode){ ................... } bool is_open(){ if (st != NULL) return st->is_open(); return false; } void close(){ .......... } std::fstream * stream(){ return st; } std::fstream & obj(){ return (*st); } }; |
vs2008中fstream用string不能打开中文路径,要用wstring.
该问题设计多个知识点。文件编码等,有几个方式不能有效解决
1.该全局的编码setLocate('c'). 该方法不可,由于TStore是基础库,整个软件是多线程,所有这个setLocate可能导致多线程的访问异常、崩溃。
2.调用C库函数转换为宽字符串mbstowcs. 该方法不可,不能转换中文,VC的实现中只是在每个字节前插入一个x0。
3.调用系统函数windows的多字符串转宽字符MuilteToWideChar,这个是可行的. 这几年一直这么跑,是windows环境,跨平台需要改下。
4.有个文章说vc2005、vc2008有这个问题,而vc2005之前没有,作者跟着fstream的open函数代码,其中有判断全局环境编码的如果是'C'那么将string.c_str()直接转了(wchar*),然后调用CreateFile,所有不能打开。
5.在vc2015确认无此问题。
6.现在用FILE的fopen先打开,然后传递给fstream,再封装下。