fstream 和 中文路径 [转]

转载自:http://jackinelee.blog.hexun.com/20954695_d.html

fstream 和中文路径 
有时候用ifstream或ofstream打开带有中文路径的文件会失败。

解决办法:
1、使用C语言的函数设置为中文运行环境
setlocale(LC_ALL,"Chinese-simplified");

2、使用STL函数设置为系统语言环境
std::locale::global(std::locale(""));

当然选2啦!

另转载针对该问题的详细讨论:http://haoren.blogbus.com/logs/2278697.html

前两天写的一个程序里面,发现中文路径扫描有问题,无法得出带有中文路径的文件的CRC值以及文件大小。因为这两个获得都是通过fstream实现的,跟踪了一下发现2005中的fstream对中文路径处理存在BUG。

跟 踪后找到问题所在,原来2005中为了让std::wfstream(这个是MS自己搞的东西,C++标准中并未规定有wfstream)的路径支持 wchar_t,所有底层函数的路径都是转换成wchar_t来进行操作的。而在此之前VC2003的wfstream并不支持wchar_t作为路径, 写STL的人并未使用MS的标准API:MultiByteToWideChar及WideCharToMultiByte来进行wchar_t和 char之间的转换,而是用了C库的wcstombos来进行转换。而wcstombos并不像MultiByteToWideChar这样的函数可以在 参数中指定代码页设置,它只接受当前全句的locale设置。当全局的locale设置并不为wcstombos所要转换的文字的代码页时,BUG就出现 了。

默认的locale设置为ANSI C,通过设置代码页为".936"可以解决中文DBCS到UNICODE的转换。因此,如果要解决这个BUG可以:

setlocale(LC_CTYPE, ".936");

设置全局locale来解决。不过
这 样将导致全局的locale改变。wcstombos是标准C库中的函数,并非STL中的库函数,所以无法只用locale类来对它造成单一影响。这么设 置的话,有可能std::cout将无法正确输出中文名,造成的影响似乎有点得不偿失。所以这个BUG最好不要用这种方式解决。还是等MS的SP补丁出来 看看是否解决了这个问题。在此之前可以考虑用C库的fopen来代替fstream.

最后:上面说过fstream底层都是用wchar_t来处理路径的,如果事先把路径转换成wchar_t传入进去也是可以的,但是这样也会带来一些问题:比如说VC2005以前的编译器将无法编译。

另转载对进行上述修改后造成的cout无法输出中文的解决方案:http://elanso.com/ArticleModule/HaHGMbTDPKHaSYHQSsSEM6Ii.html

前几天发了这篇《用fstream对二进制文件的读写 》,有朋友指出了VS2005的fstream对于中文路径支持不好的bug。我想大概是因为VS2005更加重视了对字符串的全球化支持,所以鼓励我们使用unicode编码的字符串,对于MBCS之类的支持可能就疏忽了吧。

   我搜索了一下这个问题的解决,参考了如下资料写了演示代码。

  • fstream 和 中文路径   c++博客
  • About unicode settings in visual studio 2005, it really puzzled me a lot ms forum
  • MSDN

   我综合了以上的内容,总结了3种方法,能够较好解决大家的困扰,包括可能无法使用cout的问题。

 

view plain copy to clipboard print ?
  1. /******************************************************************** 
  2.      created:    2008/05/10 
  3.     created:    10:5:2008   23:56 
  4.      filename:     k:/sj/fstreamTest/fstreamTest/main.cpp 
  5.     file path:    k:/sj/fstreamTest/fstreamTest 
  6.    file base:    main 
  7.    file ext:    cpp 
  8.     author:        Gohan 
  9. *********************************************************************/  
  10. #include  
  11. #include  
  12. #include  
  13. using namespace std ;  
  14. int main()  
  15. {  
  16.     /************************************************************************/  
  17.     /* 方法1,使用_TEXT()宏定义将字符串常量指定为TCHAR*类型                 */  
  18.     /* 如果是我,首选此类型                                                 */  
  19.     /************************************************************************/  
  20.     fstream file ;  
  21.     file.open(_TEXT("c://测试//测试文本.txt"));  
  22.     cout<<PRE>  
  23.     file.close();  
  24.       
  25.     /************************************************************************/  
  26.     /* 方法2,使用STL中的locale类的静态方法指定全局locale                   */  
  27.     /* 使用该方法以后,cout可能不能正常输出中文,十分蹊跷                    */  
  28.     /* 我发现了勉强解决的方法:不要在还原区域设定前用cout或wcout 输出中文   */  
  29.     /* 否则后果就是还原区域设定后无法使用cout wcout输出中文                 */  
  30.     /************************************************************************/  
  31.     locale :: global(locale(""));//将全局区域设为操作系统默认区域  
  32.     file.open("c://测试//测试文本2.txt");//可以顺利打开文件了  
  33.     locale :: global(locale("C"));//还原全局区域设定  
  34.     cout<<PRE>  
  35.     file.close();  
  36.       
  37.     /************************************************************************/  
  38.     /* 方法3,使用C函数setlocale,不能用cout输出中文的问题解决方法同上      */  
  39.     /************************************************************************/  
  40.     setlocale(LC_ALL,"Chinese-simplified");//设置中文环境  
  41.     file.open("c://测试//测试文本3.txt");//可以顺利打开文件了  
  42.     setlocale(LC_ALL,"C"); //还原  
  43.     cout<<PRE>  
  44.     file.close();  
  45. }  
  

 

补充一下,第一种方法,如果不是静态字符串当作路径的话,记得传入TCHAR*类型字符串作为路径,应该就没问题了。

fstream 和 中文路径 [转]_第1张图片

 

你可能感兴趣的:(c,api,测试,语言,编译器)