Unicode(UTF16)文件读写终极方案---用C++标准的字节流读取,转化为宽字符(wchar_t),再以字节流写入

          用C++做程序真够麻烦的,先不说各种数据类型搞的人头疼,再者读写各种编码的文本文件ansi、Unicode、UTF-8等等,让人头晕目眩的。

          这半年来经常要用C++处理各种不同编码的文本文件,开始读取Unicode文件,一直很麻烦。用了wifstream,wsprintf等方法。都是不尽人意。

          后来突然想何不自己节写个库函数自己用。后来就付诸行动,开始想着按行读取,怎想到行读取错误。后来才明白,Unicode(UTF16)文件都是2个字节,包括英文字符,只不过是到位填充为0罢了。明白这些,字节就按字节读取,自己判断换行符,并且实现了字节流到宽字节流的转换,实现了以前windows下复杂的库函数的基本功能,写入时按照字节流写入。用标准的C++读取、写入方法和数据类型,这样可以提供跨平台的重复使用。

          时间比较紧,并且没有做过大规模测试,各位如果发现问题,请指正。

/********************************************************************
* Copyright (C) 2011 Li Yachao
* Contact: [email protected] or [email protected]
*
* Permission to use, copy, modify, and distribute this software for
* any non-commercial purpose is hereby granted without fee, provided
* that the above copyright notice appear in all copies and that both
* that copyright notice. 
* It is provided "as is" without express or implied warranty.
*
* Version: 0.1
* Last update: 2011-7-29
*********************************************************************/
#include
#include 
#include 
#include 

using namespace std;

std::wstring UTF16StringLineToWstring(std::string utf16line);
std::string UTF16WStringToString(std::wstring utf16wline);

int main(int argc, char * argv[])
{
	/*Unicode编码文件输入*/
	std::string infile = "input.txt";
	std::string outfile = "out.txt";
	
	ifstream infs16;/*读入文件流*/
	infs16.open(infile.c_str(),ios::in | ios::binary);
	if(!infs16.is_open())
	{
		std::cout << "Open error," <> 8 );
		result += c1;
		result += c2;
	}
	return result;
}


你可能感兴趣的:(C/C++,重用代码之LinuxC&C++)