Poco库下的编码转换

Poco的帮助文档:http://pocoproject.org/docs/index.html

在Poco中存在ASCII,Latin1,Latin9,Windows1252,UTF16,UTF8编码。

1.不同字符集之间的转换,实际上是不同字符原集的不同表示之间的转换。如果两个表示方法的原集相同,转换起来自然方便一些。Poco中提供了UnicodeConverter类用于UTF8和UTF16之间的转换。

Poco::UnicodeConverter::toUTF8(ws,uft8);  // 把Unicode转成utf8

 Poco::UnicodeConverter::toUTF16(uft8,ws); //把uft8围成Unicode

2. 如果两个表示方法的原集不同,则要考虑转换方向问题。比如说中文字符在ASCII码中不存在,那么毫无疑问,把中文字符转换成ASCII码自然无意义,这个方向的转换注定要失败。在Poco中,上述字符集之间的转换是用类TextConverter来实现的。

下面是例子:

#include "stdafx.h"
#include "Poco/TextConverter.h" 
#include "Poco/Latin1Encoding.h" 
#include "Poco/UTF8Encoding.h" 
#include "Poco/UTF16Encoding.h" 
#include "Poco/UTF8String.h" 
#include "Poco/TextIterator.h" 
#include "Poco/UTF8Encoding.h" 

#include "Poco/StreamConverter.h" 

#include  
#include   

using Poco::TextConverter; 
using Poco::Latin1Encoding; 
using Poco::UTF8Encoding; 
using Poco::UTF16Encoding; 
using Poco::UTF8; 
using Poco::TextIterator; 
using Poco::UTF8Encoding;  
using Poco::OutputStreamConverter; 

void TestConvert() 
{ 
	std::string latin1String("This is Latin-1 encoded text."); 
	std::string utf8String; 
	Latin1Encoding latin1; 
	UTF8Encoding utf8; 
	TextConverter converter(latin1, utf8); 
	converter.convert(latin1String, utf8String); 
	std::cout << utf8String << std::endl;  

	std::string latin1StringZ("中国."); 
	std::string utf8StringZ; 
	UTF16Encoding utf16; 
	UTF8Encoding utf8Z; 
	TextConverter converterZ(utf16, utf8Z); 
	converterZ.convert(latin1StringZ, utf8StringZ); 
	std::cout << utf8StringZ << std::endl;

 } 
void TestStream() 
{ 
	std::string latin1String("This is Latin-1 encoded text."); 
	Latin1Encoding latin1; 
	UTF8Encoding utf8; 
	OutputStreamConverter converter(std::cout, latin1, utf8); 
	converter << latin1String << std::endl; // console output will be UTF-8
}  
void TestUTF8()
{ 
	std::string s3("\303\274\303\266\303\244"); // "u"o"a 
	UTF8::toUpperInPlace(s3);	 
	assert (s3 == "\303\234\303\226\303\204"); // "U"O"A 
	UTF8::toLowerInPlace(s3); assert (s3 == "\303\274\303\266\303\244"); // "u"o"a
}  
void TestIterator() 
{
	std::string utf8String("This is UTF-8 encoded text."); 
	UTF8Encoding utf8; 
	TextIterator it(utf8String, utf8); 
	TextIterator end(utf8String); 
	int unicode; 
	for (; it != end; ++it) 
	{
		unicode = *it; 
	} 
}  
int _tmain(int argc, _TCHAR* argv[]) 
{ 
	TestLatinToUtf8(); 
	TestStream();
	TestUTF8();
	TestIterator(); 
	return 0;
}






你可能感兴趣的:(poco库)