一旦在Qt程序中出现latin1字符集以外的字符,几乎大家无一例外的会用到 QTextCodec。
而不少网友不分青红皂白,一旦用到中文,就同时使用下面3条指令(其中textc 取为 gb18030 或 utf8,还有的会选用system)。
QTextCodec::setCodecForCStrings(textc); QTextCodec::setCodecForTr(textc); QTextCodec::setCodecForLocale(textc);
在C和C++中,我们一般都是将 "hello world!" 这种称为字符串(窄字符串、C传统字符串、char*字符串...)
或许,我们可以说,ANSI C、C++截止目前只有字节流,而缺乏对字符串的支持。
Qt 为字节流和字符串分别提供了 QByteArray 和 QString 两个类(还有QLatin1String等其他类,但这两个是最主要的)。当我们涉及到IO时,比如读写文件、读写网络socket、控制台(终端)输入输出、读写串口... 操作的都是字节流,如果我们此时需要的操作的内容是字符串,则需要二者之间的相互转换。
在java、C#、python等语言都内置支持unicode字符串的情况下,C、C++ 一直以来对unicode却没有提供任何直接的支持(尽管有个所谓的宽字符wchar_t,但却不能解决什么问题)。即使是下一代标准(C++0x, C1x),对unicode也只是提供了一部分支持,真...
QTextCodec 提供的是 字符串 和 字节流 之间的相互转换(也就是字符的编解码)。
为了了解 QTextCodec 究竟是做了什么,我们不妨先定义自己的一个codec看看:
class DbzhangCodec:public QTextCodec { public: DbzhangCodec(){} ~DbzhangCodec(){} QString convertToUnicode(const char *chars, int len, ConverterState *) const { if (len <= 0 || chars == 0) return QString(); QString r(len); for (int i=0; i<len; ++i) { if (chars[i] > 'a' && chars[i] < 'z') r[i] = 'a' + 'z' - chars[i]; else if (chars[i] > 'A' && chars[i] < 'Z') r[i] = 'A' + 'Z' - chars[i]; else r[i] = QLatin1Char(chars[i]); } return r; } QByteArray convertFromUnicode(const QChar *in, int len, ConverterState *) const { QByteArray r(len, '?'); for (int i=0; i<len; ++i) { int u = in[i].unicode(); if (u > 255) r[i] = '?'; else if (u > 'a' && u < 'z') r[i] = 'z' - u + 'a'; else if (u > 'A' && u < 'Z') r[i] = 'Z' - u + 'A'; else r[i] = u; } return r; } QByteArray name() const {return "dbzhang800";} QList<QByteArray> aliases() const{return QList<QByteArray>()<<"dbzhang-800";} int mibEnum() const{return 2011;} };
int main(int argc, char *argv[]) { QCoreApplication a(argc, argv); QTextCodec * codec = new DbzhangCodec; QTextCodec::setCodecForCStrings(codec); qDebug()<<QString("hello world!"); return 0; }
注意:此处使用 new,但却没有相应的 delete。这不会造成内存泄漏,因为Qt创建每一个TextCodec之时都会将其放入到一个QList中,这样当程序退出时,如果该codec尚未销毁,则会被清理。
#include <QTextCodecPlugin> #include <QTextCodec> class DbzhangCodecPlugin : public QTextCodecPlugin { public: DbzhangCodecPlugin() {} QList<QByteArray> names() const {return QList<QByteArray>()<<"dbzhang800";} QList<QByteArray> aliases() const {return QList<QByteArray>()<<"dbzhang-800";} QList<int> mibEnums() const {return QList<int>()<<2011;} QTextCodec *createForMib(int mib) { return mib == 2011 ? new DbzhangCodec : 0; } QTextCodec *createForName(const QByteArray & name) { if (name == "dbzhang800" || name == "dbzhang-800") return new DbzhangCodec; else return 0; } }; Q_EXPORT_PLUGIN2(dbzhangcodec, DbzhangCodecPlugin)
配合一个.pro 文件
TARGET = dbzhangcodec TEMPLATE = lib CONFIG += plugin SOURCES += codecplugin.cpp
QTextCodec * codec = QTextCodec::codecForName("dbzhang800");
QTextCodec::setCodecForCStrings(textc); QTextCodec::setCodecForTr(textc); QTextCodec::setCodecForLocale(textc);
3个很简单的东西。字节流 <==> 字符串
void QTextCodec::setCodecForCStrings ( QTextCodec * codec ) [static] Sets the codec used by QString to convert to and from const char * and QByteArrays. If the codec is 0 (the default), QString assumes Latin-1.
在QString 与中文问题 我们介绍过这个东西。它将影响QString中
QString ( const QByteArray & ba )
QString & append ( const QByteArray & ba )
QString & append ( const char * str )
bool operator!= ( const QByteArray & other ) const
QString & operator= ( const QByteArray & ba )
QString & operator= ( const char * str )
QByteArray & append ( const QString & str )
int indexOf ( const QString & str, int from = 0 ) const
bool operator< ( const QString & str ) const
void QTextCodec::setCodecForTr ( QTextCodec * c ) [static] Sets the codec used by QObject::tr() on its argument to c. If c is 0 (the default), tr() assumes Latin-1.
在 Qt中translate、tr关系 与中文问题 一文中我们过提到了一个问题。
QString QObject::tr ( const char * sourceText, const char * disambiguation = 0, int n = -1 ) [static]
这种函数时,需要将 sourceText 这个字节流转换成一个QString字符串。
void QTextCodec::setCodecForLocale ( QTextCodec * c ) [static] Set the codec to c; this will be returned by codecForLocale(). If c is a null pointer, the codec is reset to the default. This might be needed for some applications that want to use their own mechanism for setting the locale.
当我们从程序的命令行读取参数时int main(int argc, char *argv[])