当前流行的字符编码格式有:US-ASCII、ISO-8859-1、UTF-8、UTF-16BE、UTF-16LE、UTF-16、GBK、GB2312等,其中GBK、GB2312是专门处理中文编码的。而libiconv是一个常用的编码转换库,支持常用的多种编码之间的转换。在Linux下,工具链gcc有专门的libiconv库,所有不用移植,但在arm-linux下就没那么幸运了,需要我们额外移植libiconv库,不过,过程还是比较简单的。
一、字符编码转换libiconv库介绍
libiconv是一个常用的编码转换库,支持常用的多种编码之间的转换。主要函数有:
#include <iconv.h>
iconv_ticonv_open(constchar *tocode, const char *fromcode);
size_ticonv(iconv_t cd, char **inbuf, size_t *inbytesleft, char **outbuf, size_t *outbytesleft);
int iconv_close(iconv_tcd);
iconv_open是打开一个编码流,类似于打开一个编码管道(通道),出错则返回-1;
iconv用于具体输入的转换,如果出错,则返回 -1,否则返回 0;
iconv_close是关闭该管道(通道)。
如果对于大量需要转换的编码,上述函数covert不适合该方式,一是内存的限制不能一次调用,二是若分多次调用会频繁打开一个编码管道(通道),导致资源浪费,最好的办法还是拆开该函数根据情况使用。
二、arm-linux移植过程
1)http://www.gnu.org/software/libiconv/ 下载 libiconv-1.14.tar.gz
2)./configure CC=arm-hismall-linux-gcc --target=arm-linux--host=arm-hismall-linux --prefix=/usr/local/iconv --enable-shared--enable-static
3) make
4) make install
三、实例unicode.cpp
//#include <iconv.h> #include <iostream> #include <string.h> #include "./iconv.h" using namespace std; // 代码转换操作类 class CodeConverter { private: iconv_t cd; public: // 构造 CodeConverter(const char *from_charset, const char *to_charset) { cd = iconv_open(to_charset, from_charset); } // 析构 ~CodeConverter() { iconv_close(cd); } // 转换输出 int convert(char *inbuf, int inlen, char *outbuf, int outlen) { char **pin = &inbuf; char **pout = &outbuf; memset(outbuf, 0, outlen); return iconv(cd, pin, (size_t *)&inlen, pout, (size_t *)&outlen); } }; int main(int argc, char **argv) { char *gb2312 = "我是中国人"; char out0[256] = {0}; char out1[256] = {0}; // gb2312-->utf-8 CodeConverter cc0 = CodeConverter("gb2312","utf-8"); cc0.convert(gb2312, strlen(gb2312)+1, out0, 256); cout << "gb2312-->utf-8 in=" << gb2312 << ",out0=" << out0 << endl; // utf-8-->gb2312 CodeConverter cc1 = CodeConverter("utf-8", "gb2312"); cc1.convert(out0, strlen(out0)+1, out1, 256); cout << "utf-8-->gb2312 in=" << out0 << ",out1=" << out1 << endl; return 0; }
arm-hismall-linux-g++ unicode.cpp -L./-liconv //静态库然后nfs下载到板子上或直接运行就ok了。