Windows下使用iconv

资源下载

官网资源: https://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.16.tar.gz
CSDN资源:https://download.csdn.net/download/hhhuang1991/11979866
VS2015配置项目+测试代码

环境配置

编译环境:Win7 64位系统 VS2015

  1. 创建一个VS2015项目,应用程序类型使用静态库,注意取消勾选“使用预编译头”;
  2. 将资源[libiconv-1.16\lib]文件夹下的所有文件,全部复制到第一步创建的工程目录下,并找到config.h.in文件,将后缀.in去掉;
  3. 将资源[libiconv-1.16\include]文件夹下的iconv.h.in,复制到工程目录下,并将后缀.in去掉;
  4. 将资源[libiconv-1.16\libcharset\lib]文件夹下的localcharset.c,复制到工程目录下;
  5. 将资源[libiconv-1.16\libcharset\include]文件夹下的localcharset.h.in,复制到工程目录下,并将后缀.in去掉;
  6. 将资源[libiconv-1.16\include]文件夹下的iconv.h.in,复制到工程目录下,并将后缀.in去掉;
  7. iconv.clocalcharset.c文件加载到工程中;
  8. 直接编译工程。

异常排除

  1. iconv.c文件中#include 改为#include "iconv.h"
    localcharset.c文件中#include 改为#include "config.h"
 fatal error C1083: 无法打开包括文件: “config.h”: No such file or directory
 fatal error C1083: 无法打开包括文件: “iconv.h”: No such file or directory
  1. 找到iconv.h文件中,所有带@符号的字符串都要去掉@或屏蔽:
Line21,@DLL_VARIABLE@改为/*@DLL_VARIABLE@*/
Line82,@ICONV_CONST@改为const
Line100, @USE_MBSTATE_T@改为USE_MBSTATE_T
Line101,@BROKEN_WCHAR_H@改为BROKEN_WCHAR_H
Line121, @USE_MBSTATE_T@改为 USE_MBSTATE_T
Line168,@HAVE_WCHAR_T@改为HAVE_WCHAR_T
  1. 找到localcharset.c文件中的sprintf函数,全部替换成安全类型的函数sprintf_s

Demo

  1. 编译上面工程,将会生成静态库libiconv.lib。
  2. 创建一个测试工程。将iconv.h和库文件libiconv.lib拷贝到测试工程目录下,测试代码如下,
#include "stdafx.h"	
#include "..\libiconv\iconv.h"
#pragma comment(lib, "..\\Debug\\libiconv.lib")
#include 
using namespace std;
int main()
{
     // 将GBK编码的字串,转成UTF-8编码的字
     iconv_t cd = iconv_open("UTF-8", "GBK"); 
     if ((iconv_t)-1 == cd)  
     {
	 if (EINVAL == errno)
	 {
	   cerr << "The conversion from fromcode to tocode is not supported by the implementation" << endl;
	 }
	 else {
	   cerr << "iconv_open fail!" << endl;
	 }
	  return -1;
     }
     
     // 将转换描述符cd中的转换状态恢复成初始化状态,方法是iconv中的inbuff参数设置成NULL
     iconv(cd, NULL, NULL, NULL, NULL);
     // 将GBK编码的"啊"转成UTF-8编码
     char * inbuff = new char[64];
     memset(inbuff, 0, sizeof inbuff);
     char *outbuff = new char[64];
     memset(outbuff, 0, sizeof outbuff);
     
     // "啊"的GBK编码为0xB0A1,UTF-8编码为0xE2 0x80 0x9C
     inbuff[0] = 0xA1;
     inbuff[1] = 0xB0;
     char * inptr = inbuff;   // 为什么要设置这个中间指针inptr,而不支持采用      inbuff?因为iconv会改变指针inbuff的值,这样在删除内存时delete[] inbuff,将会出错
     size_t insize = 2;
     char * outptr = outbuff;  // 作用与inptr类似
     size_t outsize = 64;
     char *save = new char[64];
     memset(save, 0, sizeof save);
     size_t outsave = 0;
     
     // 资料介绍,iconv每次只转换一个多字节字符。但是经过测试,只要内容是正常,都是一次转换完,不明白其中缘由。
     size_t ret = iconv(cd, (const char **)&inptr, &insize, &outptr, &outsize);
     if ((size_t)-1 == ret) {
        if (E2BIG == errno) {
            cerr << "There is not sufficient room at *outbuf." << endl;
        }
        else if (EILSEQ == errno) {
            cerr << "An invalid multibyte sequence has been encountered in the input." << endl;
        }
        else if (EINVAL == errno) {
            cerr << "An incomplete multibyte sequence has been encountered in the input." << endl;
        }
        goto TestFinished;
     }
     else {
        outsave = 64 - outsize;
        memcpy(save, outptr - outsave, outsave);   // 此处采用memcpy而不采用strcpy的目的是,当ACSII类型字符转换到UCS2类型时,会产生0x00的字符,使用strcpy复制会在此处截断,导致内容丢失
     }
     cout << "successed." << endl;
TestFinished:
     delete[] inbuff;
     delete[] outbuff;
     delete[] save;
     iconv_close(cd);
     getchar();
     return 0;
  }
	
	

参考资源

iconv_open
iconv

你可能感兴趣的:(C/C++)