\u Unicode和汉字转化

介绍

\uxxxx这种格式是Unicode写法,表示一个字符,其中xxxx表示一个16进制数字,范围所0~65535. Unicode十六进制数只能包含数字0~9、大写字母A~F或者小写字母A~F。需要注意到是:Unicode的大小端问题,一般都是小端在前,例如 \u5c0f 表示汉语中的 '小'字,转换成10进制就是9215,所以在byte数组中应该是1592.

汉字转Unicode

复制代码
 private string Unicode2Chinese(string strUnicode)

{

    string[] splitString = new string[1];

    splitString[0] = "\\u";

    string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries);

    StringBuilder sb = new StringBuilder();



    foreach (string item in unicodeArray)

    {

        byte[] codes = new byte[2];

        int code1, code2;

        code1 = Convert.ToInt32(item.Substring(0, 2), 16);

        code2 = Convert.ToInt32(item.Substring(2), 16);

        codes[0] = (byte)code2;//必须是小端在前

        codes[1] = (byte)code1;

        sb.Append(Encoding.Unicode.GetString(codes));

    }



    return sb.ToString();

}
复制代码

Unicode转汉字

复制代码
private string Chinese2Unicode(string strChinese)

{

    string strUnicodes = string.Empty;

    foreach (char item in strChinese.ToCharArray())

    {

        strUnicodes += "\\u" + ((int)item).ToString("x"); //16进制

    }

    return strUnicodes;

}
复制代码

 

程序截图:

\u Unicode和汉字转化

 

 

转自:http://www.cnblogs.com/fanyong/archive/2013/06/26/3157476.html
作者:樊勇 
出处:http://www.cnblogs.com/fanyong/ 
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。 
我的联系方式:[email protected] 
个人独立博客:www.fy98.com

你可能感兴趣的:(unicode)