英文字母和中文汉字在不同字符集编码下的字节数

转自:http://hi.baidu.com/johnson2050/item/5be9bff0a1bac013d6ff8c2a

 

英文字母:

字节数 : 1;编码:GB2312

字节数 : 1;编码:GBK

字节数 : 1;编码:GB18030

字节数 : 1;编码:ISO-8859-1

字节数 : 1;编码:UTF-8

字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE

字节数 : 2;编码:UTF-16LE

 

中文汉字:

字节数 : 2;编码:GB2312

字节数 : 2;编码:GBK

字节数 : 2;编码:GB18030

字节数 : 1;编码:ISO-8859-1

字节数 : 3;编码:UTF-8

字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE

字节数 : 2;编码:UTF-16LE

可以通过代码看出以上结果:

 

import java.io.UnsupportedEncodingException;

 

public class EncodingTest {

 

/**

* @param args

*/

public static void main(String[] args) {

String en = "A";

String ch = "人";

System.out.println("英文字母:" + en);

printByteLength(en, "GB2312");

printByteLength(en, "GBK");

printByteLength(en, "GB18030");

printByteLength(en, "ISO-8859-1");

printByteLength(en, "UTF-8");

printByteLength(en, "UTF-16");

printByteLength(en, "UTF-16BE");

printByteLength(en, "UTF-16LE");

System.out.println();

 

System.out.println("中文汉字:" + ch);

printByteLength(ch, "GB2312");

printByteLength(ch, "GBK");

printByteLength(ch, "GB18030");

printByteLength(ch, "ISO-8859-1");

printByteLength(ch, "UTF-8");

printByteLength(ch, "UTF-16");

printByteLength(ch, "UTF-16BE");

printByteLength(ch, "UTF-16LE");

}

 

/**

* 打印不同字符集下Java字符串所占的字节数

* @param str

*            待操作的字符串

* @param encodingName

*            字符集名称

* */

public static void printByteLength(String str, String encodingName) {

System.out.print("字节数 : ");

try {

System.out.print(str.getBytes(encodingName).length);

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

System.out.println(";编码:" + encodingName);

}

}

你可能感兴趣的:(字符集编码)