Java 编码规则

Java 采用 Unicode 编码,向下兼容 ASCII,2 个字节表示一个字符 char 类型占 2 个字节

C 采用 ASCII 编码,一个字符占一个字节

GB 2313 和 GBK 编码,一个英文字母字符存储需要 1 个字节,一个汉字字符存储需要 2 个字节

UTF-8 编码,一个英文字母字符存储需要 1 个字节,一个汉字字符存储需要 3-4 个字节

UTF-16 编码,一个英文字母字符存储需要 2 个字节,一个汉字字符存储需要 3-4 个字节

UTF-32 编码,世界上任何字符的存储都需要 4 个字节

转换:

String str = "hello";
int len = str.getLength(); // 字符长度
int bytelen = str.getBytes("utf-8").length; // 获取相应编码转换后的字节长度
System.getProperty("file.encoding"); // 系统默认编码方式

你可能感兴趣的:(Java 编码规则)