实用帖:Java不同编码方式,中英文字符所占字节数

编码集 一个英文字符所占字节数 一个中文字符所占字节数
UTF-8 1 3
UTF-16 4 4
UTF-16BE 2 2
UTF-16LE 2 2
UTF-32 4 4
UTF-32LE 4 4
UTF-32BE 4 4
UNICODE 4 4
GBK 1 2
GB2312 1 2
GB18030 1 2
ISO8859-1 1 1
BIG5 1 2
ASCII 1 1

统计原理:

将一个中文字符&一个英文字符分别按照不同的charset,用getBytes().length方法获取其对应的长度
例如 "啊".getBytes("UTF-8").length
可参考博文https://www.cnblogs.com/Qian123/p/5799835.html

你可能感兴趣的:(//【杂谈或金点子记录】)