编码集 | 一个英文字符所占字节数 | 一个中文字符所占字节数 |
---|---|---|
UTF-8 | 1 | 3 |
UTF-16 | 4 | 4 |
UTF-16BE | 2 | 2 |
UTF-16LE | 2 | 2 |
UTF-32 | 4 | 4 |
UTF-32LE | 4 | 4 |
UTF-32BE | 4 | 4 |
UNICODE | 4 | 4 |
GBK | 1 | 2 |
GB2312 | 1 | 2 |
GB18030 | 1 | 2 |
ISO8859-1 | 1 | 1 |
BIG5 | 1 | 2 |
ASCII | 1 | 1 |
统计原理:
将一个中文字符&一个英文字符分别按照不同的charset,用getBytes().length方法获取其对应的长度
例如 "啊".getBytes("UTF-8").length
可参考博文https://www.cnblogs.com/Qian123/p/5799835.html