关于字符集编码的总结

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)
使用7 bit 来表示一个字符,共计可以表示128种字符.

ISO-8859-1
8 bit 表示一个字符,即用一个字符(byte)(8 bit)来表示一个字符,共计可以表示256个字符

gb2312
两个字节表示一个汉字

gbk

gb18030

big5

unicode
采用了两个字节来表示一个字符

UTF,Unicode Translation Format

说明;unicode是一种编码方式,而UTF则是一种存储方式;UTF-8是Unicode的实现方式之一。

UTF-16LE (little endian) UTF16-BE(big endian) 小端和大端 和硬件相关

UTF-8,变长字节表示形式
一般来说,UTF-8会通过3个字节来表示一个中文

你可能感兴趣的:(关于字符集编码的总结)