ASCII、GB2312、Unicode、UTF-8

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)

用于将美国字符(a-zA-Z以及一些其他的符号)编码到计算机中,仅仅使用一个字节

GB2312(信息交换用汉字编码字符集)

由于ASCII仅仅使用一个字节,并且基本被美国字符所占用完了。因此为了将中文编码到计算机中,我国使用了GB2312来进行编码

Unicode (统一码、万国码、单一码)

不仅仅是中国遇到了ASCII不够用而采用了自己的一套编码标准其他国家也面临着通用的问题,因此每个国家都有自己的一套编码标注,这不利于计算机的发展,因此出现了Unicode,这套编码一般采用两个字节,如果是一些偏僻的文字可能则会采用四个字节、六个字节进行编码。

UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。

由于Unicode至少使用两个字节来编码字符,而英文仅仅需要一个字符就够了,这就造成了存储空间上的浪费,因此出现了UTF-8,这种存储方式,可以对unicode编码的字符进行处理,然后进使用字符所需要的字节长度来表示一个字符,然后再进行存储,从而解决存储空间上的浪费。

强调一下,unicode是一种编码方式,和ascii是同一个概念,而UTF-8,UTF-16等是一种存储方式,在存储和传输上节约空间、提高性能的一种编码形式。

以上是自己对于这几种编码方式的一次小结和强化。相关知识来自这篇博客

你可能感兴趣的:(ASCII、GB2312、Unicode、UTF-8)