字符集分类

ASCLL

  • 通过数字,来表示字母
    数字和字母之间的对应关系,就称为ASCLL表,范围是0-255

GBK编码

  • 由于ASCII编码不支持中文,因此,当中国人用到计算机时,就需要寻求一种编码方式来支持中文。

Unicode字符集

  • 因为世界国家很多,每个国家都定义一套自己的编码标准,结果相互之间谁也不懂谁的编码,就无法进行很好的沟通交流,所以及时的出现了一个组织ISO(国际标准化组织)决定定义一套编码方案来解决所有国家的编码问题,这个新的编码方案就叫做Unicode。
  • java 的字符类型采用的是 Unicode编码方案每个 Unicode码占用2个字节,每个字节是8个比特位,所以,这里是16个比特位。
  • 由于传输ASCII表里的字符时,实际上可以只用一个字节就可以表示,所以,这种编码方案在传输数据比较浪费带宽,存储数据比较浪费硬盘。

UTF-8编码

  • 这个当前程序员最主要使用的汉字编码方式,由于Unicode比较浪费网络带宽和硬盘,因此为了解决这个问题,就在Unicode的基础上,定义了一套编码规则

UTF8mb4

  • 数据库一般使用utf8mb4,和utf8基本差不多,mb4就是多了一些特殊字符,比如emoji表情

你可能感兴趣的:(复习,字符集)