【Python基础】字符集与字符编码

先行了解的知识:

        1. 编码和解码

                计算机内存储的信息都是二进制表示。

                我们看到的英文,数字,汉字等在计算机内如何表示,那就需要编码

                计算机内存储的信息需要解析出来,那就是解码

        2.字符集与分类
  • 什么是字符集?
    • 一系列文字和符号,数字的总称(比如:a-z,A-Z,0-9,*&^%$#等)
  • 分类:
    • ASCII
      • 控制字符或者通信字符,大小写字母,数字,特殊字符
      • 127以下的叫做半角字符
    • GBK(主要用于处理中文汉字)  
    • GB2312(主要用于处理中文汉字)    
      • ASCII里面的和汉字,罗马希腊字母
    • Unicode
      • 解决:跨语言,跨平台文本转换和处理的要求
         3.代码点,编码字符集,字符编码
  • 代码点:对字符集中的字符赋予一个编号(比如)
  • 编码字符集:对字符集里面所有字符进行编号后的集合
  • 字符编码:将字符对应的代码点转换成计算机内部可以识别的二进制规则  
    • ASCII
      • 需要1个字节
    • GBK
    • UTF-8
      • 字符长度1-4个不等,根据需要

你可能感兴趣的:(Python,python)