Python中编码方式的转化应用

目录

明确编码方式

常用的默认编码

各个编码之间的转换

自动化框架中遇到的编码坑


明确编码方式

  1. ASCII 讲英文的国家专用的编码方式
  2. GB2313 简体中文的字符集编码
  3. GBK 是GB2313的扩展
  4. GBK18030 繁体汉字的编码
  5. Unicode 万国码,编码界的最高中介
  6. ANSI
  7. UTF-8 他是Unicode的实现方式之一,一般python编码时都会申明该文件的编码方式就是UTF-8
  8. UTF-16
  9. UTF-8-BOM 
  10. UCS-2 BigEndian
  11. UCS-2 Little Endian

常用的默认编码

  1. python3 默认编码方式是UTF-8
  2. python2 默认的编码方式是ascii
  3. windows 记事本默认编码方式是ANSI
  4. windows CMD 默认编码方式是GBK
  5. Linux 默认编码方式是UTP-8

各个编码之间的转换

  1. decode解码、encode编码。在python范围内,编程时如果遇到不同的编码方式可以通过decode方法和encode方法来做编码方式的转化。
  2. 编码和解码要以unicode作为中间编码,可以理解为先将其他编码类型的python对象解码为unicode,然后再从unicode编码方式encode编码为其他编码类型。
  3. 转换前需要先明确当前对象是什么类型的编码。

自动化框架中遇到的编码坑

  1. 在windows中,通过python3,生成.py文件,生成的文件默认编码格式是ANSI,这样会导致生成的.py文件无法正常运行,此时需要使用Notepad打开.py文件,菜单栏Encoding编码处选择Convert to UTF-8即可。更利于自动化测试的方法是在写文件的时候声明encoding参数,如 with open("a.txt", "w", encoding="utf-8") as fp 即可。
  2. 后续。

 

你可能感兴趣的:(python)