1、文件编码:
#_*_encoding: utf-8_*_ 或 #encoding=utf-8 //表示文件的编码方式为utf-8,因此出现在文件中的字符串用utf-8的方式编码。
2、字符串编码:
s = '科学研究需要大量的资金' //使用系统默认的编码方式对该字符串进行编码,如果指定了文件的编码方式,这采用文件给定的编码方式编码,这里就是utf-8
s = u'科学研究需要大量的资金但社会资源有限需要政府调控所以需要政府的限' //前面加u修饰后,不受系统环境、文件编码的影响,采用python内置的unicode编码
3、开发环境编码:
正在使用的IDE等的编码方式: 如果为gbk,则输出的字符串为gbk才能正常显示中文编码,否则会出现乱码现象,应该将字符串转换为gbk
4、编码、解码:
s = '科学研究需要大量的资金' //文件采用utf-8编码,该字符串使用utf-8编码,首先应该将utf-8的编码转换为uicode编码,
s1 = s.decode('utf-8') //将utf-8解码为unicode
s2 = s1.encode('gbk’) //将unicode编码转换为gbk编码