Python编码和解码

decode

解码

s = '呵呵'
sg = sg.encode('gbk')  # 将呵呵编码成gbk格式
print(sg)
s1 = sg.decode('gbk')  # 将呵呵使用gbk解码成unicode格式(使用什么方式编码就需要对应的方式解码)
print(s1)
# 这里如果sg使用utf-8解码会抛出UnicodeDecodeError
s3 = sg.decode('utf-8')

output:

b'\xe5\x93\x88\xe5\x93\x88'
呵呵
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 0: invalid start byte

encode

编码

s = '哈哈'
su = s.encode('utf-8')
print(su)

output:

b'\xe5\x93\x88\xe5\x93\x88'  # utf-8格式的‘哈哈’

encoding

指定编码格式

unicode

unicode编码字符串可以表示更多的字符集,Python3中默认的字符串是unicode,unicode字符串可以编码成utf-8,gbk,gb2312等等,同样的utf-8.gbk,gb2312等字符串也可以解码成unicode字符串,unicode字符串可以当做一个中间转换的编码

你可能感兴趣的:(Python编码和解码)