python3 解释器默认编码为Unicode,由str类型进行表示。二进制数据使用byte类型表示。字符串通过编码转换成字节串,字节码通过解码成为字符串。
str = '落霞与孤鹜齐飞!come on!'
#字符串进行编码"encode():str–>bytes"
str_to_utf8 = str.encode('utf-8')
print('UTF8编辑后字符:',str_to_utf8)
str_to_gbk = str.encode('gbk')
print('gbk编辑后字符:',str_to_utf8)
#结果
UTF8编辑后字符: b'\xe8\x90\xbd\xe9\x9c\x9e\xe4\xb8\x8e\xe5\xad\xa4\xe9\xb9\x9c\xe9\xbd\x90\xe9\xa3\x9e\xef\xbc\x81come on\xef\xbc\x81'
gbk编辑后字符: b'\xe8\x90\xbd\xe9\x9c\x9e\xe4\xb8\x8e\xe5\xad\xa4\xe9\xb9\x9c\xe9\xbd\x90\xe9\xa3\x9e\xef\xbc\x81come on\xef\xbc\x81'
utf8 = str_to_utf8.decode('utf-8')
print('utf-8解码utf8_to_str:',utf8)
gbk= str_to_gbk.decode('gbk')
print('gbk解码gbk_to_str:',gbk)
#结果
utf-8解码utf8_to_str: 落霞与孤鹜齐飞!come on!
gbk解码gbk_to_str: 落霞与孤鹜齐飞!come on!
来源:python3 之 字符串编码小结