Python下的encode和decode

  • s是某编码格式的字符串

  • s.encode('xxx') 将Unicode格式的字符串s,编码为xxx格式 (这里的s一定要是Unicode的类型的)

  • s.decode('xxx') 将xxx格式的字符串s,按xxx进行解码为Unicode格式


  • Unicode内部是什么样子的呢

>>> u'嘻嘻'

u'\u563b\u563b'

  • UTF8呢

>>> s = u'嘻嘻'.encode('utf8')

>>> s

'\xe5\x98\xbb\xe5\x98\xbb'


  • 关于拼接转移字符串和编码
    举个例子,想要把gb2312编码的字符串'\x'和'01'拼接起来并输出,有什么办法吗?
    直接'\x'+'01'这样会出错。

方法是取消转义,然后用用指定的方法来解码:
(string-escape和unicode-escape都可以)

>>>(r'\x' + '01').decode('string-escape')

你可能感兴趣的:(Python下的encode和decode)