在处理python字符串尤其是汉语时会遇到各种编码错误。
我们可以用一个叫chardet的库中的detect检查字符串的编码方式。然后进行转换。
我通过下面的函数解决汉语编码问题。
import chardet def codingurf8(str): if chardet.detect(str)['encoding'] != 'utf-8': str = str.decode(chardet.detect(str)['encoding']).encode('utf-8') return str