解决python中文编码混乱的问题

在处理python字符串尤其是汉语时会遇到各种编码错误。

我们可以用一个叫chardet的库中的detect检查字符串的编码方式。然后进行转换。

我通过下面的函数解决汉语编码问题。

import chardet
def codingurf8(str):
    if chardet.detect(str)['encoding'] != 'utf-8':
        str = str.decode(chardet.detect(str)['encoding']).encode('utf-8')
    return str


你可能感兴趣的:(python,乱码,中文编码,utf8)