Python3编码问题

导入txt中文一直报错,先用UltraEdit转成了unicode-ascii escaped,导入是没问题了,再使用就不太好用了。

最终解决方案:

for item in df_rate1['content'].head(20):
print(item.encode('utf-8').decode('unicode-escape'))

2019.05.17更新,识别爬虫抓取网页编码:

    print(web_data.encoding)

参考:
encode与decode讲解

Python爬虫起步:一步步解决中文乱码显示

1:字符串通过编码转换为字节码,字节码通过解码转换为字符串
str--->(encode)--->bytes,bytes--->(decode)--->str

后续编码相关问题均更新在本文档中。

你可能感兴趣的:(Python3编码问题)