解决pandas.read_csv()乱码问题

用pandas读取CSV文件:

运行的时候老是报这个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa7 in position 2: invalid start byte

解决pandas.read_csv()乱码问题_第1张图片

各种百度教程,首先改一下IDE也就是Pycharm里面的文件编码格式设置,默认是GBK。找到file-->settings-->Editor-->File Encodings,把global encoding和project encoding都改成UTF-8,以及Create UTF-8 files那里选择With BOM,然后把你要改的文件或者项目添加进来,如下图所示:

解决pandas.read_csv()乱码问题_第2张图片

改了之后运行一下,结果发现还是不行,不行的话怎么办,打开你的CSV文件,另存为-->工具-->web选项-->编码-->将此文档另存为这里选UTF-8,然后确定修改一下编码格式,如下图所示:

解决pandas.read_csv()乱码问题_第3张图片

这样再运行一下,结果还是不行。

最后百度到,解决方法是:用记事本打开csv文件,另存为设置编码为utf-8,然后重新读取文件设置encoding='utf-8'就好了。

你可能感兴趣的:(Python教程)