Pandas导入导出csv时编码格式错误的解决方法

需要知道的知识

Excel中打开的编码是ANSI型的,而你需要处理的数据是UTF-8类型的,如果将编码ANSI的Excel导入Pandas则必然会出现问题,同样以UTF-8导出的csv在Excel中打开同样是乱码

报错信息:编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb3 in position

解决方法

1.用记事本打开csv文件并在记事本的另存为中以UFT-8的编码格式保存,再重新导入
2.使用代码:
content = pd.read_csv('news.csv',encoding='gb18030'

以UTF-8编码导出的csv文件在Excel中是乱码

解决方法

用记事本打开csv文件并在记事本的另存为中以ANSI的编码格式保存,再重新打开即可

你可能感兴趣的:(大创项目,pandas,csv,excel,大数据)