用Python做数据处理时,报如下错误:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4
首先我们先看一下报错:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4
翻译过来是:
pandas.errors.parserror:标记数据时出错。C错误:第28行中需要3个字段,见4
错误产生是因为数据集格式错误。
我们需要修改一下数据格式或者在读入时做一些设置,以下两种方法可行:
在读入代码后面加入如下参数:
error_bad_lines=False #加入参数
我产生错误的原因是偷懒直接修改的后缀名,正确做法是将文件打开另存在数据集要求的格式。例如我需要csv文件,现有是xlsx文件,需要打开另存在csv文件,不能直接修改后缀名。