pandas read_csv 编码错误导致无法读取的问题

这是电投的一个比赛,基于大数据的汽轮机瞬态应力分析与预测

首先可以看下原始数据(正确的读取模式)

pandas read_csv 编码错误导致无法读取的问题_第1张图片

 

 

 

 

 

 

 

一般的读取模式

import numpy as np
import pandas as pd
train_data = pd.read_csv('./data/train.csv', sep=',')
train_data.head()

结果是显示读取编码错误UnicodeDecodeError

pandas read_csv 编码错误导致无法读取的问题_第2张图片

 网上找到的解决方案,设置编码格式

1.设置编码= 'GBK' 或者编码= 'UTF-8'.pandas.read_csv(' data.csv”,编码= 'GBK')

2.如果设置编码直接报错的话

解决方法是:用记事本打开的csv文件,另存为设置编码为UTF-8,然后重新读取文件设置编码= 'UTF-8' 就好了

在sublime中,单击文件 - >使用编码保存 - > UTF-8

而我的方案是

import numpy as np
import pandas as pd
train_data = pd.read_csv('./data/train.csv', sep=',', encoding = "gbk")
train_data.head()

结果显示有第0行是不需要的信息,添加代码skiprows = [0]

import numpy as np
import pandas as pd
train_data = pd.read_csv('./data/train.csv', sep=',', encoding = "gbk", skiprows=[0])
train_data.head()

 

pandas read_csv 编码错误导致无法读取的问题_第3张图片

 pandas read_csv 编码错误导致无法读取的问题_第4张图片

 

常用的编码格式  

UTF-8 

GBK 

ISO-8859-1 

CP1252

附上链接(可能无法访问)关于read csv的问题,代码例子

 

https://chrisalbon.com/python/data_wrangling/pandas_dataframe_importing_csv/

你可能感兴趣的:(pandas)