Python快速基础--空值 无穷值处理

https://blog.csdn.net/yi976263092/article/details/87878112

https://zhuanlan.zhihu.com/p/30866239

 

问题:

在训练模型 fit(x_train,y_train) 时遇到报错 

ValueError: Input contains NaN, infinity or a value too large for dtype('float64')

解决方法:

1、检查数据中是否有缺失值,并做缺失值处理

# 读取数据
train = pd.read_csv('./data/train.csv')
 
# 检查数据中是否有缺失值,以下两种方式均可
#Flase:对应特征的特征值中无缺失值
#True:有缺失值
print(train.isnull().any())
print(np.isnan(train).any())
 
#查看缺失值记录
train_null = pd.isnull(train)
train_null = train[train_null == True]
print(train_null)
 
#缺失值处理,以下两种方式均可
#删除包含缺失值的行
train.dropna(inplace=True)
#缺失值填充
train.fillna('100')
#当然原数据也是没有改变的,需要添加参数inplace=True,才可以改变原数据。

 2、检查数据中是否有无穷数据,并做数据处理

#检查是否包含无穷数据
#False:包含
#True:不包含
print(np.isfinite(train).all())
#False:不包含
#True:包含
print(np.isinf(train).all())
 
#数据处理
train_inf = np.isinf(train)
train[train_inf] = 0

 

你可能感兴趣的:(python,python)