ValueError: Input contains NaN, infinity or a value too large for dtype('float32').

ValueError: Input contains NaN, infinity or a value too large for dtype('float32'64).

 一般处理方式

对于以上问题其原因一般是数据集中存在nan值,以下假设数据用numpy.ndarray

存储(type(positive)=)。


首先,我们知道 if np.isnan(x) 用于判断x是否为nan,为nan则返回true。

print(np.isnan(positive).any(), np.isnan(negative).any(), np.isnan(y).any())

该语句用来判断positive、negative、y中是否存在nan值,若返回值为true,

true,true,则可通过以下方式修改:

positive[np.isnan(positive)] = np.mean(positive[~np.isnan(positive)])
negative[np.isnan(negative)] = np.mean(negative[~np.isnan(negative)])  

也就是将positive、negative中的nan值用非nan值的均值代替,当然也可以

用中位数median等代替。

再者,用print(np.isfinite(positive).all())     print(np.isfinite(negative).all())

语句来判断positive、negative是否为有限值,返回false则表示数据存在无

穷数,这个问题一般只要修改了nan值就不会报错了。

对于numpy.ndarray中的部分Nan的处理,例如,numpy.ndarray类型的

array=[[2,4,nan,6,nan],[4,45,3,nan,nan]],可以通过以下代码进行处理:

  for i in range(len(array)):
                    sample=array[i]
                    for j in range(len(sample)):
                        if np.isnan(sample[j]):
                            sample[j]=0 
则array中的Nan均用0代替了。

你可能感兴趣的:(机器学习)