math、numpy、pandas NaN 判断以及去除

 

 

转自https://blog.csdn.net/lanchunhui/article/details/80399681

>> np.nan == np.nan
False
>> np.nan is np.nan
True

>> math.nan is np.nan
False
>> np.isnan(math.nan)
True

1. 判断 ndarray 中是否存在 nan

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> np.isnan(c)
array([False, False,  True, False, False])

# 注意
>> np.nan != np.nan
True

>> np.nan in c
False

上述方案要么返回的是一个序列,要么给出的是错误的结果。判断 numpy 下的多维数组中是否存在 nan 的简单方式:

>> np.isnan(np.min(c))
True
>> np.isnan(np.sum(c))
True

# 因为
>> np.min(c)
nan
>> np.sum(c)
nan

2. 将 nan 填充为均值

>> c = np.array([ 1.,  2., np.nan,  3.,  4.])
>> c[np.isnan(c)] = np.mean(c[~np.nan(c)])

 

将NaN转化为数字或去掉

>>a(isnan(a)) = []
a = 2    3     3     5
以下是几种方法:

注:判断一个值是否为NaN,只能用 isnan(),而不可用 x==NaN; 
(1)i = find( ~ isnan(x));

x = x(i) 先找出值不是NaN的项的下标,将这些元素保留

 

(2)x = x(find( ~ isnan(x))) 同上,去掉NaN

 

(3)x = x( ~ isnan(x)); 更快的做法

 

(4)x(isnan(x)) = []; 消掉NaN

 

(5)x(any(isnan(X)’),:) = []; 把含有NaN的行都去掉
例如:

>>a=[2 3 nan 3 5 nan]

a(isnan(a))

 

 

你可能感兴趣的:(python)