Python pandas中缺失值的种类(None、NA、NaN)及删除方式

python缺失值有3种:

1)Python内置的None值。None,使用df['date'].isnull()进行判断是否为空值。

2)在pandas中,将缺失值表示为NA,表示不可用not available。

3)对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。

所以,缺失值有3种:None,NA,NaN

pandas中的dataframe对象,删除缺失值的方式:

df.dropna(how='all')#删除所有内容均为缺失值的行
df.dropna(axis=1) #丢弃有缺失值的列
df.dropna(axis=1, how = 'all') #丢弃所有列中所有值均缺失的列
df.dropna(axis=0, subset=['name', 'age'])#丢弃name和age这两列中有缺失值的行

 

你可能感兴趣的:(python基础)