df数据集
df = pd.DataFrame({'x':['A','C','B','D','C','B','B','A','D']
,'num':[np.nan,23,np.nan,54,0,1,8,9,12]
,'a':[np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan,np.nan]})
>> x num a
0 A NaN NaN
1 C 23.0 NaN
2 B NaN NaN
3 D 54.0 NaN
4 C 0 NaN
5 B 1.0 NaN
6 B 8.0 NaN
7 A 9.0 NaN
8 D 12.0 NaN
查找存在0或全是0的列并返回列名
df.loc[:,(df==0).any()].columns
>> Index(['num'], dtype='object')
df.loc[:,(df==0).all()].columns
>> Index([], dtype='object')
同理,缺失值:
df.loc[:,(df.isnull().all()].columns
df.loc[:,(df.isnull()).any()].columns
df.dropna(axis = 0)
df.dropna(axis = 1 )
df.fillna(0)
df.loc[df['num'].notnull(),:]
>x num a
1 C 23.0 NaN
3 D 54.0 NaN
4 C 52.0 NaN
5 B 1.0 NaN
6 B 8.0 NaN
7 A 9.0 NaN
8 D 12.0 NaN