pandas.DataFrame.dropna

DataFrame.dropna

定义:

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
  • thresh: 一行或者一列中最多有多少NaN
In [19]: df                                                                     
Out[19]: 
     A    B   C  D
0  NaN  2.0 NaN  0
1  3.0  4.0 NaN  1
2  NaN  NaN NaN  5
3  NaN  3.0 NaN  4

In [20]: df.dropna(how='all')                                                   
Out[20]: 
     A    B   C  D
0  NaN  2.0 NaN  0
1  3.0  4.0 NaN  1
2  NaN  NaN NaN  5
3  NaN  3.0 NaN  4

In [21]: df.loc[2,'D'] = np.NaN                                                 

In [22]: df                                                                     
Out[22]: 
     A    B   C    D
0  NaN  2.0 NaN  0.0
1  3.0  4.0 NaN  1.0
2  NaN  NaN NaN  NaN
3  NaN  3.0 NaN  4.0

In [23]: df.dropna(how='all')                                                   
Out[23]: 
     A    B   C    D
0  NaN  2.0 NaN  0.0
1  3.0  4.0 NaN  1.0
3  NaN  3.0 NaN  4.0

# 删除一列
In [25]: df.dropna(how='all', axis=1)                                           
Out[25]: 
     A    B    D
0  NaN  2.0  0.0
1  3.0  4.0  1.0
2  NaN  NaN  NaN
3  NaN  3.0  4.0


In [22]: df                                                                     
Out[22]: 
     A    B   C    D
0  NaN  2.0 NaN  0.0
1  3.0  4.0 NaN  1.0
2  NaN  NaN NaN  NaN
3  NaN  3.0 NaN  4.0

# 一行中最多有两个NaN, 否则drop
>>> df.dropna(thresh=2)
     A    B   C  D
0  NaN  2.0 NaN  0
1  3.0  4.0 NaN  1

你可能感兴趣的:(Pandas)