python——pandas——dropna()函数

该函数主要用于滤除缺失数据。

import pandas as pd
import numpy as np

from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"


df=pd.DataFrame(np.random.randn(6,5),columns=['a','b','c','d','e'])
df.iloc[1,:]=np.nan
df.iloc[:,1]=np.nan
df.iloc[4,4]=np.nan
df

输出:

python——pandas——dropna()函数_第1张图片

df.dropna(how = 'all')    # 传入这个参数后将只丢弃全为缺失值的那些行,axis默认值为0
df.dropna(axis = 1)       # 丢弃有缺失值的列(一般不会这么做,这样会删掉一个特征)
df.dropna(axis=1,how="all")   # 丢弃全为缺失值的那些列
df.dropna(axis=0,subset = ["a", "e"])   # 丢弃‘a’和‘e’这两列中有缺失值的行  

输出:

python——pandas——dropna()函数_第2张图片

python——pandas——dropna()函数_第3张图片

 

 

 

你可能感兴趣的:(pandas,pyhton)