Python_数据分析_pandas_04缺失值处理

1. 缺失值处理

缺失值处理主要有三个内容、四个函数:发现缺失值(isnull() notnull())、删除缺失值(dropna())、填补缺失值(fillna())

首先创建一个矩阵
Python_数据分析_pandas_04缺失值处理_第1张图片

1.1 发现缺失值

发现缺失值是生成布尔类型的掩码数据,两个函数相反
Python_数据分析_pandas_04缺失值处理_第2张图片

1.2 删除缺失值

基本类型dropna(axis=0, how =‘any’,tresh) ,其中axis是按行还是按列删除、how有两种any-有缺失值即删除和all-全部确实删除、tresh是限定非缺失值的数量

eg1:有缺失删除该列
Python_数据分析_pandas_04缺失值处理_第3张图片

eg2:按列,全部缺失删除
Python_数据分析_pandas_04缺失值处理_第4张图片

eg3:按列,非缺失值至少为三个
Python_数据分析_pandas_04缺失值处理_第5张图片

1.3 填补缺失值

填补缺失值fillna(),除了给固定值,还可以method参数,有ffill-从前向后填充和bfill-从后向前填充

固定值填充
Python_数据分析_pandas_04缺失值处理_第6张图片

按列前向填充
Python_数据分析_pandas_04缺失值处理_第7张图片

你可能感兴趣的:(Python数据分析模块,python,数据分析,pandas,缺失值)