python统计缺失值个数_Python数据分析之缺失值处理(一)

◆ ◆ ◆  ◆ ◆

前言

数据缺失值的处理,在数据分析前期,即数据处理过程中占着重要的地位,在数据分析面试中被问到的概率也是极大的。

一般情况下,我们对待缺失值有三种处理方式:(1)源数据补录,即通过再次采样或者询问等方式将缺失内容补充完整;(2)缺失值填充,即根据一定的规则将缺失值填充,可选众数、中位数等;(3)删除缺失值,即根据一定的规则将含有缺失值的行或列直接进行删除。

我的会员请教了我关于缺失值的问题,于是我为他整理了一篇详细的文章,讲解一下如何进行缺失值处理。今天这篇文章只是缺失值处理的第一节——缺失值的删除。

dropna

dropna为pandas库下DataFrame的一个方法,用于删除缺失值。基本参数如下:

dropna(self, axis=0, how=’any’, subset=None, inplace=False)

接下来,我们一一进行讲解。

# 预览模拟数据>>> dfOut[1]:name age birthday gender0 Alan 17.0 1999-01-25 male1 NaN NaT female2 Black 18.0 1997-02-07 male3 Cici NaN 2000-01-18 female4 David 25.0 NaT male5 NaN 22.0 NaT female# 不加任何参数>>> df.dropna()Out[2]:name age birthday gender0 Alan 17.0 1999-01-25 male2  Black  18.0 1997-02-07   male&

你可能感兴趣的:(python统计缺失值个数)