22-Pandas缺失值的处理技巧

0.本集概览

1.Pandas中缺失值的表征方式及运算处理规则
2.如何发现缺失值
3.如何对缺失值进行丢弃处理
4.如何对缺失值进行填充处理

现实中的数据,往往不如我们在例子中演示的那般干净、整齐,经常会出现数据缺失的现象,今天这一集,我们就来说说Pandas中缺失值的处理方法。

1.缺失值的表征方式

python中采用一种NaN(Not a Number)标签来表示缺失值,NaN本质上是一种浮点数类型:
代码片段:

import pandas as pd
import numpy as np

var = np.array([1, np.nan, 3, 4])
print(var)
print(var.dtype)

运行结果:

[  1.  nan   3.   4.]
float64

运行结果很清楚的表明,NumPy为缺失值选择了一种原生类型的数据类型:浮点型

2.缺失值的运算处理规则

NaN缺失值类型有一个重要的特性,就是任何数与之运算,其结果都是NaN
代码片段:

import pandas as pd
import numpy as np

var = np.array([1, 2, 

你可能感兴趣的:(python数据分析编程基础)