数据分析之缺失值处理

##数据清洗之 pandas学习
最近参加了datawhale组队学数据分析,在其中task2中介绍到缺失值的处理,下面记录一点自己学习的内容,如何查看缺失值,遇到缺失值后如何处理
1.## 查看缺失值
通过DataFrame对象的info()查看

    import pandas as pd
    a = [1,2,3,None]
    b = [11,12,None, 14]
    data = {'a':a, 'b':b}
    df = pd.DataFrame(data)
    df.info()

可以看到数据中有多少个非空值,输出如下:

	<class 'pandas.core.frame.DataFrame'>
	RangeIndex: 4 entries, 0 to 3
	Data columns (total 2 columns):
	a    3 non-null float64
	b    3 non-null float64
	dtypes: float64(2)
	memory usage: 128.0 bytes

2## 缺失值如何处理
将缺失值全部设置为0,这里通过isnull()方法实现,同时尝试了==None和np.nan都没成功。

	import pandas as pd
	a = [1,2,3,None]
	b = [11,12,None, 14]
	data = {'a':a, 'b':b}
	df = pd.DataFrame(data)
	df[df['a'].isnull()] = 0
	df[df['b'].isnull()] = 0
	df.info()

输出如下:

	<class 'pandas.core.frame.DataFrame'>
	RangeIndex: 4 entries, 0 to 3
	Data columns (total 2 columns):
	a    4 non-null float64
	b    4 non-null float64
	dtypes: float64(2)
	memory usage: 128.0 bytes

你可能感兴趣的:(笔记)