Python-NaN空值的处理

一、先读取数据集

将读取的表格信息命名为df

import pandas as pd
import warnings
warnings.filterwarnings('ignore')
f = open(r"D:\Python\abalone.csv")
df = pd.read_csv(f,sep=",")
df.head()

此时df为DataFrame的格式

二、检查是否有空值

null_all = df.isnull().sum()
null_all

Python-NaN空值的处理_第1张图片

三、对空值进行填补

语法参数介绍

fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
#value:固定值,可以用固定数字、均值、中位数、众数等,此外还可以用字典,series等形式数据;
#method:填充方法,'bfill','backfill','pad','ffill'
#axis: 填充方向,默认0和index,还可以填1和columns
#inplace:在原有数据上直接修改
#limit:填充个数,如1,每列只填充1个缺失值

这里用中位值填补

# 中位值填补空值
df.fillna(df.median(),inplace=True)

再次查看,确认
Python-NaN空值的处理_第2张图片

最后:关于更多填补方式,可以自行学习,这里只做简单介绍。

你可能感兴趣的:(大数据,数据分析,python,pandas,开发语言)